一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

softmax損失函數(shù)

 Clay*more 2018-05-25

簡(jiǎn)單易懂的softmax交叉熵?fù)p失函數(shù)求導(dǎo)

96 
bakaqian 關(guān)注
2017.09.20 22:35* 字?jǐn)?shù) 1057 閱讀 1217評(píng)論 7喜歡 4

來寫一個(gè)softmax求導(dǎo)的推導(dǎo)過程,不僅可以給自己理清思路,還可以造福大眾,豈不美哉~
softmax經(jīng)常被添加在分類任務(wù)的神經(jīng)網(wǎng)絡(luò)中的輸出層,神經(jīng)網(wǎng)絡(luò)的反向傳播中關(guān)鍵的步驟就是求導(dǎo),從這個(gè)過程也可以更深刻地理解反向傳播的過程,還可以對(duì)梯度傳播的問題有更多的思考。

softmax 函數(shù)

softmax(柔性最大值)函數(shù),一般在神經(jīng)網(wǎng)絡(luò)中, softmax可以作為分類任務(wù)的輸出層。其實(shí)可以認(rèn)為softmax輸出的是幾個(gè)類別選擇的概率,比如我有一個(gè)分類任務(wù),要分為三個(gè)類,softmax函數(shù)可以根據(jù)它們相對(duì)的大小,輸出三個(gè)類別選取的概率,并且概率和為1。

softmax函數(shù)的公式是這種形式:

S_i代表的是第i個(gè)神經(jīng)元的輸出。
ok,其實(shí)就是在輸出后面套一個(gè)這個(gè)函數(shù),在推導(dǎo)之前,我們統(tǒng)一一下網(wǎng)絡(luò)中的各個(gè)表示符號(hào),避免后面突然出現(xiàn)一個(gè)什么符號(hào)懵逼推導(dǎo)不下去了。
首先是神經(jīng)元的輸出,一個(gè)神經(jīng)元如下圖:

神經(jīng)元的輸出設(shè)為:

其中w_{ij}是第i個(gè)神經(jīng)元的第j個(gè)權(quán)重,b是偏移值。z_i表示該網(wǎng)絡(luò)的第i個(gè)輸出。
給這個(gè)輸出加上一個(gè)softmax函數(shù),那就變成了這樣:

a_i代表softmax的第i個(gè)輸出值,右側(cè)就是套用了softmax函數(shù)。

損失函數(shù) loss function

在神經(jīng)網(wǎng)絡(luò)反向傳播中,要求一個(gè)損失函數(shù),這個(gè)損失函數(shù)其實(shí)表示的是真實(shí)值與網(wǎng)絡(luò)的估計(jì)值的誤差,知道誤差了,才能知道怎樣去修改網(wǎng)絡(luò)中的權(quán)重。

損失函數(shù)可以有很多形式,這里用的是交叉熵函數(shù),主要是由于這個(gè)求導(dǎo)結(jié)果比較簡(jiǎn)單,易于計(jì)算,并且交叉熵解決某些損失函數(shù)學(xué)習(xí)緩慢的問題。交叉熵的函數(shù)是這樣的:

其中y_i表示真實(shí)的分類結(jié)果。
到這里可能嵌套了好幾層,不過不要擔(dān)心,下面會(huì)一步步推導(dǎo),強(qiáng)烈推薦在紙上寫一寫,有時(shí)候光看看著看著就迷糊了,自己邊看邊推導(dǎo)更有利于理解~

最后的準(zhǔn)備

在我最開始看softmax推導(dǎo)的時(shí)候,有時(shí)候看到一半不知道是怎么推出來的,其實(shí)主要是因?yàn)橐恍┣髮?dǎo)法則忘記了,唉~
所以這里把基礎(chǔ)的求導(dǎo)法則和公式貼出來~有些忘記的朋友可以先大概看一下:

推導(dǎo)過程

好了,這下正式開始~
首先,我們要明確一下我們要求什么,我們要求的是我們的loss對(duì)于神經(jīng)元輸出(z_i)的梯度,即:

根據(jù)復(fù)合函數(shù)求導(dǎo)法則:

有個(gè)人可能有疑問了,這里為什么是a_j而不是a_i,這里要看一下softmax的公式了,因?yàn)閟oftmax公式的特性,它的分母包含了所有神經(jīng)元的輸出,所以,對(duì)于不等于i的其他輸出里面,也包含著z_i,所有的a都要納入到計(jì)算范圍中,并且后面的計(jì)算可以看到需要分為i = j和i ≠ j兩種情況求導(dǎo)。
下面我們一個(gè)一個(gè)推:

第二個(gè)稍微復(fù)雜一點(diǎn),我們先把它分為兩種情況:

ok,接下來我們只需要把上面的組合起來:

最后的結(jié)果看起來簡(jiǎn)單了很多,最后,針對(duì)分類問題,我們給定的結(jié)果y_i最終只會(huì)有一個(gè)類別是1,其他類別都是0,因此,對(duì)于分類問題,這個(gè)梯度等于:


    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    欧美三级大黄片免费看| 日韩在线免费看中文字幕| 亚洲黄色在线观看免费高清| 成人欧美一区二区三区视频| 少妇熟女亚洲色图av天堂| 日韩在线视频精品视频| 久久99青青精品免费观看| 中文字幕日韩一区二区不卡 | 国产在线不卡中文字幕| 白白操白白在线免费观看| 日韩人妻毛片中文字幕| 欧美在线观看视频免费不卡| 国产对白老熟女正在播放| 91蜜臀精品一区二区三区| 欧洲日本亚洲一区二区| 国产成人精品视频一区二区三区| 欧美激情一区=区三区| 亚洲欧美视频欧美视频| 国产麻豆一区二区三区在| 欧美日韩在线视频一区| 国产又黄又猛又粗又爽的片| 国产又猛又大又长又粗| 日本免费熟女一区二区三区| 日韩美女偷拍视频久久| 免费大片黄在线观看日本| 国产又大又硬又粗又湿| 日韩三级黄色大片免费观看 | 婷婷开心五月亚洲综合| 四季av一区二区播放| 国产女同精品一区二区| 经典欧美熟女激情综合网| 欧美国产亚洲一区二区三区| 91人妻丝袜一区二区三区| 国产午夜福利片在线观看| 中文字幕亚洲人妻在线视频| 婷婷色国产精品视频一区| 黄色日韩欧美在线观看| 色婷婷亚洲精品综合网| 激情图日韩精品中文字幕| 国产情侣激情在线对白| 东京热加勒比一区二区三区|