一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

Pytorch 中的 zero_grad 使用方法

 悅光陰 2022-12-23 發(fā)布于北京

Pytorch 為什么每一輪batch需要設(shè)置optimizer.zero_grad

 

根據(jù)pytorch中的backward()函數(shù)的計算,當(dāng)網(wǎng)絡(luò)參量進(jìn)行反饋時,梯度是被積累的而不是被替換掉;但是在每一個batch時毫無疑問并不需要將兩個batch的梯度混合起來累積,因此這里就需要每個batch設(shè)置一遍zero_grad 了。

其實(shí)這里還可以補(bǔ)充的一點(diǎn)是,如果不是每一個batch就清除掉原有的梯度,而是比如說兩個batch再清除掉梯度,這是一種變相提高batch_size的方法,對于計算機(jī)硬件不行,但是batch_size可能需要設(shè)高的領(lǐng)域比較適合,比如目標(biāo)檢測模型的訓(xùn)練。

關(guān)于這一點(diǎn)可以參考:https://discuss.pytorch.org/t/why-do-we-need-to-set-the-gradients-manually-to-zero-in-pytorch/4903/3

關(guān)于backward()的計算可以參考:https://discuss.pytorch.org/t/how-to-use-the-backward-functions-for-multiple-losses/1826/5
————————————————
版權(quán)聲明:本文為CSDN博主「xiaoxifei」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/xiaoxifei/article/details/83474724

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    久草精品视频精品视频精品| 国内女人精品一区二区三区| 妻子的新妈妈中文字幕| 欧美精品一区二区水蜜桃| 午夜精品一区二区三区国产| 亚洲国产香蕉视频在线观看| 亚洲午夜av一区二区| 一区二区在线激情视频| 亚洲天堂一区在线播放| 欧美视频在线观看一区| 欧美日韩国产黑人一区| 日韩欧美一区二区不卡看片 | 欧美午夜色视频国产精品| 亚洲国产精品一区二区毛片| 日韩精品日韩激情日韩综合| 欧美字幕一区二区三区| 日本一二三区不卡免费| 美女被后入福利在线观看| 久久精品国产亚洲av麻豆尤物| 国产视频在线一区二区| 亚洲天堂精品一区二区| 国产永久免费高清在线精品| 国产精品免费不卡视频| 亚洲午夜av一区二区| 久久青青草原中文字幕| 乱女午夜精品一区二区三区| 亚洲妇女作爱一区二区三区| 好吊妞视频这里有精品| 日韩欧美好看的剧情片免费| 国内外免费在线激情视频| 污污黄黄的成年亚洲毛片| 国产伦精品一区二区三区高清版| 69精品一区二区蜜桃视频| 亚洲综合香蕉在线视频| 午夜传媒视频免费在线观看| 国产又粗又猛又爽色噜噜| 日本女优一色一伦一区二区三区 | 国产一区欧美午夜福利| 午夜福利大片亚洲一区| 午夜精品黄片在线播放| 美女被后入福利在线观看|