一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

GBDT與XGBOOST串講

 InfoRich 2022-04-11

重磅干貨,第一時(shí)間送達(dá)

Image

最近,一直被GBDT和XGBOOST煩惱,產(chǎn)生了如下的問題,由此產(chǎn)生了這篇文章。
  • XGBOOST怎么生成一棵樹?

  • GBDT算法是什么?

  • GBDT與BT(提升樹)是一回事嗎?

本篇文章結(jié)構(gòu):

Image

Boosting Tree(提升樹)

提升樹是采用加法模型與前向分布算法進(jìn)行提升的,是基于殘差進(jìn)行訓(xùn)練的。提升樹分為回歸樹和二叉分類樹,對于分類問題就是分類樹(可以參考AdaBoost算法),對于回歸問題就是回歸樹。至于為什么叫“提升”樹?我的理解是因?yàn)槭?strong>加法模型,相加進(jìn)而為提升。
具體算法如下:

Image

其中2.a步是計(jì)算殘差,2.b步通過把2.a的殘差當(dāng)作標(biāo)簽,可以使用線性回歸的方法進(jìn)行擬合殘差。通過M次循環(huán)一共得到M+1顆樹,每個(gè)輸入數(shù)據(jù)X的結(jié)果,是M+1棵樹預(yù)測的結(jié)果之和。 

GB算法

當(dāng)提升樹的損失函數(shù)是平方損失和指數(shù)損失時(shí),每一步優(yōu)化很簡單;但是對于一般函數(shù),優(yōu)化不是非常簡單,因此采用梯度下降法進(jìn)行優(yōu)化。至于為什么是“梯度提升”,我的理解是首先基于當(dāng)前模型損失函數(shù)的負(fù)梯度信息進(jìn)行擬合形成新的弱分類器,然后根據(jù)殘差進(jìn)行尋找該新分類器的權(quán)重!由此,即為梯度提升!

具體算法如下:

Image

第4步,使用梯度作為標(biāo)簽進(jìn)行擬合新的一棵樹;第5步是基于殘差進(jìn)行得到新的一顆樹的權(quán)重,其中殘差來自于第i個(gè)數(shù)據(jù)的標(biāo)簽y與前m-1棵樹的差得到的。其中F(x)表示前幾棵樹的總的函數(shù)。

GBDT算法
 

有了上面的GB算法介紹,那么使用決策樹作為弱分類器的GB算法被稱為GBDT(Gradient Boosting Decision Tree)。一般采用CART得到?jīng)Q策樹,CART是采用基尼指數(shù)作為決策樹的損失增益函數(shù)?;嶂笖?shù)反應(yīng)了數(shù)據(jù)集D中任意兩個(gè)樣本不一致的概率。其基尼指數(shù)越高則數(shù)據(jù)集D的純度越高;純度越高正是決策樹每個(gè)葉子節(jié)點(diǎn)的類別越一致。信息熵和基尼指數(shù)都是《信息論》中的內(nèi)容。

XGBOOST
 

XGBOOST是GBDT算法的工程實(shí)現(xiàn),XGBOOST的公式推導(dǎo)采用二階泰勒公式的展開形式進(jìn)行推導(dǎo),使得每棵樹之間得變化更小,而且還使用了正則化項(xiàng),控制了每棵樹的復(fù)雜度,進(jìn)而防止過擬合。

公式推導(dǎo)也可以參見論文XGBoost: A Scalable Tree Boosting System

XGBOOST在生成一顆樹的時(shí)候,使用如下公式進(jìn)行左右分支。

Image

訓(xùn)練得到第M棵樹的損失函數(shù):   

Image

其實(shí)XGBOOST每一次分支采用的是貪心算法,對于決策說來說每次分支也是采用貪心算法,只不過每次進(jìn)行分支使用的損失函數(shù)不一樣。對于決策樹有基尼指數(shù)、信息熵等loss函數(shù)。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    黄片美女在线免费观看| 国产精品99一区二区三区| 精品精品国产自在久久高清| 丰满少妇被猛烈插入在线观看| 黄色三级日本在线观看| 正在播放国产又粗又长| 男人和女人干逼的视频| 91老熟妇嗷嗷叫太91| 亚洲视频在线观看免费中文字幕| 欧美日韩亚洲国产av| 蜜桃传媒视频麻豆第一区| 91久久精品中文内射| 男人大臿蕉香蕉大视频| 黄色av尤物白丝在线播放网址| 日韩三级黄色大片免费观看| 国产免费一区二区三区av大片| 丁香六月婷婷基地伊人| 能在线看的视频你懂的| 91人妻久久精品一区二区三区| 欧洲一级片一区二区三区| 国产三级视频不卡在线观看| 高清免费在线不卡视频| 国产欧美日韩视频91| 欧美日韩国产自拍亚洲| 欧美日韩亚洲国产av| 91欧美视频在线观看免费| 在线观看视频日韩成人| 99久久国产精品亚洲| 国产午夜福利片在线观看| 正在播放玩弄漂亮少妇高潮| 日本人妻的诱惑在线观看| 午夜福利精品视频视频| 亚洲国产av精品一区二区| 亚洲中文字幕剧情在线播放| 日韩中文字幕在线不卡一区| 国产91人妻精品一区二区三区| 老司机精品视频在线免费看| 亚洲熟妇av一区二区三区色堂| 最近的中文字幕一区二区| 91天堂素人精品系列全集| 国产亚洲欧美另类久久久 |