一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

寫給初學(xué)者的LASSO回歸

 群先 2022-03-27
文章圖片1

LASSO回歸是對(duì)回歸算法正則化的一個(gè)例子。正則化是一種方法,它通過增加額外參數(shù)來解決過擬合問題,從而減少模型的參數(shù)、限制復(fù)雜度。正則化線性回歸最常用的三種方法是嶺回歸、最小絕對(duì)值收斂和選擇算子(LASSO)以及彈性網(wǎng)絡(luò)回歸。

在本文中,我將重點(diǎn)介紹LASSO,并且對(duì)嶺回歸和彈性網(wǎng)絡(luò)回歸做簡(jiǎn)單的擴(kuò)展。

假設(shè)我們想在一個(gè)數(shù)據(jù)集上建立一個(gè)正則化回歸模型,這個(gè)數(shù)據(jù)集包含n個(gè)觀察和m個(gè)特征。

LASSO回歸是一個(gè)L1懲罰模型,我們只需將L1范數(shù)添加到最小二乘的代價(jià)函數(shù)中:

文章圖片2

看這里

文章圖片3

通過增大超參數(shù)α的值,我們加強(qiáng)了模型的正則化強(qiáng)度,并降低了模型的權(quán)重。請(qǐng)注意,沒有把截距項(xiàng)w0正則化,還要注意α=0對(duì)應(yīng)于標(biāo)準(zhǔn)回歸。

通過調(diào)整正則化的強(qiáng)度,某些權(quán)重可以變?yōu)榱?,這使得LASSO方法成為一種非常強(qiáng)大的降維技巧。

LASSO算法

  • 對(duì)于給定的α,只需把代價(jià)函數(shù)最小化,即可找到權(quán)重或模型參數(shù)w。
  • 然后使用下面的等式計(jì)算w(不包括w0)的范數(shù):
文章圖片4

案例研究:使用游輪數(shù)據(jù)集預(yù)測(cè)船員人數(shù)

我們將使用郵輪數(shù)據(jù)集cruise_ship_info.csv來演示LASSO技術(shù)

本案例已經(jīng)發(fā)布在實(shí)驗(yàn)平臺(tái),請(qǐng)關(guān)注微信公眾號(hào):老齊教室。并回復(fù): #姓名+手機(jī)號(hào)+案例# 獲取。 注意: # 必須要有 。

1.導(dǎo)入必要的庫(kù)

import numpy as npimport pandas as pdimport matplotlib.pyplot as plt

2.讀取數(shù)據(jù)集并顯示列

df = pd.read_csv('cruise_ship_info.csv')df.head()
文章圖片5

3.選擇重要的變量

從《數(shù)據(jù)準(zhǔn)備和特征工程》中的有關(guān)闡述可知,協(xié)方差矩陣圖可用于特征選擇和降維。從前述數(shù)據(jù)集中發(fā)現(xiàn),在6個(gè)預(yù)測(cè)特征( ['age’, 'tonnage’, 'passengers’, 'length’, 'cabins’, 'passenger_density’] )中,如果我們假設(shè)重要特征與目標(biāo)變量的相關(guān)系數(shù)為0.6或更大,那么目標(biāo)變量“crew”與4個(gè)預(yù)測(cè)變量“tonnage”, “passengers”, “l(fā)ength, and “cabins”的相關(guān)性很強(qiáng)。因此,我們能夠?qū)⑻卣骺臻g的維數(shù)從6減少到4。

cols_selected = ['Tonnage', 'passengers', 'length', 'cabins','crew']df[cols_selected].head()
文章圖片6
X = df[cols_selected].iloc[:,0:4].values    # features matrix y = df[cols_selected]['crew'].values        # target variable

4. 實(shí)現(xiàn)LASSO回歸

a.將數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集

from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.4, random_state=0)

b.特征數(shù)據(jù)區(qū)間化

from sklearn.preprocessing import StandardScalersc_y = StandardScaler()sc_x = StandardScaler()y_std = sc_y.fit_transform(y_train[:, np.newaxis]).flatten()X_train_std = sc_x.fit_transform(X_train)X_test_std = sc_x.transform(X_test)y_train_std = sc_y.fit_transform(y_train[:, np.newaxis]).flatten()

c.實(shí)現(xiàn)LASSO回歸

from sklearn.linear_model import Lassofrom sklearn.metrics import r2_scorealpha = np.linspace(0.01,0.4,10)r2_train =[]r2_test =[]norm = []alpha = np.linspace(0.01,0.4,10)for i in range(10): lasso = Lasso(alpha = alpha[i]) lasso.fit(X_train_std,y_train_std) y_train_std = lasso.predict(X_train_std) y_test_std = lasso.predict(X_test_std) r2_train = np.append(r2_train, r2_score(y_train,sc_y.inverse_transform(y_train_std))) r2_test = np.append(r2_test, r2_score(y_test,sc_y.inverse_transform(y_test_std))) norm = np.append(norm,np.linalg.norm(lasso.coef_))

d.可視化結(jié)果

plt.figure(figsize=(8,6))plt.scatter(alpha,r2_train,label='r2_train')plt.plot(alpha,r2_train)plt.scatter(alpha,r2_test,label='r2_test')plt.plot(alpha,r2_test)plt.scatter(alpha,norm,label = 'norm')plt.plot(alpha,norm)plt.ylim(-0.1,1)plt.xlim(0,.43)plt.xlabel('alpha', size = 14)plt.ylabel('R2_score',size = 14)plt.legend()plt.show()
文章圖片7

我們觀察到,隨著正則化參數(shù)α的增加,回歸系數(shù)的范數(shù)變得越來越小。這意味著更多的回歸系數(shù)被強(qiáng)制為零,這會(huì)增加偏差(模型過度簡(jiǎn)化)。α保持較低值時(shí),比如α=0.1或更低時(shí),是偏差和方差的最佳平衡點(diǎn)。在決定使用哪種降維方法之前,應(yīng)將該方法與主成分分析法(PCA)進(jìn)行比較。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    国产又粗又长又大的视频| 亚洲五月婷婷中文字幕| 五月天丁香亚洲综合网| 伊人久久青草地综合婷婷| 熟妇久久人妻中文字幕| 亚洲熟女一区二区三四区| 久久精品国产亚洲av久按摩| 日韩欧美三级中文字幕| 亚洲最新中文字幕一区| 国产精品丝袜一二三区| 国产亚洲视频香蕉一区| 国产爆操白丝美女在线观看| 无套内射美女视频免费在线观看| 久久精品亚洲精品一区| 91人妻丝袜一区二区三区| 国产精品欧美一区二区三区不卡| 91日韩欧美中文字幕| 成人午夜激情免费在线| 欧美色欧美亚洲日在线| 一区二区在线激情视频| 精品人妻一区二区三区免费| 一二区中文字幕在线观看| 亚洲日本中文字幕视频在线观看 | 国产一区二区三区口爆在线| 日本熟妇五十一区二区三区| 深夜日本福利在线观看| 91精品日本在线视频| 日本欧美三级中文字幕| 中文字幕有码视频熟女| 国产日韩熟女中文字幕| 日韩中文无线码在线视频 | 五月综合婷婷在线伊人| 免费一区二区三区少妇| 亚洲精品成人福利在线| 黄色污污在线免费观看| 日韩特级黄片免费观看| 久久国产人妻一区二区免费| 日本人妻精品中文字幕不卡乱码| 99热中文字幕在线精品| 日韩毛片视频免费观看| 日韩成人中文字幕在线一区|