一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

數(shù)據(jù)分析中常見(jiàn)的七種回歸分析以及R語(yǔ)言實(shí)現(xiàn)(五)

 勤悅軒 2017-11-27

套索回歸,這個(gè)回歸模型有些新穎,要寫個(gè)詳細(xì)的介紹預(yù)計(jì)要寫好長(zhǎng),受限于水平,就寫個(gè)普及文,所以這里就稍微簡(jiǎn)答的介紹一下;


為什么我們老說(shuō)多重共線性呢?那是,因?yàn)槲覀冊(cè)谘芯繑?shù)據(jù)的時(shí)候總會(huì)不行制止的泛起多維度的數(shù)據(jù),這時(shí)候高緯度的數(shù)據(jù)就會(huì)泛起多重共線性,變量選擇等;所以如何消除多重共線性確定最佳模型,是回歸分析的一個(gè)重點(diǎn),我們一般使用的最小二乘法預(yù)計(jì)在處置懲罰多重共線性上有太大的局限性或者說(shuō)讓人不滿意吧,第一個(gè)就是預(yù)測(cè)的精度,第二個(gè)就是模型解釋性;目前處置懲罰多重共線性的常用要領(lǐng)有幾個(gè):主身分回歸,嶺回歸,適應(yīng)性lasso回歸和偏最小二乘回歸等;


套索回歸模型和的作用和嶺回歸有些類似,都是為了淘汰自變量的多重共線性的影響的一種建模要領(lǐng);這個(gè)要領(lǐng)和嶺回歸差異的是,它在參數(shù)預(yù)計(jì)的同時(shí)能夠?qū)崿F(xiàn)自變量精簡(jiǎn)的預(yù)計(jì)要領(lǐng),其實(shí)質(zhì)就是加一定的約束條件,就是用模型的回歸系數(shù)的絕對(duì)值函數(shù)作為處罰(正則化項(xiàng))來(lái)壓縮模型系數(shù),使得一些回歸系數(shù)變小,將絕對(duì)值較小或者影響因子較小的自變量的回歸系數(shù)置為零,這樣做的結(jié)果和嶺回歸有些類似,就是犧牲了一定的預(yù)計(jì)偏差,但是能降低預(yù)測(cè)的方差從而提高預(yù)測(cè)的精準(zhǔn)性;


在使用套索回歸做預(yù)測(cè)的時(shí)候我們首先需要將數(shù)據(jù)集進(jìn)行中心尺度處置懲罰,這樣是為了消除差異的量綱帶來(lái)的其他影響;是自變量們滿足均值為零0,方差為1;


這里在一次引用一下嶺回歸的謝佳標(biāo)老師的代碼,有點(diǎn)欠美意思了,哈哈,各人自己腦補(bǔ)微信用手晤面流淚的心情;不外這次的話我加一點(diǎn)解釋給各人,否則不太悅目懂;



cement <- data.frame(X1 = c(7, 1, 11, 11, 7, 11, 3, 1, 2, 21, 1, 11, 10), X2 = c(26, 

    29, 56, 31, 52, 55, 71, 31, 54, 47, 40, 66, 68), X3 = c(6, 15, 8, 8, 6, 

    9, 17, 22, 18, 4, 23, 9, 8), X4 = c(60, 52, 20, 47, 33, 22, 6, 44, 22, 26, 

    34, 12, 12), Y = c(78.5, 74.3, 104.3, 87.6, 95.9, 109.2, 102.7, 72.5, 93.1, 

    115.9, 83.8, 113.3, 109.4))

cement

##    X1 X2 X3 X4     Y

## 1   7 26  6 60  78.5

## 2   1 29 15 52  74.3

## 3  11 56  8 20 104.3

## 4  11 31  8 47  87.6

## 5   7 52  6 33  95.9

## 6  11 55  9 22 109.2

## 7   3 71 17  6 102.7

## 8   1 31 22 44  72.5

## 9   2 54 18 22  93.1

## 10 21 47  4 26 115.9

## 11  1 40 23 34  83.8

## 12 11 66  9 12 113.3

## 13 10 68  8 12 109.4

lm.sol <- lm(Y ~ ., data = cement)

summary(lm.sol)

## 

## Call:

## lm(formula = Y ~ ., data = cement)

## 

## Residuals:

##    Min     1Q Median     3Q    Max 

## -3.175 -1.671  0.251  1.378  3.925 

## 

## Coefficients:

##             Estimate Std. Error t value Pr(>|t|)  

## (Intercept)   62.405     70.071    0.89    0.399  

## X1             1.551      0.745    2.08    0.071 .

## X2             0.510      0.724    0.70    0.501  

## X3             0.102      0.755    0.14    0.896  

## X4            -0.144      0.709   -0.20    0.844  

## ---

## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

## 

## Residual standard error: 2.45 on 8 degrees of freedom

## Multiple R-squared:  0.982,  Adjusted R-squared:  0.974 

## F-statistic:  111 on 4 and 8 DF,  p-value: 4.76e-07

# 從結(jié)果看,截距和自變量的相關(guān)系數(shù)均不顯著。

# 利用car包中的vif()函數(shù)檢察各自變量間的共線情況

library(car)

vif(lm.sol)#盤算方差膨脹因子

##     X1     X2     X3     X4 

##  38.50 254.42  46.87 282.51

# 從結(jié)果看,各自變量的VIF值都凌駕10,存在多重共線性,其中,X2與X4的VIF值均凌駕200.

plot(X2 ~ X4, col = "red", data = cement)



從上圖,可以知道x2,x4泛起線性漫衍;

library(lars)#這個(gè)是我們用套索回歸的包,該包還含有最小角回歸

## Loaded lars 1.2

x = as.matrix(cement[, 1:4])#將X轉(zhuǎn)換成矩陣

y = as.matrix(cement[, 5])#將Y轉(zhuǎn)換成矩陣

(laa = lars(x, y, type = "lar"))  #lars函數(shù)值只用于矩陣型數(shù)據(jù)

## 

## Call:

## lars(x = x, y = y, type = "lar")


這幅圖說(shuō)明了lasso回歸中系數(shù)隨著參數(shù)濱化而變化

## R-squared: 0.982 

## Sequence of LAR moves:

##      X4 X1 X2 X3

## Var   4  1  2  3

## Step  1  2  3  4

# 由此可見(jiàn),LASSO的變量選擇依次是X4,X1,X2,X3

plot(laa)  #繪出圖


#這里選擇模型有兩種要領(lǐng),一個(gè)是K折交織驗(yàn)證,cp值兩種要領(lǐng),這里用了CP,K折交織驗(yàn)證就是將數(shù)##據(jù)集分為K等份,k-1份用來(lái)擬合數(shù)據(jù),最后一份作為測(cè)試集,獲得擬合和測(cè)試集的均方誤差,做平均#,然后選擇均方誤差最小的那個(gè)模型;

#cp值統(tǒng)計(jì)量也是評(píng)價(jià)回歸的一個(gè)準(zhǔn)則:如果從k個(gè)自變量中選取P個(gè)加入回歸,則cp值



#SSE就是我們常說(shuō)的殘差平方和;

summary(laa)  #給出Cp值

## LARS/LAR

## Call: lars(x = x, y = y, type = "lar")

##   Df  Rss     Cp

## 0  1 2716 442.92

## 1  2 2219 361.95

## 2  3 1918 313.50

## 3  4   48   3.02

## 4  5   48   5.00

# 憑據(jù)課上對(duì)Cp寄義的解釋(權(quán)衡多重共線性,其值越小越好),我們?nèi)〉降?步,使得Cp值最小,也就是選擇X4,X1,X2這三個(gè)變量

 

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    老外那个很粗大做起来很爽| 久久精品亚洲精品一区| 丝袜破了有美女肉体免费观看| 91国内视频一区二区三区| 91福利视频日本免费看看| 香蕉久久夜色精品国产尤物| 色婷婷中文字幕在线视频| 日本免费一级黄色录像| 黑丝袜美女老师的小逼逼| 亚洲国产欧美精品久久| 久久99夜色精品噜噜亚洲av| 色丁香之五月婷婷开心| 国产精品午夜视频免费观看| 亚洲第一区二区三区女厕偷拍| 欧洲精品一区二区三区四区| 日本一二三区不卡免费| 五月天六月激情联盟网| 午夜精品一区二区三区国产| 激情内射亚洲一区二区三区| 在线日韩中文字幕一区| 精品日韩视频在线观看| 国产一区二区三区成人精品| 美女被草的视频在线观看| 精品日韩中文字幕视频在线| 国产精品欧美激情在线观看| 高清不卡视频在线观看| 少妇福利视频一区二区| 色好吊视频这里只有精| 五月天丁香婷婷狠狠爱| 丰满少妇被猛烈插入在线观看| 久久99这里只精品热在线| 亚洲av又爽又色又色| 中文字幕中文字幕在线十八区| 日韩在线免费看中文字幕| 中国少妇精品偷拍视频| 中文字幕日韩欧美亚洲午夜| 九七人妻一区二区三区| 91精品国产综合久久福利| 亚洲中文字幕在线视频频道| 久久精品国产亚洲av麻豆| 亚洲欧美中文字幕精品|