上次我們說到,一對兒男女朋友經(jīng)過相關(guān)性檢驗,發(fā)現(xiàn)相關(guān)性如此之好,達到了0.9后面還跟了好幾個9。數(shù)據(jù)告訴他倆,天生一對啊,強正相關(guān)??!好吧,結(jié)婚,生娃! 520來了,一頓放炮慶祝,熱鬧。 很快,娃要來了。預(yù)測下娃是大頭還是小頭,嗯,爸爸是小頭,那兒子的頭應(yīng)該是--- 回歸一下就知道。 今天我們說說簡單線性回歸。 直線回歸:是分析兩個變量間數(shù)量依存關(guān)系的統(tǒng)計分析方法。如果一個變量隨另一個變量的變化而變化,并且他們的變化呈直線趨勢,就可以用直線回歸方程來定量地描述他們之間的數(shù)量依存關(guān)系,這就是直線回歸分析。 相關(guān)關(guān)系是分析兩個變量間的相互關(guān)系,回歸分析用于分析一個變量對另一個變量的依賴關(guān)系。 直線回歸,簡單說數(shù)學(xué)模型就是一元一次方程,初中知識。自變量就是X,應(yīng)變量(因變量)就是Y。其實說到這里就沒啥多說的啦,畢竟這點數(shù)學(xué)知識大家都是有的。 這里面需要多說的一點是:一般是Y是正態(tài)總體的隨機變量,X可以精確測量,就是由老子估計兒子,這就是Ⅰ型回歸。如果X也服從正態(tài)分布,就是X和Y 可以互相估計,那就是Ⅱ型回歸。 由老子直接估計兒子頭大小的叫簡單線性回歸,要是加上老媽的頭大小,共同估計(多個自變量)就是多重線性回歸。 由老子的頭做出回歸直線,計算兒子的頭大小。兒子出生后,實際頭大小和計算值不一樣,那么計算值和實際測量值之間的差距就是殘差。殘差太大,就變成了離群值,需要找原因,是不是病了,或者研究一下隔壁老王。 那啥叫殘差過大呢?因為你估計的兒子頭大小是有置信區(qū)間的,也就是說有一個上下限,一般我們?nèi)?5%的置信區(qū)間。超過這個區(qū)間了,就是出問題的可能性太大了。 直線回歸的應(yīng)用條件:LINE 1、線性(linear),兩變量的變化關(guān)系呈直線趨勢; 2、獨立性(Independence),每個個體觀察值之間相互獨立; 3、正態(tài)性(Normal distribution)應(yīng)變量Y屬于正態(tài)隨機變量; 4、等方差性(Equal variance)Ⅰ型回歸要每個選定的X Y都有一個正態(tài)分布總體,并且方差相等。Ⅱ型回歸要求X Y服從雙變量正態(tài)分布。 直線回歸方程 β的統(tǒng)計學(xué)意義是X每變化一個單位,Y平均改變 β 個單位。且: 在這里輸入你的內(nèi)容,注意不要用退格鍵把所有文字刪除,請保留一個或者用鼠標選取后直接輸入,防止格式錯亂。 β>0 , 同向線性變化 Β<0 ,="">0> Β=0 , 無線性關(guān)系,但是不代表沒關(guān)系 回歸方程有統(tǒng)計學(xué)意義嗎? 在這里輸入你的內(nèi)容,注意不要用退格鍵把所有文字刪除,請保留一個或者用鼠標選取后直接輸入,防止格式錯亂。 因為抽樣誤差的原因,可能沒有關(guān)系的兩個數(shù)字計算出了有關(guān)系,為了不誤解隔壁老王,我們需要檢驗,這里是假設(shè)檢驗,可不是DNA檢驗啊。 假設(shè)檢驗兩個方面: 1 回歸模型是否成立:方差分析 2 總體回歸系數(shù)是否為零:t檢驗 這兩個方面在咱們醫(yī)研云(1rcloud.net)里面,計算回歸的時候就一起給出了,不用特別計算。 應(yīng)用直線回歸的注意事項: 1 直線回歸要有實際意義。就是說自變量X的取值不能隨便外延,要有道理。一般來說X與Y之間有因果關(guān)系,并且X取值范圍應(yīng)在合理范圍,不能隨便擴大。大頭兒子頭再大也不能比豬頭大。 2 注意隨機性。 3 一般現(xiàn)做散點圖,不滿足線性條件就不要回歸。 4 對離群值要反復(fù)核查,找到原因,以便修正或剔除。不是你的兒子不要隨便養(yǎng),避免將來悲劇。 5 回歸直線不能外延。自變量取值范圍內(nèi)的Y值稱為內(nèi)插,超過自變量取值范圍的Y值叫外延。沒有特殊情況不要外延。 結(jié)果報告: 在這里輸入你的內(nèi)容,注意不要用退格鍵把所有文字刪除,請保留一個或者用鼠標選取后直接輸入,防止格式錯亂。 簡單線性回歸分析通常需要報告以下內(nèi)容: 1 分析目的 2 擬合簡單線性回歸方程的估計方法 3 是否符合前提條件(LINE) 4 參數(shù)估計結(jié)果 5 模型的擬合優(yōu)度及假設(shè)檢驗 6 對結(jié)果的專業(yè)解釋 直線相關(guān)與回歸的區(qū)別: 1 資料要求不同(自己回憶下)。 2 統(tǒng)計意義不同。相關(guān)是伴隨關(guān)系,回歸是因果關(guān)系。 3 分析目的不同。相關(guān)研究的是密切程度,回歸是確定的定量關(guān)系。 |
|