Linear Mixde Model, 簡(jiǎn)稱(chēng)LMM, 稱(chēng)之為線性混合模型。從名字也可以看出,這個(gè)模型和一般線性模型有著很深的淵源。 線性混合模型是在一般線性模型的基礎(chǔ)上擴(kuò)展而來(lái),在回歸公式中同時(shí)包含了以下兩種效應(yīng)
其名稱(chēng)中的 其中 相比簡(jiǎn)單線性模型,多出了 所以關(guān)鍵之處在于判定自變量的類(lèi)別,如果一個(gè)自變量的所有類(lèi)別在抽樣的數(shù)據(jù)集中全部包含,則將該變量作為固定效應(yīng),比如性別,只要抽樣的數(shù)據(jù)中同時(shí)包含了兩種性別,就可以將性別作為固定效應(yīng)自變量;如果一個(gè)自變量在抽樣的數(shù)據(jù)集中的結(jié)果只是從總體中隨機(jī)抽樣的結(jié)果,那么需要作為隨機(jī)效應(yīng)自變量。簡(jiǎn)而言之,如果抽樣數(shù)據(jù)集中的自變量可以包含該自變量的所有情況,則作為固定效應(yīng),如果只能代表總體的一部分,則作為隨機(jī)效應(yīng)。 在分析的時(shí)候,可以將自變量都作為固定效應(yīng)自變量,然后用一般線性模型來(lái)進(jìn)行處理,那么為何要引入隨機(jī)效應(yīng)自變量呢? 使用一般線性模型時(shí),是需要滿(mǎn)足以下3點(diǎn)假設(shè)的
以性別這個(gè)分類(lèi)變量為例,如果不同性別對(duì)應(yīng)的因變量值有明顯差異,也就說(shuō)我們常說(shuō)數(shù)據(jù)分層,那么就不滿(mǎn)足上述條件了。此時(shí)如果堅(jiān)持使用一般線性模型來(lái)擬合所有樣本,其參數(shù)估計(jì)值不在具有最小方差線性無(wú)偏性,回歸系數(shù)的標(biāo)準(zhǔn)誤差會(huì)被低估,利用回歸方程得到的估計(jì)值也會(huì)過(guò)高。 對(duì)于分層明顯的數(shù)據(jù),一種解決方案就是將不同的層分開(kāi)處理,比如性別分層,那么就將不同性別的數(shù)據(jù)分開(kāi),每一類(lèi)單獨(dú)處理,但是這要求每一類(lèi)包含的樣本數(shù)據(jù)量要夠多,而且分層因素的類(lèi)別也不能太多,太多了處理起來(lái)也很麻煩。另外一個(gè)解決方案就是更換模型,使用線性混合模型。 一般線性模型有3個(gè)前提條件,而線性混合模型只保留了其中的第一點(diǎn),即因變量要符合正態(tài)分布,對(duì)于獨(dú)立性和方差齊性不做要求,所以適用范圍更加廣泛。 在線性混合模型中,隨機(jī)效應(yīng)變量
在GCTA軟件中,其核心就是線性混合模型,將所有SNP作為自變量,然后通過(guò)上述公式來(lái)估算SNP遺傳力。 對(duì)于一般線性模型,可以通過(guò)最小二乘法或者最大似然法來(lái)估算其參數(shù),對(duì)于線性混合模型,常用的參數(shù)估方法為約束性最大似然法
簡(jiǎn)稱(chēng)REML, 對(duì)于如下的混合模型 其中y是已知的,表示因變量的觀測(cè)值, 對(duì)于固定效應(yīng)
對(duì)于隨機(jī)效應(yīng)
線性混合模型只要求因變量服從正態(tài)分布,適用范圍廣,在遺傳統(tǒng)計(jì)學(xué)中廣泛使用。 ·end· |
|
來(lái)自: 生信修煉手冊(cè) > 《待分類(lèi)》