一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

Linear Mixde Model:線性混合模型簡(jiǎn)介

 生信修煉手冊(cè) 2019-12-24

Linear Mixde Model, 簡(jiǎn)稱(chēng)LMM, 稱(chēng)之為線性混合模型。從名字也可以看出,這個(gè)模型和一般線性模型有著很深的淵源。

線性混合模型是在一般線性模型的基礎(chǔ)上擴(kuò)展而來(lái),在回歸公式中同時(shí)包含了以下兩種效應(yīng)

  1. fixed-effects, 固定效應(yīng)

  2. random efffects,隨機(jī)效應(yīng)

其名稱(chēng)中的混合一詞正是來(lái)源于此。一元簡(jiǎn)單線性模型的公式如下

其中X代表固定效應(yīng),ε表示隨機(jī)誤差,而線性混合模型的公式如下

相比簡(jiǎn)單線性模型,多出了Z這一項(xiàng),這一項(xiàng)稱(chēng)之為隨機(jī)效應(yīng)。當(dāng)然兩種模型的本質(zhì)并不是體現(xiàn)在回歸公式中自變量的多少,而在于自變量的類(lèi)別,在一般線性模型中,其自變量全部為固定效應(yīng)自變量,而線性混合模型中,除了固定效應(yīng)自變量外,還包含了隨機(jī)效應(yīng)自變量。

所以關(guān)鍵之處在于判定自變量的類(lèi)別,如果一個(gè)自變量的所有類(lèi)別在抽樣的數(shù)據(jù)集中全部包含,則將該變量作為固定效應(yīng),比如性別,只要抽樣的數(shù)據(jù)中同時(shí)包含了兩種性別,就可以將性別作為固定效應(yīng)自變量;如果一個(gè)自變量在抽樣的數(shù)據(jù)集中的結(jié)果只是從總體中隨機(jī)抽樣的結(jié)果,那么需要作為隨機(jī)效應(yīng)自變量。簡(jiǎn)而言之,如果抽樣數(shù)據(jù)集中的自變量可以包含該自變量的所有情況,則作為固定效應(yīng),如果只能代表總體的一部分,則作為隨機(jī)效應(yīng)。

在分析的時(shí)候,可以將自變量都作為固定效應(yīng)自變量,然后用一般線性模型來(lái)進(jìn)行處理,那么為何要引入隨機(jī)效應(yīng)自變量呢?

使用一般線性模型時(shí),是需要滿(mǎn)足以下3點(diǎn)假設(shè)的

  1. 正態(tài)性,因變量y符合正態(tài)分布

  2. 獨(dú)立性,不同類(lèi)別y的觀察值之間相互獨(dú)立,相關(guān)系數(shù)為零

  3. 方差齊性,不同類(lèi)別y的方差相等

以性別這個(gè)分類(lèi)變量為例,如果不同性別對(duì)應(yīng)的因變量值有明顯差異,也就說(shuō)我們常說(shuō)數(shù)據(jù)分層,那么就不滿(mǎn)足上述條件了。此時(shí)如果堅(jiān)持使用一般線性模型來(lái)擬合所有樣本,其參數(shù)估計(jì)值不在具有最小方差線性無(wú)偏性,回歸系數(shù)的標(biāo)準(zhǔn)誤差會(huì)被低估,利用回歸方程得到的估計(jì)值也會(huì)過(guò)高。

對(duì)于分層明顯的數(shù)據(jù),一種解決方案就是將不同的層分開(kāi)處理,比如性別分層,那么就將不同性別的數(shù)據(jù)分開(kāi),每一類(lèi)單獨(dú)處理,但是這要求每一類(lèi)包含的樣本數(shù)據(jù)量要夠多,而且分層因素的類(lèi)別也不能太多,太多了處理起來(lái)也很麻煩。另外一個(gè)解決方案就是更換模型,使用線性混合模型。

一般線性模型有3個(gè)前提條件,而線性混合模型只保留了其中的第一點(diǎn),即因變量要符合正態(tài)分布,對(duì)于獨(dú)立性和方差齊性不做要求,所以適用范圍更加廣泛。

在線性混合模型中,隨機(jī)效應(yīng)變量Z的參數(shù)向量Γ服從均值為0,方差為G的正態(tài)分布,即Γ ~ N(0, G), 隨機(jī)誤差ε服從均值為,方差為R的正態(tài)分布,即ε ~ N(0, R), 同時(shí)假定G和R沒(méi)有相關(guān)性,即Cov(G, R) = 0, 此時(shí)因變量Y的方差可以表示為

Var(Y) = ZGZ + R

在GCTA軟件中,其核心就是線性混合模型,將所有SNP作為自變量,然后通過(guò)上述公式來(lái)估算SNP遺傳力。

對(duì)于一般線性模型,可以通過(guò)最小二乘法或者最大似然法來(lái)估算其參數(shù),對(duì)于線性混合模型,常用的參數(shù)估方法為約束性最大似然法

restricted maximum likelihood

簡(jiǎn)稱(chēng)REML, 對(duì)于如下的混合模型

其中y是已知的,表示因變量的觀測(cè)值,β是未知的,表示固定效應(yīng)的參數(shù)向量,u是未知的,表示隨機(jī)效應(yīng)的參數(shù)向量,對(duì)于該方程的參數(shù)估計(jì),其實(shí)就是求解βu的值,公式如下

對(duì)于固定效應(yīng)β, 其估計(jì)值為最佳線性無(wú)偏估計(jì)

best linear unbiased estimates(BLUE)

對(duì)于隨機(jī)效應(yīng)u, 其估計(jì)值為最佳線性無(wú)偏預(yù)測(cè)

best linear unbiased predictors(BLUP)

線性混合模型只要求因變量服從正態(tài)分布,適用范圍廣,在遺傳統(tǒng)計(jì)學(xué)中廣泛使用。

·end·

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多

    国产人妻熟女高跟丝袜| 大屁股肥臀熟女一区二区视频| 日韩一级欧美一级久久| 高清国产日韩欧美熟女| 欧美精品亚洲精品日韩精品| 亚洲欧美国产精品一区二区| 精品国产日韩一区三区| 少妇肥臀一区二区三区| 一二区不卡不卡在线观看 | 日韩性生活视频免费在线观看 | 日本精品最新字幕视频播放| 儿媳妇的诱惑中文字幕| 欧美日韩中黄片免费看| 99久久国产亚洲综合精品| 国语对白刺激高潮在线视频| 国产免费操美女逼视频| 国产二级一级内射视频播放| 亚洲视频一区自拍偷拍另类| 日韩欧美一区二区久久婷婷| 欧美国产日韩变态另类在线看| 中文字幕在线区中文色| 91久久精品国产成人| 亚洲欧美日韩国产自拍| 亚洲欧美国产网爆精品| 日韩欧美亚洲综合在线| 中文字幕一区久久综合| 九九热视频网在线观看| 久久国产精品热爱视频| 久久国产亚洲精品成人| 亚洲精品成人午夜久久| 日本精品中文字幕人妻| 色综合伊人天天综合网中文| 青青操日老女人的穴穴| 亚洲高清中文字幕一区二三区| 中字幕一区二区三区久久蜜桃| 欧美一区二区三区视频区| 免费大片黄在线观看日本| 国产熟女一区二区精品视频| 欧美日韩亚洲精品在线观看| 国产精品蜜桃久久一区二区| 五月婷婷综合缴情六月|