GWAS十年鑒定了數(shù)千疾病和復(fù)雜性狀相關(guān)的遺傳變異,然而哪些基因是致病基因在很大程度上是未知的。本文介紹的是一種基于孟德爾隨機(jī)化實(shí)驗(yàn)的思想而設(shè)計(jì)的工具——SMR(Summary data-based Mendelian randomization analysis) GWAS研究投入了大量的人力物力和財(cái)力,得到了數(shù)量眾多的疾病/復(fù)雜性狀相關(guān)的位點(diǎn),而具體是哪些基因或DNA元件在疾病的發(fā)生發(fā)展中起作用仍未知。 原因:
探索歷程 有些人就提出了在信號(hào)最顯著的位點(diǎn)附近的基因更可能是致病基因~ 不幸的是,因?yàn)槿狈?duì)GWAS研究結(jié)果的全面的功能研究,這個(gè)假設(shè)并沒有被證實(shí)。 而最近的研究卻發(fā)現(xiàn),致病基因可能并不是最近的那個(gè)基因,如肥胖基因FTO對(duì)IRX和IR5的遠(yuǎn)程調(diào)控。 QTL研究的出現(xiàn),為如上的迷之尷尬提供了一個(gè)出口O(∩_∩)O~ 如果一個(gè)基因的表達(dá)量收到一個(gè)遺傳變異(SNP)的影響,那么這個(gè)SNP就叫做eQTL位點(diǎn),也就意味著,若不同的人在這個(gè)SNP上基因型不同(如AA,Aa, aa),那么他們的基因的表達(dá)也會(huì)有差異。然后,如果這個(gè)基因的表達(dá)量對(duì)一個(gè)性狀有影響的話,那么我們就會(huì)觀察到不同的人具有不同的表型。那么我們就觀察到了不同的基因型,具有不用的表型了。 GWAS的結(jié)果,告訴我們基因型和表型之間有相關(guān),然后QTL的分析告訴我們基因型和表達(dá)之間有關(guān)系,那么如果我們能確定這個(gè)基因的表達(dá)和表型之間有關(guān)系,我們就把這個(gè)過程走通了,就找到了目標(biāo)基因啦。 這就跟孟德爾隨機(jī)化實(shí)驗(yàn)的思路非常相似。孟德爾隨機(jī)化實(shí)驗(yàn)的思想是利用遺傳變異(如一個(gè)SNP)作為一個(gè)工具變量,來研究暴露因素(如基因表達(dá))和結(jié)果(如表型)之間的因果關(guān)系的方法,如下圖(通過證明 1 和 2 來推導(dǎo)除3) 小編看到了另外一篇非常優(yōu)秀的微信文章里面做了很好的解釋,感興趣的請(qǐng)移步【統(tǒng)計(jì)咨詢:如何設(shè)計(jì)好的研究?孟德爾隨機(jī)化!】 但是,問題又來了,孟德爾隨機(jī)化實(shí)驗(yàn)的統(tǒng)計(jì)效力與三個(gè)方面有關(guān):
那么根據(jù)我們對(duì)人類復(fù)雜性狀的了解,一個(gè)性狀被一個(gè)SNP解釋的變異數(shù)很小,一個(gè)SNP對(duì)基因表達(dá)的比例也很小,那么必須需要提供非常大的樣本量了。而在實(shí)踐過程中,研究某一表型的研究中既有基因型又有表達(dá)的數(shù)據(jù),且樣本量非常大的寥寥無幾,怎么辦怎么辦? 雖然我們沒有樣本量大的同一個(gè)樣本的數(shù)據(jù),但是我們有樣本量非常大的 summary-level 的數(shù)據(jù)啊,已經(jīng)有很多可以從公共數(shù)據(jù)庫下載的大樣本的GWAS數(shù)據(jù)了【詳見:GWAS Catlog】,QTL的數(shù)據(jù)也有【看來需要把已經(jīng)有的QTL的數(shù)據(jù)整理整理發(fā)個(gè)文章了】哦,那么我們是不是可以利用起來呢。 啰嗦了那么多,終于要說重點(diǎn)啦,本文的方法,SMR便是這么設(shè)計(jì)的~且該文章的方法可以用來區(qū)分如下三種去情況: Causality, Pleiotropy, 和 Linkage 作者為了驗(yàn)證該模型的可靠性,便將這一方法用于對(duì)五個(gè)復(fù)雜性狀的研究中,包括身高,BMI,BMI矯正后的腰臀比,類風(fēng)濕性關(guān)節(jié)炎和精神分裂癥,利用GWAS的結(jié)果和來自外周血的五千多人的樣本得到的eQTL數(shù)據(jù),來預(yù)測(cè)與這些性狀的致病基因。 通過使用SMR得了了289個(gè)基因,然后使用HEIDI方法區(qū)分 pleiotropy和linkage,剩下了104個(gè)基因,在這104個(gè)基因中有22個(gè)是之前沒有被報(bào)道的基因如表格所示。同時(shí)作者還進(jìn)行了組織特異性的評(píng)估,相關(guān)功能的評(píng)估。 該文章于2016年三月發(fā)在Nature genetics上。 SMR方法使用可以參考網(wǎng)址上的教程: http:///software/smr/ 作者:夏夢(mèng)馨 |
|