一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

gnomAD v2.1 更新后的最大人群測(cè)序數(shù)據(jù)庫(kù) 到底增強(qiáng)了什么

 生物_醫(yī)藥_科研 2018-12-25

gnomAD v2.1

更新后的最大人群測(cè)序數(shù)據(jù)庫(kù)

到底增強(qiáng)了什么

好的工具,讓復(fù)雜遺傳病易于被診斷

如果覺(jué)得內(nèi)容對(duì)您有用,歡迎分享

如果有不同觀點(diǎn)或建議,歡迎留言


0

為什么突然寫gnomAD?

看到題目一些小伙伴可能會(huì)有疑問(wèn)

“gnomAD v2.1不是出來(lái)兩個(gè)多月了嗎”

“我們?cè)缍贾懒耍瑸槭裁船F(xiàn)在才寫”

沒(méi)錯(cuò)

在10月中旬

The MacArthur lab就正式公布了

gnomAD v2.1的相關(guān)信息和數(shù)據(jù)


但在與一些做解讀的朋友溝通后卻發(fā)現(xiàn)

有不少人只把gnomAD當(dāng)作一個(gè)AF數(shù)據(jù)庫(kù)

其實(shí)gnomAD v2.1里

有許多非常有價(jià)值的數(shù)據(jù)

可以作為輔助解讀的信息

如果只是當(dāng)作AF數(shù)據(jù)庫(kù)使用

會(huì)浪費(fèi)很多寶貴資源


正文開始

說(shuō)到參考人群等位基因頻率數(shù)據(jù)庫(kù)

目前最受歡迎的

我說(shuō)是gnomAD

大家大概不會(huì)有意見(jiàn)吧

畢竟

這可是目前

數(shù)據(jù)量最大(樣本量141,456)

貢獻(xiàn)者最多(上百個(gè)組織參與)

數(shù)據(jù)最精細(xì)

(15個(gè)細(xì)分人種 + 五個(gè)表型類區(qū)分)

的公開數(shù)據(jù)庫(kù)了


gnomAD第一版

便有

123126個(gè)WES

15469個(gè)WGS數(shù)據(jù)

驚人的數(shù)據(jù)量

迅速碾壓其他數(shù)據(jù)庫(kù)


如今

gnomAD于今年10月又帶來(lái)了的

全面升級(jí)的v 2.1版本

更多的數(shù)據(jù)

更精細(xì)的數(shù)據(jù)分析

“絕對(duì)你是沒(méi)有玩過(guò)的船新版本”



但這么一個(gè)強(qiáng)大的數(shù)據(jù)庫(kù)

許多人只把他當(dāng)作一個(gè)allele頻率參考數(shù)據(jù)庫(kù)用

所以今天就介紹下

gnomAD v2.1的一些強(qiáng)大之處


1

重要更新內(nèi)容

更新后的gnomAD可不是簡(jiǎn)單的

計(jì)算了新增人群的等位基因頻率

其實(shí)做了非常多的流程和方法學(xué)的優(yōu)化

重要的更新有

改進(jìn)了基因的變異耐受性計(jì)算方法

改進(jìn)了樣本和變異質(zhì)控的標(biāo)準(zhǔn)

細(xì)化了歐洲和東亞人的人群分類

新增了以表型分類的頻率統(tǒng)計(jì)人群

增加了新的變異注釋內(nèi)容


2

解讀需要知道的內(nèi)容

改進(jìn)了基因的變異耐受性計(jì)算方法

評(píng)估基因變異耐受性

是判斷基因

對(duì)于人類功能重要性的一個(gè)重要參考

在gnomAD v2.1之前

基因的LOF變異耐受性由pLI計(jì)算

主要是通過(guò)

對(duì)loss-of-function變異出現(xiàn)頻率進(jìn)行判斷

現(xiàn)在由新方法

observed / expected score(oe)代替

主要為了解決pLI計(jì)算方法的一些缺陷

如無(wú)法區(qū)分由于樣本數(shù)量引起的pLI值異常

而通過(guò)oe值的CI區(qū)間就容易判斷

要注意的是

oe值和pLI的計(jì)算方式相反

即值越小耐受性越低


細(xì)化了歐洲和東亞人的人群分類

進(jìn)一步將歐洲和東亞人種做細(xì)化

歐洲人被細(xì)化成7個(gè)亞群體

東亞人被細(xì)化成3個(gè)亞群體

這些細(xì)化的亞群體

對(duì)于相應(yīng)人群的數(shù)據(jù)分析(人群control)

以及人種最大等位基因頻率的計(jì)算

提供了更多的信息

但遺憾的是依然沒(méi)有中國(guó)人群


新增了以表型分類的頻率統(tǒng)計(jì)人群

這是一個(gè)非常有價(jià)值的信息

根據(jù)表型種類

不分人種的做了頻率統(tǒng)計(jì)

例如

沒(méi)有神經(jīng)系統(tǒng)疾病的人群

不同項(xiàng)目的正常對(duì)照樣本

非TOPMed項(xiàng)目的樣本

(有heart, lung, blood,或sleep疾病的樣本)

這些細(xì)分的數(shù)據(jù)

可以更好的針對(duì)不同疾病提供信息

例如分析神經(jīng)類疾病時(shí)

更適合參考沒(méi)有神經(jīng)類疾病的數(shù)據(jù)


增加了新的變異注釋內(nèi)容

兩個(gè)非常有意義的改動(dòng):

改動(dòng)1

根據(jù)maximum credible population AF方法

通過(guò)考慮發(fā)病率和外顯率數(shù)據(jù)

對(duì)人群頻率做了修正

更好的適應(yīng)頻率過(guò)濾

舉個(gè)例子

假如一個(gè)變異對(duì)應(yīng)疾病的外顯率比較低

那么用0.05等硬性過(guò)濾

會(huì)漏掉潛在的致病變異

或者對(duì)應(yīng)疾病的發(fā)病率極低

用0.05等硬性過(guò)濾

會(huì)增加很多潛在的假陽(yáng)性數(shù)據(jù)


gnomAD根據(jù)疾病的已知

發(fā)病率/外顯率/最大致病變異攜帶率

根據(jù)上圖的公式計(jì)算了

正常變異的理論最低頻率(柏松Q95上限矯正)

當(dāng)過(guò)濾AF時(shí)

如果gnomAD提供了這個(gè)理論值

如上圖的0.01388(WES)

這時(shí)AF的過(guò)濾cutoff

可以從0.05改為0.01388


針對(duì)不同顯隱性疾病

例如LQTS或PKU

結(jié)合疾病的統(tǒng)計(jì)數(shù)據(jù)

對(duì)參考人群進(jìn)行AF矯正

更符合對(duì)應(yīng)疾病的遺傳學(xué)原理

同時(shí)使用ACMG指南對(duì)應(yīng)條目時(shí)

如PM2/BS1時(shí),證據(jù)性會(huì)更強(qiáng)


改動(dòng)2

對(duì)變異頻率做了年齡區(qū)分

這也是一個(gè)非常實(shí)用的數(shù)據(jù)

對(duì)于不同年齡段表現(xiàn)的疾病

尤其是對(duì)于晚發(fā)疾病

有非常大的參考意義

例如晚發(fā)型帕金森氏癥等疾病

在青年正常人群中的攜帶率

會(huì)高于老年正常人群

參考對(duì)應(yīng)發(fā)病年齡的數(shù)據(jù)

對(duì)疾病分析會(huì)更有參考意義


3

生信需要知道的內(nèi)容

改進(jìn)了樣本和變異質(zhì)控的標(biāo)準(zhǔn)

樣本指控的重點(diǎn)改進(jìn)是

增加了測(cè)序平臺(tái)區(qū)分

(減少方法學(xué)不同造成的差異)

祖源分析用新方法UMPD替換了PCA

(結(jié)果更準(zhǔn)確)

變異質(zhì)控的重點(diǎn)改進(jìn)是

改進(jìn)了變異過(guò)濾的random forest模型的特征

(結(jié)果更準(zhǔn)確)


其他一些改動(dòng)

例如AF的表示方式

從全大寫換成了正常方式

半合子計(jì)算的改動(dòng)等

由于篇幅原因

就不多做介紹了


4

個(gè)人建議

在使用gnomAD時(shí)

不要只關(guān)注人群頻率(AF)

gnomAD v2.1中的新增內(nèi)容

增加了許多非常有價(jià)值的數(shù)據(jù)和思路

利用好這些信息

才能更有效的進(jìn)行數(shù)據(jù)解讀


解讀的小伙伴們

解讀時(shí)獲得的信息越全面

越有可能發(fā)掘到與數(shù)據(jù)最相關(guān)的信息

不能只依賴hard filter

例如晚發(fā)疾病要參考對(duì)應(yīng)年齡的數(shù)據(jù)

做AF過(guò)濾時(shí)

要考慮對(duì)應(yīng)疾病的發(fā)病率/外顯率等等

只有通過(guò)參考更有效的信息

才能有效的進(jìn)行解讀決策


最后

特別感謝診斷大師群的

王玲姐和占輝兄的建議和指正


如果對(duì)文章內(nèi)容有評(píng)價(jià)或不同看法,

歡迎到行業(yè)大咖顧大夫創(chuàng)建的論壇中討論


NGS基因診斷率能力提高之路徑

多維度、多學(xué)科、多角度,合共同之力解決問(wèn)題。


『廣告時(shí)間』

bpvast(上海冪普智能科技有限公司)的基因檢測(cè)智能操作系統(tǒng)(g-TIES),是由多年單基因遺傳病領(lǐng)域的資深從業(yè)人士領(lǐng)銜,整合國(guó)內(nèi)最優(yōu)秀的生物信息學(xué)和生產(chǎn)運(yùn)營(yíng)管理團(tuán)隊(duì),并與業(yè)內(nèi)專家反復(fù)溝通交流,最終開發(fā)出的適合大規(guī)模應(yīng)用的單基因遺傳病檢測(cè)支持系統(tǒng)。詳細(xì)請(qǐng)見(jiàn):基因檢測(cè)智能操作系統(tǒng)(g-TIES)

上海瀚垚生物全國(guó)獨(dú)家代理,如有試用和購(gòu)買需要請(qǐng)聯(lián)系 info@56dna.cn,或在公眾號(hào)留言


上海瀚垚生物  (www.56dna.cn)

我們?yōu)槟峁﹥?yōu)質(zhì)的基因檢測(cè)服務(wù):

A、低成本即可獲得最高質(zhì)量的基因測(cè)序和數(shù)據(jù)解讀服務(wù),對(duì)于初期客戶,可以提供低成本的試錯(cuò)機(jī)會(huì),未來(lái)業(yè)務(wù)證明可以做大,可以無(wú)縫銜接到Turn key服務(wù)模塊。

B、團(tuán)隊(duì)多年從事遺傳類疾病檢測(cè)服務(wù),可以幫客戶完成最復(fù)雜的數(shù)據(jù)解讀環(huán)節(jié),客戶可以做到零參與或只參與審核。

C、快速的實(shí)驗(yàn)周期,大部分項(xiàng)目20個(gè)工作日可完成報(bào)告。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    日韩欧美综合中文字幕| 成人精品视频在线观看不卡| 欧美黑人在线一区二区| 男女午夜视频在线观看免费| 亚洲国产四季欧美一区| 国产一区二区精品丝袜| 九九热精品视频免费在线播放| 日韩免费国产91在线| 老司机精品一区二区三区| 亚洲男人天堂网在线视频| 欧美精品二区中文乱码字幕高清| 日韩精品第一区二区三区| 欧美有码黄片免费在线视频| 国产午夜免费在线视频| 亚洲熟女国产熟女二区三区| 午夜国产精品福利在线观看| 午夜国产精品国自产拍av | 麻豆视传媒短视频在线看| 91日韩欧美国产视频| 老司机精品视频免费入口| 欧美日韩亚洲精品内裤| 欧美午夜不卡在线观看| 久久天堂夜夜一本婷婷| 欧洲一区二区三区蜜桃| 国产成人综合亚洲欧美日韩 | 中文字幕中文字幕在线十八区| 国产精品欧美激情在线播放| 大尺度激情福利视频在线观看| 色好吊视频这里只有精| 又大又长又粗又黄国产| 国产视频在线一区二区| 欧美有码黄片免费在线视频| 麻豆蜜桃星空传媒在线观看| 亚洲一区二区三区精选| 久热久热精品视频在线观看| 亚洲一区二区三区一区| 视频在线播放你懂的一区| 91人人妻人人爽人人狠狠| 国产超薄黑色肉色丝袜| 日韩精品在线观看一区| 欧美小黄片在线一级观看|