簡(jiǎn)介 Genome Aggregation Database(簡(jiǎn)稱gnomAD)是由各國(guó)研究者聯(lián)合發(fā)展起來(lái)的基因組突變頻率數(shù)據(jù)庫(kù)。其目的是匯集和協(xié)調(diào)來(lái)自眾多大規(guī)模測(cè)序計(jì)劃的全外顯子組和全基因組測(cè)序數(shù)據(jù),為廣泛的科學(xué)研究團(tuán)體匯總數(shù)據(jù)。 該數(shù)據(jù)庫(kù)提供的數(shù)據(jù)集包括123,136個(gè)個(gè)體的全外顯子組測(cè)序數(shù)據(jù)和15,496個(gè)個(gè)體的全基因組測(cè)序數(shù)據(jù),這些數(shù)據(jù)來(lái)源于各種疾病研究項(xiàng)目及大型人群測(cè)序項(xiàng)目。 左側(cè)的圖表對(duì)1000Genomes、ESP、ExAC和gnomAD數(shù)據(jù)庫(kù)收集的人群分布及其數(shù)量進(jìn)行了比較統(tǒng)計(jì),不難發(fā)現(xiàn)gnomAD是目前最大的人群頻率數(shù)據(jù)庫(kù)。右表對(duì)gnomAD數(shù)據(jù)庫(kù)收錄的人種類型及測(cè)序數(shù)據(jù)進(jìn)行了分類統(tǒng)計(jì)。該數(shù)據(jù)庫(kù)所有的數(shù)據(jù)都可免費(fèi)下載。 數(shù)據(jù)庫(kù)使用 通過(guò)gnomAD瀏覽器,我們可以在搜索框中輸入自己感興趣的基因、變異或者區(qū)域進(jìn)行相關(guān)信息的查詢 例如以ACTN2基因進(jìn)行查詢: 可以獲取基因上每個(gè)位點(diǎn)的覆蓋信息圖,其中全基因組數(shù)據(jù)的測(cè)序深度用綠線表示,外顯子數(shù)據(jù)深度為藍(lán)色部分。變異注釋表格記錄了變異位點(diǎn),來(lái)源,注釋信息,變異flags,變異等位基因數(shù),等位基因總數(shù),等位基因頻率等信息。通過(guò)復(fù)選框我們也可以選擇特異的數(shù)據(jù)進(jìn)行展示,用戶可以選擇包括或排除SNPs、indels、外顯子組變異、基因組變異及被過(guò)濾掉的變異。 需要注意的是該數(shù)據(jù)庫(kù)展示的等位基因數(shù)默認(rèn)是只計(jì)數(shù)了高質(zhì)量的基因型,即通過(guò)了設(shè)定的閾值(GQ>=20,DP>=10,雜合基因型allele balance > 0.2)的,原始的等位基因數(shù)可通過(guò)AC_raw查看。另外在全基因組數(shù)據(jù)中沒(méi)有Y染色體的覆蓋度及變異信息提供,也無(wú)法通過(guò)該數(shù)據(jù)庫(kù)獲取每個(gè)測(cè)序個(gè)體的基因型信息。 數(shù)據(jù)下載 可通過(guò)鏈接http://gnomad./downloads 進(jìn)行全外顯子組,全基因組變異vcf文件及覆蓋度數(shù)據(jù)的下載。 Annovar中也于2017年3月11日更新了該數(shù)據(jù)庫(kù),可利用該軟件對(duì)gnomAD數(shù)據(jù)庫(kù)進(jìn)行下載注釋。 由于該數(shù)據(jù)庫(kù)去除了攜帶有嚴(yán)重兒童疾病的患者及其父母的基因組數(shù)據(jù),可以很好的應(yīng)用于單基因遺傳病人群頻率的查詢。對(duì)于評(píng)估罕見(jiàn)位點(diǎn)的致病性,如果某位點(diǎn)在該數(shù)據(jù)庫(kù)未見(jiàn)報(bào)道,則致病幾率增大。 gnomAD數(shù)據(jù)庫(kù)網(wǎng)址:http://gnomad./ 參考資料:https:///2017/02/27/the-genome-aggregation-database-gnomad/ 遺傳資源數(shù)據(jù)庫(kù)專題1.遺傳資源數(shù)據(jù)庫(kù)專題-1000genomes 2.遺傳資源數(shù)據(jù)庫(kù)專題-hapmap 4.遺傳資源數(shù)據(jù)庫(kù)專題-ESP6500 5.遺傳資源數(shù)據(jù)庫(kù)專題-UK10K |
|