一個轉(zhuǎn)錄因子能同時控制多個基因的表達(dá),同時轉(zhuǎn)錄因子的功能作用也可能受多個調(diào)控因子的影響。Cistrome DB就是這樣的一個數(shù)據(jù)庫,可以展示轉(zhuǎn)錄因子的相關(guān)調(diào)控內(nèi)容。 Cistrome DB歷年樣本數(shù)據(jù)收錄情況 Cistrome DB總共收錄了30451人和26013小鼠的轉(zhuǎn)錄因子、組蛋白修飾和染色質(zhì)可及性樣本,可以說是目前最全面的研究ChIP-seq和DNase-seq的數(shù)據(jù)庫。Cistrome DB由哈佛大學(xué)劉小樂教授課題組創(chuàng)建(之前我們介紹過她的另一個數(shù)據(jù)庫:TIMER)。Cistrome DB提供檢索工具,通過關(guān)鍵詞檢索或物種、來源、因子類型、一步步限定搜索范圍,用戶可查看詳細(xì)的數(shù)據(jù)注釋、分析結(jié)果和單個數(shù)據(jù)集的詳細(xì)信息(數(shù)據(jù)的QC情況、motif分析結(jié)果、潛在的靶基因預(yù)測)、同時還可以在基因組瀏覽器中查看數(shù)據(jù)的分布及下載分析的結(jié)果文件。 Cistrome DB http:///db/#/ 學(xué)會使用cistrome,是每個研究轉(zhuǎn)錄因子路上的必備技能,所以接下來看看Cistrome DB有哪些功能吧。 01 Search 在這里我們可以搜索感興趣的實驗,細(xì)胞或組織。 如上,通過指定關(guān)鍵字,選擇相應(yīng)物種或生物來源以及要研究的因子類型。 搜索框下面下方會顯示搜索結(jié)果,這里展示的默認(rèn)(即使你什么都沒搜)的呈現(xiàn)results: 每個ChIP-seq和DNase-seq樣本都有一個唯一的數(shù)據(jù)集ID, Cistrome DB為每個數(shù)據(jù)集(包含手動管理的元數(shù)據(jù))進(jìn)行注釋,包括物種、因素、生物來源、發(fā)布時間和處理狀態(tài)。點擊單個數(shù)據(jù)集可獲取分析結(jié)果和質(zhì)控指標(biāo),點擊多個數(shù)據(jù)集可提取批量數(shù)據(jù)查看,選擇感興趣的數(shù)據(jù)集后我們可以將數(shù)據(jù)發(fā)送到genome browser(WashU Browse:、UCSC Browse)進(jìn)行聯(lián)合分析,如輔因子、染色質(zhì)調(diào)節(jié)因子與組蛋白修飾之間的關(guān)系等。 我們點擊任意一行數(shù)據(jù)集,下方都會自動更新結(jié)果說明,這里以第一個數(shù)據(jù)集為例,結(jié)果共兩部分: 第一部分是Inspector: ①可視化的WashU Browse: ②可視化的UCSC Browse: 第二部分是tools,分為:QCreports,QC motifs,Get top putative targets,Check a putative target。 ①質(zhì)控報告: ②motif分析: 可以單擊每個motif編號,查看詳細(xì)motif logo: ③預(yù)測靶點及TSS分布: ![]() ④檢測可能靶點: ![]() 02 Toolkit 這部分就是把我們重點介紹的內(nèi)容啦,這里可以檢索哪個因子調(diào)控了我們感興趣的基因,哪個因子結(jié)合在用戶的基因組區(qū)域或者和用戶的peak有顯著重疊。 使用方式和功能條件如下: (1)輸入基因名稱, 查看有哪些轉(zhuǎn)錄因子可能調(diào)控該基因; (2)輸入基因組區(qū)域,查看有哪些轉(zhuǎn)錄因子可能結(jié)合在該區(qū)域; (3)輸入peak結(jié)果,查看哪些轉(zhuǎn)錄因子的結(jié)果與你的輸入結(jié)果有明顯的overlap,可以用于轉(zhuǎn)錄因子的colocation分析。 這里我們重點介紹第一種:Toolkit從基因?qū)用婊卮稹癢hat factors regulate your gene of interest?” ![]() 以上面為例,輸入基因GAPDH顯示內(nèi)容如下(因為上面只輸入了一個基因,沒有具體到位置,所以有多個位置選擇): ![]() 這里我們選擇片段:chr12:6534516:6538370:NM_001289746:GAPDH,點擊continue,提供內(nèi)容如下。 表格: ![]() 圖表:形式①,可以選因子和生物來源: ![]() 橫坐標(biāo)表示調(diào)控潛勢(RP),縱坐標(biāo)表示不同的因子。 圖表:形式②: ![]() 上圖只展示前20(或更少)因子,Y軸表示樣品中總peak的重疊峰比,X軸表示不同的因子,x軸上的點表示相同的因子。 可以看到,在這個功能中,我們可輸入任意的蛋白質(zhì)編碼基因,Cistrome DB Toolkit會返回按照調(diào)控潛能排序好的轉(zhuǎn)錄因子列表,哪個因子結(jié)合在用戶的基因組區(qū)域或者和用戶的peak有顯著重疊。 03 Cistrome-GO Cistrome-GO是用于對轉(zhuǎn)錄因子ChIP-seq進(jìn)行功能富集分析的網(wǎng)絡(luò)服務(wù)。它有兩種工作模式。如果用戶同時提供了TF的ChIP-seq文件和差異表達(dá)分析文件(基于TF),則Cistrome-GO將基于兩種數(shù)據(jù)類型的整合執(zhí)行集成模式分析。如果我們僅上傳TF ChIP-seq文件,則Cistrome-GO將以單獨模式執(zhí)行分析。 ![]() 所以,你有轉(zhuǎn)錄因子ChIP-seq數(shù)據(jù),預(yù)測轉(zhuǎn)錄因子功能完全可以交給Cistrome-GO做。 總的來說,通過Cistrome DB ,可以直接關(guān)鍵詞搜索,也可以通過toolKit進(jìn)行可以檢索哪個因子調(diào)控了我們感興趣的基因、結(jié)合在該區(qū)域;輸入peak結(jié)果,查看哪些轉(zhuǎn)錄因子的結(jié)果與你的輸入結(jié)果有明顯的overlap,轉(zhuǎn)錄因子的colocation分析。Cistrome-GO還可以做轉(zhuǎn)錄因子ChIP-seq peak或者TF干擾表達(dá)的差異表達(dá)的功能富集分析,功能強(qiáng)大,下次可以用上。 Research: Zheng R, Wan C, Mei S, Qin Q, Wu Q, Sun H, Chen CH, Brown M, Zhang X, Meyer CA, Liu XS. Cistrome Data Browser: expanded datasets and new tools for gene regulatory analysis. Nucleic Acids Res, 2018 Nov 20. Doi: 10.1093/nar/gky1094 Mei S, Qin Q, Wu Q, Sun H, Zheng R, Zang C, Zhu M, Wu J, Shi X, Taing L, Liu T, Brown M, Meyer CA, Liu XS. Cistrome data browser: a data portal for ChIP-Seq and chromatin accessibility data in human and mouse. Nucleic Acids Res, 2017 Jan 4;45(D1):D658-D662. Doi: 10.1093/nar/gkw983 |
|