2017-04-28 頁面很簡潔,左邊是癌癥類型,右邊選擇樣本類型,然后點檢索 選擇感興趣的數(shù)據(jù)類型,即可進行下載 其中選擇Clinical可以獲取相應(yīng)的臨床信息,點擊Clinical解析可以進行臨床信息解析。 解析完了之后,結(jié)果如下 導(dǎo)入EXCEL中結(jié)果如下 如果是RNA-seq的數(shù)據(jù),可以將ENSG_ID轉(zhuǎn)換成Gene_symbol,合并文件功能則能將多個數(shù)據(jù)整合成數(shù)據(jù)矩陣。 下面就TCGA數(shù)據(jù)庫下載下來的數(shù)據(jù)名稱作一個簡單的介紹,更多的信息可以到官網(wǎng)上查看(https://wiki.nci./display/TCGA/TCGA+barcode)。 上圖紅框中的數(shù)字是樣本類型,其中01-10是癌組織,11-19是正常組織。 有的時候我們下載的數(shù)據(jù)是這樣的 同樣的,01是癌組織,11是正常組織,在做進一步表達譜分析的時候,按照這個編號進行分組。 最后,關(guān)于TCGA數(shù)據(jù)庫,本宮說兩句。TCGA數(shù)據(jù)庫相對于其他公共數(shù)據(jù)庫(NCBI GEO數(shù)據(jù)庫、SRA數(shù)據(jù)庫、EBI-ArrayExpress數(shù)據(jù)庫等)有著明顯的優(yōu)勢:1、TCGA數(shù)據(jù)庫樣本量大,基本每種癌癥都超過100例樣本,這使得統(tǒng)計學(xué)意義更加顯著;2、組學(xué)豐富,TCGA數(shù)據(jù)庫對每個樣本都分別做了轉(zhuǎn)錄組(RNA-seq、基因芯片、小RNA-seq)、基因組(突變)、表觀組(甲基化)的分析;3、數(shù)據(jù)質(zhì)量高,背景誤差小;4、臨床信息完善。但TCGA也有它的缺點:疾病研究方向窄,只包括33種癌癥的研究,并且有些數(shù)據(jù)沒有公開。 網(wǎng)盤鏈接:http://pan.baidu.com/s/1sl34dC5 密碼:s0m6 |
|