以GEO芯片數(shù)據(jù)GSE14520為例:
首先從GEO下載GSE14520數(shù)據(jù):
從圖中可以看出共有488個(gè)樣本,我們選擇MINiML格式的數(shù)據(jù)(軟件只支持該格式),下載完:
然后我們將該文件導(dǎo)入到軟件中:
從圖...
工具下載鏈接:http://gap./tool/8/ 以GEO芯片數(shù)據(jù)GSE14520為例: 首先從GEO下載GSE14520數(shù)據(jù):
然后我們將該文件導(dǎo)入到軟件中: 從圖中可以看出,軟件將該文件解析出來兩個(gè)平臺(tái)的數(shù)據(jù)GPL571和GPL3921,樣本數(shù)與下載時(shí)頁(yè)面顯示一致,我們點(diǎn)擊導(dǎo)出樣本信息: 最終得到了SampleInfo.xls,打開文件看看如下: 從圖中可以看出我們成功的導(dǎo)出了樣本的臨床信息,主要表中的分號(hào),分號(hào)分割的是多次隨訪,有些樣本可能存在多次回訪,所以該信息我們使用分號(hào)分割 下面我們導(dǎo)出樣本數(shù)據(jù)矩陣,首先我們需要選擇導(dǎo)出來的矩陣中是探針形式的還是genesymbol等其他ID形式的: 如圖,我們選擇geneSymbol形式導(dǎo)出,下一步我們需要選擇導(dǎo)出的數(shù)據(jù)列,這個(gè)例子中只有兩列:Column1、Column2,從左側(cè)的表中我們可以知道Column2是數(shù)據(jù)列,所以在step2中選擇Column2,對(duì)于當(dāng)多個(gè)探針對(duì)應(yīng)一個(gè)基因是我們選擇其中位數(shù)代表該基因的表達(dá)值,當(dāng)然軟件提供了三種方式,都可以選擇,如下圖: 點(diǎn)擊導(dǎo)出數(shù)據(jù)矩陣:
|
|