對于轉(zhuǎn)錄組數(shù)據(jù)而言,差異分析和富集分析是最核心的分析內(nèi)容之一,通過TCGAbiolinks可以輕松實現(xiàn)TCGA表達譜數(shù)據(jù)的下載,差異分析,富集分析等功能,以乳腺癌的基因表達譜為例,分析過程如下 1. 下載原始數(shù)據(jù)由于TCGA中乳腺癌的樣本很多,所以只挑選了部分樣本來測試,下載的過程如下 2. 差異分析詳細步驟如下
代碼如下 3. 富集分析代碼如下 可視化的結(jié)果如下所示 GO的3大類別加上kegg pathway共4個類別的數(shù)據(jù),對應(yīng)4張柱狀圖,每個柱狀圖展示的是FDR值最顯著的top10個條目,橫坐標(biāo)我-log10(FDR), 散點代表的是GeneRatio, 也稱之為enrich factor, 代表富集到該通路下的差異基因個數(shù)占該通路下所有基因總數(shù)的比例。 ·end· |
|