本文章18年7月發(fā)表于FrontiersinGenetics,當(dāng)年4分現(xiàn)在3.5分,屬于一個(gè)可以模仿的范疇,作為經(jīng)典套路學(xué)習(xí)很好。 文章基本思路是通過(guò)一系列的生物信息分析的方法挖掘胃癌預(yù)后相關(guān)的潛在標(biāo)志物,該研究的結(jié)果為進(jìn)一步研究診斷和預(yù)后生物標(biāo)志物以及促進(jìn)GC的分子靶向治療提供了一些指導(dǎo)意義。 Step1:數(shù)據(jù)篩選 通過(guò)調(diào)研GEO數(shù)據(jù)庫(kù)尋找合適研究的樣本集: GSE19826,GSE27342,GSE29272,GSE33335,GSE54129,GSE56807,GSE63089,GSE65801和GSE79973; 篩選標(biāo)準(zhǔn):(1)他們使用人胃組織樣本。 (2)他們包含病例對(duì)照組。 (3)它們含有至少十個(gè)樣品。 選取對(duì)應(yīng)TCGA的胃癌數(shù)據(jù):從癌癥基因組圖譜(TCGA)獲得含有375個(gè)GC樣品和32個(gè)匹配的癌旁樣品的RNA-Seq數(shù)據(jù) 數(shù)據(jù)展示如下: Step2:差異基因分析及合并 1、使用limma包對(duì)每個(gè)芯片數(shù)據(jù)集進(jìn)行差異分析,選擇閾值為|log2FC|≥1,P值<0.05且FDR<0.05。 2、使用RRA(RobustRankAggreg)包對(duì)這9套數(shù)據(jù)集的差異基因進(jìn)行合并,使用默認(rèn)參數(shù),共得到411個(gè)差異基因,包含234個(gè)下調(diào)基因和177個(gè)上調(diào)基因。 3、TCGARNA-Seq數(shù)據(jù)差異分析,使用R軟件包edgR,使用閾值為|log2FC|≥1,P值<0.05并且FDR<0.05,得到2219個(gè)下調(diào)基因和2404個(gè)上調(diào)基因。4、與GEO的差異數(shù)據(jù)集進(jìn)行合并取交集,共得到268個(gè)重疊DEG(149個(gè)下調(diào)基因和119個(gè)上調(diào)基因) Step3:差異基因富集分析 1、使用DAVID做GO富集分析 FDR<0.05 2、使用R軟件包c(diǎn)lusterProfiler做KEGG富集分析FDR<0.05 3、氣泡圖對(duì)結(jié)果進(jìn)行可視化 Step4:PPI網(wǎng)絡(luò)互作分析 1、將差異基因丟入到String數(shù)據(jù)中,選擇置信得分大于等于0.4作為閾值,得到差異基因的互作信息,共得到173 nodes and 711 interactions。 2、將互作信息導(dǎo)入到Cytoscope進(jìn)行網(wǎng)絡(luò)可視化,統(tǒng)計(jì)分析網(wǎng)絡(luò)的拓?fù)湫再|(zhì)(度和介數(shù)中心性),根據(jù)網(wǎng)絡(luò)的度和介數(shù)中心性來(lái)篩選hub gene,得到10個(gè)基因。 3、使用Cytoscope的mcode插件進(jìn)行網(wǎng)絡(luò)模塊挖掘(使用默認(rèn)參數(shù)),得到三個(gè)模塊,這三個(gè)模塊包含了10個(gè)hub基因中的九個(gè)。 4、對(duì)每個(gè)模塊進(jìn)行通路富集分析觀察這些模塊的功能來(lái)推測(cè)這9個(gè)hub 基因的功能 Step5:差異基因預(yù)后分析 1、選擇TCGA帶預(yù)后信息的368個(gè)樣本,匹配差異基因的表達(dá)譜進(jìn)行單因素生存分析,選擇閾值0.05,共得到44個(gè)預(yù)后相關(guān)的差異基因。 2、進(jìn)一步使用多因素回歸,對(duì)這些顯著的基因進(jìn)行多因素回歸分析,得到了9個(gè)基因。 Step6:高低風(fēng)險(xiǎn)組的表達(dá)差異分析 這篇文章解讀相對(duì)細(xì)致,作為一個(gè)標(biāo)準(zhǔn),如果不能獨(dú)立完成這樣一個(gè)分析流程,那么生信能力大約處于剛?cè)腴T(mén)或未進(jìn)階的狀態(tài),想要獨(dú)立完成以生物信息分析為主的課題是比較困難的。當(dāng)然困難歸困難,不代表不能做,現(xiàn)在有很多0代碼只用網(wǎng)站后者工具進(jìn)行數(shù)據(jù)分析的方法。 |
|
联系客服
微信扫码,添加客服企业微信
客服QQ:
1732698931联系电话:4000-999-276
客服工作时间9:00-18:00,晚上非工作时间,请在微信或QQ留言,第二天客服上班后会立即联系您。