大家好,今天向大家分享的是2020年4月發(fā)表在Frontiers in Genetics (IF=3.517) 雜志上的一篇文獻《Novel Immune-Related Gene Signature for Risk Stratification and Prognosis of Survival in Lower-Grade Glioma》。文章基于TCGA數據庫和CGGA數據庫中的腦膠質瘤相關數據,利用單因素、多因素Cox回歸分析及Lasso算法構建了六個免疫相關基因簽名(gene signature,或者叫標記基因),并建立了預后諾模圖,可有效地進行風險分層和預測原發(fā)性LGG的整體生存。 免疫微環(huán)境已被確定在腫瘤生物學中起著至關重要的作用,近來,許多有希望的臨床前和臨床免疫治療方法,包括免疫檢查點抑制劑,主動或被動免疫治療以及基因治療,都得到了應用。因此,腫瘤微環(huán)境中免疫成分的分子譜在用作預后生物標志物方面具有巨大價值。低級神經膠質瘤(LGG)構成中樞神經系統的普遍原發(fā)性惡性腫瘤,從生物學行為上表現出極大的內在異質性。盡管人們?yōu)楦纳婆R床結果付出了巨大的努力,但隨著時間的流逝,仍有超過一半的LGG病例演變?yōu)槟椭委煹母叨惹忠u性膠質瘤。因此,必須確定LGG的新的預后因素。 1) 從TCGA數據庫獲取低級神經膠質瘤患者的RNA-seq數據,臨床信息數據 2) 從GTEx數據庫收集低級神經膠質瘤患者正常組織中的RNA-seq數據 3) 從ImmPort數據庫獲取免疫相關基因(IRGs)的完整列表 4) 從CGGA數據庫獲取低級神經膠質瘤患者的RNA-seq數據,臨床信息數據 膠質瘤數據集的準備 本研究中總共916名符合納入標準的患者,包括來自TCGA數據庫的432例原發(fā)性LGG患者,來自CGGA數據庫的353例原發(fā)性LGG患者和來自CGGA數據庫的131例復發(fā)性LGG患者。來自這兩個數據庫的患者的臨床病理特征如表1。 差異表達及免疫相關基因鑒定 與非腫瘤組織相比,共鑒定了5,490個DEGs,其中包括2,718個上調基因和2,772個下調基因。在這些DEGs中共提取了277個差異表達的IRGs(圖1A)。熱圖證明了六個差異表達的免疫相關風險基因(圖1B)。 免疫相關基因風險評分的開發(fā) 基于單變量Cox回歸模型(P<0.05),共發(fā)現36個IRGs與OS顯著相關。森林圖表明,有29個IRGs是危險因素,而7個IRGs是保護因素(圖2)。 在36個IRGs中利用Lasso回歸算法篩選出了11個最重要的IRGs,之后通過多因素Cox回歸分析確定了6個預后標記IRGs(CANX、HSPA1B、KLRC2、PSMC6、RFXAP、TAP1) ,以建立原發(fā)性LGG中IRGs衍生的風險特征。風險評分公式如下: 其中,k,βi,S i分別代表簽名基因的數目,風險系數和基因表達水平。 根據評分結果可將患者分為低(風險評分<1.28)和高風險(風險評分≥1.28)組。 風險評分的評估 作者將TCGA數據庫中的342例原發(fā)性LGG患者納入生存分析。Kaplan-Meier生存分析表明低風險評分患者的生存時間顯著長于高風險評分患者的生存時間(圖3A)。ROC分析(AUC=0.914)表明風險評分在該診斷的功效中起著重要作用(圖3B)。通過熱圖發(fā)現高風險患者傾向于高表達危險基因,低風險患者傾向于高表達保護基因(圖3C)。風險圖顯示患者的死亡率隨著風險評分的增加而增加(圖3D)。 預后預測模型的建立 作者將TCGA數據集中的432名原發(fā)性LGG患者以7:3的比例隨機分為訓練和測試組。為了評估免疫相關基因的獨立預后能力,作者應用了單變量和多變量Cox比例風險回歸模型(圖4A,B)。然后,在諾模圖中可視化風險評分,年齡,性別,等級,放療,化學療法和IDH狀態(tài),預測3年和5年OS(圖4C)。諾模圖的ROC分析(AUC=0.88)表明其在患者預后方面具有出色的能力(圖4D)。諾模圖校準圖顯示出預測值和觀察值之間的令人滿意的一致性(圖4E,F)。這些結果表明,諾模圖在預測LGG患者的3年或5年生存率方面具有良好的準確性。 內部驗證和外部驗證 接下來,作者利用TCGA數據集中128例原發(fā)性LGG患者進行內部驗證(圖5),此外作者還利用CGGA數據集中353例原發(fā)性LGG患者進行外部驗證(圖6),內部、外部驗證均表明先前建立的諾模圖在預測LGG患者的3年或5年生存率方面具有良好的準確性。 預后模型在復發(fā)性LGG中的應用 為了研究該模型在復發(fā)LGG患者中的可行性,作者使用相同的公式計算131例復發(fā)性LGG患者的風險評分,結果發(fā)現在Kaplan-Meier生存曲線上得出的結果與原發(fā)LGG觀察到的結果相似,但是ROC結果分析顯示該模型在復發(fā)性LGG的預后能力較差。 風險評分與臨床病理參數之間的關聯 作者還分析了LGG中六基因標記與臨床病理參數(年齡,性別,等級,放療,化療和IDH突變狀態(tài))之間的關系。結果發(fā)現在原發(fā)性LGG中,III級、IDH野生型和老年患者的風險評分高于II級、IDH突變和年輕患者,但是,在復發(fā)的LGG中,IDH野生和突變組之間沒有發(fā)現顯著差異。 風險評分與腫瘤浸潤免疫細胞的相關性 作者基于CIBERSORTx算法分析了風險評分與浸潤性免疫細胞的相關性,結果發(fā)現22種浸潤免疫細胞的豐度明顯不同(圖7A,B),同時作者在TIMER數據庫中驗證了免疫細胞的豐度差異(圖7C)。為了進一步研究浸潤性免疫細胞的預后價值,作者應用了單變量Cox比例風險回歸模型,發(fā)現Treg細胞,嗜中性粒細胞和M2型巨噬細胞與不良的生存結果顯著相關,而巨噬細胞M1和激活的DC細胞是原發(fā)性LGG的保護因素(圖7D)。 預后免疫相關基因的mRNA和蛋白質水平驗證 最后,作者在CCLE數據庫(https://portals./ccle)中驗證了預后模型中六個免疫相關基因的mRNA表達水平,同。時在人類蛋白質圖譜數據庫(http://www./)中驗證了這些基因的蛋白質表達水平。CANX,HSPA1B,PSMC6和TAP1在膠質瘤中高表達, KLRC2低表達(圖8) 在這項研究中,作者證明了基于六種免疫相關基因的風險特征可能在風險分層中有效,并且可以作為原發(fā)性LGG患者總體生存的獨立預后因素。本文聚焦于免疫相關基因與腦膠質瘤的相關研究,重點討論特定生物學功能的基因在腦膠質瘤預后中的作用,研究內容非常豐富,基于TCGA及CCGA公共數據庫,通過Cox回歸分析及LASSO算法構建了腦膠質瘤預后預測模型,之后又利用內部和外部數據對模型進行了驗證,說服性很強。相比于同類型的文章,本文的研究內容顯然是非常豐富的,并且具有非常實用的臨床意義。小編個人認為,本文分析方法選用合理,分析思路清晰,這篇文章的水平應該不只是局限在3分左右,如果你對這種分析思路有興趣,完全可以考慮沖刺5+的文章。好了,最后再一起回顧一下本文的分析流程吧!希望對你有所幫助! 更多科研新鮮資訊、文獻精讀和生物信息技能 |
|
來自: 昵稱30384704 > 《待分類》