導(dǎo)語 今天給同學(xué)們分享一篇調(diào)控基因+分型+甲基化的生信文章“Prognostic Value and Genome Signature of m6A/m5C Regulated Genes in Early-Stage Lung Adenocarcinoma”,這篇文章于2023年3月30日發(fā)表在 Int J Mol Sci期刊上,影響因子為5.6。 RNA修飾在癌癥的發(fā)展和進展中具有病理和預(yù)后意義,其中m6A和m5C是代表性的調(diào)節(jié)因子。這些RNA修飾可以通過調(diào)節(jié)基因表達(dá)對其他RNA的功能產(chǎn)生影響。因此,在本研究中,作者旨在探索m6A/m5C調(diào)節(jié)因子與早期肺腺癌(LUAD)之間的相關(guān)性。 1. 基于m6A/m5C相關(guān)基因的早期LUAD分子亞型鑒定 本研究使用TCGA-LUAD早期患者進行研究。根據(jù)37個m6A/m5C調(diào)控基因的mRNA表達(dá),采用無監(jiān)督聚類方法對早期LUAD患者進行亞型分析。作者選擇了兩個作為最佳的k值,將402名患者分為cluster1(N = 240)和cluster2(N = 162)(圖1A)。此外,在可視化PCA算法的結(jié)果時,作者發(fā)現(xiàn)聚類判別效果非常好,進一步證實了早期LUAD的兩個明顯不同的亞型。K-M生存分析顯示m6A/m5C相關(guān)聚類之間的OS存在顯著差異,cluster1的患者的OS明顯優(yōu)于cluster2的患者(log-rank檢驗p < 0.05)(圖1B)。兩個聚類中m6A/m5C相關(guān)基因的表達(dá)及其與臨床特征的相關(guān)性如圖1C所示。大多數(shù)基因在cluster2中高表達(dá),并且兩個聚類的性別和分期特征有顯著差異。此外,性別差異(p < 0.01)和生存狀態(tài)(p < 0.05) 在兩個早期LUAD亞型之間。 圖1 早期LUAD中m6A/m5C相關(guān)基因的共識聚類 2. 早期LUAD中m6A/m5C亞型的免疫微環(huán)境 文章鑒定了六種全癌癥的免疫亞型,包括C1(傷口愈合型)、C2(IFN-γ優(yōu)勢型)、C3(炎癥型)、C4(淋巴細(xì)胞減少型)、C5(免疫沉默型)和C6(TGF-β優(yōu)勢型)。進一步比較了兩個m6A/m5C亞型之間的免疫亞型特征,結(jié)果顯示cluster2中C1亞型的比例較高,而C3、C4和C6亞型的比例較低,這些亞型與預(yù)后不良相關(guān)(圖2A)。為了探索兩個m6A/m5C相關(guān)聚類之間的免疫特征差異,作者使用Estimate、MCPcounter和CIBERSORT算法分析了免疫細(xì)胞浸潤的異質(zhì)性。結(jié)果顯示兩組之間的免疫評分存在顯著差異。cluster1的免疫評分高于cluster2(p = 0.00061)。此外,cluster2的基質(zhì)評分低于cluster1(p = 0.01172,圖2B)。cluster1和cluster2之間的免疫細(xì)胞比例存在顯著差異。與cluster1相比,cluster2表現(xiàn)出T細(xì)胞、CD8+ T細(xì)胞、細(xì)胞毒性淋巴細(xì)胞、NK細(xì)胞、單核細(xì)胞系細(xì)胞、中性粒細(xì)胞、內(nèi)皮細(xì)胞、成纖維細(xì)胞以及巨噬細(xì)胞M0和M1的表達(dá)增加。此外,cluster2顯示出髓樣樹突狀細(xì)胞、T細(xì)胞CD4記憶靜止?fàn)顟B(tài)以及靜止?fàn)顟B(tài)肥大細(xì)胞的浸潤較低(圖2C、D)。如圖2E所示,cluster2表現(xiàn)出六個免疫檢查點基因的高表達(dá),表明存在免疫逃逸的趨勢。隨后,作者還探索了兩個亞型之間不同趨化因子基因的表達(dá)差異。在41個趨化因子中,有25個在兩個亞型之間顯示出統(tǒng)計學(xué)上的顯著差異,而18個趨化因子受體基因中的11個在兩個m6A/m5C相關(guān)亞型之間表達(dá)不同。有趣的是,大多數(shù)趨化因子和趨化因子受體基因在cluster2中的表達(dá)較高。細(xì)胞溶解活性(CYT)顯示cluster2中的CYT顯著高于cluster1。同時,作者研究了兩個亞型與主要組織相容性復(fù)合體和HLA家族基因之間的關(guān)系。14個主要組織相容性復(fù)合物和HLA家族基因的表達(dá)水平在cluster2中相對較高。 圖2 TCGA-LUAD早期階段的m6A/m5C亞型的免疫景觀 3. 早期肺腺癌患者的體細(xì)胞改變格局在不同亞型中的展示 通過TCGA早期LUAD數(shù)據(jù)集分析體細(xì)胞突變,并創(chuàng)建瀑布圖來描述2個聚類中前20個突變基因。在聚類1和聚類2中,最常見的突變基因分別是TP53和TTN。在這些體細(xì)胞突變中,有436個基因在2個聚類之間的突變頻率有顯著差異(p < 0.05)。此外,對于LUAD常見突變的致癌基因和抑癌基因,SMARCA4、ERBB4、CDKN2A、WNT10B、ROS1、TTN和TP53的突變頻率在聚類2中較高(圖3A,B)。聚類1的腫瘤突變負(fù)荷(TMB)低于聚類2(p = 0.00089)(圖3C)。在CNA方面,與聚類1相比,聚類2表達(dá)更多的CNA負(fù)擔(dān)、擴增和缺失(圖3D-F)。 圖3 m6A/m5C亞型的體細(xì)胞變異 突變標(biāo)識分析顯示,早期肺腺癌(LUAD)與三個標(biāo)識有關(guān)。標(biāo)識1與APOBEC胞嘧啶脫氨酶(COSMIC_13)有關(guān)。標(biāo)識2類似于DNA錯配修復(fù)(COSMIC_6),發(fā)生在微衛(wèi)星不穩(wěn)定的腫瘤中,并與DNA錯配修復(fù)的喪失有關(guān)。標(biāo)識3與吸煙有關(guān)(COSMIC_4)。兩個亞型之間的三個標(biāo)識的比例明顯不同。 4. 亞型之間的差異表達(dá)基因(DEGs)鑒定和功能分析 根據(jù) p < 0.05 和 |log2FC| > 1 的閾值,共篩選出1625個差異表達(dá)基因(DEGs)在cluster1和cluster2之間,其中51個基因上調(diào),1574個基因下調(diào)(圖4A)。此外,GO注釋分析顯示,DEGs富集在295個生物過程中,如核分裂和染色體分離,56個細(xì)胞組分中,包括染色體區(qū)域和緊湊染色體,以及22個分子功能,例如單鏈DNA解旋酶活性和DNA解旋酶活性(p.adjust < 0.05)。圖4C-E顯示了前15個注釋,GO注釋的原始分析統(tǒng)計數(shù)據(jù)列在表S4中。此外,KEGG富集分析顯示,DEGs參與了315個通路(p.adjust < 0.05),包括Fanconi貧血通路、p53信號通路、同源重組和其他與腫瘤相關(guān)的通路(圖4F)。 圖4 m6A/m5C亞型之間的差異分析和功能分析 為了確定2個m6A/m5C相關(guān)的亞型激活途徑之間的差異,作者使用MSigDB v7.5進行了GSVA分析,并發(fā)現(xiàn)這兩個亞型顯示出72個不同的途徑(p.adjust < 0.01)。詳細(xì)的GSVA富集結(jié)果如表S6所示。熱圖顯示,亞型1在腸道免疫網(wǎng)絡(luò)的iga產(chǎn)生、糖脂類代謝和合成神經(jīng)節(jié)系列等方面顯著富集,而亞型2在DNA復(fù)制、錯配修復(fù)、同源重組等方面富集(圖4B)。同時,GSEA分析證實了這兩個m6A/m5C亞型之間52個途徑的差異(p.adjust < 0.05)。 5. 鑒定 Cluster2 特定關(guān)鍵基因 作者發(fā)現(xiàn)在Dep map數(shù)據(jù)庫中,709個基因在LUAD細(xì)胞系的生存中起著重要作用。在這709個候選基因中,有78個在cluster2中表達(dá)相對較高(圖5A)。然后,作者根據(jù)這78個基因的表達(dá)情況探索了生存情況,生存分析顯示有9個基因(CCNA2、CDC6、RACGAP1、SGOL1、TICRR、RRM2、BUB1B、KIF23和CDK1)在TCGA和GEO數(shù)據(jù)庫(GSE72094和GSE50081)中具有預(yù)后意義。在早期LUAD患者中,這九個基因的高表達(dá)水平與TCGA-LUAD、GSE72094和GSE50081中的不良預(yù)后相關(guān)(圖5B)。此外,這九個基因與大多數(shù)m6A/m5C相關(guān)的調(diào)控基因呈顯著正相關(guān)。 圖5 早期LUAD預(yù)后標(biāo)志物的篩選 6. m6A/m5C相關(guān)預(yù)后模型的構(gòu)建 使用TCGA隊列中具有OS信息的早期LUAD患者建立了預(yù)測模型。通過LASSO-Cox回歸(圖6A、B)和多變量Cox分析(圖6C),從37個m6A/m5C相關(guān)調(diào)控基因中篩選出了最佳預(yù)后標(biāo)志物。最終,基于七個m6A/m5C相關(guān)調(diào)控基因(METTL3、NPLOC4、RBM15、YTHDF1、IGF2BP1、NSUN3和NSUN7)構(gòu)建了一個預(yù)后模型。 圖6 m6A/m5C相關(guān)預(yù)后模型的構(gòu)建 根據(jù)基因表達(dá)計算了每個樣本的風(fēng)險評分,并繪制了樣本的風(fēng)險評分分布(圖6D)。此外,為了評估七個m6A/m5C相關(guān)調(diào)控基因在蛋白質(zhì)水平上的表達(dá)情況,作者利用HPA數(shù)據(jù)庫獲取了免疫組化圖像。從圖S9可以直觀地看出,與正常組織相比,腫瘤組織中5個m6A/m5C相關(guān)調(diào)控基因的蛋白質(zhì)表達(dá)顯著增加。 根據(jù)風(fēng)險評分,TCGA數(shù)據(jù)集中的患者被分為高風(fēng)險組和低風(fēng)險組。對訓(xùn)練和測試數(shù)據(jù)集進行Kaplan-Meier(KM)生存分析,以評估m(xù)6A/m5C相關(guān)簽名評分的預(yù)測能力。在TCGA數(shù)據(jù)集中,高風(fēng)險患者的總生存期較低風(fēng)險患者差(p = 0.0049,圖7A)。在測試數(shù)據(jù)集(GSE72094和GSE50081)中也觀察到類似的結(jié)果(圖7C、E)。同時,時間依賴的AUC顯示m6A/m5C相關(guān)簽名評分在TCGA和GEO數(shù)據(jù)集中對早期LUAD患者的總生存期預(yù)測具有顯著意義。TCGA在預(yù)測1年、5年和10年預(yù)后的時間依賴AUC值分別為0.653、0.643和0.791(圖7B)。對于GSE72094的預(yù)測,1年、3年和5年的OS曲線下面積分別為0.667、0.611和0.736(圖7D)。此外,GSE50081中1年、3年和5年生存的時間依賴AUC值分別為0.620、0.628和0.605(圖7F)。 圖7 訓(xùn)練集和測試集中七個基因標(biāo)識的驗證 此外,分析了TCGA-LUAD數(shù)據(jù)集中配對腫瘤和正常樣本之間上述7個風(fēng)險基因的不同mRNA表達(dá),顯示早期LUAD中的表達(dá)明顯上調(diào)(圖8A)。為了進一步探索7個m6A/m5C調(diào)節(jié)基因的mRNA表達(dá)水平,利用16對LUAD的冷凍新鮮腫瘤組織和癌旁組織進行了qRT-PCR實驗。盡管這七個基因的表達(dá)在正常組織和腫瘤組織之間沒有顯著差異,但LUAD中的七個基因mRNA表達(dá)水平相對高于正常人肺細(xì)胞,這與TCGA結(jié)果一致(圖8B)。來自LUAD患者的16對腫瘤和正常樣本的RT-qPCR實驗的2?(??Ct)值此外,分析了TCGA-LUAD數(shù)據(jù)集中配對腫瘤和正常樣本之間上述7個風(fēng)險基因的不同mRNA表達(dá),顯示早期LUAD中的表達(dá)明顯上調(diào)(圖8A)。為了進一步探索7個m6A/m5C調(diào)節(jié)基因的mRNA表達(dá)水平,利用16對LUAD的冷凍新鮮腫瘤組織和癌旁組織進行了qRT-PCR實驗,引物序列如表1所示。盡管這七個基因的表達(dá)在正常組織和腫瘤組織之間沒有顯著差異,但LUAD中的七個基因mRNA表達(dá)水平相對高于正常人肺細(xì)胞,這與TCGA結(jié)果一致(圖8B)。 圖8 七種風(fēng)險基因的mRNA表達(dá) 總結(jié) m6A/m5C甲基化修飾可以調(diào)節(jié)早期LUAD中重要預(yù)后基因的表達(dá)和癌基因的改變。m6A/m5C調(diào)節(jié)的基因可能參與T細(xì)胞耗竭和信號轉(zhuǎn)導(dǎo)途徑的進展,如DNA復(fù)制和錯配修復(fù),這可能進一步導(dǎo)致早期LUAD的不良預(yù)后和進展。鑒于m6A/m5C調(diào)節(jié)基因的調(diào)節(jié)已被確定為早期LUAD的重要預(yù)后生物標(biāo)志物,研究能夠靶向m6A/m5C的治療藥物可能是一種有前景的方法。RNA修飾蛋白可能是理想的治療靶點,目前大多數(shù)酶都有生物結(jié)構(gòu),這使得藥物開發(fā)變得方便??傊?,m6A/m5C調(diào)節(jié)因子可能成為早期LUAD的潛在治療靶點和預(yù)測性生物標(biāo)志物,未來需要更多深入的臨床研究來驗證。 |
|