預(yù)后模型是臨床研究的重要類型,但是要怎么才能玩出新意,發(fā)出高分了?生信路今天帶來(lái)了一篇機(jī)器學(xué)習(xí)大雜燴,主打一個(gè)分析的完整度,定能為你的科研工作提供新方向! 本報(bào)道由復(fù)旦大學(xué)馮建峰團(tuán)隊(duì)完成,作者開(kāi)發(fā)了一個(gè)基于血漿蛋白和臨床-人口學(xué)變量的帕金森病高風(fēng)險(xiǎn)預(yù)測(cè)模型,通過(guò)機(jī)器學(xué)習(xí)技術(shù)篩選關(guān)鍵蛋白,預(yù)測(cè)精準(zhǔn)度相當(dāng)高!更酷的是,他們不僅驗(yàn)證了模型的穩(wěn)定性,還發(fā)現(xiàn)這些蛋白質(zhì)在確診前10多年就開(kāi)始發(fā)生變化!是不是很棒?各位科研伙伴們趕緊看看,說(shuō)不定能給你的研究帶來(lái)全新啟發(fā)哦~(ps:模型數(shù)據(jù)和代碼也公開(kāi)啦,感興趣的不要錯(cuò)過(guò)?。?/span> 1.本文首次結(jié)合多種血漿蛋白與臨床-人口學(xué)變量,通過(guò)機(jī)器學(xué)習(xí)算法建立帕金森病高風(fēng)險(xiǎn)預(yù)測(cè)模型,顯著提升了預(yù)測(cè)準(zhǔn)確性; 2.通過(guò)使用PPMI數(shù)據(jù)集驗(yàn)證模型的穩(wěn)定性,證明了該模型在不同人群中具有良好的泛化能力; 3.研究發(fā)現(xiàn)某些關(guān)鍵蛋白質(zhì)在確診前10年以上已出現(xiàn)變化,提供了帕金森病的早期檢測(cè)機(jī)會(huì),有助于盡早干預(yù)并延緩疾病進(jìn)展; 4.本研究應(yīng)用LightGBM等多種機(jī)器學(xué)習(xí)算法篩選關(guān)鍵蛋白,采用前向選擇策略構(gòu)建最佳蛋白質(zhì)組合,極大提升了帕金森病的預(yù)測(cè)效果。想要發(fā)表高分SCI的小伙伴們也可以借鑒一下本文的研究思路哦~ (ps:機(jī)器學(xué)習(xí)還在發(fā)光發(fā)熱,而且數(shù)據(jù)還好搞!方法還很容易復(fù)現(xiàn),分析方法學(xué)到手,還愁發(fā)不了這么好的刊嘛!趕緊來(lái)和生信路一起試試呀~)。 定制生信分析 云服務(wù)器租賃 加微信備注99領(lǐng)取使用 l題目:利用血漿蛋白結(jié)合臨床人口統(tǒng)計(jì)學(xué)指標(biāo)預(yù)測(cè)未來(lái)帕金森氏癥 l雜志:Neurology l影響因子:IF=7.7 l發(fā)表時(shí)間:2024年4月 研究背景 帕金森?。≒D)是繼阿爾茨海默病之后第二常見(jiàn)的神經(jīng)退行性疾病,其早期非運(yùn)動(dòng)癥狀包括自主神經(jīng)功能障礙、抑郁、焦慮等,可能持續(xù)長(zhǎng)達(dá)二十年。由于PD早期神經(jīng)元損失不可逆,建立基于血液生物標(biāo)志物的預(yù)測(cè)模型至關(guān)重要。 數(shù)據(jù)來(lái)源 本研究的數(shù)據(jù)來(lái)源于兩個(gè)主要數(shù)據(jù)庫(kù):英國(guó)生物樣本庫(kù)(UK Biobank,UKB)和帕金森病進(jìn)展標(biāo)志物計(jì)劃(PPMI)。UKB提供了52,503名無(wú)帕金森病參與者的血漿蛋白質(zhì)數(shù)據(jù),用于模型構(gòu)建;PPMI則提供227名參與者的數(shù)據(jù),用于外部驗(yàn)證。 研究思路 本研究首先選取UKB隊(duì)列中52,503名無(wú)帕金森病參與者,使用血漿蛋白質(zhì)進(jìn)行分析,排除基線患病者。通過(guò)LightGBM等機(jī)器學(xué)習(xí)算法,篩選出重要蛋白質(zhì),并結(jié)合臨床-人口學(xué)變量,構(gòu)建帕金森病高風(fēng)險(xiǎn)預(yù)測(cè)模型。隨后,使用PPMI數(shù)據(jù)集進(jìn)行外部驗(yàn)證,分析15年內(nèi)的預(yù)測(cè)趨勢(shì),并通過(guò)時(shí)間序列回歸和Cox比例風(fēng)險(xiǎn)模型評(píng)估蛋白質(zhì)與帕金森病的關(guān)系(圖1)。 圖1 研究流程圖 主要結(jié)果 1.人群特征 本研究納入了52,503名無(wú)帕金森病的UKB參與者,其中54.0%為女性,93.7%為白人,基線時(shí)的中位年齡為58歲。經(jīng)過(guò)中位14年的隨訪,共識(shí)別出751例新發(fā)帕金森病病例,其中593例發(fā)生在10年內(nèi)。診斷為帕金森病的患者年齡較大,中位年齡為65歲,女性占比37.4%(表1)。 表1 英國(guó)生物樣本庫(kù)的參與者特征 2. 對(duì)未來(lái)PD風(fēng)險(xiǎn)的預(yù)測(cè) 本研究通過(guò)機(jī)器學(xué)習(xí)篩選出22種血漿蛋白作為帕金森病預(yù)測(cè)的關(guān)鍵標(biāo)志物,模型的AUC為0.800,APR為0.079。整合其他臨床變量后,最終模型的AUC提升至0.832,APR提升至0.140。關(guān)鍵蛋白質(zhì)如NfL、EDA2R等與帕金森病風(fēng)險(xiǎn)增加相關(guān),模型具備良好的預(yù)測(cè)能力和廣泛的適用性(圖2)。 圖2 預(yù)測(cè)器的預(yù)測(cè)性能和SHAP值 3. 將預(yù)測(cè)的PD風(fēng)險(xiǎn)分層分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組 本研究將參與者按照預(yù)測(cè)模型的最佳閾值0.017分為高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)組,結(jié)果顯示26.1%的參與者被歸為高風(fēng)險(xiǎn)組,其患帕金森病的風(fēng)險(xiǎn)顯著增加,HR為4.30(95% CI 3.53–5.22,p = 2.12 × 10?48)。PDRP模型能有效區(qū)分不同風(fēng)險(xiǎn)組,具有較高的預(yù)測(cè)準(zhǔn)確性(圖3)。 圖3 分層風(fēng)險(xiǎn)組的Kaplan-Meier圖 4. PPMI中的驗(yàn)證 通過(guò)PPMI數(shù)據(jù)對(duì)模型進(jìn)行了驗(yàn)證,227名參與者中72名已確診帕金森病,58名處于帕金森病前期。使用篩選出的蛋白質(zhì)面板并整合其他表型變量后,預(yù)測(cè)帕金森病前期的AUC提升至0.754,進(jìn)一步證明了模型的泛化性和準(zhǔn)確性(表2)。 表2 英國(guó)-生物樣本庫(kù)和PPMI的預(yù)測(cè)性能指標(biāo) 5. PDRP中預(yù)測(cè)因子的時(shí)間趨勢(shì) 研究顯示帕金森病患者在確診前12年,NfL水平開(kāi)始高于對(duì)照組,且持續(xù)升高。大多數(shù)其他蛋白質(zhì)水平低于對(duì)照組。EDA2R和LXN在確診前15年低于對(duì)照組,并在確診前10年和8年后分別開(kāi)始上升,WARS的趨勢(shì)相反。此外,肌酐在確診前9至5年間呈倒U型上升趨勢(shì)(圖4)。 圖4 PD診斷前預(yù)測(cè)因素的時(shí)間趨勢(shì) 文章小結(jié) 本研究通過(guò)結(jié)合多種血漿蛋白和易獲取的臨床-人口學(xué)變量,使用機(jī)器學(xué)習(xí)算法可有效識(shí)別帕金森病高風(fēng)險(xiǎn)人群。年齡、教育年限、腦外傷史等是顯著預(yù)測(cè)因子,血漿蛋白和肌酐水平的加入進(jìn)一步提升了預(yù)測(cè)精度。部分蛋白質(zhì)在確診前10年以上出現(xiàn)變化,提示早期檢測(cè)和干預(yù)有助于預(yù)防或延緩神經(jīng)退行性過(guò)程,為未來(lái)的預(yù)防和治療策略提供了機(jī)會(huì)。機(jī)器學(xué)習(xí)算法更優(yōu)秀,更準(zhǔn)確,更潮流,更高分!如果您計(jì)劃復(fù)現(xiàn)本研究或在數(shù)據(jù)分析上需要幫助,歡迎隨時(shí)聯(lián)系生信路!我們致力于為您的科研提供全方位支持,助您取得卓越成果。 生信路有話說(shuō) |
|
來(lái)自: 昵稱69125444 > 《UKB論文》