【原 】 《Science》子刊:監(jiān)督學(xué)習(xí)模型預(yù)測(cè)蛋白質(zhì)對(duì)碳納米管的吸附
工程納米顆粒,在生物技術(shù)應(yīng)用中具有優(yōu)勢(shì),包括生物分子傳感和傳遞。然而,在生物系統(tǒng)中測(cè)試納米技術(shù)的兼容性和功能需要一種啟發(fā)式的方法,但不可預(yù)測(cè)的蛋白質(zhì)冠形成阻礙了它們的有效實(shí)施。 在此,來(lái)自美國(guó)加州大學(xué)伯克利分校的Markita P. Landry等研究者,利用質(zhì)譜數(shù)據(jù)開(kāi)發(fā)了一個(gè)隨機(jī)森林分類器,用于識(shí)別僅基于蛋白質(zhì)序列(78%準(zhǔn)確率,70%精確性)吸附在納米顆粒上的蛋白質(zhì)。相關(guān)論文以題為“Supervised learning model predicts protein adsorption to carbon nanotubes”發(fā)表在Science Advances上。 https://www./doi/10.1126/sciadv.abm0898
設(shè)計(jì)優(yōu)異的納米顆粒,可以改變?nèi)藗冞M(jìn)行生物傳感、成像和傳遞的方式:納米材料,可以在其他不可接近的生物環(huán)境中進(jìn)行定位,并顯示出高度可調(diào)的物理化學(xué)特性,以定制功能。 模式識(shí)別技術(shù),包括機(jī)器學(xué)習(xí)技術(shù),提供了一條以高通量的方式描述蛋白質(zhì)-納米顆粒相互作用的途徑,這種方式貫穿了納米顆粒在不同生物系統(tǒng)中應(yīng)用的廣泛設(shè)計(jì)空間。 先前的工作開(kāi)創(chuàng)了這一想法,應(yīng)用隨機(jī)森林分類來(lái)預(yù)測(cè)在生物相關(guān)環(huán)境中吸附到銀納米粒子的蛋白質(zhì),并已擴(kuò)展到更大的納米粒子庫(kù)。 然而,某些方面還有待改進(jìn),比如設(shè)置一個(gè)蛋白質(zhì)被歸類為冠內(nèi)或冠外的閾值,以及更廣泛地將這些策略應(yīng)用到非球形納米顆粒上。 在此,研究者開(kāi)發(fā)了一個(gè)分類器來(lái)研究蛋白質(zhì)的氨基酸序列和蛋白質(zhì)與碳納米管的結(jié)合傾向之間的關(guān)系。研究者的目的有兩個(gè):其中之一,是預(yù)測(cè)在生物環(huán)境中蛋白質(zhì)與SWCNT的相互作用。這些知識(shí),將為納米顆粒的有效生物應(yīng)用,提供抗生物污染策略的實(shí)施。研究者的第二個(gè)目標(biāo):是預(yù)測(cè)SWCNTs的高親和力蛋白結(jié)合物以及與這種結(jié)合親和力相關(guān)的蛋白特征,以改善蛋白質(zhì)-納米顆粒結(jié)構(gòu)設(shè)計(jì)的過(guò)程。 為此,研究者構(gòu)建并優(yōu)化了一個(gè)用于SWCNTs上蛋白質(zhì)吸附的隨機(jī)森林分類器(RFC)。研究者將蛋白質(zhì)特性(源自蛋白質(zhì)序列數(shù)據(jù))與SWCNTs上的蛋白質(zhì)是否處于冠狀相(通過(guò)定量質(zhì)譜蛋白質(zhì)組學(xué)實(shí)驗(yàn)確定)之間聯(lián)系起來(lái)。具體而言,由于(GT)15 -SWCNTs已被證明可用于多巴胺感知,研究者重點(diǎn)研究了其蛋白冠的形成;然而,工作流可推廣到其他納米顆粒,正如研究者簡(jiǎn)要地演示了聚苯乙烯納米顆粒(PNPs)。研究者使用基于MS的蛋白質(zhì)組學(xué)數(shù)據(jù),來(lái)訓(xùn)練他們的分類器,這些數(shù)據(jù)表征了(GT)15-SWCNTs在兩種相關(guān)生物環(huán)境中形成的冠狀結(jié)構(gòu):靜脈環(huán)境(血漿)和腦環(huán)境(腦脊液(CSF))。研究者發(fā)現(xiàn),他們的分類器可以精確地針對(duì)吸附在納米顆粒上的少量蛋白質(zhì)。此外,研究者確定了最重要的蛋白質(zhì)特性之間的種群分布變化,以洞察他們的分類器如何區(qū)分積極的目標(biāo)。
圖1 測(cè)定(GT)15 -SACNTS冠相內(nèi)與冠相外蛋白質(zhì)的RFC流程和開(kāi)發(fā)。
圖2 分類器的性能結(jié)果在不同的生物流體訓(xùn)練數(shù)據(jù)集和不同的蛋白質(zhì)特征輸入。
圖3 在(GT)15 -SACNTS上,冠相外蛋白(紅色)與冠相外蛋白(藍(lán)色)的前4個(gè)歸一化特征值的分布。
圖4 預(yù)測(cè)蛋白與(GT)15 -SACNTS結(jié)合的蛋白冠動(dòng)力學(xué)。 綜上所述,研究者應(yīng)用監(jiān)督學(xué)習(xí)方法,開(kāi)發(fā)了一個(gè)分類器來(lái)預(yù)測(cè)ssDNA功能化SWCNTs上的蛋白質(zhì)吸附,準(zhǔn)確率為78%,AUC為76%,精密度為70%,召回率為65%。研究者擴(kuò)展了之前預(yù)測(cè)蛋白質(zhì)冠的工作,通過(guò)(i)利用定量蛋白質(zhì)冠數(shù)據(jù),(ii)重新定義冠閾值,與相應(yīng)的預(yù)測(cè)概率,(iii)建立一種基于蛋白質(zhì)氨基酸序列的蛋白質(zhì)分類方法,(iv)實(shí)驗(yàn)證實(shí)了在溶液階段與未修飾的蛋白質(zhì)的吸附。 該機(jī)器學(xué)習(xí)算法允許人們快速解析公共數(shù)據(jù)庫(kù)中的蛋白質(zhì)屬性,以確定SWCNTs上冠形成的蛋白質(zhì)特征和感興趣的蛋白質(zhì)。所開(kāi)發(fā)的分類器,為預(yù)測(cè)有望參與生物沉積的關(guān)鍵蛋白和合理設(shè)計(jì)的納米生物技術(shù)中候選蛋白的快速預(yù)篩選提供了初步工具。 (文: 水生 ) ?? ?
轉(zhuǎn)藏
分享
獻(xiàn)花(0 )
+1