美國華盛頓大學的研究人員報告說他們已經(jīng)從“宏基因組學”的項目(來自土壤和海洋大量微生物的DNA片段)找到了如何預測未知蛋白質(zhì)結(jié)構(gòu)的方法。相關(guān)結(jié)果發(fā)表在1月19日的Science上。 這項工作預測了614個蛋白的結(jié)構(gòu),在沒有實驗結(jié)構(gòu)存在的5211個蛋白家族中占12%。新的蛋白結(jié)構(gòu)有望對細胞內(nèi)部工作的進一步了解,并為研發(fā)新的藥物鋪平道路。而且該項技術(shù)會在宏基因組測序進一步發(fā)展的狀況下繼續(xù)成長得更強有力。 分析蛋白家族的結(jié)構(gòu)是一個巨大的工程 僅僅根據(jù)基因序列是不可能知道蛋白質(zhì)如何折疊的。可能的結(jié)構(gòu)是天文數(shù)字,盡管計算生物學家在縮小可能性方面取得了進展。幾十年的實驗和計算工作表明,氨基酸更傾向于彼此依偎,并保持在一個臂的長度。這有助于研究人員計算最穩(wěn)定的折疊模式,但主要是相對較小的蛋白質(zhì)。但對于較大的蛋白,變量的數(shù)量使得計算非常棘手。 基因序列中的共進化對會有助于蛋白結(jié)構(gòu)分析 在上世紀90年代,哈佛大學的計算生物學家Chris Sander,表明基因序列數(shù)據(jù)可以有所幫助。Sander推斷當?shù)鞍踪|(zhì)折疊時,在二維上相當遙遠的氨基酸對可能在三維折疊的蛋白質(zhì)上是相鄰的,這提供了讓蛋白質(zhì)來保持其形狀的關(guān)鍵相互作用。如果基因突變導致這些氨基酸中的一種改變,它可以破壞這種相互作用,使蛋白質(zhì)失去作用,并可能殺死有機體。但在極少數(shù)情況下,基因突變可能同時改變兩種關(guān)鍵氨基酸,保持它們之間的相互作用,使蛋白質(zhì)能夠繼續(xù)發(fā)揮作用。進化將有利于這種串聯(lián)的突變,導致氨基酸的伙伴共同進化。 共進化對的示意圖 Sander建議要找到這些共同進化對,要查看的不只是一個單一的生物蛋白基因序列,而是很多。生物體從細菌到人類共享許多密切相關(guān)的蛋白質(zhì)。通過比較這些共享蛋白的基因序列,研究人員可以定位這些共同進化的DNA片段。任何這樣氨基酸對的代碼,很可能作為一個三維結(jié)構(gòu)的近鄰,就是需要改善計算機折疊算法的約束類型。 Rosetta結(jié)構(gòu)預測運用宏基因組數(shù)據(jù) 這個方法叫做Rosetta結(jié)構(gòu)預測,通過進化信息來預測殘基之間的接觸。這種方法能對屬于大型家族的蛋白建模,比蛋白家族數(shù)多三倍的充足宏基因組數(shù)據(jù)能夠準確地建模。幾年前由Sander 和 David Baker領導的華盛頓大學的生物化學家的工作,表明了這個想法能夠起作用。到目前為止,照這個方法確定了幾十種蛋白質(zhì)的結(jié)構(gòu),Baker解釋說:“限制的事情是得到更多的序列數(shù)據(jù)?!?/p> Baker在這個方法上加大了力度,根據(jù)發(fā)表在Science上的報道他們已經(jīng)采用宏基因組測序技術(shù)結(jié)合使用的技術(shù),通過篩選的序列數(shù)據(jù),他們能夠追蹤足夠的共進化的氨基酸來確定614個蛋白的結(jié)構(gòu),每一個代表未發(fā)現(xiàn)結(jié)構(gòu)的一個完整家族的蛋白。206個是膜蛋白,137個折疊的蛋白沒有在蛋白數(shù)據(jù)庫中有代表。使用這些結(jié)構(gòu)的模板,計算生物學家應該能夠模擬成千上萬的相關(guān)家族的結(jié)構(gòu)。這種方法為大型蛋白家族提供了代表性模型,開創(chuàng)了以小成本獲得蛋白結(jié)構(gòu)的想法。 參考資料 Hundreds of elusive protein structure spinned down from genome data Protein structure determination using metagenome sequence data Seeking structure with metagenome sequences |
|
來自: 成靖 > 《醫(yī)學探討/從頭到腳》