David Baker是AI蛋白質(zhì)設(shè)計領(lǐng)域的全球最頂尖科學(xué)家之一。本文整理了David Baker團(tuán)隊自2021年至今發(fā)表的19篇Cell/Science/Nature主刊文章的簡要內(nèi)容 (子刊文章不包括在內(nèi))。 全部文章參見 https://www./publications/ David Baker是華盛頓大學(xué)蛋白質(zhì)設(shè)計研究所所長,專注于大分子結(jié)構(gòu)和功能的設(shè)計。至今發(fā)表了550多篇研究論文,獲得了100多項專利,并與他人共同創(chuàng)立了17家公司。
David Baker的研究方向包括以下六大方面:蛋白質(zhì)結(jié)構(gòu)預(yù)測、蛋白質(zhì)和小分子結(jié)合、自組裝納米材料、新型蛋白質(zhì)骨架、酶設(shè)計、蛋白質(zhì)結(jié)構(gòu)測定。蛋白質(zhì)結(jié)構(gòu)預(yù)測 構(gòu)建深度學(xué)習(xí)工具,僅通過序列數(shù)據(jù)就能快速準(zhǔn)確地建立蛋白質(zhì)三維結(jié)構(gòu)模型。最新工具RoseTTAFold可供公眾免費使用。 創(chuàng)造了產(chǎn)生高親和性蛋白質(zhì)結(jié)合的方法,并將其應(yīng)用于醫(yī)學(xué)感興趣的靶點。團(tuán)隊還在設(shè)計與小分子結(jié)合的蛋白質(zhì)。這項研究有助于深入了解大多數(shù)細(xì)胞過程的分子相互作用。團(tuán)隊正在開發(fā)創(chuàng)造新型自組裝納米結(jié)構(gòu)的方法,并利用這些方法開發(fā)先進(jìn)的疫苗和藥物遞送載體。首個獲批藥物COVID-19疫苗采用了團(tuán)隊的通過計算設(shè)計的蛋白質(zhì)納米粒子技術(shù)。 過去,幾乎所有的蛋白質(zhì)設(shè)計工作都是對自然界中的蛋白質(zhì)進(jìn)行改造。團(tuán)隊正在開發(fā)從頭開始設(shè)計各種異常穩(wěn)定的蛋白質(zhì)折疊的方法,這些折疊具有可調(diào)的幾何形狀,可用于特定應(yīng)用。酶催化生命所必需的化學(xué)反應(yīng)。團(tuán)隊正在開發(fā)設(shè)計新酶的方法,以實現(xiàn)自然界中未發(fā)現(xiàn)的化學(xué)轉(zhuǎn)化。這項研究有助于揭示生命的化學(xué)基礎(chǔ)。團(tuán)隊正在開發(fā)利用有限的實驗數(shù)據(jù)解決蛋白質(zhì)結(jié)構(gòu)的方法。世界各地的研究實驗室都在使用這些工具。 通過深度網(wǎng)絡(luò)幻化進(jìn)行全新蛋白質(zhì)設(shè)計
De novo protein design by deep network hallucination. Nature. 2021 Dec;600(7889):547-552. doi: 10.1038/s41586-021-04184-w.利用深度神經(jīng)網(wǎng)絡(luò)從氨基酸序列預(yù)測殘基間距離,在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面取得了可觀的進(jìn)展。本文研究了這類網(wǎng)絡(luò)捕獲的信息是否足夠豐富,以生成與訓(xùn)練模型所用的天然蛋白質(zhì)序列無關(guān)的新折疊蛋白質(zhì)。首先生成隨機的氨基酸序列,并將其輸入到trRosetta結(jié)構(gòu)預(yù)測網(wǎng)絡(luò)中以預(yù)測起始?xì)埢?殘基距離圖,正如所預(yù)期的那樣,該圖是相當(dāng)無特征的。然后,在氨基酸序列空間進(jìn)行蒙特卡洛采樣,優(yōu)化網(wǎng)絡(luò)預(yù)測的距離分布與背景分布之間的對比度(KL-divergence)。從不同的隨機起點進(jìn)行優(yōu)化的結(jié)果是,新型蛋白質(zhì)跨越了非常廣泛的序列和預(yù)測結(jié)構(gòu)。本文獲得了編碼129個網(wǎng)絡(luò)幻化(hallucinated)序列的合成基因,在大腸桿菌中表達(dá)并純化了這些蛋白質(zhì),發(fā)現(xiàn)其中27個折疊成單分散物種(monodisperse species),其圓二色光譜與幻化結(jié)構(gòu)一致。作者確定了三個幻覺蛋白質(zhì)的結(jié)構(gòu),其中兩個通過X射線晶體學(xué),一個通過核磁共振,這些結(jié)構(gòu)與幻化模型非常吻合。 因此,從序列預(yù)測蛋白質(zhì)結(jié)構(gòu)的深度網(wǎng)絡(luò)可以反向設(shè)計新的蛋白質(zhì),這樣的網(wǎng)絡(luò)和方法應(yīng)該與傳統(tǒng)的基于物理的模型一起,為從頭設(shè)計具有新功能的蛋白質(zhì)做出貢獻(xiàn)。本文證明了分子設(shè)計的生成深度學(xué)習(xí)方法的力量。真核生物核心蛋白質(zhì)復(fù)合物的計算結(jié)構(gòu) Computed structures of core eukaryotic protein complexes. Science. 2021 Dec 10;374(6573): eabm4805.doi: 10.1126/science.abm4805.蛋白質(zhì)與蛋白質(zhì)之間的相互作用在生物學(xué)中起著至關(guān)重要的作用,但許多真核生物蛋白質(zhì)復(fù)合物的結(jié)構(gòu)尚不清楚,可能還有許多相互作用尚未確定。本文利用全蛋白質(zhì)組氨基酸協(xié)同進(jìn)化分析和基于深度學(xué)習(xí)的結(jié)構(gòu)建模的進(jìn)步,在釀酒酵母蛋白質(zhì)組中系統(tǒng)地鑒定和建立真核生物核心蛋白質(zhì)復(fù)合物的精確模型。 作者使用RoseTTAFold和AlphaFold的組合來篩選830萬對酵母蛋白質(zhì)的成對多序列比對,識別出1505個可能相互作用的蛋白質(zhì),并為106個以前未識別的復(fù)合物和806個未被結(jié)構(gòu)表征的復(fù)合物建立結(jié)構(gòu)模型。這些復(fù)合物有多達(dá)5個亞基,在真核細(xì)胞的幾乎所有關(guān)鍵過程中發(fā)揮作用,為了解生物功能提供了廣泛的視角。 利用三軌神經(jīng)網(wǎng)絡(luò)準(zhǔn)確預(yù)測蛋白質(zhì)結(jié)構(gòu)和相互作用 Accurate prediction of protein structures and interactions using a three-track neural network. Science. 2021 Aug 20;373(6557):871-876.doi: 10.1126/science.abj8754.在最近的CASP14蛋白質(zhì)結(jié)構(gòu)預(yù)測評估會議上,DeepMind展示了非常準(zhǔn)確的預(yù)測結(jié)果。我們探索了包含相關(guān)思想的網(wǎng)絡(luò)架構(gòu),并利用三軌網(wǎng)絡(luò)獲得了最佳性能。在該網(wǎng)絡(luò)中,一維序列層、二維距離圖層和三維坐標(biāo)層的信息被相繼轉(zhuǎn)換和整合。三軌網(wǎng)絡(luò)的結(jié)構(gòu)預(yù)測精度接近DeepMind在CASP14中的預(yù)測精度,能夠快速解決具有挑戰(zhàn)性的X射線晶體學(xué)和低溫電子顯微鏡結(jié)構(gòu)建模問題,并為目前結(jié)構(gòu)未知的蛋白質(zhì)的功能提供見解。該網(wǎng)絡(luò)還能僅通過序列信息快速生成準(zhǔn)確的蛋白質(zhì)-蛋白質(zhì)復(fù)合物模型,從而縮短了需要先建立單個亞基模型再進(jìn)行對接的傳統(tǒng)方法的時間。具有1D,2D和3D注意力軌道的RoseTTAFold架構(gòu)如下。軌道之間的多個連接允許網(wǎng)絡(luò)同時學(xué)習(xí)序列、距離和坐標(biāo)內(nèi)部和之間的關(guān)系: 設(shè)計蛋白質(zhì)將抗體組裝到模塊化納米籠中 Designed proteins assemble antibodies into modular nanocages. Science. 2021 Apr 2;372(6537):eabd9994.
doi: 10.1126/science.abd9994. 受體連接抗體或配體的多價呈現(xiàn)可增強其活性 (Multivalent display of receptor-engaging antibodies or ligands can enhance their activity)。在這里,我們通過計算設(shè)計納米籠(其中一個結(jié)構(gòu)成分是抗體或Fc-配體融合體,第二個結(jié)構(gòu)成分是設(shè)計的抗體結(jié)合同源異構(gòu)體),驅(qū)動納米籠組裝,而不是通過附著在已有的骨架上實現(xiàn)多價性。通過電子顯微鏡測定了8個納米籠的結(jié)構(gòu),包括二面體、四面體、八面體和二十面體結(jié)構(gòu),每個納米籠分別含有2、6、12和30個抗體,這些結(jié)構(gòu)與相應(yīng)的計算模型非常吻合。在死亡受體5(DR5)介導(dǎo)的細(xì)胞凋亡、血管生成素-1受體(Tie2)介導(dǎo)的血管生成、CD40活化和T細(xì)胞增殖方面,與游離抗體或Fc融合抗體相比,靶向細(xì)胞表面受體的抗體納米籠增強了信號傳導(dǎo)。納米籠組裝還提高了α-SARS-CoV-2單克隆抗體和Fc-血管緊張素轉(zhuǎn)換酶2(ACE2)融合蛋白對嚴(yán)重急性呼吸系統(tǒng)綜合征冠狀病毒2(SARS-CoV-2)偽病毒的中和作用。De novo design of transmembrane β barrels. Science. 2021 Feb 19;371(6531):eabc8182.doi: 10.1126/science.abc8182.跨膜β管蛋白(TMBs)能夠自發(fā)折疊和插入膜并形成穩(wěn)定的孔,因此對單分子分析技術(shù)具有極大的價值。我們利用全新計算設(shè)計的力量,結(jié)合"假設(shè)、設(shè)計和測試"的方法來確定TMB的設(shè)計原則,特別是negative設(shè)計對減緩β管組裝的重要性。我們設(shè)計了新的八鏈TMB,與已知的TMB沒有同源性,可插入合成脂膜并可逆折疊,其核磁共振和X射線晶體結(jié)構(gòu)與計算模型非常相似。這些進(jìn)展將有助于為廣泛的應(yīng)用定制孔隙設(shè)計。 模塊化和可調(diào)諧蛋白質(zhì)生物傳感器的從頭設(shè)計
De novo design of modular and tunable protein biosensors. Nature. 2021 Mar;591(7850):482-487.doi: 10.1038/s41586-021-03258-z.天然存在的蛋白質(zhì)開關(guān)已被重新用于開發(fā)細(xì)胞和臨床應(yīng)用的生物傳感器和報告器。然而,這類開關(guān)的數(shù)量有限,重新設(shè)計它們具有挑戰(zhàn)性。在這里,我們展示了一種基于蛋白質(zhì)的通用生物傳感器,它可以通過全新設(shè)計的蛋白質(zhì)開關(guān)逆轉(zhuǎn)信息流,其中肽鍵的結(jié)合觸發(fā)感興趣的生物輸出。所設(shè)計的傳感器是模塊化的分子裝置,具有閉合的暗態(tài)和開放的發(fā)光態(tài);分析物的結(jié)合驅(qū)動開關(guān)從閉合態(tài)轉(zhuǎn)向開放態(tài)。由于傳感器是基于分析物結(jié)合到傳感器激活的熱力學(xué)耦合,因此只需要一個目標(biāo)結(jié)合域,這簡化了傳感器的設(shè)計,并允許在溶液中直接讀出。我們創(chuàng)造的生物傳感器可以靈敏地檢測抗凋亡蛋白BCL-2、IgG1 Fc結(jié)構(gòu)域、HER2受體和肉毒桿菌神經(jīng)毒素B,以及心肌肌鈣蛋白I和抗乙型肝炎病毒抗體,具有臨床檢測這些分子所需的高靈敏度。鑒于需要診斷工具來追蹤嚴(yán)重急性呼吸系統(tǒng)綜合征冠狀病毒2(SARS-CoV-2),我們利用這種方法設(shè)計了SARS-CoV-2尖峰蛋白的傳感器以及針對膜蛋白和核殼蛋白的抗體。前者結(jié)合了全新設(shè)計的尖峰受體結(jié)合域(RBD)粘合劑,其檢測限為15 pM,發(fā)光信號比背景水平高50倍。該平臺的模塊化和靈敏度使其能夠快速構(gòu)建用于多種分析物的傳感器,并凸顯了從頭開始設(shè)計蛋白質(zhì)以創(chuàng)建具有新的有用功能的多態(tài)蛋白質(zhì)系統(tǒng)的能力。Design of biologically active binary protein 2D materials. Nature. 2021 Jan;589(7842):468-473.
doi: 10.1038/s41586-020-03120-8. 有序的二維陣列,如S層和設(shè)計的類似物,已經(jīng)引起了生物工程師的興趣,但除了用柔性連接體形成的單一晶格外,它們僅由一種蛋白質(zhì)成分構(gòu)成。由兩種成分組成的材料在調(diào)節(jié)組裝動力學(xué)和整合更復(fù)雜的功能方面具有相當(dāng)大的潛在優(yōu)勢。在這里,我們描述了一種計算方法,通過在成對的二面性蛋白質(zhì)構(gòu)件之間設(shè)計剛性界面來生成共同組裝的二元層,并用它來設(shè)計p6m晶格。 由于這種材料是從頭開始設(shè)計的,因此可以很容易地對其組分進(jìn)行功能化和重新配置其對稱性,從而形成具有可區(qū)分表面的配體陣列,我們證明這種陣列可以驅(qū)動廣泛的受體聚集、下游蛋白招募和信號傳導(dǎo)。使用原子力顯微鏡觀察支撐雙層膜和定量顯微鏡觀察活細(xì)胞,我們發(fā)現(xiàn)組裝在膜上的陣列具有與體外形成的陣列相似的組分配比和結(jié)構(gòu),因此我們的材料可以在細(xì)胞膜等基本無序的基質(zhì)上建立秩序。與先前表征的細(xì)胞表面受體結(jié)合組裝體(如抗體和納米籠)快速內(nèi)吞不同,我們發(fā)現(xiàn)組裝在細(xì)胞表面的大型陣列以可調(diào)的方式抑制內(nèi)吞,這對延長受體參與和免疫逃避具有潛在的治療意義。我們的工作為合成細(xì)胞生物學(xué)奠定了基礎(chǔ),在合成細(xì)胞生物學(xué)中,多蛋白宏觀材料被設(shè)計用來調(diào)節(jié)細(xì)胞反應(yīng)并重塑合成和生命系統(tǒng)。四價流感納米顆粒疫苗誘導(dǎo)廣泛保護(hù) Quadrivalent influenza nanoparticle vaccines induce broad protection. Nature. 2021 Apr;592(7855):623-628. doi: 10.1038/s41586-021-03365-x. 在這里,我們展示了通過計算設(shè)計的雙組分納米顆粒免疫原可誘導(dǎo)針對多種流感病毒的強效中和及廣泛的保護(hù)性抗體反應(yīng)。這種納米顆粒免疫原包含20個有序排列的血凝素糖蛋白三聚體,它們在體外的組裝可以精確控制多種不同血凝素蛋白以確定的比例共同顯示。共同顯示四價流感疫苗中四種血凝素的納米顆粒免疫原在幾種動物模型中引起了針對疫苗匹配毒株的抗體反應(yīng),其效果等同于或優(yōu)于商用四價流感疫苗,同時通過靶向亞優(yōu)勢但保守的血凝素干,誘導(dǎo)了針對異源病毒的廣泛保護(hù)性抗體反應(yīng)。納米顆粒免疫原誘導(dǎo)的強效受體阻斷抗體和交叉反應(yīng)性干定向抗體的結(jié)合使它們成為有吸引力的超季節(jié)性流感疫苗候選物,有可能取代傳統(tǒng)的季節(jié)性疫苗。 Hallucinating symmetric protein assemblies. Science. 2022 Oct 7;378(6615):56-61.doi: 10.1126/science.add1964.深度學(xué)習(xí)生成方法為廣泛探索天然蛋白質(zhì)序列和結(jié)構(gòu)之外的蛋白質(zhì)結(jié)構(gòu)空間提供了機會。在這里,我們利用深度網(wǎng)絡(luò)幻化生成了廣泛的對稱蛋白質(zhì)同質(zhì)異構(gòu)體,只給定了原體數(shù)目和原體長度。七種設(shè)計的晶體結(jié)構(gòu)與計算模型非常相似(中位數(shù)均方根偏差:0.6埃),三種具有多達(dá)1550個殘基和C33對稱性的10納米巨環(huán)的冷凍電鏡結(jié)構(gòu)也非常相似;所有這些結(jié)構(gòu)都與以前解決的結(jié)構(gòu)有很大不同。我們的研究結(jié)果凸顯了利用深度學(xué)習(xí)可以生成的新蛋白質(zhì)結(jié)構(gòu)的豐富多樣性,并為設(shè)計日益復(fù)雜的納米機器和生物材料組件鋪平了道路。使用 ProteinMPNN 進(jìn)行基于深度學(xué)習(xí)的穩(wěn)健蛋白質(zhì)序列設(shè)計 Robust deep learning-based protein sequence design using ProteinMPNN. Science. 2022 Oct 7;378(6615):49-56.doi: 10.1126/science.add2187.盡管深度學(xué)習(xí)已經(jīng)徹底改變了蛋白質(zhì)結(jié)構(gòu)預(yù)測,但幾乎所有具有實驗特征的全新蛋白質(zhì)設(shè)計都是通過基于物理的方法(如Rosetta)產(chǎn)生的。在這里,我們描述了一種基于深度學(xué)習(xí)的蛋白質(zhì)序列設(shè)計方法ProteinMPNN,它在計算和實驗測試中都有出色的表現(xiàn)。在原生蛋白質(zhì)骨架上,ProteinMPNN的序列恢復(fù)率為52.4%,而Rosetta為32.9%。不同位置的氨基酸序列可以在單鏈或多鏈間耦合,從而能夠應(yīng)用于當(dāng)前廣泛的蛋白質(zhì)設(shè)計挑戰(zhàn)。我們利用X射線晶體學(xué)、冷凍電鏡和功能研究證明了ProteinMPNN的廣泛實用性和高準(zhǔn)確性,挽救了以前用Rosetta或AlphaFold設(shè)計失敗的蛋白質(zhì)單體、環(huán)狀同源高分子、四面體納米顆粒和目標(biāo)結(jié)合蛋白。高精度從頭設(shè)計可透膜的環(huán)狀多肽 Accurate de novo design of membrane-traversing macrocycles. Cell. 2022 Sep 15;185(19):3520-3532.e26.doi: 10.1016/j.cell.2022.07.019.我們采用計算設(shè)計和實驗表征相結(jié)合的方法,系統(tǒng)地研究了大環(huán)化合物膜滲透性和口服生物利用度的設(shè)計原理。我們設(shè)計了184種6-12個殘基的大環(huán),其預(yù)測結(jié)構(gòu)范圍廣泛,包含非典型的骨架修飾,實驗測定了35種結(jié)構(gòu),其中29種與計算模型非常接近。通過這樣的控制,我們表明通過確保所有酰胺(NH)基團(tuán)參與內(nèi)部氫鍵相互作用,可以系統(tǒng)地實現(xiàn)膜滲透性。在6-12個殘基大小范圍內(nèi)的84個設(shè)計交叉膜的表觀滲透性大于1×10-6 cm/s。暴露NH基團(tuán)的設(shè)計可通過設(shè)計脂膜中偏愛的替代等能完全氫鍵態(tài)使其具有膜滲透性。以高結(jié)構(gòu)精度設(shè)計膜滲透性和口服生物可用性肽的能力應(yīng)有助于下一代設(shè)計的大環(huán)治療藥物。用于設(shè)計透膜肽的計算機管道的總體示意圖:利用深度學(xué)習(xí)構(gòu)建蛋白質(zhì)功能位點 Scaffolding protein functional sites using deep learning. Science. 2022 Jul 22;377(6604):387-394.doi: 10.1126/science.abn2100.蛋白質(zhì)的結(jié)合和催化功能通常由整體蛋白質(zhì)結(jié)構(gòu)固定的少量功能殘基介導(dǎo)。在這里,我們描述了無需預(yù)先指定骨架的折疊或二級結(jié)構(gòu)就能構(gòu)建此類功能位點的深度學(xué)習(xí)方法。第一種方法是"約束幻化(constrained hallucination)",它可以優(yōu)化序列,使其預(yù)測結(jié)構(gòu)包含所需的功能位點。第二種方法是"內(nèi)繪制(inpainting)",從功能位點開始,在經(jīng)過專門訓(xùn)練的RoseTTAFold網(wǎng)絡(luò)中填充額外的序列和結(jié)構(gòu),在一次前向傳遞中創(chuàng)建一個可行的蛋白質(zhì)骨架。我們使用這兩種方法設(shè)計候選免疫原、受體陷阱、金屬蛋白、酶和蛋白質(zhì)結(jié)合蛋白,并通過結(jié)合使用計算和實驗測試驗證設(shè)計。機械耦合軸轉(zhuǎn)子蛋白質(zhì)組件的計算設(shè)計 Computational design of mechanically coupled axle-rotor protein assemblies. Science. 2022 Apr 22;376(6591):383-390.doi: 10.1126/science.abm1183.自然界的分子機器包含相互運動的蛋白質(zhì)成分。設(shè)計這種具有內(nèi)部自由度的機械約束納米級蛋白質(zhì)結(jié)構(gòu)是計算蛋白質(zhì)設(shè)計的一個突出挑戰(zhàn)。在這里,我們探索了從設(shè)計的具有內(nèi)部循環(huán)或二面對稱性的軸和轉(zhuǎn)子組件中重新構(gòu)建蛋白質(zhì)機械。我們發(fā)現(xiàn)軸-轉(zhuǎn)子系統(tǒng)在體外和體內(nèi)都能按照設(shè)計進(jìn)行組裝。利用低溫電子顯微鏡,我們發(fā)現(xiàn)這些系統(tǒng)具有構(gòu)象可變的相對方向,反映了耦合組件的對稱性和計算設(shè)計的界面能譜。這些具有內(nèi)部自由度的機械系統(tǒng)向設(shè)計可基因編碼的納米機械邁出了一步。僅從靶結(jié)構(gòu)設(shè)計蛋白質(zhì)結(jié)合蛋白 Design of protein-binding proteins from the target structure alone. Nature. 2022 May;605(7910):551-560. doi: 10.1038/s41586-022-04654-9.在沒有靶蛋白三維結(jié)構(gòu)信息的情況下設(shè)計能與靶蛋白表面特定位點結(jié)合的蛋白仍然是一個挑戰(zhàn)。在這里,我們描述了這一問題的一般解決方案,即從廣泛探索蛋白質(zhì)表面選定區(qū)域可能的結(jié)合模式的廣闊空間開始,然后在最有希望的結(jié)合模式附近加強搜索。我們通過為12種不同形狀和表面性質(zhì)的蛋白質(zhì)靶標(biāo)從頭設(shè)計結(jié)合蛋白,證明了這種方法的廣泛適用性。生物物理表征結(jié)果表明,這些結(jié)合蛋白都小于65個氨基酸,具有超穩(wěn)定性,經(jīng)過實驗優(yōu)化后,能以毫微摩爾到皮摩爾的親和力與靶標(biāo)結(jié)合。我們成功地解析了五種結(jié)合劑-靶標(biāo)復(fù)合物的晶體結(jié)構(gòu),所有這五種復(fù)合物都與相應(yīng)的計算設(shè)計模型非常吻合。近50萬個計算設(shè)計和數(shù)十萬個點突變體的實驗數(shù)據(jù)詳細(xì)反饋了該方法的優(yōu)勢和局限性以及我們目前對蛋白質(zhì)-蛋白質(zhì)相互作用的理解,并將指導(dǎo)兩者的改進(jìn)。我們的方法能夠針對各種蛋白質(zhì)上的感興趣位點有針對性地設(shè)計粘合劑,用于治療和診斷應(yīng)用。通過隱式negative設(shè)計重新配置不對稱蛋白質(zhì)組裝 Reconfigurable asymmetric protein assemblies through implicit negative design. Science. 2022 Jan 21;375(6578):eabj7662. doi: 10.1126/science.abj7662.進(jìn)行亞基交換的不對稱多蛋白復(fù)合物在生物學(xué)中起著核心作用,但也給設(shè)計帶來了挑戰(zhàn),因為這些組分不僅必須包含能夠?qū)崿F(xiàn)可逆結(jié)合的界面,而且還必須是穩(wěn)定的和行為良好的。我們使用隱式negative設(shè)計來產(chǎn)生β折疊介導(dǎo)的異二聚體,這些異二聚體可以組裝成各種各樣的復(fù)合物。這些設(shè)計在隔離狀態(tài)下穩(wěn)定、折疊和可溶,并且在混合后迅速組裝,晶體結(jié)構(gòu)接近計算模型。我們構(gòu)建了多達(dá)六種不同組分的線性排列的異構(gòu)高聚物、支化異構(gòu)高聚物、封閉的C4對稱雙組分環(huán),以及組裝在環(huán)狀同源高聚物中心樞紐上的異構(gòu)高聚物,并證明了這種復(fù)合物可以通過亞基交換而很容易地重組。我們的方法為設(shè)計非對稱可重構(gòu)蛋白質(zhì)系統(tǒng)提供了一條通用途徑。 IV型分泌系統(tǒng)的冷凍電鏡結(jié)構(gòu) Cryo-EM structure of a type IV secretion system. Nature. 2022 Jul;607(7917):191-196.doi: 10.1038/s41586-022-04859-y.細(xì)菌共軛是DNA(通常是質(zhì)粒DNA)從供體細(xì)胞向受體細(xì)胞單向轉(zhuǎn)移的基本過程。它是抗生素耐藥基因在細(xì)菌種群中傳播的主要途徑。在革蘭氏陰性細(xì)菌中,共軛作用由供體細(xì)胞產(chǎn)生并嵌入其外膜和內(nèi)膜的大型轉(zhuǎn)運裝置--共軛IV型分泌系統(tǒng)(T4SS)介導(dǎo)。T4SS還能形成長的胞外絲--共軛柔毛,這對DNA轉(zhuǎn)移至關(guān)重要。在這里,我們展示了由92個多肽組成的2.8百萬道爾頓T4SS復(fù)合物的高分辨率冷凍電鏡(cryo-EM)結(jié)構(gòu),這些多肽代表了參與柔毛生物發(fā)生的10個基本T4SS組分中的8個。我們利用蛋白質(zhì)界面的協(xié)同進(jìn)化分析將剩余的兩個組分加入到結(jié)構(gòu)模型中,從而實現(xiàn)了包括柔毛在內(nèi)的整個系統(tǒng)的重組。該結(jié)構(gòu)描述了組裝構(gòu)成T4SS的許多組分所需的異常龐大的蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò),并提供了關(guān)于它們制造纖毛蟲的獨特機制的見解。The road to fully programmable protein catalysis. Nature. 2022 Jun;606(7912):49-58.doi: 10.1038/s41586-022-04456-z.從零開始設(shè)計高效酶的能力將對化學(xué)、生物技術(shù)和醫(yī)學(xué)產(chǎn)生深遠(yuǎn)影響。過去十年中蛋白質(zhì)工程的快速發(fā)展使我們樂觀地認(rèn)為這一目標(biāo)指日可待。含有金屬輔助因子和非典型有機催化基團(tuán)的人工酶的開發(fā)顯示了如何通過優(yōu)化蛋白質(zhì)結(jié)構(gòu)來利用非蛋白元素的反應(yīng)性。與此同時,計算方法已被用于根據(jù)過渡態(tài)穩(wěn)定的基本原理設(shè)計用于各種反應(yīng)的蛋白質(zhì)催化劑。盡管設(shè)計的催化劑活性很低,但大量的實驗室進(jìn)化已被用于產(chǎn)生高效的酶。對這些系統(tǒng)的結(jié)構(gòu)分析表明,要設(shè)計出具有更高活性的催化劑,需要很高的精確度。為此,包括深度學(xué)習(xí)在內(nèi)的新興蛋白質(zhì)設(shè)計方法特別有望提高模型的準(zhǔn)確性。在此,我們對該領(lǐng)域的主要發(fā)展進(jìn)行了總結(jié),并強調(diào)了新的創(chuàng)新機遇,這些機遇將使我們超越目前的技術(shù)水平,實現(xiàn)生物催化劑的穩(wěn)健設(shè)計,以滿足社會需求。利用深度學(xué)習(xí)從頭設(shè)計熒光素酶 De novo design of luciferases using deep learning. Nature. 2023 Feb;614(7949):774-780.doi: 10.1038/s41586-023-05696-3.從頭酶設(shè)計試圖將預(yù)測能催化感興趣反應(yīng)的活性位點和底物結(jié)合口袋引入幾何上兼容的原生骨架,但一直受限于缺乏合適的蛋白質(zhì)結(jié)構(gòu)和原生蛋白質(zhì)序列結(jié)構(gòu)關(guān)系的復(fù)雜性。在這里,我們描述了一種基于深度學(xué)習(xí)的"全家族幻化"方法,該方法可以生成大量理想化的蛋白質(zhì)結(jié)構(gòu),其中包含不同的口袋形狀和編碼它們的設(shè)計序列。我們利用這些骨架設(shè)計了人工熒光素酶,它可以選擇性地催化合成熒光素底物二苯基三嗪和2-脫氧腔腸素的氧化化學(xué)發(fā)光。所設(shè)計的活性位點將一個精氨酸胍基團(tuán)與一個陰離子相鄰,該陰離子在反應(yīng)過程中形成一個具有高度形狀互補性的結(jié)合袋。對于這兩種熒光素底物,我們獲得了具有高選擇性的設(shè)計熒光素酶;其中最活躍的是一種小型(13.9 kDa)、可恒溫(熔點高于95 °C)的酶,它對二苯基三嗪的催化效率(kcat/Km = 106 M-1 s-1)與原生熒光素酶相當(dāng),但底物特異性更高。從零開始創(chuàng)造在生物醫(yī)學(xué)中具有廣泛應(yīng)用的高活性和特異性生物催化劑是計算酶設(shè)計的一個關(guān)鍵里程碑,我們的方法應(yīng)該能夠產(chǎn)生廣泛的熒光素酶和其他酶。通過超螺旋匹配從頭設(shè)計模塊化多肽結(jié)合蛋白 De novo design of modular peptide-binding proteins by superhelical matching. Nature. 2023 Apr;616(7957):581-589.
doi: 10.1038/s41586-023-05909-9.設(shè)計序列特異性肽結(jié)合蛋白的一般方法在蛋白質(zhì)組學(xué)和合成生物學(xué)中具有廣泛的用途。然而,設(shè)計肽結(jié)合蛋白具有挑戰(zhàn)性,因為大多數(shù)肽不具有確定的獨立結(jié)構(gòu),氫鍵必須與埋藏在肽骨架中的極性基團(tuán)結(jié)合。 在這里,受天然和再造蛋白質(zhì)-肽系統(tǒng)的啟發(fā),我們著手設(shè)計由重復(fù)單元組成的蛋白質(zhì),這些重復(fù)單元可結(jié)合具有重復(fù)序列的肽,蛋白質(zhì)的重復(fù)單元與肽的重復(fù)單元之間具有一一對應(yīng)的關(guān)系。我們使用幾何哈希算法來識別蛋白質(zhì)骨架和肽對接排列,這些排列與蛋白質(zhì)側(cè)鏈和肽骨架之間的雙叉氫鍵兼容。然后對蛋白質(zhì)序列的其余部分進(jìn)行折疊和肽結(jié)合優(yōu)化。我們設(shè)計的重復(fù)蛋白以多脯氨酸II構(gòu)象與六種不同的三肽重復(fù)序列結(jié)合。這些蛋白具有超穩(wěn)定性,在體外和活細(xì)胞中能以納摩爾到皮摩爾的親和力與4到6個三肽目標(biāo)串聯(lián)重復(fù)序列結(jié)合。晶體結(jié)構(gòu)揭示了蛋白質(zhì)和肽之間的重復(fù)相互作用,包括從蛋白質(zhì)側(cè)鏈到肽骨架的氫鍵階梯。通過重新設(shè)計單個重復(fù)單元的結(jié)合界面,可以實現(xiàn)對非重復(fù)肽序列和原生蛋白無序區(qū)的特異性。 利用強化學(xué)習(xí)自上而下設(shè)計蛋白質(zhì)結(jié)構(gòu) Top-down design of protein architectures with reinforcement learning. Science. 2023 Apr 21;380(6642):266-273.
doi: 10.1126/science.adf6591. 由于進(jìn)化選擇的結(jié)果,自然形成的蛋白質(zhì)組裝體的亞基往往以很大的形狀互補性組合在一起,以產(chǎn)生目前的設(shè)計方法無法實現(xiàn)的最佳功能結(jié)構(gòu)。我們描述了一種基于強化學(xué)習(xí)的"自上而下"的設(shè)計方法,該方法利用蒙特卡洛樹搜索,在整體結(jié)構(gòu)和特定功能約束的背景下對蛋白質(zhì)構(gòu)象進(jìn)行采樣,從而解決了這一問題。所設(shè)計的盤狀納米孔和超小型二十面體的冷凍電鏡結(jié)構(gòu)與計算模型非常接近。二十面體可以實現(xiàn)免疫原和信號分子的高密度顯示,從而增強疫苗反應(yīng)和血管生成誘導(dǎo)。我們的方法能夠自上而下地設(shè)計出具有所需系統(tǒng)特性的復(fù)雜蛋白質(zhì)納米材料,并證明了強化學(xué)習(xí)在蛋白質(zhì)設(shè)計中的強大作用。利用RFdiffusion從頭設(shè)計蛋白質(zhì)結(jié)構(gòu)和功能 De novo design of protein structure and function with RFdiffusion. Nature. 2023 Jul 11.doi: 10.1038/s41586-023-06415-8.最近在利用深度學(xué)習(xí)方法設(shè)計新蛋白質(zhì)方面取得了相當(dāng)大的進(jìn)展。盡管取得了這一進(jìn)展,但用于蛋白質(zhì)設(shè)計的通用深度學(xué)習(xí)框架仍有待描述,該框架能夠解決廣泛的設(shè)計挑戰(zhàn),包括全新粘合劑設(shè)計和高階對稱架構(gòu)設(shè)計。擴(kuò)散模型在圖像和語言生成建模中取得了相當(dāng)大的成功,但在應(yīng)用于蛋白質(zhì)建模時卻成效有限,這可能是由于蛋白質(zhì)骨架幾何和序列結(jié)構(gòu)關(guān)系的復(fù)雜性。在這里,我們展示了通過在蛋白質(zhì)結(jié)構(gòu)去噪任務(wù)中對RoseTTAFold結(jié)構(gòu)預(yù)測網(wǎng)絡(luò)進(jìn)行微調(diào),我們獲得了一個蛋白質(zhì)骨架的生成模型,該模型在無條件和拓?fù)浼s束的蛋白質(zhì)單體設(shè)計、蛋白質(zhì)粘合劑設(shè)計、對稱寡聚體設(shè)計、酶活性位點骨架以及用于治療和金屬結(jié)合蛋白質(zhì)設(shè)計的對稱主題骨架方面取得了杰出的性能。我們通過實驗表征了數(shù)百個設(shè)計的對稱組合體、金屬結(jié)合蛋白和蛋白結(jié)合劑的結(jié)構(gòu)和功能,證明了這種稱為RoseTTAFold Diffusion(RFdiffusion)的方法的強大功能和通用性。RFdiffusion的準(zhǔn)確性通過設(shè)計的粘合劑與流感血凝素復(fù)合物的低溫電子顯微鏡結(jié)構(gòu)得到證實,該結(jié)構(gòu)與設(shè)計模型幾乎完全相同。與根據(jù)用戶指定的輸入生成圖像的網(wǎng)絡(luò)類似,RFdiffusion能夠根據(jù)簡單的分子規(guī)格設(shè)計出多種功能蛋白質(zhì)。
|