用AI,探索生命科學(xué)的星辰大海。 繼黃崢、張一鳴之后,王小川也“下?!鄙茖W(xué)了。 在被騰訊正式收編之后,一向佛系的王小川,再次自主擇業(yè),成立健康咨詢公司。 互聯(lián)網(wǎng)早已進(jìn)入下半場,紅利消逝、用戶增長疲軟后,巨頭們不斷地給自己、給公司謀下一條出路。而大佬們都有一種驚人的默契,將目光放在兩大領(lǐng)域: 一是元宇宙,另一個便是生命科學(xué)。 生命科學(xué)領(lǐng)域,前有李彥宏創(chuàng)立百圖生科,后有張一鳴世界三地招兵買馬,招攬醫(yī)學(xué)生物人才。如果再往前看,馬化騰、傅盛、王小川等一眾互聯(lián)網(wǎng)一線創(chuàng)業(yè)者都是生物學(xué)思維的癡迷者和堅(jiān)定實(shí)踐者。 傅盛說,生物學(xué)是一門能打通很多跨界知識的學(xué)科。相比物理學(xué)等自然科學(xué),生物學(xué)更深刻地揭示了世界的底層規(guī)律。 王小川甚至說,正是生物學(xué)思維讓搜狗活到今天。他說,從2020年開始,就開始以生物學(xué)的視角去看待公司和組織,看待創(chuàng)始人對于這個組織的決定性意義,看待組織自身的延續(xù)。 生命科學(xué),是一扇扇未打開的生命本源大門,而去年12月一項(xiàng)顛覆生命科學(xué)的成果——Google的AlphaFold2橫空出世,用一種近乎“匪夷所思”的蛋白質(zhì)結(jié)構(gòu)預(yù)測精度,大大加速人們探索生命科學(xué)的進(jìn)程。 黃崢、張一鳴們最初的生命科學(xué)夢,正在被人工智能重構(gòu)。 今年的7月,AlphaFold2宣布開源。 開源的消息傳出后,有人聲稱,“都開源了、免費(fèi)了,還怎么申報經(jīng)費(fèi)?!彪S后,AlphaFold2的所有者——DeepMind再放大招,發(fā)布AlphaFold數(shù)據(jù)集,再次引爆科研圈。 目前,AlphaFold數(shù)據(jù)集里大約有36.5萬個蛋白質(zhì)結(jié)構(gòu)預(yù)測。到今年年底,這個數(shù)量將會增加到1.3億個。而且,這個預(yù)測結(jié)果不是張口就來,可信度甩了人類好大一截。 不少人感受到了被AI支配的恐懼,驚嘆道:“機(jī)器再一次戰(zhàn)勝了人類?!?/span> DeepMind聯(lián)合創(chuàng)始人、首席執(zhí)行官德米斯·哈薩比斯(Demis Hassabis),對自家的“王者級成果”也是不吝贊美之詞:“這是迄今為止AI在推動科學(xué)進(jìn)步方面做出的最大貢獻(xiàn)。我覺得這么說一點(diǎn)兒也不夸張?!?/span> 事實(shí)真是如此嗎? 五位結(jié)構(gòu)生物學(xué)家怎么看? AlphaFold2的成功,離不開蛋白質(zhì)組學(xué)(Proteomics)的研究。 在90年代,人類基因組計劃開始成形時,科學(xué)家意識到光掌握基因的堿基排列是不夠的,還必須了解基因的產(chǎn)物蛋白質(zhì)。 由此,澳大利亞遺傳學(xué)家馬克·威爾金斯提出了破譯人類蛋白質(zhì)組的想法。此后,眾多學(xué)者都投入了這一研究。 如何評價這次AlphaFold2的研究成果——一口氣預(yù)測98.5%的人類蛋白質(zhì)結(jié)構(gòu)、并且宣布開源? 密蘇里大學(xué)教授,AAAS、AIMBE Fellow許東教授告訴雷鋒網(wǎng),DeepMind在論文中提到的高置信度蛋白質(zhì)結(jié)構(gòu)預(yù)測,基本可以達(dá)到準(zhǔn)實(shí)驗(yàn)精度,而這極大地擴(kuò)展了它的應(yīng)用范圍。在以往的研究中,受限于預(yù)測的精度和可信度,諸如小分子藥物設(shè)計等方面的研究受到了很大的阻礙,而現(xiàn)在能夠在高置信度蛋白質(zhì)結(jié)構(gòu)上做分子對接預(yù)測。 “DeepMind 向外界公開源代碼和數(shù)據(jù)庫,是一個重大利好,尤其是生物制藥等工業(yè)界?!弊鳛?/span>第一個用深度學(xué)習(xí)來進(jìn)行氨基酸距離預(yù)測的專家,芝加哥豐田計算技術(shù)研究所教授,斯隆獎得主許錦波教授說到。 許錦波教授認(rèn)為,目前國內(nèi)的研究成果可能略顯滯后,但隨著人工智能算法的提升,加上更多高質(zhì)量數(shù)據(jù)庫的開源,相信在未來的2-3年內(nèi)相關(guān)研究會有一個質(zhì)的飛躍,或者達(dá)到與DeepMind比肩的水平。 西湖大學(xué)教授、蛋白質(zhì)組大數(shù)據(jù)實(shí)驗(yàn)室負(fù)責(zé)人郭天南教授表示,AlphaFold2的這項(xiàng)成果意味AI已進(jìn)入生命科學(xué)的微觀分子領(lǐng)域,并且向生命科學(xué)研究人員開放,其意義類似于AlphaGo進(jìn)入人們生活(圍棋領(lǐng)域),它的廣泛使用可能對結(jié)構(gòu)生物學(xué)產(chǎn)生重大影響。 也有人工智能與蛋白質(zhì)結(jié)構(gòu)預(yù)測專家也補(bǔ)充到,在方法創(chuàng)新上,AlphaFold提出了一套全新的模型架構(gòu)與訓(xùn)練策略;在應(yīng)用價值上,AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,將為更好地理解蛋白質(zhì)在生物體內(nèi)的功能與作用提供見解和參考。 對于AlphaFold2的行業(yè)影響,該專家認(rèn)為,“它可以為蛋白質(zhì)單鏈結(jié)構(gòu)、蛋白質(zhì)復(fù)合體以及蛋白質(zhì)小分子等結(jié)構(gòu)預(yù)測任務(wù)指明思路,對基于結(jié)構(gòu)的藥物設(shè)計等領(lǐng)域可能會有較大的推動作用。” 盡管AlphaFold2這次的成果得到了眾多專家的力捧,但是正如上文所說,沒有完美的科學(xué)成果,只有不斷完美的過程。 AlphaFold2 目前也存在一定的局限性,比如很多蛋白和區(qū)間并不能達(dá)到高置信度,AlphaFold2評估的一些高置信度,本質(zhì)上更像是一種高可信性的假設(shè),它與實(shí)驗(yàn)的第一手的觀察仍有差距。 許東教授分析道,其主要原因在于蛋白質(zhì)結(jié)構(gòu)具有的很強(qiáng)的多變性,個別情況下,幾個氨基酸可能就會完全改變其結(jié)構(gòu)和功能,而人工智能系統(tǒng)基于統(tǒng)一性,很難發(fā)現(xiàn)這種變化和差異。 換言之,預(yù)測結(jié)構(gòu)與實(shí)驗(yàn)室結(jié)構(gòu)仍不能完全劃等號。不過許東教授相信,隨著算法的提升和AI的數(shù)據(jù)邊際效應(yīng),AlphaFold2仍有很大的提升空間。 許東教授表示,人工智能預(yù)測在本質(zhì)上是基于大數(shù)據(jù)的統(tǒng)計,而非物理學(xué)過程。蛋白質(zhì)折疊結(jié)構(gòu)中的一些物理屬性,比如不同的酸堿度、溫度造成的結(jié)構(gòu)變化,AI是無法預(yù)測和分析的,這意味它不能完全取代傳統(tǒng)以物理為基礎(chǔ)的模擬、預(yù)測方法。 值得一提的是,國內(nèi)近年來在AI預(yù)測蛋白質(zhì)結(jié)構(gòu)方面的研究也取得了長足的進(jìn)步。 比如中科院卜東波教授主持的FALCON預(yù)測系統(tǒng),其預(yù)測精度有了大幅度提升,雖然仍未達(dá)到AlphaFold2 的預(yù)測水平,但整體趨勢是快速向前發(fā)展的,這是人工智能技術(shù)日漸成熟的一種必然結(jié)果。 密歇根大學(xué)教授,I-TASSER 算法發(fā)明人張陽教授參加了 DeepMind 兩篇研究論文的評審工作。 他在與雷鋒網(wǎng)的訪談中提到,所有審稿人都對第一篇 AlphaFold2關(guān)于算法的文章評價很高,而對本次關(guān)于人類基因組的應(yīng)用的論文有所保留,具體包括以下幾個方面: 第一是論文缺乏新意。自從蛋白質(zhì)結(jié)構(gòu)預(yù)測問題被提出后,特別是人體基因組計劃后,如何用計算機(jī)算法對整體基因組進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測,便成為了科學(xué)家努力的目標(biāo)。在過去二十年,關(guān)于基因組蛋白質(zhì)結(jié)構(gòu)預(yù)測的論文發(fā)表已發(fā)表很多,這遠(yuǎn)不是第一篇。 第二,從方法學(xué)來講,蛋白質(zhì)預(yù)測關(guān)鍵在于算法開發(fā),應(yīng)用層面是很直接的事情,只要有足夠的計算機(jī)資源就可以實(shí)現(xiàn)。 第三,這篇文章注重強(qiáng)調(diào)如何利用預(yù)測結(jié)構(gòu)對蛋白質(zhì)功能進(jìn)行分析,特別展示了三個蛋白例子。雖然這些努力很可貴,但是沒有一個例子是經(jīng)過雙盲實(shí)驗(yàn)驗(yàn)證,而這在蛋白質(zhì)功能預(yù)測方面是非常必要的。 張陽教授認(rèn)為,這篇工作之所以備受關(guān)注,是因?yàn)?AlpahFold2算法(即第一篇論文)達(dá)到了目前為止計算機(jī)能夠預(yù)測的最高精度。從CASP14的結(jié)果來看,AlphaFold2有2/3的目標(biāo)蛋白達(dá)到了實(shí)驗(yàn)精度,在難度較高的非同源序列預(yù)測上,有1/3的目標(biāo)蛋白達(dá)到這個精度,而人體基因庫中尚未解開的蛋白大部分為非同源蛋白。 另外一方面,因?yàn)闅v史的原因,CASP14 的測評是基于單結(jié)構(gòu)域的小蛋白質(zhì)結(jié)構(gòu)。對多結(jié)構(gòu)域的大蛋白質(zhì)或者多鏈蛋白質(zhì)復(fù)合體結(jié)構(gòu)的預(yù)測,AlphaFold2 的模擬精度還是一個未知數(shù)。 許錦波教授表示,作為最高等的生物,人類蛋白質(zhì)組的預(yù)測難度比較高,AlphaFold 雖然預(yù)測人類蛋白的覆蓋率達(dá)到了 98.5%,但其在氨基酸層面的結(jié)構(gòu)預(yù)測上仍有一定的提升空間。 與其他幾位學(xué)者一樣,許錦波教授也認(rèn)為,蛋白質(zhì)高精度預(yù)測不能完全依賴于人工智能技術(shù),它應(yīng)作為生物實(shí)驗(yàn)方法的最佳補(bǔ)充技術(shù),二者的關(guān)系是相輔相成的。數(shù)十年來,實(shí)驗(yàn)方法尚未解開的人類蛋白結(jié)構(gòu),仍需要基于大數(shù)據(jù)和算力的AI提供更多思路和可能,同時,加速現(xiàn)有生物結(jié)構(gòu)研究的AI, 其預(yù)測結(jié)果仍需要得到實(shí)驗(yàn)的驗(yàn)證。 郭天南教授是國內(nèi)蛋白質(zhì)組學(xué)領(lǐng)域知名專家,對于AlphaFold2的局限,他的觀點(diǎn)與張陽教授有些類似。 他認(rèn)為,Alphafold2 雖然發(fā)現(xiàn)了很多新的蛋白質(zhì)結(jié)構(gòu),但是這些結(jié)構(gòu)是否完全正確,尚需要傳統(tǒng)生物實(shí)驗(yàn)的驗(yàn)證。如某一個氨基酸的翻譯后修飾可能完全改變蛋白質(zhì)的結(jié)構(gòu)和功能,而目前,AlphaFold2是否具有氨基酸水平和翻譯后修飾的準(zhǔn)確度,尚有待進(jìn)一步研究和驗(yàn)證。 上述不具名的專家說到,目前,AlphaFold 對于模型輸入側(cè)的同源序列信息仍然存在一定的依賴,可能會出現(xiàn)預(yù)測不夠精確的問題;同時,對于三維結(jié)構(gòu)更多依賴于異構(gòu)接觸(heterotypic contacts)而非鏈內(nèi)接觸或同構(gòu)接觸的蛋白質(zhì),也可能出現(xiàn)精度問題,這也是作者在論文中所提到的未來改進(jìn)方向之一。 在 AlphaFold(以及David Baker組的RoseTTAFold)發(fā)布之前,國內(nèi)已有一些將端到端學(xué)習(xí)引入到蛋白質(zhì)結(jié)構(gòu)預(yù)測中的初步嘗試(包括tFold),在預(yù)測精度方面,基本可以達(dá)到與CASP14中排名第二的Baker組相仿的水平,但與AlphaFold仍存在一定差距。 不過,在AlphaFold論文及代碼公開后,相信國內(nèi)這方面的研究將在短期內(nèi)迎來較大的提升幅度。 AlphaFold成功的兩個關(guān)鍵之處 從去年12月亮相以來,AlphaFold已經(jīng)成為圈內(nèi)圈外,生物學(xué)、非生物學(xué)人士的“現(xiàn)象級話題”。 盡管很多人發(fā)出驚呼之聲,但是,如果高度概括一下,AlphaFold的創(chuàng)新之處,會提煉出哪幾個關(guān)鍵詞? 根據(jù)此前DeepMind在CASP14會議上公布的技術(shù)方案,應(yīng)該有兩點(diǎn)。 首先,是注意力機(jī)制的引入。 注意力機(jī)制的引入,解決了如何更好地從多序列對齊(multiple sequence alignment)數(shù)據(jù)中提取特征以指導(dǎo)結(jié)構(gòu)預(yù)測的問題。 在此之前,較為主流的方案是從多序列對齊數(shù)據(jù)中提取共進(jìn)化信息,但DeepMind通過對比發(fā)現(xiàn)這種人工設(shè)計的特征提取會丟失部分關(guān)鍵信息,而通過引入注意力機(jī)制可以較好地解決這一問題。 同時,注意力機(jī)制也應(yīng)用在了迭代更新序列-殘基和殘基-殘基相互作用的過程中,從而以迭代的方式得到更為準(zhǔn)確的距離預(yù)測與三維結(jié)構(gòu)。 許東教授表示,注意力機(jī)制確實(shí)在蛋白結(jié)構(gòu)預(yù)測方面上了一個臺階。 “AlphaFold可以把氨基酸之間的距離整合成三維結(jié)構(gòu)。因?yàn)樗麄兊乃懔芏?,兩年前他們雖然方法和別人幾乎是一樣的,預(yù)測的距離卻準(zhǔn)的多,在CASP里做得很好。” 但是,許教授認(rèn)為,AlphaFold真正的創(chuàng)新之處在于利用了注意力機(jī)制,可以把氨基酸之間的距離預(yù)測問題更為全局、整體的解決,同時對每一對距離的預(yù)測可靠性有更好的評價,從而看出什么預(yù)測距離更靠譜,讓其在蛋白三維結(jié)構(gòu)重建中發(fā)揮更大作用。 這么做,就真正把蛋白已知結(jié)構(gòu)進(jìn)行最大化的應(yīng)用。 許東教授坦言,此前,自己的團(tuán)隊(duì)也思考過,但是那時候采用的是“土一點(diǎn)”的統(tǒng)計方法。 “AlphaFold確實(shí)是非常大的創(chuàng)新,這種創(chuàng)新對研究其他問題也有幫助。比如,我們現(xiàn)在就想用類似的思想去做單細(xì)胞數(shù)據(jù)建模的一些研究。 其次,端到端學(xué)習(xí)的引入。 端到端學(xué)習(xí)的引入,使得從輸入氨基酸序列到輸出蛋白質(zhì)三維結(jié)構(gòu)的過程,可以完全在深度學(xué)習(xí)的框架內(nèi)實(shí)現(xiàn),從而使得優(yōu)化過程可以得到更為直接的誤差信號。 而之前的方法往往基于深度學(xué)習(xí)+傳統(tǒng)結(jié)構(gòu)建模工具(例如Rosetta、I-TASSER等)的組合,這樣結(jié)構(gòu)建模的誤差信號不能直接用于對深度學(xué)習(xí)模型本身進(jìn)行更新。 AlphaFold的商業(yè)前景如何? 雖然,AI不會去掉傳統(tǒng)的蛋白質(zhì)結(jié)構(gòu)研究方法,傳統(tǒng)實(shí)驗(yàn)室技術(shù)仍然具備生命力。但是有一點(diǎn)值得肯定,AlphaFold的爆炸性成果,會對其他入局蛋白質(zhì)結(jié)構(gòu)預(yù)測的廠商產(chǎn)生非常大的沖擊——猶如一條“鯰魚”一樣,攪動整個行業(yè)的現(xiàn)有技術(shù)和商業(yè)格局。 去年,DeepMind聯(lián)合創(chuàng)始人及CEO德米斯·哈薩比斯(Demis Hassabis)第一時間向外界表示:“DeepMind背后的終極愿景一直是構(gòu)建通用人工智能,利用通用人工智能來極大地加速科學(xué)發(fā)現(xiàn)的步伐,幫助我們更好地了解周圍世界?!?/span> 但值得注意的是,在AI領(lǐng)域,研究成果與商業(yè)化之間仍然存在一條鴻溝,即便是有領(lǐng)先算法的DeepMind也不例外。 2019年,據(jù)外媒報道,谷歌母公司Alphabet旗下的人工智能子公司DeepMind2018年的營收幾乎翻了一倍,但凈虧損仍高達(dá)5.72億美元。 從這項(xiàng)成果來看,AlphaFold本質(zhì)還是基于深度學(xué)習(xí)技術(shù),需要算力的支持(使用了大約128個 TPU v3 ——大致相當(dāng)于100-200個 GPU ),這些都是需要真金白銀的支持。 但是,行業(yè)專業(yè)人士向雷鋒網(wǎng)《醫(yī)健AI掘金志》表示,從計算資源需求上來看,128個TPU v3基本還在可接受的范圍內(nèi),同時學(xué)術(shù)界和工業(yè)界后續(xù)也勢必會從算法和工程實(shí)現(xiàn)的角度,對計算效率繼續(xù)進(jìn)行優(yōu)化,來降低實(shí)際計算開銷。 因此,盡管擁有著非常前沿的AI技術(shù),如何將所耗費(fèi)的成本轉(zhuǎn)化為實(shí)實(shí)在在的商業(yè)收益,也是DeepMind需要考慮的現(xiàn)實(shí)問題。 AlphaFold的出現(xiàn),似乎為DeepMind在醫(yī)藥領(lǐng)域的生意帶來了新的突破口。 印第安納大學(xué)醫(yī)學(xué)院主管數(shù)據(jù)科學(xué)的副院長黃昆教授認(rèn)為,對于藥廠來說,100-200個GPU本身投資并不算太大,主要是怎么樣建立或者維持一個這方面的團(tuán)隊(duì)。這就也誕生了一些新的外包機(jī)會。 “幾年前,我就看到有初創(chuàng)公司用機(jī)器學(xué)習(xí)來做結(jié)構(gòu)篩藥,不知道這個進(jìn)展是會引過來更多這方面的創(chuàng)業(yè)還是反過來讓DeepMind獨(dú)霸一方?!?/span> 此前,許東教授也考慮過這個問題:這項(xiàng)技術(shù)的應(yīng)用前景,很多程度上取決于DeepMind的商業(yè)模式,是不是能給學(xué)術(shù)界開放使用。從商業(yè)的角度來看,很多制藥公司會為此付費(fèi)。 此外,AlphaFold并不是一個開源軟件,不是所有人都能拿到AlphaFold最好的版本。DeepMind也許會部分開放,但不一定開放最好的版本。 “如果是需要收費(fèi),很多研究組不見得有錢去做這個事情。像BLAST那樣進(jìn)行序列比對,我覺得還有一點(diǎn)距離。” 但是,7月AlphaFold2的這次開源,也算是對許東教授疑問的一次正式回應(yīng)。 晶泰科技的CEO馬健也認(rèn)為,算力現(xiàn)在已經(jīng)不是問題。100-200個GPU是訓(xùn)練的使用量,真正使用中的算力可能只是這個數(shù)字的零頭。而計算將節(jié)省大量的時間和實(shí)驗(yàn)成本。 “計算機(jī)輔助藥物設(shè)計與發(fā)現(xiàn)以及AI的應(yīng)用,經(jīng)過了漫長的發(fā)展和近期的飛速發(fā)展,也已經(jīng)有了質(zhì)的飛躍,比如晶泰科技的智能藥物研發(fā)平臺,在大部分蛋白上都可以準(zhǔn)確預(yù)測活性,選擇性,耐藥性等藥物關(guān)鍵性質(zhì),可以在極少量的實(shí)驗(yàn)下獲得理想的藥物候選?!?/span> 正如馬健所言,這項(xiàng)技術(shù)將開啟一個藥物研發(fā)和疾病研究的新時代,可以從原子分子層面上幫助理解疾病的作用機(jī)理。 同時,與疾病相關(guān)的蛋白結(jié)構(gòu)越來越多地被計算解析出來,會提供大量的新靶點(diǎn),如同給藥物發(fā)現(xiàn)打開了一道源頭的閘門,為藥企開發(fā)first-in-class藥物創(chuàng)造更多新機(jī)會。 生命科學(xué),站在最好的時代路口 其實(shí),任何一項(xiàng)學(xué)術(shù)成果的爆發(fā),都有前人不斷耕耘的腳步。 去年Deepmind消息出來后,做了多年結(jié)構(gòu)生物學(xué)研究的許東教授就發(fā)了一條朋友圈。 他寫道,我在這個領(lǐng)域做了十幾年的工作,多次參加過CASP大賽。現(xiàn)在終于看到這個問題被靠譜地解決了,是一件科學(xué)領(lǐng)域的幸事,可喜可賀!雖然DeepMind是集大成者,但這個問題的解決是無數(shù)人幾十年的結(jié)晶。 許東教授向雷鋒網(wǎng)說到,自己在橡樹嶺國家實(shí)驗(yàn)室和徐鷹教授一起,做了一些蛋白結(jié)構(gòu)預(yù)測的工作,當(dāng)時受到不少關(guān)注,因此兩人獲得了2001年美國“最杰出研究與開發(fā)100 人獎。 此外,周耀旗教授、李明教授、許錦波教授、張陽教授、卜東波教授和自己系里的程建林教授等在這個領(lǐng)域里都做了非常好的工作。 特別是許錦波教授課題組是真正第一個用深度學(xué)習(xí)來進(jìn)行氨基酸距離預(yù)測的人,對這個領(lǐng)域起了很大的作用;密歇根大學(xué)張陽教授實(shí)驗(yàn)室的服務(wù)器很久在CASP自動預(yù)測大類里排名第一,得到了廣泛使用。 “所以,大家可能看到是最閃亮的那顆星,但是背后有很多人默默為之奮斗。今天AlphaFold的成就絕對是太多人積淀的結(jié)果。” 同樣集大成的,還有DeepMind本身的團(tuán)隊(duì),他們站在了這個時代最聰明的人的肩膀上。 行業(yè)專業(yè)人士向雷鋒網(wǎng)表示,AlphaFold的研究團(tuán)隊(duì)非常豪華,19位共同一作者里面有很多人是在語音、計算機(jī)視覺、自然語言處理、機(jī)器學(xué)習(xí)、醫(yī)療影像、分子動力學(xué)、高能物理、量子化學(xué)等領(lǐng)域的知名學(xué)者。 值得注意的是,排在榜單前幾名的就有上文提到的密歇根大學(xué)張陽教授實(shí)驗(yàn)室。 有知乎網(wǎng)友表示,“能戰(zhàn)勝AlphFold的只能是其他巨頭公司,高校已經(jīng)沒有戰(zhàn)勝的條件了?!?/span> 行業(yè)專業(yè)人士坦言,和工程型團(tuán)隊(duì)相比,學(xué)術(shù)型團(tuán)隊(duì)在計算資源上已經(jīng)不再是短板,而學(xué)術(shù)團(tuán)隊(duì)和工程團(tuán)隊(duì)的一個明顯差別在于,學(xué)生很難做到工程人員能做的事情,公司在這一點(diǎn)上可以做到極致。 “真正要把一件事情做好,需要每個component(組成部分)都做到極致。因此,從這個角度來看,很細(xì)致才能做得很好,DeepMind是一個很優(yōu)秀的集成者?!?/span> 每到AI戰(zhàn)勝人類時,總有這種相似的論調(diào):XX職業(yè)要被AI取代了。因此,當(dāng)AlphaFold一出時,就有人預(yù)言到,結(jié)構(gòu)生物學(xué)家都要失業(yè)。 顏寧在微博里也就明確表示,如果你對結(jié)構(gòu)生物學(xué)的理解還停留在20年前,那這么說也不是不行。但是結(jié)構(gòu)生物學(xué)自身一直在發(fā)展著,一場冷凍電鏡的分辨率革命更是令結(jié)構(gòu)生物學(xué)今時不同往日了。 AlphaFold注定會成為這個時代中濃墨重彩的一筆。顏寧在微博中的一段話,特別適合概括這次AlphaFold的時代意義。 我在2015年主持一個seminar的時候曾經(jīng)評論過:structural biology的本質(zhì)是biology,是理解生命、是做出生物學(xué)發(fā)現(xiàn)。但是在X-射線晶體學(xué)為主要手段的時代,獲得大多數(shù)研究對象的結(jié)構(gòu)本身太難了,于是很多研究者把“獲得結(jié)構(gòu)”本身作為了目標(biāo),讓外行誤以為結(jié)構(gòu)生物學(xué)就是解結(jié)構(gòu)。 但是我從進(jìn)入這個領(lǐng)域之初,就被教育的明明白白:結(jié)構(gòu)本身只是手段,它們是為了回答問題、做出發(fā)現(xiàn)。 人類對未知世界的渴求,對真相的追求,是AlphaFold在這個AI時代最好的注腳。 因此,當(dāng)看到馬化騰、李彥宏、王小川等人對生命科學(xué)的追求,花大價錢組建團(tuán)隊(duì),我們應(yīng)該對這件事情的本身報以善良的敬意。因?yàn)?,在學(xué)術(shù)研究的過程中,有著太多黎明前的黑暗,不是所有人都可以挺得過去。 每一個為了探尋人類生命奧秘而努力的個體,都是這個時代,最值得敬佩的人。 |
|