晴天霹靂,上周末AI圈突然傳出噩耗:商湯創(chuàng)始人湯曉鷗教授于2023年12月15日晚去逝。 現(xiàn)在媒體的口徑是“睡夢中不幸離世”,原因有人說是心梗,也有人說是呼吸暫停癥狀。當(dāng)然,海外還有一堆人瞎造謠,都不可信。湯曉鷗教授最著名的身份是“AI四小龍”之一的商湯科技創(chuàng)始人,但他從2019年開始就逐漸淡出了商湯的管理,精力更多放在教育和科研上。他今年只有55歲,說一句英年早逝并不過分,AI圈者都在刷屏致哀。而且令人難過的是:類似的事兒去年發(fā)生過一次了。2022年6月,曠視科技的首席科學(xué)家孫劍也是突發(fā)疾病,搶救無效逝世,年僅45歲。曠視是“AI四小龍”中的另外一家,孫劍和湯曉鷗更是相熟多年。事實(shí)上,湯曉鷗最著名的一篇論文,就是2009年跟孫劍和何愷明一起合作發(fā)表的Single Image Haze Removal Using Dark Channel Prior。這篇論文是關(guān)于圖像去霧算法的,是計算機(jī)視覺領(lǐng)域頂級會議CVPR的2009年度最佳論文。這是CVPR歷史上第一次有中國團(tuán)隊獲獎。 論文第一作者何愷明,是湯曉鷗在香港中文大學(xué)的博士生,也是孫劍在微軟工作時的實(shí)習(xí)生,他目前任教于MIT,學(xué)術(shù)成就甚至超越了兩位導(dǎo)師。 回望2009年的這篇論文,三個作者中有兩個已經(jīng)英年早逝,令人唏噓。 而且這些英年早逝,發(fā)生在AGI革命爆發(fā)、中國AI產(chǎn)業(yè)被部分封鎖、業(yè)界正在焦慮追趕的背景下,所以有好事者第一時間就跟陰謀論聯(lián)系在一起。 這兩天筆者跟很多從業(yè)人員聊起了湯曉鷗,發(fā)現(xiàn)他的分量的確極重,影響力難以復(fù)制。 在科學(xué)領(lǐng)域,他一手把香港中文大學(xué)MMLabs打造成全球人工智能重鎮(zhèn),而他自己也是計算機(jī)視覺領(lǐng)域的頂級科學(xué)家,論文被引13.9萬次。 在政策領(lǐng)域,他是科技領(lǐng)域?yàn)閿?shù)不多能夠“上達(dá)天聽”的學(xué)者。在2018年11月舉辦的民營經(jīng)濟(jì)座談會上,湯曉鷗是10個發(fā)言的人之一。 在商業(yè)領(lǐng)域,他創(chuàng)辦的商湯曾經(jīng)是中國最耀眼的AI創(chuàng)業(yè)公司。盡管技術(shù)和商業(yè)化頻繁遭遇爭議,但目前市值仍然超過400億港幣。 所以,他的逝世是中國AI屆的巨大損失,影響難以估量。 但業(yè)界在討論湯曉鷗的“難以復(fù)制”時,還不在上述的三點(diǎn)上,畢竟中國的企業(yè)家很多,科學(xué)家很多,轉(zhuǎn)型企業(yè)家的科學(xué)家也很多。 大家提到最多的,是湯曉鷗培養(yǎng)人才的模式,用一個朋友的話來說就是:“在他的調(diào)教下,頂級人工智能人才如同流水線一般被錘煉出來?!?/span> 這位朋友給我扔給我一個網(wǎng)址頁面,來自湯曉鷗創(chuàng)辦的香港中文大學(xué)MMLab,上面記述了實(shí)驗(yàn)室所有已畢業(yè)校友的去向和履歷。 筆者翻完頁面上134名學(xué)生的履歷,筆者對湯曉鷗教授的重要性,有了更新的認(rèn)識。
一路高光的履歷在解讀湯曉鷗如何培養(yǎng)人才之前,我們先來復(fù)盤一下他本人的經(jīng)歷,原因很簡單:湯曉鷗自己的履歷,給未來的學(xué)生們打了一個模版。 由于長期在香港任教,所以不少人以為湯曉鷗是一個香港人,但實(shí)際上他是一個地道的東北人,于1968年出生于遼寧鞍山。 湯曉鷗從小成績優(yōu)異,1985年畢業(yè)于當(dāng)?shù)刂攸c(diǎn)中學(xué)鞍山一中??赡苁鞘艿郊亦l(xiāng)工業(yè)重鎮(zhèn)的影響,湯曉鷗報考了中科大的精密機(jī)械與精密儀器系。 年輕時的湯曉鷗 來源:B站up主xoooooooo 1990年本科畢業(yè)后,他前往美國羅徹斯特大學(xué)攻讀碩士,一年后,他申請到了麻省理工學(xué)院的博士項(xiàng)目,專業(yè)是應(yīng)用海洋科技(Applied Ocean Science and Engineering)。 這個博士項(xiàng)目,是由MIT和世界著名的海洋研究機(jī)構(gòu)伍茲霍爾海洋研究所(Woods Hole Oceanographic Institution,簡稱WHOI)聯(lián)合培養(yǎng)。 伍茲霍爾海洋研究所,馬薩諸塞州 這個研究所位于麻省南部,距離MIT的校園一個半小時車程。在1985年,正是伍茲霍爾研究所設(shè)計的機(jī)器人,找到了沉在海底的泰塔尼克號。 也是在這里,湯曉鷗發(fā)表了大量跟聲納和圖像識別相關(guān)的論文和報告。 在后來的公開發(fā)言中,湯曉鷗說這是他對人工智能開始產(chǎn)生濃厚興趣的起點(diǎn),尤其是當(dāng)他看到機(jī)器人使用聲納和攝像頭在海底自由地探索時。WHOI潛水機(jī)器人 Jason Jr.探索泰坦尼克號, 1986年 1996年博士畢業(yè)后,湯曉鷗前往香港中文大學(xué)任教,2001年他創(chuàng)辦了香港中文大學(xué)多媒體實(shí)驗(yàn)室(MMLab),主攻計算機(jī)視覺。 這一實(shí)驗(yàn)室如今也被認(rèn)為是商湯科技的前身。 此時計算機(jī)視覺雖在國際上有廣泛討論,但在香港屬于徹頭徹尾的“前沿技術(shù)”,基本相當(dāng)于當(dāng)年奧本海默回美國開設(shè)量子力學(xué)課。 沒有成熟的學(xué)術(shù)圈,就意味著這個實(shí)驗(yàn)室既吸引不到學(xué)生,又拿不到研究經(jīng)費(fèi),更何況在香港,優(yōu)秀的本地學(xué)生去美國深造早已成為共識。 但很快,湯曉鷗就想到了一套解決方法——從內(nèi)陸招生。 第一個生源地就是母校中科大。通過自己的接觸和校友的介紹,湯曉鷗很快就挖掘到了王曉剛、陶大程、林達(dá)華、曹亮亮等優(yōu)秀學(xué)生。 湯曉鷗從科大招的第一個學(xué)生是王曉剛,后來不僅成了他的妹夫,還跟他一起創(chuàng)立了商湯。 商湯科技研究院院長王曉剛 2005年,湯曉鷗開始在微軟亞洲研究院(MSRA)兼職。微軟亞洲研究院位于北京市海淀區(qū),最不缺的就是來自清華北大的實(shí)習(xí)生。 通過這個途徑,他進(jìn)一步拓展了生源,邀請優(yōu)秀的年輕人前往MMLab訪學(xué)或者求學(xué),如何愷明,顏水成,徐東,崔靖宇等人。 解決了生源問題,下面就應(yīng)該解決培養(yǎng)問題了。港中文MMLab后來被稱為“中國計算機(jī)視覺的黃埔軍?!?,必定有一套獨(dú)特的培養(yǎng)體系。 這套體系的核心密碼,就在于四個字——頂級會議。
勇攀頂級會議先普及下計算機(jī)視覺領(lǐng)域的三大頂級會議:CVPR、ICCV和ECCV。CVPR全稱是“計算機(jī)視覺和模式識別會議”,每年舉辦一次,基本都在美國,偶爾也去其他地方,論文接受率大概是20~30%。ICCV全稱是“計算機(jī)視覺國際會議”,每兩年舉辦一次,地點(diǎn)全球流動,比如19年在首爾,21年停辦,今年在巴黎,論文接受率也在20~30%。ECCV全稱是“歐洲計算機(jī)視覺會議”,每兩年舉辦一次,跟ICCV錯峰,舉辦地點(diǎn)主要在歐洲,不過去年在特拉維夫,接收率跟上面兩個差不多。計算機(jī)科學(xué)由于發(fā)展速度快,所以學(xué)術(shù)大牛會優(yōu)先選擇把成果發(fā)在會議上,而不是出版周期長的期刊。因此計算機(jī)的學(xué)術(shù)影響力,就看頂會。比如CVPR,在最新的Google學(xué)術(shù)出版物的排名中,CVPR只排在Nature、新英格蘭醫(yī)學(xué)和Science之后,在柳葉刀之前,高居第四位。從2001年成立開始,湯曉鷗就把這些頂級會議,設(shè)置成了學(xué)生們的標(biāo)靶。雷鋒網(wǎng)的一篇報道描述了這種氛圍:“以頂會'死亡線’(Deadline)為目標(biāo)制定科研規(guī)劃,在投稿前熬夜備戰(zhàn)沖刺,并且閱讀大量的科研論文?!?/span>湯曉鷗的學(xué)生也非常給力。在他的指導(dǎo)下,王曉剛在碩士兩年里發(fā)表了5篇CVPR和ICCV論文,林達(dá)華則在兩年里發(fā)表了7篇頂會論文。香港中文大學(xué)教授林達(dá)華 最終,這些頂會論文成了更高舞臺的敲門磚:王曉剛和林達(dá)華碩士畢業(yè)后都去了麻省理工學(xué)院攻讀博士,兩人后來都回到了MMLab執(zhí)教。從港中文碩士走向麻省理工博士的還有薛天帆(本科清華,現(xiàn)香港中文大學(xué)教授)和周博磊(本科上海交大,現(xiàn)UCLA助理教授)等人。我在2010年八月一進(jìn)實(shí)驗(yàn)室就悶頭苦干三個月,順利在十一月份提交了自己在湯老師和曉剛老師指導(dǎo)下的第一篇論文,也成為了我的第一篇CVPR論文。從此初出茅廬,開始了我在計算機(jī)視覺領(lǐng)域的探索。而更多潛在的生源,被這樣的案例所吸引,越來越多的優(yōu)秀學(xué)生加入MMLab,實(shí)驗(yàn)室形成了培養(yǎng)人才的正向循環(huán)。湯曉鷗認(rèn)為沖擊頂會是在跟全球的同行競技,他把做研究比做“論劍”,認(rèn)為“要論就要到華山論劍,不要去太行山、大別山論劍?!?/span>另外,他還非常重視原創(chuàng)研究。在灌水論文橫行的當(dāng)下,港中文MMLab的論文質(zhì)量很高,多次拿到頂級會議的“最佳論文”稱號。2009年,港中文MMLab和微軟亞洲研究院合作的論文奪得了當(dāng)年CVPR的最佳論文獎(本文開頭提到的那一篇),MMLab的江湖地位驟然提升。湯曉鷗和何愷明, 2010年 2010年后,湯曉鷗將目光逐漸轉(zhuǎn)向深度學(xué)習(xí)。在2011年到2013年期間,MMLab在ICCV和CVPR兩大頂會上發(fā)表了14篇深度學(xué)習(xí)論文,占比超過一半。而在商湯成立(2014年)之后,“卷論文”的傳統(tǒng)也從香港帶到了上海。2018年湯曉鷗在一場發(fā)布會上公布了一個數(shù)據(jù):過去幾年全球各類機(jī)構(gòu)在頂級計算機(jī)視覺學(xué)術(shù)會上發(fā)布的論文數(shù)量排行中,商湯位列第三,僅次于微軟和卡耐基梅隆大學(xué)。擁有頂會論文的加持,湯曉鷗學(xué)生的職業(yè)路徑顯然也是頂級的。黃埔軍校,實(shí)至名歸我們統(tǒng)計了香港中文大學(xué)MMLab的134名畢業(yè)校友的去向,發(fā)現(xiàn)大致可以分為三類。第一類方向是高校,根據(jù)統(tǒng)計有50名畢業(yè)校友去了高校擔(dān)任教職,最高的自然是麻省理工,最低的也至少是國內(nèi)211/985高校。 第二類方向是企業(yè),有84位學(xué)生選擇去了科技公司,人數(shù)最多的自然是商湯,有18名校友追隨湯曉鷗的創(chuàng)業(yè)。其他去企業(yè)的學(xué)生也進(jìn)的也都是頂級科技公司,比如華為(6人)、騰訊(6人)、Google(3人)、微軟(4人)以及Meta(3人)等。第三類方向是研究機(jī)構(gòu),如上海人工智能實(shí)驗(yàn)室和深圳先進(jìn)技術(shù)研究院等,其中有6名學(xué)生加入了湯曉鷗主持的上海人工智能實(shí)驗(yàn)室,另外至少還有5名校友在這所實(shí)驗(yàn)室里兼職工作。在這些校友中,我們挑選了比較有代表性的一部分人,履歷如下所示。在前往高校的校友中,有相當(dāng)一部分人已經(jīng)自己成為碩導(dǎo)或者博導(dǎo),如王曉東、林達(dá)華、趙峰、王利民等,為中國AI行業(yè)培養(yǎng)出更多的人才。 而何愷明則是湯曉鷗為全人類培養(yǎng)的人才。用一位業(yè)內(nèi)人士的話來說:“僅憑ResNet,何愷明就在人工智能的史書上擁有名字了?!?/span>何愷明的發(fā)表的論文“只有”69篇,但引用量就高達(dá)51.2萬次。他加入麻省理工之后,馬上就成了MIT被引用次數(shù)最多的科學(xué)家。何愷明文獻(xiàn)和引用統(tǒng)計,Google Scholar 林達(dá)華在悼念湯曉鷗時寫道[2]:湯老師的一生,傾盡心血,就是要為年輕一代的學(xué)者創(chuàng)造一個成長的空間,為國家也為全世界培育原創(chuàng)的力量。從MMLab、商湯、到上海人工智能實(shí)驗(yàn)室,都是他為年輕人打造的一個個成長的舞臺。 在2023年的世界人工智能大會上,湯曉鷗做主題發(fā)言,他沒有講產(chǎn)業(yè)趨勢,沒有講前沿突破,而是講述了三個學(xué)生——王曉剛、何愷明、林達(dá)華——的成長故事。這充分說明了一件事情:在他心里,學(xué)生才是最令他珍視的。壯志未竟的事業(yè)
從2019年之后,湯曉鷗的精力就主要放在了一家新成立的機(jī)構(gòu)——上海人工智能實(shí)驗(yàn)室上。目前在UIUC任教的曹亮亮回憶: 上次回國跟湯老師聊天,我就傻乎乎的問他,即然商湯已經(jīng)不需要太多精力了,為什么不休息或者退休,為什么要付出那么多力氣去搞上海AI Lab。曉鷗說我們一直要瞄準(zhǔn)最高水平,這樣才有能力去改變這個社會。使命驅(qū)動著湯曉鷗,而大量出身MMLab的學(xué)者則追隨他的腳步,加入了這家新成立的實(shí)驗(yàn)室,如喬宇、歐陽萬里、侯躍南、王佳琦、高鵬、邵文琪、呂照陽、龐江淼等。 在今年6月,上海人工智能實(shí)驗(yàn)室聯(lián)合武大、商湯的關(guān)于自動駕駛通用模型的論文,從9155篇作品中脫穎而出,獲得CVPR 2023年最佳論文獎。而論文的牽頭作者,是湯曉鷗的學(xué)生王曉剛帶出來的博士——湯曉鷗傳承的第三代已經(jīng)獨(dú)當(dāng)一面,這離MMLab的成立也已經(jīng)20多年。 但命運(yùn)的休止符,落在了這個格外寒冷的冬天。在AI浪潮席卷而來之時,中國人工智能領(lǐng)域還要在焦慮和追趕中繼續(xù)前行。只是湯老師的課已經(jīng)提前結(jié)束了。老師再見。全文完。 [1] 致敬湯曉鷗:將港中文建成中國計算機(jī)視覺黃埔軍校,陳彩嫻、黃楠,雷鋒網(wǎng)[3] 商湯科技創(chuàng)始人湯曉鷗睡夢中離世,你對他有哪些記憶?知乎
|