盡管人工智能不是新鮮的概念,從1956年被提出至今已逾一個甲子,但對于大多數(shù)人來說,從2016年AlphaGo戰(zhàn)勝圍棋世界冠軍李世石開始,才對人工智能略有耳詳。在此之前,人工智能在大眾輿論場中幾乎是長期沉默的。 但從學(xué)術(shù)界的視角來看,對人工智能的研究,猶如在盤山公路上爬坡,從未停止過。歐洲科學(xué)院院士、上海交大人工智能研究院首席科學(xué)家徐雷就是一位從上世紀(jì)八十年代初就加入這個領(lǐng)域的老一輩研究者,談及隨機霍夫變換RHT、分類器組合、對手競爭學(xué)習(xí)RPCL、非線性PCA學(xué)習(xí)、Mixture of Experts, EM 算法,LMSER學(xué)習(xí)、BYY 學(xué)習(xí)等神經(jīng)網(wǎng)絡(luò)和模式識別領(lǐng)域中的多項先驅(qū)成果時,都繞不開他的名字。在這些領(lǐng)域中,徐雷自九十年代初起就一直是國際上最有影響的幾位華人之一。 在37年余的人工智能研究生涯中,徐雷做出了多個廣為引用的成果。2001年當(dāng)選IEEE Fellow,是從計算智能學(xué)會當(dāng)選之首位中國學(xué)者;2002年當(dāng)選國際模式識別學(xué)會 Fellow,是最早獲選的幾個華人之一; 2003年當(dāng)選歐洲科學(xué)院院士。徐雷曾與Judea Pearl (2011圖靈獎得主), Geoffrey Hinton(引發(fā)當(dāng)下人工智能浪潮的深度學(xué)習(xí)之父)和Michael I. Jordan均有合作文章發(fā)表。1993年加入香港中文大學(xué)之前,曾在MIT的Michael I. Jordan團隊工作過一年多。早在九十年代的前五年里,就在學(xué)界最頂級的NIPS(后改名為NeurlPS)會議中發(fā)表了四篇論文,并三次擔(dān)任NIPS大中華區(qū)的聯(lián)絡(luò)人。 徐雷曾榮獲多個國內(nèi)外主要獎項,如獲93年國家自然科學(xué)獎、95年國際神經(jīng)網(wǎng)絡(luò)學(xué)會領(lǐng)袖獎、06年亞太神經(jīng)網(wǎng)絡(luò)學(xué)會最高獎杰出成就獎(首位獲獎華人)。 為了解人工智能研究的歷史、現(xiàn)在與未來,AI報道(AI Report)拜訪了徐雷教授。這位在國際舞臺上為中國贏得聲譽的科學(xué)家對中國人工智能的發(fā)展有何看法?答案或許并不如國內(nèi)AI圈中很多人想得那么樂觀。 中國人工智能發(fā)展水平距離世界頂尖還有多遠? 近年,我國人工智能發(fā)展迅猛,在企業(yè)數(shù)、發(fā)表論文數(shù)等數(shù)項指標(biāo)上都已達到了世界第二。那么,中國整體人工智能發(fā)展水平距離世界頂尖水平還差多遠? 徐雷認(rèn)為,要講清這個問題,最好先看一下這一波人工智能熱潮是怎樣發(fā)展起來的。 這一波人工智能熱潮起點源于2006年Geoffrey Hinton 及其學(xué)生在《神經(jīng)計算》和《科學(xué)》上發(fā)表的兩篇深度學(xué)習(xí)論文,經(jīng)過在學(xué)界的幾年孕育以后,引起IBM,微軟、谷歌等企業(yè)跟進推動,尤其是中國互聯(lián)網(wǎng)產(chǎn)業(yè)的蜂擁而入,才有了現(xiàn)在人工智能大發(fā)展的盛況。這波熱潮有下面三個主要支撐: (1) 理論方法 Hinton在2006年的工作源頭其實是八十年代中期曾引起人工神經(jīng)網(wǎng)絡(luò)研究熱潮的反向傳播學(xué)習(xí)算法,始于發(fā)表在1986年《自然》的一篇論文,Hinton是三位作者中間的那位。這個算法的早期影子先是回溯到1974年,后又前推到1968年。八十年代末之后的十余年,在神經(jīng)網(wǎng)絡(luò)研究在理論、方法、和算法上都有很大發(fā)展?,F(xiàn)今的基本家當(dāng),例如,卷積網(wǎng)絡(luò)、生成網(wǎng)絡(luò),自編碼學(xué)習(xí)、變分學(xué)習(xí)、以及包括LSTM在內(nèi)的各種遞歸網(wǎng)絡(luò),大都來自于那個時期。近年來的發(fā)展主流,基本上是這些方法的應(yīng)用、拓展、和各種集成,當(dāng)然也有一些如GAN學(xué)習(xí)等基礎(chǔ)研究突破。 (2) 芯片算力 馬斯克的OpenAI 認(rèn)為,2012-2017六年間AI計算力6年提升30萬倍。保守估計九十年代初到2006年的算力增長就算只有它的十分之一,那也意味著做2006年需要20分鐘算的問題,九十年代初中期要算一年。當(dāng)時的基礎(chǔ)研究提出了各種方法,但不可能通過計算得到驗證,所以才會有一、二十年的滯后期。Hinton在1986年后的二十年再續(xù)前緣,既反映他的執(zhí)著,也是歷史的圓滿。 (3) 大數(shù)據(jù)和互聯(lián)網(wǎng) 九十年代初采集用于語音識別的數(shù)據(jù)都已經(jīng)十分困難,采集人臉圖像數(shù)據(jù)則難度更大。就算那時有算力,也不可能有足夠大量的數(shù)據(jù)來訓(xùn)練,以確定深度神經(jīng)網(wǎng)絡(luò)中的大量參數(shù)。2009年原微軟人工智能首席科學(xué)家鄧力邀請Hinton來到微軟,利用他們在語音領(lǐng)域積累了多年的大數(shù)據(jù),嘗試了深度學(xué)習(xí)的應(yīng)用,發(fā)現(xiàn)用深度學(xué)習(xí)進行語音識別比原來的識別方法成果有了很大提高。李飛飛在 CVPR 2009 上發(fā)表了關(guān)于ImageNet的論文,關(guān)注如何有效地獲取圖像數(shù)據(jù)集,并從2010 年開始開啟了每年一度的ImageNet 挑戰(zhàn)賽(通過互聯(lián)網(wǎng)和眾籌),解決了計算機視覺的大數(shù)據(jù)獲取問題。 在上述三大支撐中,第三個是我國的明顯強項。最多的人口、通訊和互聯(lián)網(wǎng)的飛速發(fā)展和普及、以及體制的優(yōu)勢和社會的需求,語音、圖像、以及其他大數(shù)據(jù)的獲取都遠超歐美。而通過雄厚的資金投入,也購買獲得了巨大的算力,這些催生了國內(nèi)許多獨角獸公司出現(xiàn)和飛速發(fā)展。2012年,Hinton團隊在ImageNet首次使用深度學(xué)習(xí)完勝其它團隊,神經(jīng)網(wǎng)絡(luò)層數(shù)只有個位數(shù)。商湯的團隊在2016年ImageNet圖片分類中做出最佳性能時,用得神經(jīng)網(wǎng)絡(luò)層數(shù)是1200多層。 語音識別和計算機視覺這兩個“耳聰目明”領(lǐng)域快速進入商用,這大大推動了這波人工智能浪潮在世界范圍內(nèi)的高漲。與此同時,主要集中在這兩個領(lǐng)域,中國學(xué)者發(fā)表論文數(shù)與日俱增,國內(nèi)也出現(xiàn)了許多獨角獸公司。從總量來看,在企業(yè)數(shù)、發(fā)表論文數(shù)等數(shù)項指標(biāo)上都已達到了世界第二。甚至可以說,在刷臉場景下,已做到世界第一。 能在“耳聰目明”領(lǐng)域迅速發(fā)力,還和我國的文化淵源有關(guān)。徐雷說, 粗略地,人工智能可以從機器模擬“耳聰目明”、形象思維、和抽象思維三個方面來考慮。早在1975年,錢學(xué)森先生就提出,常用而重要的智能活動其實在形象思維。而那時候,人工智能界主要在研究抽象思維。 很有意思,這兩種不同方式,中國人和西方人正好各擅長其一。中國文字基本是象形的,思維發(fā)展偏重形象思維,而西方文字抽象成符號,注重關(guān)系、形式、與語法。 符號文字抽象于形象文字,故有西方有學(xué)者把抽象思維叫高級智能。自然地, AI發(fā)展的前半段就是基于符號思維,注重解析出基本單元,再按一定的規(guī)則,由底朝上逐步組合搭出一個體系。這種思維有利于抓住主要脈絡(luò),解釋所看到的現(xiàn)實世界。 但是,針對“耳聰目明”這類識別認(rèn)知活動,反而遇到很大困難。盡管有時被稱為初級智能, “耳聰目明”卻是思維的基礎(chǔ),AI發(fā)展的前半段其實走了建“空中樓閣”的彎路。 而這次人工智能浪潮就是從“耳聰目明”這個形象思維的基礎(chǔ)突破的。做法很簡單,數(shù)學(xué)上完成一個X到Y(jié)的一個整體性的映射,用一個深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來實現(xiàn)??赡苡捎谖覀兊奈幕眯蜗笏季S,華人不僅參與這次推波助瀾并引起主要發(fā)展,而且也是過去一路走來致力于推動“耳聰目明”的主角之一。 早在1957年就有在美國的華人介入字符識別,70年代中期到80年代中期,是主攻“耳聰目明“的模式識別之第一個發(fā)展期,頭號領(lǐng)袖是美國普渡大學(xué)教授付京孫先生(1930-1985)。而徐雷的博士導(dǎo)師清華大學(xué)常迵院士(1917-1991)和博士后導(dǎo)師北京大學(xué)程民德院士(1917-1998),在上述時期則領(lǐng)導(dǎo)了中國模式識別的發(fā)展,建立了我國智能科學(xué)的第一批三個國家重點實驗室,其中兩個主攻模式識別與機器認(rèn)知,并在我國學(xué)科設(shè)置上正式開出了模式識別的相關(guān)專業(yè),近年來我國在 “耳聰目明”方面能夠人才濟濟,應(yīng)當(dāng)回溯到當(dāng)年他們打下的根基。 中國在“耳聰目明”領(lǐng)域能迅速發(fā)力的現(xiàn)實基礎(chǔ),是有大量數(shù)據(jù)、大量需求,和大量投入。影像醫(yī)療就是另一個我國依靠樣本優(yōu)勢有望快速趕超的領(lǐng)域,僅北京腫瘤醫(yī)院一個月胃癌的門診病歷數(shù)就超過全美胃癌患者一年的門診量。中國還有不少有明顯的樣本優(yōu)勢的其它應(yīng)用領(lǐng)域,都有望能快速看到應(yīng)用效益,并問鼎世界。即使如此,現(xiàn)在也不到聲稱中國AI在應(yīng)用方面已經(jīng)領(lǐng)先的時候。例如,在語音識別和語言翻譯方面,Google的水平優(yōu)于國內(nèi)企業(yè),特別是在英文和其他文字領(lǐng)域更是如此。在機器人行業(yè)中,尤其是類人或特種機器人,離美國的波士頓動力機器人的水平,國內(nèi)水平遠遠落后,可能差一、二十年都不止。 更令我們保持清醒的是,在三大支撐中的前兩個,我們的差距更大。 在芯片方面,設(shè)計各種專門的人工智能芯片,是可以有望很快趕上甚至超越的。但是在芯片的制造上,卻有一段很長的路要趕。而制造能力才是基礎(chǔ),造不出來的設(shè)計只能是紙上談兵。在算力方面,盡管中國的神威和天河超級計算機都曾經(jīng)問鼎全球,現(xiàn)在也仍位四甲,但在量子計算機方面,谷歌和IBM都在商用化方面推進很快。還有,在下一代計算材料和芯片方面,我國的短板可能更大。 在徐雷看來,東方文化注重集成、注重整體應(yīng)用,這是一種優(yōu)勢;西方注重基礎(chǔ),注重造芯片,這是另一種優(yōu)勢。取人之長補己之短,把別人的芯片集成過來直接使用不失為上策,東西方文化融合、互補,才能給發(fā)展人工智能帶來更好局面;只有在行不通時,才需要我們一切重新造起,這其中的關(guān)鍵是,中國必須要做到讓對方愿意賣給我們使用。 80年代初期的歷史或值得我們借鑒:當(dāng)時中國要買美國的一些計算機設(shè)備,都面臨西方所謂巴黎統(tǒng)籌委員會對我們的掣肘。因此,中國不斷跟蹤研制,一達到一個新的水平,他們就會批準(zhǔn)把更一高檔的設(shè)備賣給中國??梢姡诋a(chǎn)業(yè)發(fā)展時,不一定要樣樣自主做,以小得多的代價跟蹤,最優(yōu)配置資源,也許更佳,但要清楚讓人知道,需要的時候,我們是有能力自己做的。 要在人工智能理論方法的基礎(chǔ)研究達到世界領(lǐng)先水平,中國也仍然是任重道遠。目前來自中國的論文,大多是在偏應(yīng)用性質(zhì)的會議上發(fā)表,能沖進NIPS論文不多,還達不到能在NIPS這個基礎(chǔ)研究的頂會上占有不可或缺的地位。大量的工作,都在追求能在中國計算機學(xué)會或其他單位自定的頂級會議上可以發(fā)表,并不追求是否能被別人大量的引用、跟隨和應(yīng)用,而追求從0到1突破的努力更是鳳毛麟角。尤其令人擔(dān)憂的是,大多數(shù)大學(xué)和研究機構(gòu)發(fā)出的論文,還都是通過直接用別人的開源程序計算的。 徐雷接著說,前面提到,中國人的思維是從頂向下的,忽略基礎(chǔ)創(chuàng)新,重視整體把握、應(yīng)用集成,追求“短、平、快”,最后一點是尤其堪憂的。大家都離起跑線不遠時,差距還不遠,越往前差距越大。對此,他特別地提到八十年代導(dǎo)師常迵之問。第一次常先生問付京孫教授:“中國模式識別的研究水平離美國差多遠?”付先生答“三、四年”。而三、四年后付先生再來華訪問,常先生再問“還差幾年”, 付先生答“七、八年”。類似的故事,在基礎(chǔ)研究起關(guān)鍵作用的階段,其他領(lǐng)域也出現(xiàn)過。徐雷希望,這個故事不會在今后的中國人工智能發(fā)展中重演。 他還表示:“希望中國的學(xué)者中能有一部分,在這一波熱潮漸漸平穩(wěn)下來、整頓盤整的期間,能慢慢沉下來,回歸到一些基礎(chǔ)研究。‘耳聰目明’ 的基礎(chǔ)研究不是中國人貢獻的,中國人的貢獻主要是快速推廣到實際應(yīng)用。希望中國學(xué)者未來在形象思維、抽象思維等基礎(chǔ)研究領(lǐng)域有更多貢獻。” 在科學(xué)“奧運會”上為國摘金 上海市經(jīng)信委副主任張英(左一)給中科院上海分院副院長張旭院士(左二)、同濟大學(xué)副校長蔣昌俊教授(左三)、和徐雷教授(左四)發(fā)WAIC SAIL獎的評審專家的聘書。徐雷教授在去年和今年都擔(dān)任了SAIL獎的終評會審專家。 盡管徐雷已過花甲之年,但他仍保持著高強度的工作,帶領(lǐng)著團隊奮戰(zhàn)在科研第一線?!拔野岩簧臅r間都用來拼搏了,我自認(rèn)為是一個很拼的人?!毙炖走@樣評價自己。這位發(fā)已斑白的老人始終保持著簡樸的生活,除了工作外,徐雷很少有別的愛好,每天從宿舍走到辦公室,晚上再走回去,就充作鍛煉身體了。 很難想象,這位聞名遐邇的科學(xué)家曾是一名煤礦工人。在恢復(fù)高考前,徐雷曾在云貴交界的一處煤礦工作。1977年,在恢復(fù)高考后的第一次招生中,徐雷走進了考場,進入哈爾濱工業(yè)大學(xué)獲得了本科學(xué)位,隨后又考入清華大學(xué),成為常迵先生和閆平凡教授共同任導(dǎo)師的第一個碩士生和第一個博士生。1987年,徐雷來到北大,師從程民德院士和石青云院士做博士后,次年成為北大全校當(dāng)年破格提升的十位副教授之一。 在此期間,徐雷在包括《中國科學(xué)》《科學(xué)通報》《計算機學(xué)報》《電子學(xué)報》《自動化學(xué)報》在內(nèi)的國內(nèi)核心刊物上發(fā)表論文18篇,在模式識別、人工智能、信號處理的主要國際會議上發(fā)表論文九篇。其中,1987年發(fā)表在UAI會議上的一篇論文最早將二值變量貝葉斯樹之學(xué)習(xí)拓廣到高斯變量,開實變量貝葉斯網(wǎng)學(xué)習(xí)之先。這篇論文被J.Pearl(2011年圖靈獎獲得者)收入1988年出版的經(jīng)典專著中,成為了專門的一節(jié)。 還有一篇發(fā)表在國際模式識別大會ICPR上的論文,是口頭報告,因為當(dāng)時外匯有限,不能出去開會。會后當(dāng)時的國際模式識別學(xué)會主席 Pierre Devijver(?-1996)卻給徐雷來了一封信,說他沒有時間事先獲得許可(當(dāng)時國內(nèi)還沒有電郵),就主動幫徐雷代做了口頭報告。Devijver當(dāng)時并不認(rèn)識徐雷,也不知道是常迵的學(xué)生,那論文徐雷是單獨作者,他只是認(rèn)為那篇論文應(yīng)該被介紹。當(dāng)今國際模式識別學(xué)會的大獎,最重要的獎項是以付京孫(K.S.Fu)命名的,而另一個主要獎項是P.Devijver獎。 1988年,在時任國家主席在北京人民大會堂主持頒獎的第一批40名霍英東獎獲得者中,徐雷是唯一的人工智能相關(guān)學(xué)科的學(xué)者。那年冬天,北大視覺與聽覺信息處理國家重點實驗室的主任石青云教授找他談,告知領(lǐng)導(dǎo)有意讓他接任做主任,該實驗室是當(dāng)時國家首批智能科學(xué)相關(guān)的三個國家重點實驗室之一。此時,擺在徐雷面前的本是一個順理成章進入仕途的機會,但他毅然決然地放棄了。徐雷認(rèn)為,在世界范圍內(nèi),中國的人工智能學(xué)科相關(guān)的研究離世界前沿還差的很遠,因此他選擇出國看看,與世界上最頂尖的科學(xué)家直接打交道。 談及為何做出這一選擇時,徐雷回憶道,他曾深深受到陳景潤故事的影響:1972年,蘇聯(lián)數(shù)學(xué)家代表團來訪問中國,周總理一時很為難,不知道該找哪些數(shù)學(xué)家去接待。此時代表團提出,中國有個杰出年輕數(shù)學(xué)家叫陳景潤,哥德巴赫猜想研究做出了杰出成果,希望和他談?wù)?。于是政府到處去找這個年輕人,最后在中科院一間不足6平米的鍋爐房里找到了他。陳景潤的故事激勵著那個年代的知識分子,從此徐雷立下志向,一旦國家需要,也要能為國爭光。 實際上,后來徐雷的確以中國自己培養(yǎng)的博士身份,在模式識別、神經(jīng)網(wǎng)絡(luò)等人工智能領(lǐng)域,留下了多個中國人的印記,實現(xiàn)了當(dāng)年的愿望。 1989年至1993年,徐雷輾轉(zhuǎn)于歐美當(dāng)時相關(guān)學(xué)術(shù)領(lǐng)域的四個領(lǐng)軍團隊。1989年初徐雷加入芬蘭拉普蘭塔理工大學(xué)的E.Oja團隊做高級研究員(Oja是九十年代歐洲神經(jīng)網(wǎng)絡(luò)領(lǐng)域的幾個主要學(xué)術(shù)領(lǐng)頭人之一),1990年春加入加拿大康考迪亞大學(xué)C.Y.Suen團隊做副研究員,也是當(dāng)時加拿大模式識別領(lǐng)域的領(lǐng)軍團隊。徐雷在1991年9月以訪問學(xué)者的身份加入了哈佛的 A.Yuille 團隊(Yuille是霍金的弟子,也是計算機視覺研究領(lǐng)域的大師),又在一年后加入麻省理工的M. I. Jordan團隊做博士后。直到1993年秋返回中國香港,加入香港中文大學(xué)任教。 在此期間,徐雷研究著名的霍夫變換有突破性進展,發(fā)明了隨機霍夫變換RHT。他還以第一作者身份發(fā)表了另一論文,提出了分類器組合的三級框架并討論了多個組合方法, 為現(xiàn)在廣為研究的集成學(xué)習(xí)和信息融合提供了基礎(chǔ),被廣為引用。這兩個成果使他在2002年當(dāng)選國際模式識別學(xué)會 IAPR Fellow會士,成為最早獲選的幾位華人之一。 在此期間,徐雷將當(dāng)時相關(guān)領(lǐng)域很有影響的Oja自適應(yīng)PCA學(xué)習(xí),發(fā)展到自適應(yīng)非線性PCA學(xué)習(xí);并率先揭示了Hebb學(xué)習(xí)輔以S非線性實現(xiàn)獨立化學(xué)習(xí),能消除旋轉(zhuǎn)不確定性;還為Oja自適應(yīng)子空間學(xué)習(xí)的全局收斂性提供了數(shù)學(xué)證明。這些成果不僅讓徐雷在該方向的影響緊隨Oja之后,而且將Oja團隊的主要興趣引回,也吸引了歐美還有中國的不少學(xué)者之后的持續(xù)推進。 在此期間,作為單獨作者,徐雷在1991年會議論文首先提出并在1993年的期刊論文中進一步闡述,提出了多層神經(jīng)網(wǎng)絡(luò)自組織學(xué)習(xí)LMSER,以雙向?qū)ε挤绞綄崿F(xiàn)對網(wǎng)絡(luò)中參數(shù)的學(xué)習(xí),其特點是強制了參數(shù)對稱性和神經(jīng)元強度的對稱性。2006年Hinton團隊的那兩篇經(jīng)典論文中的深度學(xué)習(xí)結(jié)構(gòu)Stacked RBM,也強制了這種參數(shù)對稱性,而近年才出現(xiàn)的所謂U-net的結(jié)構(gòu),也與多層LMSER類似。由于算力的限制,當(dāng)時計算實驗只做了單個隱層。但在論文中,討論和預(yù)言了多層LMSER的若干認(rèn)知功能,如聯(lián)想、概念形成、心像、注意等。后面會提到,這些預(yù)言都在近年得到了計算驗證。 在此期間,徐雷還1991年提出在競爭學(xué)習(xí)中引入反壟斷機制,同時適度地引入對手懲罰機制,發(fā)明了對手懲罰競爭學(xué)習(xí)(RPCL),開創(chuàng)了無監(jiān)督學(xué)習(xí)過程中,可以實現(xiàn)模型自動選擇的先河。在學(xué)習(xí)中可以自動去除多余參數(shù),可實現(xiàn)選擇模型自動選擇的另一個辦法L1學(xué)習(xí), 是1995年才出現(xiàn)而快速走紅的。RPCL已被直接應(yīng)用于解決許多實際問題上。例如,在大數(shù)據(jù)分析和無監(jiān)督統(tǒng)計學(xué)習(xí)中經(jīng)常遇到的聚類分析中,可自動確定樣本集來自幾個不同的類。 在此期間,徐雷通過對Gaussian Mixture和Mixture of Experts 上的EM算法之收斂性做數(shù)學(xué)分析,有力支持了M. I. Jordan在九十年代倡導(dǎo)的EM算法的新一輪研究熱,澄清了當(dāng)時統(tǒng)計文獻上關(guān)于EM算法的一些誤解,厘清了EM的優(yōu)缺點。徐雷還與M. I. Jordan和G. Hinton合作,提出一個改進的多專家混合模型,更適合利用EM算法。 也從這期間開始,徐雷成為了當(dāng)時NIPS(后改名為NeurlPS)會議上活躍的少數(shù)幾位華人學(xué)者之一。從NIPS1992起,每年一篇,連續(xù)在NIPS年會上發(fā)表了四篇論文。若看作者單位,第一篇徐雷是第一作者,單位是北京大學(xué)。其他3篇的作者單位都是香港中文大學(xué)。這意味著中國學(xué)者在NIPS發(fā)表論文的最早時間至少可提前到1992年,而不是目前國內(nèi)一些資料所記載的本世紀(jì)的頭幾年。 80年代底開始,引發(fā)當(dāng)下人工智能浪潮的深度學(xué)習(xí)之父G. Hinton和一批學(xué)術(shù)精英,接管了這個在1986年由IEEE信息論分會發(fā)起的學(xué)術(shù)會議。 從此NIPS成為神經(jīng)網(wǎng)絡(luò)領(lǐng)域、乃至人工智能所有相關(guān)領(lǐng)域的旗艦會議。其后近三十年,先是G. Hinton和M. I.Jordan交替為旗手,后由他們的學(xué)生們接力,是人工智能領(lǐng)域,最活躍、最有創(chuàng)意,也是文章最難進入的會議?;A(chǔ)研究成果大多先出現(xiàn)在NIPS,然后向其他會議,以一定的滯后期傳播和推廣應(yīng)用。順便一提,從1995年起,徐雷曾連續(xù)三年擔(dān)任NIPS組委會中大中華區(qū)的聯(lián)絡(luò)人(Liaison)。 徐雷在香港中文大學(xué)二十多年期間,先是進一步發(fā)展提出了貝葉斯陰陽學(xué)習(xí)理論,發(fā)表在NIPS1995會議上,這點后面還會做介紹。然后,他一方面將貝葉斯陰陽學(xué)習(xí)理論及以上所述成果,進一步發(fā)展、完善、系統(tǒng)化,并在智能金融、智能醫(yī)療、雷達信號識別等領(lǐng)域做了許多應(yīng)用工作;另一方面,在徑向基網(wǎng)學(xué)習(xí)、獨立子空間學(xué)習(xí)、獨立分量分析、時序獨立狀態(tài)空間、運籌優(yōu)化等方向還做了不少基礎(chǔ)研究工作。根據(jù)資料檢索,徐雷的多個研究成果已被國內(nèi)和歐美日等許多研究單位,廣泛應(yīng)用于雷達、遙感、材料、機器人、無人駕駛、軟件工程、網(wǎng)絡(luò)發(fā)掘、精密制造、醫(yī)學(xué)圖像、生物信息等領(lǐng)域。 徐雷曾獲得數(shù)個國內(nèi)外主要獎項和榮譽。1993年,徐雷獲國家自然科學(xué)獎。1995年,徐雷獲國際神經(jīng)網(wǎng)絡(luò)學(xué)會領(lǐng)袖獎。2006年,徐雷獲亞太神經(jīng)網(wǎng)絡(luò)學(xué)會最高獎——杰出成就獎,此獎每年僅獎一人,徐雷是榮獲此獎第三人,首兩位分別是日本智能領(lǐng)域的頭兩位大咖。此外,徐雷于2001年當(dāng)選IEEE會士,成為中國最早的幾位會士之一,也是從計算智能學(xué)會當(dāng)選的首位中國學(xué)者。2002年,徐雷當(dāng)選國際模式識別學(xué)會 IAPR Fellow會士,成為最早獲選的幾位華人之一。2003年,徐雷當(dāng)選歐洲科學(xué)院院士。 徐雷曾任9個國際學(xué)術(shù)期刊之編委,例如,1994起年擔(dān)任國際神經(jīng)網(wǎng)絡(luò)權(quán)威學(xué)術(shù)期刊Neural Networks的編委達22年,是首位擔(dān)任這個角色的華人。2001年至2003年,徐雷當(dāng)選國際神經(jīng)網(wǎng)絡(luò)學(xué)會理事會理事,是中國學(xué)者最早當(dāng)選的二人之一(另一位是當(dāng)時的北京大學(xué)常務(wù)副校長),并任Award committee委員。2007-08年徐雷任IEEE計算智能學(xué)會Fellow committee委員,是首位華人擔(dān)任該學(xué)會此角色。他還是首位獲任 IEEE 計算智能學(xué)會會士評審委員會的華人。 徐雷于2016夏全職到崗上海交大,任致遠講席教授、人工智能研究院首席科學(xué)家、腦科學(xué)與技術(shù)中心首席科學(xué)家、張江實驗室腦與智能科技研究院神經(jīng)網(wǎng)絡(luò)計算研究中心主任。在香港期間也一直致力于貢獻內(nèi)陸,為促進中國神經(jīng)網(wǎng)絡(luò)領(lǐng)域的發(fā)展出力。2005年中國神經(jīng)網(wǎng)絡(luò)學(xué)會在總結(jié)其十五年歷程時,向為該領(lǐng)域在中國之發(fā)展做出貢獻者,頒發(fā)了三個獎,一是給國內(nèi)學(xué)者的貢獻獎, 羅沛林院士、吳佑壽院士獲獎;二是一個給外國學(xué)者的友誼獎,日本神經(jīng)網(wǎng)絡(luò)領(lǐng)域頭號大咖Amari教授獲得;三是給境外華人的長期報效獎,由徐雷獲得。 面對如此豐碩的成果,徐雷卻自謙道,“我只是在科技‘奧運會’的某個項目為中國拿過獎牌,只不過就像很多優(yōu)秀的運動員一樣,只能在很短一段歷史時間里做冠軍?!睂嶋H上,徐雷的領(lǐng)軍時間并不短暫,從90年代初之后的一、二十年里,徐雷一直是神經(jīng)網(wǎng)絡(luò)和模式識別等人工智能領(lǐng)域中,中國人的一個重要代表人物。 人工智能將帶來哪些行業(yè)機會? 近年間,人工智能為多個傳統(tǒng)行業(yè)賦能,如醫(yī)療、金融、安防等行業(yè)都受到了深刻的影響。哪些行業(yè)更能吃到人工智能的紅利?下一個人工智能帶來的增長點又將會出現(xiàn)在哪里? 對此,徐雷概括,凡是涉及到視覺和語音的行業(yè)都可能被人工智能所改變。人類最主要的信息獲取渠道是視覺和聽覺,自2006年Hinton團隊的工作以來,這一波人工智能的核心突破點正是讓機器“耳聰目明”。 以語音應(yīng)用為例,由于人說話快、寫字慢,很多原本需要人們耗費時間精力記錄的工作可通過語音技術(shù)轉(zhuǎn)成記錄,如醫(yī)生手術(shù)記錄、打官司寫訴狀、填表等,都是人工智能可以發(fā)揮作用的場景。視覺方面,我國對場景監(jiān)控的需求越來越大,相關(guān)行業(yè)未來仍有較大增長空間。不僅如此,人類智能中最主流的信息獲取渠道就是視覺,70%左右的信息獲取來自視覺,如果一個人從小就失明,長大后智能發(fā)展必然受損。人工智能也是同理,現(xiàn)在人工智能發(fā)展程度相當(dāng)于達到了幾歲的兒童就能達到的視覺和聽覺能力,在此基礎(chǔ)上開發(fā)其他應(yīng)用的空間是很大的。 徐雷指出,要挖掘人工智能在視覺和語音相關(guān)領(lǐng)域的新應(yīng)用,關(guān)鍵在于找到還未被一窩蜂涌入又有經(jīng)濟增長點的場景,這就是二次創(chuàng)新。 盡管人工智能應(yīng)用前景廣闊,但在精密制造等領(lǐng)域,智能化進程并不如人們預(yù)期的那么快。徐雷認(rèn)為,這是由于進入專業(yè)領(lǐng)域的人工智能人才過少,無論是來自高校的人才還是AI初創(chuàng)企業(yè)都很少選擇精密制造業(yè)的緣故。這類領(lǐng)域需要從業(yè)者能夠同時在人工智能領(lǐng)域和特定專業(yè)領(lǐng)域具備研究水平,從業(yè)者要進入相應(yīng)領(lǐng)域的學(xué)習(xí)成本較高,這就導(dǎo)致大學(xué)老師和企業(yè)雙方都沒有強烈發(fā)展AI+制造的意愿。但一旦人工智能進入制造領(lǐng)域,必能發(fā)揮更大的作用。 如今人工智能在醫(yī)療行業(yè)最重要的應(yīng)用是醫(yī)療影像分析,也是中國有樣本優(yōu)勢有望問鼎世界的領(lǐng)域。一來醫(yī)院已積累了大量影像片子,便于機器學(xué)習(xí)訓(xùn)練;二來影像分析中人工智能的應(yīng)用相對簡單,只要識別、檢索、分割和標(biāo)記影像即可,需要用到的醫(yī)學(xué)專業(yè)知識較少,因此人工智能可以順利投入應(yīng)用。而在醫(yī)藥開發(fā)這類需要更多專業(yè)知識的領(lǐng)域,人工智能與醫(yī)療的結(jié)合依然很難。懂醫(yī)的不懂AI,懂AI的人不懂醫(yī),甚至雙方想互懂的欲望都不大,應(yīng)用自然落地維艱。徐雷認(rèn)為,這與評價機制有關(guān),學(xué)者研究新領(lǐng)域的時間成本高,發(fā)文章慢,又難以獲得適當(dāng)?shù)脑u價,造成動力不足,這是AI與應(yīng)用場景結(jié)合的關(guān)鍵難點。 行業(yè)機會與地方政策息息相關(guān)。談及上海人工智能產(chǎn)業(yè)的發(fā)展機會,徐雷對AI報道表示,從中國現(xiàn)狀來看,人才最集中的地區(qū)是北京,但是上海政府是布局人工智能最積極的地方政府。 一方面,從2018年起上海政府每年舉辦的世界人工智能大會WAIC,打造世界頂尖的智能合作交流平臺和行業(yè)盛會。并在大會上頒發(fā)最高榮譽SAIL獎(Super AI Leader,即“卓越人工智能引領(lǐng)者獎”),打造AI行業(yè)的“諾貝爾獎”,激勵全球范圍內(nèi)在技術(shù)上做出方向性突破、應(yīng)用創(chuàng)新,正在或?qū)⒁淖兾磥砩畹娜斯ぶ悄茼椖俊?/p> 另一方面,在上海政府的優(yōu)惠政策下,很多來自北京、深圳的人工智能企業(yè)來到上海發(fā)展,為上海帶來了大量的人才。特別是上海經(jīng)信委積極建設(shè)人工智能應(yīng)用基地,并在一年內(nèi)連續(xù)發(fā)布了二十多個人工智能試點應(yīng)用場景作為各個領(lǐng)域的示范,動作是相對超前的。如果上海政府能夠堅持推動下去,未來前景很可觀。另外,上海研究人工智能的力量更具備可聯(lián)合性,協(xié)同性較強。 2018年在上海舉辦的世界人工智能大會期間,多年未見的老朋友相見于黃浦江畔。從右邊起依次是Alan L. Yuille、 張旭、徐雷、鄧力。另外,左起是Michael I. Jordan和徐雷。 雙向智能應(yīng)用初探 談及近兩年的研究成果,徐雷介紹,近期他正在繼續(xù)發(fā)展雙向智能,即將形象思維抽象思維和認(rèn)知結(jié)合到一起,并繼續(xù)發(fā)展整體理論框架。前面提到,早在1991年提出的LMSER學(xué)習(xí),就具備實現(xiàn)換臉功能的潛力,只是當(dāng)時因算力所限沒有實現(xiàn)。但在那篇論文中,已討論和預(yù)言了多層LMSER的若干認(rèn)知功能,如聯(lián)想、概念形成、心像、注意等。最近徐雷的學(xué)生,對多層Lmser進行計算,不僅驗證了早年的預(yù)言,而且發(fā)現(xiàn)比目前相近的自編碼和U網(wǎng),性能更優(yōu)越,尤其是樣本少、攻擊強的情況下。 推理是徐雷研究的又一方向?,F(xiàn)在的知識圖譜方法反映的是信息的相關(guān)性,不能揭示因果性。在借助人工智能進行問題推斷時,找出因果關(guān)系是更有必要的。1987年時,徐雷就曾涉獵因果推理,最近在這方面又取得了較大進展。近年,中國全面啟動了新一代人工智能重大科技項目。徐雷作為負(fù)責(zé)人,帶領(lǐng)上海交大、清華、北大、浙大、電子科大、上科大和阿里巴巴七個單位組成的團隊,成功申請下來最近公布的首批項目之一,就是要主攻這個方向,希望能夠獲得大的突破。 此外,雙向智能還能應(yīng)用于許多類似AlphaGo的場景。在人工智能領(lǐng)域中,AlphaGo做到的事實際上被叫做啟發(fā)式搜索和問題求解?,F(xiàn)在很多人以為AlphaGo的成功關(guān)鍵在于蒙特卡洛樹的前瞻性搜索,但徐雷表示,這并不是AlphaGo成功的關(guān)鍵要素,在1986-1988年間,中國學(xué)者在研究啟發(fā)式搜索時就已提出過類似思路。真正的關(guān)鍵在于用深度學(xué)習(xí)網(wǎng)絡(luò)來看到棋盤,猶如開了“天眼”,認(rèn)清了狀態(tài)并由此聯(lián)想,做到三管齊下。 徐雷總結(jié)稱,下棋和做領(lǐng)導(dǎo)是類似的,都要做三件事。第一件,是要先試幾步看一看,類似于鄧小平做深圳特區(qū)先行探路。第二件,需要有仙人指路,指出這一盤棋能不能贏,贏面是多少,這類似于大智慧者老子出面提示,起到的是堅定信心的作用。第三件,需要孫子相助,告訴從業(yè)者具體有幾種走法、走哪里是最好的策略,讓從業(yè)者選擇贏面最大的走法。下棋也好,解決任何一個問題也好,都需要三種人同時協(xié)同。AlphaGo之所以能贏,就是因為用深度學(xué)習(xí)網(wǎng)絡(luò)開了天眼、認(rèn)了棋盤,同時做了“老子”和“孫子”。 而雙向智能的關(guān)鍵就在于形象思維認(rèn)知和抽象思維相結(jié)合,雙向協(xié)同互補。過去只用抽象思維進行問題求解所遇到的困難,有望通過雙向智能獲得改進。 一般認(rèn)為,AlphaGo按最低使用率計算,能耗也高達3萬瓦,是一個人腦的耗能一千倍。后來的AlphaGoZero 降到了其百分之十。我們希望運用雙向智能的耗能明顯小于AlphaGo,希望僅通過一個很小的機器就可以做到。徐雷強調(diào):“關(guān)鍵是要追求單位能耗下的智能?!?/p> AlphaGo和AlphaGoZero由背靠Google的DeepMind公司研發(fā)而成,此外,世界上其他的巨無霸公司也先后投入了這場研究,如騰訊已推出圍棋AI“絕藝”,日本、法國也各有自己的圍棋AI。但徐雷認(rèn)為,圍棋AI不應(yīng)只有擁有巨大資源的巨無霸公司能做,希望僅用普通的機器也可以與它們對弈。 雙向智能的另一優(yōu)勢是魯棒性高。以刷臉應(yīng)用為例,很多刷臉程序在應(yīng)用時,框稍微動一下,用戶的臉就識別不出了,雙向智能方法有望改進這一困擾。 徐雷解釋道,通常的人工智能研究,要么單向地由外向內(nèi)考慮識別認(rèn)知,如現(xiàn)在大多數(shù)深度學(xué)習(xí)應(yīng)用,要么單向地由內(nèi)向外考慮思維與問題求解。而雙向智能是兩個方向同時考慮,認(rèn)知抽象的部分被叫做陽,另一部分叫作陰,陰陽和諧進行。有趣的是,1981年諾貝爾獎獲得者羅杰·斯佩里的發(fā)現(xiàn),左右腦皮質(zhì)區(qū)分為左右兩邊,一部分負(fù)責(zé)邏輯、分析,一部分負(fù)責(zé)認(rèn)知,雙向智能理論與這個人腦分工理論是相容的。 沿著在1991年提出Lmser的路子發(fā)展,引入概率理論,結(jié)合上面的思路, 徐雷在1995年進一步發(fā)展提出了貝葉斯陰陽學(xué)習(xí)理論。盡管陰陽的概念源自中國,在西方面臨接受度的問題,人工智能頂會NIPS在1995年會議還是接受了這個論文。它不但為許多現(xiàn)有統(tǒng)計學(xué)習(xí)主要模型提供了一個統(tǒng)一的框架,而且建立了一個易于計算的有限樣本下學(xué)習(xí)的新理論,可在參數(shù)學(xué)習(xí)的過程中自動完成模型選擇。上世紀(jì)末,麻省理工整理20世紀(jì)腦科學(xué)和神經(jīng)網(wǎng)絡(luò)重要貢獻,出版經(jīng)典匯集《腦理論和神經(jīng)網(wǎng)絡(luò)方法》時,貝葉斯陰陽學(xué)習(xí)理論也被收納其中。 AI新挑戰(zhàn)無可回避 人工智能蓬勃發(fā)展的同時,也帶來了一系列新的挑戰(zhàn)。 倫理方面,面臨最大爭議的研究領(lǐng)域是“增強智能”,特斯拉CEO埃隆·馬斯克正在研究的腦后插管就是一個代表性例子?!霸鰪娭悄堋敝荚趯⑷四X與機器直接連接,讓人能夠通過腦電波直接控制機器進行交流。這部分研究對殘疾人是有意義的,但也提出了重大的倫理挑戰(zhàn):這一類人與機器的結(jié)合體是否依然能被稱作人類? 人工智能還可能帶來更為直觀的危險。比如,國外有人做出蝴蝶或蜻蜓大小的飛行器,攜帶著烈性炸藥,通過人臉識別技術(shù)尋找特定對象并炸穿面部實施謀殺。目前,有3000多名人工智能從業(yè)者聯(lián)合簽名阻止上述研究,但以現(xiàn)有技術(shù)做出這類“殺手機器人”已不成問題。 更重要的是,人工智能減少人的勞動,將導(dǎo)致失業(yè)問題。隨著人工智能逐漸替代人的勞動崗位,用工成本漸低,未來財富很可能越來越集中到幾個寡頭手里,其他人卻越來越貧窮。而人的本性決定,大資本家掙錢后不會拿出來與普通百姓共享。 不過,失業(yè)問題并非完全無解。徐雷認(rèn)為,人工智能不斷改變?nèi)祟惖纳钚螒B(tài),將造就行業(yè)洗牌的機會,舊的行業(yè)倒下后,也可能洗出新的領(lǐng)域。核心問題在于如何創(chuàng)造出新的生活方式,在某個領(lǐng)域的從業(yè)者批量失業(yè)的同時,怎樣讓新的行業(yè)吸收倒下的行業(yè)。徐雷將該過程比作小孩搭積木,“現(xiàn)在有一些積木塊,我們用它搭出一個世界;后來有一天,小孩玩這個積木玩煩了,希望搭出新的一堆積木,拆拆搭搭總有事干?!敝皇牵祟惖男枨蟛⒎菬o限增長,因此新行業(yè)的創(chuàng)造存在極限。對此,徐雷寄希望于政府進行統(tǒng)一管理,強有力地從頂層解決最關(guān)鍵的分配問題,才有可能達到人工智能為勞動者減負(fù)而不導(dǎo)致失業(yè)潮的狀態(tài)。 最后,徐雷談到了人工智能發(fā)展可能帶來人類抽象思維能力下降的問題?,F(xiàn)代計算機在西方智能高度抽象的基礎(chǔ)上建立而成,在計算機替代人類完成很多抽象思維工作后,人類的相應(yīng)能力就得不到鍛煉。這意味著人類不只是工作在被替代,連思維能力也在被代勞的過程中逐步減退。 |
|