新智元原創(chuàng)1 來(lái)源:Edge 譯者:張巨巖 王婉婷 2015 年發(fā)生了機(jī)器學(xué)習(xí)的大事件?這背后折射出什么技術(shù)趨勢(shì)?Edge 從全球 198 個(gè)頂尖專(zhuān)家中梳理了科技和技術(shù)大事件,新智元從中選擇了關(guān)于人工智能的部分。其中有諾獎(jiǎng)得主John C. Mather、MIT名譽(yù)機(jī)器人學(xué)教授Rodney A. Brooks、凱文凱利等。 你可能不愿相信!但是人工智能去年因?yàn)椤敦惾~斯程序?qū)W習(xí)》(Science,Lake,Salakhutdinov,Tenenbaum)的發(fā)展而更進(jìn)一步。這是重大新聞,因?yàn)槲乙呀?jīng)聽(tīng)到“很難實(shí)現(xiàn)人工智能”有數(shù)十年了,而且最成功的方法都使用了暴力解決。基于事物和語(yǔ)言符號(hào)與邏輯理解的方法一直很難取得進(jìn)步。挑戰(zhàn)在于發(fā)明代表復(fù)雜信息的電腦語(yǔ)言,接著讓機(jī)器理解來(lái)自示例和證據(jù)中的信息。 Lake等人給出了一個(gè)數(shù)學(xué)框架,一個(gè)算法和實(shí)現(xiàn)該算法的代碼,并且他們的軟件可以像人一樣學(xué)習(xí)瀏覽50種語(yǔ)言的1623種手寫(xiě)字體。他們說(shuō)“概念被表征為簡(jiǎn)單的概率程序——即是說(shuō),概率生成模型被表征為抽象描述性語(yǔ)言的結(jié)構(gòu)化步驟。”此外,概念可以通過(guò)重復(fù)部分其它概念或程序而建立。概率方法可以同時(shí)處理定義和實(shí)例的不精確性。(貝葉斯定理告訴我們?nèi)绻覀冎栏鞣N組成復(fù)雜事情的更小部分的可能性的話,應(yīng)該如何計(jì)算復(fù)雜事情的可能性。)他們的系統(tǒng)可以學(xué)得很快,有時(shí)一次,或從幾個(gè)例子就能像人一樣,而且有人一樣的精度地學(xué)習(xí)。這種能力與其他依據(jù)海量數(shù)據(jù)集和模擬神經(jīng)網(wǎng)絡(luò)等具有競(jìng)爭(zhēng)力的方法有著戲劇性的差距,這些都是新聞。 所以現(xiàn)在又產(chǎn)生了很多新問(wèn)題:這個(gè)方法有多么通用?人們?yōu)榱俗屍溆杏靡x予它怎樣的結(jié)構(gòu)?這個(gè)算法最終真的會(huì)很優(yōu)越嗎?這是生物智能的工作機(jī)制嗎?我們?nèi)绾畏直??這種電腦系統(tǒng)可以成長(zhǎng)的足夠強(qiáng)大來(lái)理解人類(lèi)日常很重要的概念嗎?第一種實(shí)際應(yīng)用會(huì)在哪? 這是一個(gè)長(zhǎng)期項(xiàng)目,沒(méi)有任何明顯限制會(huì)阻礙其發(fā)展。這種方法能否足以有效,以至于它并不需要一個(gè)超級(jí)厲害的超級(jí)計(jì)算機(jī)來(lái)實(shí)現(xiàn),或者這種方法至少代表了人工智能?畢竟,昆蟲(chóng)用其微小的大腦做的非常好。更一般地,我們何時(shí)能實(shí)現(xiàn)多人交談的速記、即時(shí)機(jī)器語(yǔ)言翻譯、場(chǎng)景識(shí)別、面部識(shí)別、自動(dòng)駕駛汽車(chē),自動(dòng)導(dǎo)向的無(wú)人機(jī)安全遞送包裹、機(jī)器理解物理和工程、機(jī)器對(duì)生物概念的理解還有機(jī)器閱讀國(guó)會(huì)圖書(shū)館藏書(shū)并在哲學(xué)或歷史層面討論其概念?我的數(shù)字助理何時(shí)能真正明白我想做的事,或告訴我應(yīng)該怎么做?這是智能火星車(chē)尋找火星生命跡象的方式嗎?軍事進(jìn)攻和防守會(huì)怎么樣?這樣的系統(tǒng)怎么實(shí)現(xiàn)Asimov的三大機(jī)器人定理,以保護(hù)人類(lèi)免受機(jī)器人攻擊?你如何知道是否應(yīng)該相信你的機(jī)器人?人們何時(shí)會(huì)被淘汰? 我確信很多人已經(jīng)開(kāi)始致力于這樣的問(wèn)題的研究。我看到了很多負(fù)面影響,但對(duì)于這些負(fù)面作用的改進(jìn)工作也推進(jìn)得很快。我既激動(dòng)又驚恐。 今年關(guān)于人工智能有很多非常不錯(cuò)的新聞故事。很多故事涉及了來(lái)自于非該領(lǐng)域的杰出科學(xué)家和工程師的顧慮,這些顧慮幾乎是關(guān)于超級(jí)人工智能覺(jué)醒但沒(méi)有人類(lèi)倫理概念的危害,這樣的危害對(duì)于人類(lèi)是一種災(zāi)難。一些其他的顧慮是該領(lǐng)域的人們擔(dān)憂(yōu)讓AI做軍事戰(zhàn)術(shù)決定會(huì)帶來(lái)危險(xiǎn),還有一些來(lái)自各個(gè)汽車(chē)廠商,他們看到了實(shí)現(xiàn)自主駕駛汽車(chē)的緊迫性。還有一些人來(lái)自哲學(xué)領(lǐng)域(業(yè)余和專(zhuān)業(yè)的),他們擔(dān)心自駕汽車(chē)將不得不做出生死選擇。 我自己對(duì)這些話題的觀點(diǎn)與普遍說(shuō)法相反,而且我認(rèn)為每個(gè)人都想的太遠(yuǎn)。Arthur C. Clarke的第三定律是,任何足夠先進(jìn)的技術(shù)都與魔法無(wú)異。所有這些新聞報(bào)道,和那些有此觀點(diǎn)的專(zhuān)家,在我看來(lái),要遠(yuǎn)遠(yuǎn)超過(guò)目前人工智能技術(shù)的狀態(tài),他們談?wù)摰氖且粋€(gè)具有魔力的未來(lái)并且這種未來(lái)很容易實(shí)現(xiàn)人的欲望,或恐懼。 2015年也出現(xiàn)了大量人工智能合乎情理的新聞,它們大部分圍繞深度學(xué)習(xí)算法的驚艷表現(xiàn),80年代中期的反向傳播想法,現(xiàn)在通過(guò)更好的數(shù)學(xué)被擴(kuò)展到遠(yuǎn)遠(yuǎn)超過(guò)三層的網(wǎng)絡(luò)中,這些能夠?qū)崿F(xiàn),離不開(kāi)美國(guó)西海岸科技巨頭龐大的云計(jì)算資源,也離不開(kāi)在那些云計(jì)算中巧妙利用的GPU。 深度學(xué)習(xí)最實(shí)際效果是,語(yǔ)言理解系統(tǒng)比兩三年前明顯好很多,促成了網(wǎng)上、智能手機(jī)和家庭設(shè)備上新服務(wù)的出現(xiàn)。我們現(xiàn)在可以很容易地與它們交談并讓它們理解我們。五年前的語(yǔ)音交互劣勢(shì)完全消失了。 我相信,深度學(xué)習(xí)的成功導(dǎo)致許多人產(chǎn)生錯(cuò)誤的結(jié)論。當(dāng)一個(gè)人展示了自己在某些任務(wù)中特定的表現(xiàn)時(shí),例如,翻譯外語(yǔ),那么我們就能大致了解要如何從這個(gè)人的表現(xiàn)中概括出他的能力。例如,我們知道,這個(gè)人可以理解語(yǔ)言,并能回答哪些人在聽(tīng)到一個(gè)孩子死于恐怖襲擊的故事后會(huì)悲傷,哪些人會(huì)哀悼一個(gè)月,哪些人認(rèn)為他們已經(jīng)得手。但是,翻譯程序很可能無(wú)法理解得這么深。人們可以從人的表現(xiàn)中歸納出他的能力,但這不能應(yīng)用在人工智能程序上。 在今年年底,我們已經(jīng)開(kāi)始看到一些新聞在反對(duì)人工智能某些狹小領(lǐng)域的成功。我樂(lè)于見(jiàn)到這些新聞,因?yàn)樗鼈儗⑽規(guī)Щ噩F(xiàn)實(shí),去考慮我們未來(lái)與AI的關(guān)系。而且我們已經(jīng)開(kāi)始看到兩類(lèi)故事。 第一類(lèi)故事是關(guān)于科學(xué),有許多研究人員已經(jīng)指出,要找到能夠模仿人類(lèi)和動(dòng)物廣泛能力的算法,還有很多科學(xué)方面的工作要完成。深度學(xué)習(xí)本身不會(huì)解決許多對(duì)于通用人工智能來(lái)說(shuō)很重要的學(xué)習(xí)問(wèn)題,例如,空間或演繹推理能力。此外,我們看到的所有AI突破是多年的醞釀,而我們并沒(méi)有科學(xué)依據(jù)去期待看到,突然的,持續(xù)的AI系列的覺(jué)醒,顯然有這種想法的年輕的研究人員沒(méi)有經(jīng)歷過(guò)1950年代,1960年代,和1980年的同樣的預(yù)測(cè)熱潮。 第二類(lèi)故事是關(guān)于自動(dòng)駕駛汽車(chē)和其他汽車(chē)的駕駛程序如何進(jìn)行交互。當(dāng)大型運(yùn)動(dòng)的事物要進(jìn)入人類(lèi)生活時(shí),普及速度會(huì)明顯變慢,例如網(wǎng)頁(yè)瀏覽器中的Java Script。對(duì)于自主駕駛汽車(chē)不久將出現(xiàn)在公共道路上這一觀點(diǎn)有些人天真地表示支持?,F(xiàn)實(shí)情況是,這其中存在致命事故(即使是由非常聰明的人開(kāi)發(fā)的東西,有時(shí)也會(huì)讓事情變得糟糕),這樣的事件會(huì)引起人們極度的謹(jǐn)慎,特別是當(dāng)?shù)弥巳蚍秶鷥?nèi)由人類(lèi)引起的汽車(chē)致死案件有超過(guò)3000例時(shí)。但是,最近的新聞報(bào)道都記錄到自動(dòng)駕駛汽車(chē)的測(cè)試事故率很高。到目前為止,所有的都是非典型事故,而且所有都可歸因于其它司機(jī),即人的錯(cuò)誤。汽車(chē)駕駛得完美,據(jù)報(bào)道,并汽車(chē)沒(méi)有像所有人類(lèi)一樣違反法律,所以這是人類(lèi)的錯(cuò)誤。當(dāng)你爭(zhēng)辯說(shuō),是那些討厭的人沒(méi)有開(kāi)發(fā)好技術(shù)時(shí),你已經(jīng)失去了論據(jù)。在自動(dòng)駕駛車(chē)被放到普通民眾在行駛的車(chē)道之前,還有很多工作要做,無(wú)論這些技術(shù)對(duì)于其開(kāi)發(fā)工程師和風(fēng)險(xiǎn)資本家來(lái)說(shuō)多么有價(jià)值。 從2014年到15年過(guò)度炒作的AI終于得到了一點(diǎn)阻力。這還會(huì)讓很多憤怒的忠實(shí)信徒尖叫,但最終這個(gè)泡沫會(huì)逐漸成為過(guò)去。同時(shí),我們將在我們的生活中逐漸看到更多AI更有效的利用方式,但是這將是緩慢而穩(wěn)定的,并非爆發(fā)式的,而且也不存在生存危機(jī)。 在過(guò)去的幾年里,人工智能存在已久的無(wú)法解決的很多經(jīng)典挑戰(zhàn),在幾乎沒(méi)有告知的情況下,用一種AI純粹主義者鄙視的方法(因?yàn)槠溆小敖y(tǒng)計(jì)”的感覺(jué))解決了:這個(gè)方法的本質(zhì)是從海量數(shù)據(jù)中學(xué)習(xí)概率分布,而不是研究人類(lèi)解決問(wèn)題的能力,接著試圖將這種能力編碼成可執(zhí)行的形式。該技術(shù)解決的高難任務(wù)范圍很廣,從物體分類(lèi)和語(yǔ)音識(shí)別,到為圖片生成標(biāo)題和合成某藝術(shù)家風(fēng)格的圖片——甚至還能指導(dǎo)機(jī)器人完成它們從未在代碼中編寫(xiě)的任務(wù)。 這個(gè)最新的研究方法,最初的名字是“神經(jīng)網(wǎng)絡(luò)”,現(xiàn)在被命名為“深度學(xué)習(xí)”來(lái)強(qiáng)調(diào)其神經(jīng)網(wǎng)絡(luò)數(shù)量方面的進(jìn)步。它最近的成功歸功于大型數(shù)據(jù)集和更強(qiáng)大的計(jì)算系統(tǒng),或者是大型科技公司突然對(duì)該領(lǐng)域產(chǎn)生興趣。這些越來(lái)越多的資源確實(shí)是這些技術(shù)快速進(jìn)步的關(guān)鍵部分,但是大公司一直在向眾多機(jī)器學(xué)習(xí)方法中投入資源,但只在深度學(xué)習(xí)中看到了如此難以置信的進(jìn)步;很多其他的方法也有改善,但改進(jìn)程度遠(yuǎn)遠(yuǎn)不及深度學(xué)習(xí)。 所以讓深度學(xué)習(xí)與其他方法區(qū)分的關(guān)鍵是什么,為什么它能夠解決人類(lèi)沒(méi)辦法編寫(xiě)出解決方案的問(wèn)題?第一個(gè)關(guān)鍵點(diǎn)是,來(lái)源于早期神經(jīng)網(wǎng)絡(luò),一個(gè)久遠(yuǎn)的算法,被一次又一次的重新發(fā)現(xiàn),名字為“反向傳播”。它真的只是鏈?zhǔn)揭?guī)則——一個(gè)簡(jiǎn)單的微積分技巧——用一種很優(yōu)雅的方式被應(yīng)用。它是對(duì)連續(xù)數(shù)學(xué)和離散數(shù)學(xué)的深度整合,從而讓復(fù)雜的潛在解決方案集合通過(guò)向量微積分被優(yōu)化。 關(guān)鍵是要將潛在解決方案模板作為有向圖來(lái)規(guī)劃(例如,從一幅圖像中到一個(gè)生成的標(biāo)題,之間有很多節(jié)點(diǎn))。反向遍歷這個(gè)圖讓該算法自動(dòng)計(jì)算出一個(gè)“成分向量(gradient vector)”,這為搜索越來(lái)越好的解決方案提供了方向。你不能不瀏覽大部分現(xiàn)代深度學(xué)習(xí)技巧來(lái)觀察其與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的相似性,但是在這背后,這種反向傳播算法是古老框架和新框架的重要部分。 但是原始使用反向傳播的神經(jīng)網(wǎng)絡(luò)遠(yuǎn)遠(yuǎn)不如新深度學(xué)習(xí)技術(shù),即使讓其使用今天的硬件和數(shù)據(jù)集。另一個(gè)在每個(gè)現(xiàn)代框架都存在的關(guān)鍵部分是另一個(gè)具有迷惑性的簡(jiǎn)單想法:網(wǎng)絡(luò)的組件可以同時(shí)在多個(gè)地方使用。網(wǎng)絡(luò)被優(yōu)化后,每個(gè)組件的每個(gè)拷貝被迫變得相同(這個(gè)想法被稱(chēng)為“權(quán)重捆綁(weight tying)”)。這對(duì)權(quán)重相聯(lián)系(weight-tied)的組件提出了新要求:它們必須學(xué)著一次在許多地方變得有用,而且不會(huì)被特化到某個(gè)特定位置。權(quán)重聯(lián)系(weight tying)促使網(wǎng)絡(luò)學(xué)習(xí)更通用的函數(shù),因?yàn)橐粋€(gè)詞可能出現(xiàn)在某塊文本的任何區(qū)域中,或者一個(gè)物理物體有可能出現(xiàn)在任何圖片部分中。 將一個(gè)通用的組件放在網(wǎng)絡(luò)很多位置中類(lèi)似于在程序中編寫(xiě)一個(gè)函數(shù),并在多處調(diào)出該函數(shù)——這是在計(jì)算機(jī)科學(xué)和函數(shù)式編程中很多不同領(lǐng)域的本質(zhì)概念。這實(shí)際上不僅僅是個(gè)類(lèi)比:權(quán)重相聯(lián)系組件實(shí)際上在編程中與可復(fù)用函數(shù)(reusable function)概念相同。而且它可以更深!過(guò)去幾年里很多最成功的框架重復(fù)使用組件的模式與由函數(shù)式編程中常見(jiàn)的“高階函數(shù)”生成的模式相同。這暗示了我們可以從函數(shù)式編程的其他著名操作函數(shù)中汲取好想法。 探索由深度學(xué)習(xí)訓(xùn)練出的功能結(jié)構(gòu)(functional program)的最自然的背景是一個(gè)可以直接在函數(shù)式編程上運(yùn)行反向傳播的新語(yǔ)言。結(jié)果證明,在實(shí)現(xiàn)方法的細(xì)節(jié)中體現(xiàn)出來(lái),函數(shù)式編程實(shí)際上可以編譯成一個(gè)類(lèi)似于反向傳播所需要的計(jì)算圖像。圖像中的個(gè)體組件也要被微分,但是Grefenstette等人最近發(fā)表了一些簡(jiǎn)單數(shù)據(jù)結(jié)構(gòu)(棧,隊(duì)和雙端隊(duì)列)的微分的構(gòu)建,這表明了更多的可微分的實(shí)現(xiàn)方法可能只是更高深的數(shù)學(xué)而已。在這個(gè)領(lǐng)域的更多的工作將會(huì)打開(kāi)新的編程形式——可微編程(Differentiable Programming)。用這樣的語(yǔ)言寫(xiě)一段程序就像畫(huà)了一個(gè)函數(shù)結(jié)構(gòu)的輪廓,把細(xì)節(jié)留給了優(yōu)化器;語(yǔ)言將會(huì)根據(jù)整個(gè)程序使用反向傳播自動(dòng)學(xué)習(xí)細(xì)節(jié)——就像在深度學(xué)習(xí)中優(yōu)化權(quán)重一樣,但是用函數(shù)式編程作為表征權(quán)重聯(lián)系的更通用的形式。 深度學(xué)習(xí)可能看起來(lái)像另一個(gè)會(huì)過(guò)氣的時(shí)尚,就像“專(zhuān)家系統(tǒng)”或者“大數(shù)據(jù)”一樣。但是它是依據(jù)兩個(gè)久遠(yuǎn)的想法(反向傳播和權(quán)重聯(lián)系),并且雖然可微編程是非常新的概念,它實(shí)際是這些永恒想法的擴(kuò)展,并且技術(shù)詞語(yǔ)穿梭于時(shí)尚中,這些核心概念會(huì)繼續(xù)是AI成功的本質(zhì)。 也許今天最重要的新聞是數(shù)據(jù)集——而非算法——是對(duì)人類(lèi)級(jí)別AI發(fā)展的關(guān)鍵限制因素。 AI領(lǐng)域黎明階段,1967年,它的兩個(gè)創(chuàng)立者預(yù)測(cè)了解決電腦視覺(jué)問(wèn)題只需要一個(gè)夏天?,F(xiàn)在,過(guò)了幾乎半個(gè)世紀(jì),機(jī)器學(xué)習(xí)軟件終于似乎準(zhǔn)備在視覺(jué)任務(wù)和很多其他挑戰(zhàn)中達(dá)到人類(lèi)界別的表現(xiàn)。什么讓AI革命等待了這么久? 過(guò)去30年里AI被發(fā)表的進(jìn)步似乎給出了一點(diǎn)具有諷刺意味的暗示:也許很多主要的AI突破受到了有限高質(zhì)量訓(xùn)練集的限制,而非算法方面的進(jìn)步。例如,在1994年人類(lèi)級(jí)別自動(dòng)語(yǔ)音識(shí)別系統(tǒng)的完成主要依賴(lài)于隱馬爾可夫模型的一個(gè)變體,而隱馬爾可夫模型則是在此10年之前發(fā)表的,但是使用了華爾街日?qǐng)?bào)的語(yǔ)音和其他當(dāng)時(shí)3年之前的文本。1997年,當(dāng)IBM的深藍(lán)打敗Garry Kasparov成為世界頂級(jí)國(guó)際象棋大師時(shí),它的核心算法(NegaScout規(guī)劃算法)已經(jīng)有14年之久,然而它的核心數(shù)據(jù)集——70 0000國(guó)際象棋特級(jí)大師比賽數(shù)據(jù)集(名字為“The Extended Book”)——只有6年歷史。2005年,谷歌軟件完成的阿拉伯轉(zhuǎn)英文翻譯和中文轉(zhuǎn)英文翻譯是基于當(dāng)時(shí)17年前發(fā)表的統(tǒng)計(jì)機(jī)器翻譯算法的一個(gè)變體,但是使用了同一年從谷歌網(wǎng)站和新網(wǎng)頁(yè)中收集到的超過(guò)1.8萬(wàn)億的符號(hào)。2011年,IBM的Watson成為世界Jeopardy!冠軍,它使用了基于當(dāng)時(shí)20年前公布的多專(zhuān)家決策算法的一個(gè)變體,但用了來(lái)自維基百科、維基詞典、維基語(yǔ)錄和前一年更新的古騰堡計(jì)劃中860萬(wàn)文獻(xiàn)資料。2014年,谷歌的GoogLeNet軟件在物體識(shí)別中有接近人類(lèi)的表現(xiàn),它使用了25年前提出的卷積神經(jīng)網(wǎng)絡(luò)算法,但卻是在當(dāng)時(shí)4年之前ImageNet語(yǔ)料庫(kù)中大約有150萬(wàn)標(biāo)記好的圖像和1000個(gè)物體分類(lèi)的數(shù)據(jù)集上訓(xùn)練的。最終2015年,谷歌DeepMind宣布它的軟件在29款雅特麗游戲中達(dá)到了人類(lèi)級(jí)別的表現(xiàn),該系統(tǒng)所用的算法是Q學(xué)習(xí)算法的一個(gè)變體,該算法是在23年之前公布的,而這個(gè)算法卻是在2年之前出現(xiàn)的——超過(guò)50款雅特麗游戲街機(jī)學(xué)習(xí)環(huán)境數(shù)據(jù)集上——訓(xùn)練的。 看完這些進(jìn)步后,關(guān)鍵算法的提出和相應(yīng)的進(jìn)步之間的平均時(shí)間間隔大概有18年,然而關(guān)鍵數(shù)據(jù)集的出現(xiàn)和對(duì)應(yīng)的進(jìn)步之間的時(shí)間間隔少于3年,或者說(shuō)要快6倍,這意味著數(shù)據(jù)集可能是這些進(jìn)步的限制因素。特別地,我們可以提出假說(shuō):用于AI突破的關(guān)鍵算法通常會(huì)滯后,只需要從現(xiàn)存的典籍中挖掘出大型高質(zhì)量數(shù)據(jù)集,接著在當(dāng)時(shí)現(xiàn)存硬件中優(yōu)化即可。當(dāng)然,研究領(lǐng)域中令人悲傷的常見(jiàn)現(xiàn)象是,注意力、資金和學(xué)術(shù)進(jìn)步與算法的進(jìn)步關(guān)聯(lián)性更高,而非數(shù)據(jù)集的進(jìn)步。 如果這個(gè)假說(shuō)正確的話,這會(huì)對(duì)將來(lái)AI的進(jìn)步有重大暗示。最重要的是,優(yōu)先挖掘高質(zhì)量訓(xùn)練集可能對(duì)AI突破有指數(shù)級(jí)的加速,相比純算法的進(jìn)步。例如,我們可能已經(jīng)擁有相應(yīng)的算法和硬件:這些算法和硬件可以讓機(jī)器在幾年內(nèi)創(chuàng)作出有創(chuàng)造力的長(zhǎng)篇作品,完成標(biāo)準(zhǔn)的人類(lèi)測(cè)試,甚至能通過(guò)圖靈測(cè)試,只要我們用高質(zhì)量的寫(xiě)作數(shù)據(jù)集、測(cè)試數(shù)據(jù)集和語(yǔ)言數(shù)據(jù)集來(lái)測(cè)試它們。另外,保證AI的友好這樣的新問(wèn)題或許也可以通過(guò)對(duì)數(shù)據(jù)集的關(guān)注而非對(duì)算法的關(guān)注來(lái)解決——一個(gè)潛在更簡(jiǎn)單的方法。 雖然新算法受到了大量公眾的關(guān)注(結(jié)束了AI寒冬),真正的新聞也許是:優(yōu)先挖掘新數(shù)據(jù)集并培養(yǎng)以數(shù)據(jù)集為中心的研究團(tuán)體才是延長(zhǎng)AI盛夏的本質(zhì)方法。 對(duì)于我來(lái)說(shuō)在2015年中期聽(tīng)到的最重要的新聞是在三個(gè)科學(xué)家Samuel J. Gershman,Eric J. Horvitz和Joshua Tenenbaum在2015年7月17日的Science上發(fā)表了文章《Computational rationality: A converging paradigm for intelligence in brains, minds, and machines》的時(shí)候。他們宣布他們和他們的同事在進(jìn)行新研究:識(shí)別原理,或者說(shuō)是智能的定律,就像牛頓宣布發(fā)現(xiàn)力學(xué)定律一樣。 在此之前,在公園散步、河流的流動(dòng)、馬車(chē)輪子的滾動(dòng)、炮彈的軌跡和行星軌跡之間的任何共性似乎都是荒誕的。正是牛頓發(fā)現(xiàn)了潛在的共性,并從根本上解釋了上述的所有現(xiàn)象(等更多現(xiàn)象)。 現(xiàn)在有了相似的人大膽的試圖總結(jié)智能的規(guī)律甚至是本質(zhì)?!罢嫦鄰膩?lái)都是從簡(jiǎn)單中尋獲,而非從多樣和混亂的事物中”牛頓說(shuō)。 對(duì)于智能領(lǐng)域的研究而言,我們都是前牛頓。智能的共性被細(xì)胞、海豚、植物、鳥(niǎo)類(lèi)、機(jī)器人共享,但人類(lèi)在此方面,如果不是覺(jué)得荒誕的話,至少是遠(yuǎn)未有所建樹(shù)的。 然而作為起點(diǎn),人工智能、認(rèn)知心理學(xué)和神經(jīng)科學(xué)之間豐富的交流就將目標(biāo)鎖定在牛頓的“真相存在于簡(jiǎn)單中”,那些潛在的規(guī)則(也可能是定律)會(huì)將這些分離的實(shí)體連接在一起。這種研究的正式名字就是計(jì)算理性(computational rationality)。我們會(huì)問(wèn)道,它到底是什么?誰(shuí),或者說(shuō)什么,搭載了它? 這種追尋是受到眾多科學(xué)思想共同認(rèn)可的觀點(diǎn)的啟發(fā):智能不來(lái)自那些體現(xiàn)智能的介質(zhì)——生物形式或者電子形式——但卻來(lái)自于被系統(tǒng)安排的元素之間的交互方式。當(dāng)系統(tǒng)識(shí)別出一個(gè)目標(biāo),學(xué)習(xí)(從老師那里、訓(xùn)練集或者一段經(jīng)歷中),接著自動(dòng)移動(dòng),同時(shí)根據(jù)復(fù)雜多變的環(huán)境作出調(diào)整。另一個(gè)看待這個(gè)過(guò)程的方式是智能實(shí)體是網(wǎng)絡(luò),通常是智能系統(tǒng)的框架,人類(lèi)當(dāng)然在這些最復(fù)雜的網(wǎng)絡(luò)中,而且人類(lèi)聚集體更是如此。 這三位科學(xué)家提出了假設(shè):三個(gè)核心想法可以描述智能。第一,智能個(gè)體有目標(biāo),并形成信仰接著計(jì)劃動(dòng)作來(lái)盡可能實(shí)現(xiàn)這些目標(biāo)。第二,計(jì)算理想情況下最好的選擇對(duì)于實(shí)際世界問(wèn)題可能是不現(xiàn)實(shí)的,但是理性算法可以做到足夠接近(以Herbert Simon的術(shù)語(yǔ)來(lái)講,是“satisfice(滿(mǎn)足目標(biāo)的最低要求)”),同時(shí)包含計(jì)算成本。第三,這些算法應(yīng)該可以根據(jù)實(shí)體的特定需求進(jìn)行理性調(diào)整,離線情況下通過(guò)工程或進(jìn)化設(shè)計(jì),或者在線情況下,通過(guò)元推理(meta-reasoning)機(jī)制對(duì)給定情況選擇最好的策略。 雖然剛剛開(kāi)始,對(duì)計(jì)算理性的需求已經(jīng)很大,而且具有普適性。例如,生物學(xué)家現(xiàn)在可以與認(rèn)知輕松地進(jìn)行交談,從細(xì)胞層面到系統(tǒng)層面。神經(jīng)生物學(xué)家可以識(shí)別人類(lèi)和動(dòng)物共有的計(jì)算策略。樹(shù)木學(xué)家可以展示樹(shù)木之間如何(緩慢地)溝通來(lái)警告附近的敵害,如木甲蟲(chóng):鄰居,快釋放毒素。 人類(lèi)自己在家也是這樣,雖然這讓我們大部分人花了很多年才知道這些。當(dāng)然,到這兒就涉及到人工智能,一個(gè)關(guān)鍵的說(shuō)明和啟示。 它現(xiàn)在是新聞了;它也一直會(huì)是新聞,因?yàn)樗绱说幕A(chǔ);它的演變啟示將幫助我們用全新的方式看待我們的世界和宇宙。至于感受到超級(jí)智能威脅的人們,在如此基本的層面上理解智能當(dāng)然是我們最好的防御方法之一。 這些日子涌現(xiàn)出無(wú)數(shù)重要的科學(xué)新聞,很難說(shuō)哪一條是其中最重要的。氣候模型表明我們已經(jīng)邁過(guò)了轉(zhuǎn)折點(diǎn),不可逆轉(zhuǎn)地進(jìn)入了一個(gè)全新的、對(duì)我們的文明來(lái)說(shuō)相當(dāng)艱難的時(shí)期。Mark Van Raamsdonk拓展了Brian Swingle和Juan Maldacena的成果,展示了在離散張量網(wǎng)絡(luò)(discrete tensor network)中我們可以徹底拋棄時(shí)空的概念,這打開(kāi)了一扇統(tǒng)一物理學(xué)理論的大門(mén)。Bruce Conklin、George Church、以及其他研究者為我們帶來(lái)了CRISPR,這種技術(shù)或許會(huì)讓基因編輯變得簡(jiǎn)單易用、無(wú)處不在。深度學(xué)習(xí)開(kāi)始告訴我們互連特征探測(cè)器(interconnected feature detectors)的層級(jí)結(jié)構(gòu)如何讓它能自主地搭建起模型、學(xué)習(xí)解決問(wèn)題、以及識(shí)別語(yǔ)音、圖像、和視頻。 也許同樣重要的是關(guān)注一下我們?cè)诤翁幦狈M(jìn)展:社會(huì)學(xué)沒(méi)能教我們社會(huì)運(yùn)作的原理,哲學(xué)領(lǐng)域看上去已經(jīng)變得貧瘠荒蕪,經(jīng)濟(jì)學(xué)似乎難以提示我們經(jīng)濟(jì)和財(cái)務(wù)政策,心理學(xué)尚未理解我們心靈背后的機(jī)制,而神經(jīng)科學(xué)雖然告訴了我們大腦中哪些地方會(huì)發(fā)生一些事,但大部分時(shí)候說(shuō)不清究竟發(fā)生了什么。 我認(rèn)為,20世紀(jì)為理解世界而創(chuàng)造出的最重要的東西,不是實(shí)證科學(xué)、計(jì)算機(jī)科學(xué)、航天、或者物理學(xué)基礎(chǔ)理論——而是計(jì)算。計(jì)算,在核心層面,是非常簡(jiǎn)單的:每一次觀察都會(huì)產(chǎn)生一些可分辨的差異。 這些差異,我們稱(chēng)之為信息。如果是對(duì)于會(huì)改變狀態(tài)的系統(tǒng)所作的觀察,我們就可以描述這些狀態(tài)的變化。如果我們?cè)谶@些狀態(tài)變化中發(fā)現(xiàn)了規(guī)律性,我們?cè)谘芯康木褪且粋€(gè)計(jì)算系統(tǒng)了。如果規(guī)律性可以得到完全的描述,我們就把這個(gè)系統(tǒng)稱(chēng)為算法。一旦一個(gè)系統(tǒng)可以進(jìn)行特定狀態(tài)的轉(zhuǎn)換、也可以重新訪問(wèn)之前的狀態(tài),它幾乎就可以完成任何的計(jì)算了。在無(wú)限的情況下——也就是說(shuō),如果我們不限制它狀態(tài)轉(zhuǎn)換的次數(shù),也不限制狀態(tài)信息的存儲(chǔ)空間大小——它就成為了一種圖靈機(jī),或是一種λ演算(Lambda Calculus),或是波斯特機(jī)(Post Machine),或者其它的什么能夠模擬所有計(jì)算的等價(jià)存在(mutually equivalent formalisms)。 計(jì)算術(shù)語(yǔ)重新表述了“因果(causality)”這種哲學(xué)家們爭(zhēng)論了幾個(gè)世紀(jì)的概念。因果就是計(jì)算系統(tǒng)中從一個(gè)狀態(tài)到下一個(gè)狀態(tài)的轉(zhuǎn)換。計(jì)算術(shù)語(yǔ)也更新了機(jī)械論哲學(xué)或是自然主義哲學(xué)中“機(jī)械主義(mechanism)”的概念。計(jì)算主義是新的機(jī)械主義,與它的前輩們不同,它并不充滿(mǎn)了各種帶有誤導(dǎo)性的直覺(jué)性知識(shí)。 計(jì)算與數(shù)學(xué)是不同的。數(shù)學(xué)是形式語(yǔ)言的領(lǐng)域,大部分都是不可判定的——這與“不可計(jì)算”是同義詞(因?yàn)闆Q策和證明都是計(jì)算的同義詞),雖然所有我們?cè)跀?shù)學(xué)方面的探索都是可計(jì)算的那一些。計(jì)算意味著真正地做完所有工作,從一個(gè)狀態(tài)轉(zhuǎn)移到下一個(gè)狀態(tài)。 計(jì)算改變了我們對(duì)于知識(shí)的看法:知識(shí)不再是一種“得到辯護(hù)的真信念”(justified true belief,譯者注:一直以來(lái),西方哲學(xué)界對(duì)知識(shí)的定義包含了三個(gè)要素,即所謂的得到辯護(hù)的真信念,英文中常被簡(jiǎn)稱(chēng)為JTB理論。具體來(lái)說(shuō),某個(gè)人A“知道”某個(gè)事件B,或說(shuō)A掌握了關(guān)于B的知識(shí),是指:B本身是真的;A相信B是真的;A相信B為真是得到辯護(hù)的,或者說(shuō)有理?yè)?jù)、合理的或確證的。這樣的情況下,獲得的知識(shí)是真實(shí)可靠的。來(lái)自維基百科),而是描述了一種在捕捉可觀察對(duì)象之間的規(guī)律時(shí)的局部最小值(local minimum)。知識(shí)幾乎從來(lái)都不是一個(gè)靜止不變的概念,而是在可能的世界觀所組成狀態(tài)空間中梯度式地變化。我們將不再企圖把真實(shí)傳授給我們的孩子,因?yàn)?,和我們一樣,他們也不?huì)停下改變想法的步伐。我們將會(huì)教他們?nèi)绾斡幸饬x地改變他們的想法,如何探索永無(wú)止境的靈感王國(guó)。 宇宙不是數(shù)學(xué)的(mathematical),而是計(jì)算的(computational),越來(lái)越多的物理學(xué)家理解了這一點(diǎn),而物理學(xué)也正在忙于尋找一種算法來(lái)再現(xiàn)我們的觀察。離開(kāi)了不可計(jì)算的、數(shù)學(xué)的概念(比如連續(xù)空間),獲得進(jìn)展成為了可能。氣候科學(xué)、分子基因?qū)W、以及人工智能都是計(jì)算科學(xué)。社會(huì)學(xué)、心理學(xué)、以及神經(jīng)科學(xué)都不是:它們似乎仍然被機(jī)制(呆板的零碎知識(shí))與研究客體表面上的二元對(duì)立所困擾。它們正在探尋社會(huì)、行為、化學(xué)、神經(jīng)方面的規(guī)律,但是在這些方面它們真正應(yīng)該探尋的是計(jì)算規(guī)律。 萬(wàn)物皆計(jì)算。 連線雜志“資深游俠”(Senior Maverick)、聯(lián)合創(chuàng)始人,“酷工具”網(wǎng)站作者、編輯;出版了《科技想要什么》、《失控:機(jī)器、社會(huì)與經(jīng)濟(jì)的新生物學(xué)》、《新經(jīng)濟(jì)的新規(guī)則》等著作。 今年,DeepMind公司——一家位于倫敦的AI企業(yè)——的研究人員報(bào)告,他們教會(huì)了計(jì)算機(jī)系統(tǒng)學(xué)習(xí)如何玩49個(gè)簡(jiǎn)單的視頻游戲。他們教它的并不是“怎樣玩視頻游戲”,而是怎樣學(xué)習(xí)玩游戲。這之間有著深遠(yuǎn)的區(qū)別。玩一款視頻游戲,即使是1970年代經(jīng)典的“乓(Pong)”那么簡(jiǎn)單的游戲,也需要一系列嫻熟的感覺(jué)、預(yù)測(cè)、和認(rèn)知技巧。十幾年前,沒(méi)有算法能做得到這些;但到今天,這些大部分電腦游戲中內(nèi)嵌了這種自動(dòng)玩游戲的代碼。當(dāng)你玩一款2015年的視頻游戲時(shí),你通常都需要與天才人類(lèi)程序員創(chuàng)作的精良的算法相對(duì)抗。DeepMind的團(tuán)隊(duì)沒(méi)有編寫(xiě)一系列在游戲內(nèi)玩游戲的算法,而是編寫(xiě)了在游戲外、像人類(lèi)一樣進(jìn)行操作玩游戲的算法。這種算法(一種深度神經(jīng)網(wǎng)絡(luò))一開(kāi)始在游戲中完全無(wú)法獲勝,也沒(méi)有任何玩游戲得技巧和策略,隨后通過(guò)不斷得到反饋和改進(jìn),它自己組建出了玩這個(gè)游戲的代碼。 這種學(xué)習(xí)不能被等價(jià)于“人類(lèi)智能”。它背后的機(jī)制與我們學(xué)習(xí)的方法有極大的不同。這將不會(huì)取代人類(lèi),也不會(huì)稱(chēng)霸世界。然而,這種合成學(xué)習(xí)的能力將會(huì)逐漸增長(zhǎng)。大新聞是,學(xué)習(xí)——我指真正的、非監(jiān)督式的學(xué)習(xí)——是可以被合成的。一旦學(xué)習(xí)可以被合成,它就能被分布到所有尋??梢?jiàn)的設(shè)備和功能中。它就能被用于讓自動(dòng)駕駛汽車(chē)變得更好,或是讓醫(yī)療診斷系統(tǒng)隨著人們不斷的使用而得到提高。 學(xué)習(xí),就像其他那些我們?cè)詾橹挥腥祟?lèi)才擁有的能力一樣,被證明了是一種機(jī)器在得到編程以后也能擁有的東西。學(xué)習(xí)可以是自動(dòng)化的。雖然簡(jiǎn)單的二級(jí)學(xué)習(xí)(學(xué)習(xí)怎樣去學(xué)習(xí))曾經(jīng)是罕見(jiàn)而珍惜的,現(xiàn)在它將會(huì)變得隨處可見(jiàn)。就像一個(gè)世紀(jì)以前不眠不休的強(qiáng)大的馬達(dá)一樣,學(xué)習(xí)將會(huì)快速在我們建立的世界中成為常態(tài)。所有簡(jiǎn)單的東西都將會(huì)有學(xué)習(xí)的能力。自動(dòng)化的合成學(xué)習(xí)不會(huì)讓你的烤箱達(dá)到和你一樣的聰明程度,但它可以做出更好的面包。 不用多久,我們就會(huì)覺(jué)得讓智能物品不夠用了。現(xiàn)在我們知道了怎樣合成學(xué)習(xí),我們將期待所有的一切都能隨著不斷被人使用而自動(dòng)地自我改善,就像DeepMind那個(gè)學(xué)習(xí)玩游戲的系統(tǒng)一樣。我們未來(lái)幾年迎來(lái)的驚喜將會(huì)是在許多我們覺(jué)得不可能的領(lǐng)域?qū)崿F(xiàn)合成學(xué)習(xí)。 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)是最近最激動(dòng)人心的科技進(jìn)展。從技術(shù)上來(lái)說(shuō),它們?cè)谠S多領(lǐng)域的比賽上都大大勝過(guò)它們的競(jìng)爭(zhēng)對(duì)手,包括語(yǔ)音識(shí)別、圖像識(shí)別、讀圖、語(yǔ)義分析、翻譯、藥物探索、以及玩視頻游戲。這導(dǎo)致了許多大型科技公司都向它投入巨額資金,而深度學(xué)習(xí)初創(chuàng)企業(yè)也有300逾家,獲得的投資總額超過(guò)15億美元。 這種網(wǎng)絡(luò)為我們這個(gè)時(shí)代最重要的科學(xué)問(wèn)題——我們?cè)鯓颖碚骱筒僮饕饬x(meaning)——帶來(lái)了啟迪。已經(jīng)有了許多針對(duì)意義(meaning)的理論,包括用正式的操作規(guī)則將語(yǔ)句、聲音、圖像投射到邏輯演算(logical calculi)中。例如,Montague語(yǔ)義學(xué)試圖將自然語(yǔ)言短句投射到有類(lèi)型λ演算(typed lambda calculus)上。 深度學(xué)習(xí)網(wǎng)絡(luò)本身會(huì)將輸入的詞語(yǔ)、聲音、圖像投射到神經(jīng)活動(dòng)向量上。這些向量表征展示了一種有趣的“意義(meaning)的代數(shù)”。比如,在使用大量英語(yǔ)語(yǔ)言材料巽寮以后,Mikolov的Word2Vec顯示出了這種奇怪的關(guān)系:“國(guó)王 – 男人 + 女人 = 女王”。他的神經(jīng)網(wǎng)絡(luò)試圖從詞語(yǔ)所在的語(yǔ)境中預(yù)測(cè)詞語(yǔ)是什么(或是相反)。語(yǔ)境從“國(guó)王吃了他的午餐”到“女王吃了她的午餐”的變化和從“男人吃了他的午餐”到“女人吃了她的午餐”是相同的。對(duì)許多相似句子進(jìn)行統(tǒng)計(jì)以后,向量從“國(guó)王”到“女王”的變化就與從“男人”到“女人”的變化一樣了。它也同樣做出了從“王子”到“公主”、“英雄(hero)”到“女英雄(heroine)”等相似的匹配。其他的“意義(meaning)等式”包括“巴黎 – 法國(guó) + 意大利 = 羅馬”,“奧巴馬 – 美國(guó) + 俄羅斯 = 普京”,“結(jié)構(gòu) – 建筑 + 軟件 = 程序員”。通過(guò)這種方式,這些系統(tǒng)僅僅從統(tǒng)計(jì)訓(xùn)練樣例中就發(fā)現(xiàn)了重要的關(guān)系信息。 這些網(wǎng)絡(luò)的成功可以被看作是1950年代提出的“分布式語(yǔ)義(distributional semantics)”的勝利。意義(meaning)、關(guān)系、以及有效的推理都來(lái)自于對(duì)于實(shí)驗(yàn)語(yǔ)境的統(tǒng)計(jì)結(jié)果。在視覺(jué)領(lǐng)域,Radford、Metz、以及Chintala用來(lái)生成圖像的深度學(xué)習(xí)網(wǎng)絡(luò)中也發(fā)現(xiàn)了相似的現(xiàn)象。微笑的女人、減去中性表情的女人、加上中性表情的男人,產(chǎn)生了微笑的男人。戴著眼鏡的男人、減去不戴眼鏡的男人、加上不戴眼鏡的女人,產(chǎn)生了戴眼鏡的女人。 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)現(xiàn)在正被應(yīng)用于數(shù)以百計(jì)的重要應(yīng)用中。工業(yè)機(jī)器人的一項(xiàng)經(jīng)典挑戰(zhàn)就是使用視覺(jué)從一堆雜亂擺放的零件中找出并揀起需要的那一個(gè)。最近,一家工業(yè)機(jī)器人公司表示,他們通過(guò)使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行8個(gè)小時(shí)的訓(xùn)練成功解決了這個(gè)問(wèn)題。一家無(wú)人機(jī)公司最近也描述了一個(gè)深度神經(jīng)網(wǎng)絡(luò),可以在復(fù)雜的真實(shí)環(huán)境中自動(dòng)操作無(wú)人機(jī)。為什么這些進(jìn)展會(huì)在近期發(fā)生?為了讓這些網(wǎng)絡(luò)能夠高效學(xué)習(xí),需要大量的訓(xùn)練數(shù)據(jù)集,通常都是數(shù)以百萬(wàn)計(jì)的樣例。大量數(shù)據(jù)與大型網(wǎng)絡(luò)的組合,意味著它們也需要非常多的計(jì)算力(computational power)。這些系統(tǒng)現(xiàn)在擁有非常大的影響力,因?yàn)榛ヂ?lián)網(wǎng)能夠提供大量訓(xùn)練數(shù)據(jù),而配有圖像圖處理的現(xiàn)代計(jì)算機(jī)也有足夠的用來(lái)訓(xùn)練數(shù)據(jù)的計(jì)算力。 這將會(huì)發(fā)展成什么樣?等著這些神經(jīng)網(wǎng)絡(luò)很快被應(yīng)用到你見(jiàn)得到的每一種應(yīng)用上吧。最近的一些關(guān)于深度學(xué)習(xí)的大學(xué)課程貼出了學(xué)生的課堂作業(yè)。在短短幾個(gè)月間,就能有數(shù)以百計(jì)的學(xué)生學(xué)會(huì)運(yùn)用這種技術(shù)來(lái)解決各種各樣的問(wèn)題——這些問(wèn)題在10年前可能會(huì)被認(rèn)為是一個(gè)研究課題。我們正處于深度學(xué)習(xí)網(wǎng)絡(luò)的某種“寒武紀(jì)大爆發(fā)”中。全球各地的研究團(tuán)隊(duì)正在實(shí)驗(yàn)不同的網(wǎng)絡(luò)大小、架構(gòu)、以及訓(xùn)練技巧,而其他的一些團(tuán)隊(duì)則在搭建能讓它們運(yùn)行得更高效的硬件。 所有這些都是非常激動(dòng)人心的,但是這也意味著人工智能很有可能會(huì)馬上對(duì)我們的社會(huì)產(chǎn)生更巨大的影響。我們必須作出努力,確保這些系統(tǒng)產(chǎn)生的是有益的影響,并創(chuàng)造出有助于整合這些新技術(shù)的社會(huì)架構(gòu)。許多在競(jìng)賽中獲得勝利的網(wǎng)絡(luò)從輸入到輸出都是前饋的(feedforward)。它們通常是為輸入做分類(lèi)或是評(píng)估(evaluation),不會(huì)創(chuàng)造任何新的東西。更新穎的網(wǎng)絡(luò)是“卷積網(wǎng)絡(luò)”,可以被“強(qiáng)化學(xué)習(xí)”所訓(xùn)練。這類(lèi)系統(tǒng)更擅長(zhǎng)于找到出人意料的獲得結(jié)果的方法。下一代的網(wǎng)絡(luò)將會(huì)為世界創(chuàng)造出模型,并進(jìn)行詳細(xì)的推理來(lái)選擇出最佳的行動(dòng)。這種系統(tǒng)在設(shè)計(jì)時(shí)必須非常謹(jǐn)慎,以免帶來(lái)預(yù)料不到的惡性結(jié)果。我們?cè)谶x擇向這些系統(tǒng)要求什么結(jié)果時(shí)必須萬(wàn)分小心。如果我們能夠獲得讓這些發(fā)展保持在有益的方向上的科學(xué)理解和社會(huì)意志(social will),那么我們的未來(lái)會(huì)是非常燦爛的! 這個(gè)世界正在越來(lái)越多地充斥著深度架構(gòu)——多層人工神經(jīng)網(wǎng)絡(luò),(通過(guò)“深度學(xué)習(xí)”的方法)用來(lái)在圖像和文字之類(lèi)的大數(shù)據(jù)集里發(fā)現(xiàn)模式(pattern)。但是,這些深度架構(gòu)的強(qiáng)力性能和流行程度掩蓋了一個(gè)主要的問(wèn)題——知識(shí)透明性的問(wèn)題。這種架構(gòu)可以學(xué)會(huì)做出很棒的事情,但是它們沒(méi)有提供(在不進(jìn)行進(jìn)一步努力了解的情況下)它們?cè)谧鲞@些事的時(shí)候到底根據(jù)的是什么知識(shí)。 這既讓人失望(理論上)又十分危險(xiǎn)(實(shí)際上)。深度學(xué)習(xí)以及它提取出的模式現(xiàn)在充斥在我們?nèi)粘I畹姆椒矫婷?,從在線搜索和推薦系統(tǒng),到銀行貸款申請(qǐng)、醫(yī)療、約會(huì),無(wú)所不包。一種對(duì)于我們的命運(yùn)有如此重要影響的系統(tǒng),應(yīng)當(dāng)是盡可能透明的。好消息是,偵測(cè)深度學(xué)習(xí)系統(tǒng)收集并應(yīng)用了什么知識(shí)的新技術(shù)正在涌現(xiàn)。 在2015年6月,Alexander Mordvintsev等研究者發(fā)布了一篇簡(jiǎn)短的論文,名為《開(kāi)端主義:深入神經(jīng)網(wǎng)絡(luò)內(nèi)部(Inceptionism: Going Deeper into Neural Networks)》。“開(kāi)端主義(inceptionism)”的名字來(lái)自于一種架構(gòu),這個(gè)詞很快就出現(xiàn)在幾乎每一個(gè)技術(shù)博客上。他們選擇了一個(gè)訓(xùn)練完成的網(wǎng)絡(luò),它能夠分辨出給定的圖片里有什么。他們之后又設(shè)計(jì)了一種自動(dòng)的方法,讓網(wǎng)絡(luò)能將輸入的圖片微調(diào)、變得更接近它已經(jīng)歸類(lèi)好的圖片類(lèi)型。這在本質(zhì)上涉及到了以相反的方向運(yùn)行網(wǎng)絡(luò)(因此在各種博客中會(huì)頻繁提到“networks dreaming”和“reverse hallucination”兩個(gè)詞)。比如,一開(kāi)始有隨機(jī)噪音和一種目標(biāo)分類(lèi)(target classification),并且限制網(wǎng)絡(luò)只能參照它之前訓(xùn)練時(shí)的那些圖片的統(tǒng)計(jì)結(jié)果,最后將會(huì)得到模糊的、幾乎是印象派的圖像,這個(gè)圖像代表了這個(gè)網(wǎng)絡(luò)認(rèn)為這種物體(香蕉,海星,降落傘,或是別的什么東西)應(yīng)該是什么樣子。 也有意料之外的時(shí)候。比如,目標(biāo)“杠鈴”,的確讓網(wǎng)絡(luò)產(chǎn)生了兩端有杠鈴片的東西——但是杠鈴邊上隱隱約約還連著肌肉發(fā)達(dá)的手臂。這告訴我們,這個(gè)網(wǎng)絡(luò)還沒(méi)有能很好地區(qū)分核心含義,雖然它已經(jīng)非常接近了。其中最有趣的是,你可以輸入一個(gè)真實(shí)的圖像,在你的多層神經(jīng)網(wǎng)絡(luò)中選擇一層,要求系統(tǒng)加強(qiáng)它能探測(cè)到的一切。這意味著,你可以使用inceptionism來(lái)偵測(cè)每一層處理發(fā)生了什么,并將它可視化。所以,inceptionism是一個(gè)用來(lái)一層一層查看神經(jīng)網(wǎng)絡(luò)中發(fā)生了什么的工具。 有許多結(jié)果看上去都充滿(mǎn)了迷幻的色彩——在某一層重復(fù)強(qiáng)化會(huì)導(dǎo)致形狀不規(guī)則的美感,如同某些讓人眼花繚亂的藝術(shù)圖案。這是因?yàn)椋貜?fù)處理過(guò)程會(huì)導(dǎo)致反饋循環(huán)(feedback loops)。這在效果上相當(dāng)于要求系統(tǒng)強(qiáng)化它在處理圖片的某個(gè)步驟時(shí)“看到”的一切。 所以如果它在一朵云中“看到”了鳥(niǎo)的跡象,或是在一個(gè)漩渦中“看到”了臉的跡象,它就會(huì)加強(qiáng)這些跡象,深化這種特征或是屬性。如果將獲得的加強(qiáng)后的圖像又輸入到網(wǎng)絡(luò)中,同樣的技術(shù)就會(huì)再次應(yīng)用其上,進(jìn)一步強(qiáng)化鳥(niǎo)(或者其他什么東西)的跡象。這個(gè)過(guò)程的重復(fù)會(huì)快速地導(dǎo)致圖片中某些元素變成我們熟悉的物體的夢(mèng)幻版本。 如果你還沒(méi)有見(jiàn)過(guò)這些美妙的圖片,你可以在網(wǎng)上的“inceptionism gallery”找到它們,甚至是使用DeepDream上的代碼自行創(chuàng)作。這類(lèi)圖像自身非常美麗,并且引人深思,而這種技術(shù)可能也因此為探索“創(chuàng)造”提供了一種新的工具——更不用說(shuō)帶來(lái)關(guān)于我們?nèi)祟?lèi)創(chuàng)造過(guò)程的啟示了。但是這并不只是,或者主要是,在玩圖像。這種技術(shù)正在幫助我們理解這些不透明的多層系統(tǒng)知道什么樣的東西:展開(kāi)它們處理過(guò)程,一層一層地了解它們?cè)谔幚頃r(shí)依賴(lài)的是什么。 這是人工大腦的神經(jīng)成像。 神經(jīng)網(wǎng)絡(luò)已經(jīng)復(fù)活了。走過(guò)了充滿(mǎn)爭(zhēng)議的60年以后,它只用了短短3年就蔓延到了無(wú)數(shù)人的日常生活中。 在2015年5月,Sundar Pichai宣布Google將語(yǔ)音識(shí)別中的錯(cuò)誤率降低到了8%,這一數(shù)字在兩年前是23%。關(guān)鍵是什么?被冠上了新名字“深度學(xué)習(xí)”的神經(jīng)網(wǎng)絡(luò)。Google表示,在收購(gòu)了Geoffrey Hinton和他兩個(gè)學(xué)生創(chuàng)立的DNN Research公司以后,僅僅過(guò)了6個(gè)月,圖像識(shí)別方面就獲得了極大的提升。反向傳播回來(lái)了——伴隨著大數(shù)據(jù)。它現(xiàn)在突然身價(jià)百倍。 這個(gè)新聞并不在封面報(bào)道上。沒(méi)有任何科學(xué)上的突破,也沒(méi)有什么新的應(yīng)用。 為什么這是一個(gè)新聞?它的影響規(guī)模讓人震驚,就像它蔓延的速度一樣。從充滿(mǎn)噪音、有無(wú)限的不同之處的視覺(jué)和聽(tīng)覺(jué)模式(pattern)中獲得意義,一直以來(lái)都是人工智能領(lǐng)域被追逐的焦點(diǎn)。原始計(jì)算力(raw computing power)已經(jīng)趕上了數(shù)十年前創(chuàng)造出的算法的需求。在短短幾年間,這種技術(shù)從在實(shí)驗(yàn)室中對(duì)于過(guò)度簡(jiǎn)單問(wèn)題(oversimplified problems)的模擬一躍而升,達(dá)到了真實(shí)世界中作為手機(jī)應(yīng)用程序來(lái)識(shí)別語(yǔ)音和圖像的程度。 在1970年代的自我組織(self-organization)、1980年代的反向傳播的開(kāi)拓性工作以后,神經(jīng)網(wǎng)絡(luò)的理論進(jìn)展大部分時(shí)候都十分緩慢。近期達(dá)到的轉(zhuǎn)折點(diǎn),并不是來(lái)自于根本上的全新洞見(jiàn),而是來(lái)自于處理速度的提高——這讓更大型的神經(jīng)網(wǎng)絡(luò)、更大量的數(shù)據(jù)集、以及更多次的迭代成為可能。 這是神經(jīng)網(wǎng)絡(luò)的第二次復(fù)活。第一次是Geoffrey Hinton和Yann LeCun發(fā)現(xiàn)多層網(wǎng)絡(luò)能夠?qū)W習(xí)非線性分類(lèi)的時(shí)候。在這個(gè)突破之前,Marvin Minsky對(duì)于這個(gè)領(lǐng)域有了一切的準(zhǔn)備,卻在他1969年出版的《感覺(jué)器(Perceptrons)》中否定了這一點(diǎn)。他在其中證明了Frank Rosenblatt的感覺(jué)器不能學(xué)習(xí)非線性的分類(lèi)。 Rosenblatt在1950年代發(fā)明了感覺(jué)器。他的這一成果建立于1940年McCulloch和Pitts(他們展示了模式(pattern)會(huì)如何在神經(jīng)元的網(wǎng)絡(luò)中得到處理)以及Donald Hebb(他假設(shè)了當(dāng)相連神經(jīng)元活躍時(shí),它們之間的聯(lián)系會(huì)得到加強(qiáng))的工作上。感覺(jué)器的發(fā)明掀起了一股熱浪,紐約時(shí)報(bào)在1958年7月13日對(duì)此進(jìn)行了題為“電子‘大腦’自我學(xué)習(xí)(Electronic ‘Brain’ Teaches Itself)”的報(bào)道。時(shí)代雜志引用了Rosenblatt的話,說(shuō)感覺(jué)器“將會(huì)隨著它獲得更多經(jīng)驗(yàn)而變得更聰明”,又添油加醋道“海軍表示,他們將會(huì)運(yùn)用這些原理來(lái)建造第一臺(tái)‘思考的機(jī)器’感知器,它將會(huì)能夠讀或?qū)憽薄?/p> Minsky的批評(píng)對(duì)于Rosenblatt和神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō)是主要的阻力——搞不好也是最致命的。但是,仍有一些人在沉默地堅(jiān)持著,包括Stephen Grossberg在內(nèi)。當(dāng)時(shí)的1950年代,他以達(dá)特茅斯學(xué)院的一名本科生的身份開(kāi)始致力于研究這些問(wèn)題。到1970年代,Grossberg發(fā)明了一種非監(jiān)督式、(自我組織(self-organizing))的學(xué)習(xí)算法,在已取得的類(lèi)別的穩(wěn)定性和學(xué)習(xí)新東西所需的可塑性(plasticity)之間取得了平衡。 Hinton和LeCun解決了Minsky的挑戰(zhàn),再次將神經(jīng)網(wǎng)絡(luò)帶回到了公眾的視野。對(duì)于反向傳播的興奮之情讓人關(guān)注起了Grossberg的模型,還有Fukushima和Kohonen模的型。然而,在1988年,Steven Pinker和Alan Prince對(duì)神經(jīng)網(wǎng)絡(luò)做了20年前Minsky做過(guò)的事,攻擊了神經(jīng)網(wǎng)絡(luò)在解釋語(yǔ)言獲得(acquisition of language)方面的價(jià)值。神經(jīng)網(wǎng)絡(luò)再一次敗退。 在Geoffrey Hinton和他的學(xué)生們贏得了2012年ImageNet挑戰(zhàn)、在圖像識(shí)別的表現(xiàn)上展現(xiàn)出了極大的提高之后,Google抓住了這個(gè)機(jī)會(huì),于是神經(jīng)網(wǎng)絡(luò)又一次煥發(fā)出生機(jī)。 對(duì)于深度學(xué)習(xí)的反對(duì)已經(jīng)開(kāi)始逐漸出現(xiàn)。所有方法都能從強(qiáng)大計(jì)算力中受益,傳統(tǒng)的符號(hào)主義方法也不例外。時(shí)間會(huì)告訴我們哪一種方法在解決哪些問(wèn)題上能夠盛行。無(wú)論如何,2012-2015年將會(huì)成為神經(jīng)網(wǎng)絡(luò)把人工智能推到我們指尖的時(shí)間。 |
|
來(lái)自: victor1208 > 《待分類(lèi)》