本文原載Medium,作者Steven Levy,由機(jī)器之心翻譯,微信公眾號:機(jī)器之心(Almosthuman2014)。 Geoffrey Hiton說:“我需要了解一下你的背景,你有理科學(xué)位嗎?” Hiton站在位于加利福尼亞山景城谷歌園區(qū)辦公室的一塊白板前,2013年他以杰出研究者身份加入這家公司。Hiton也許是全世界研究神經(jīng)網(wǎng)絡(luò)系統(tǒng)最早的專家,在上世紀(jì)80年代中期,他就是人工智能技術(shù)的先驅(qū)(他提到在16歲時就開始思考神經(jīng)網(wǎng)絡(luò))。自那時起,以模擬人腦為原理的神經(jīng)網(wǎng)絡(luò)被認(rèn)為是一種在處理計算機(jī)視覺和自然語言等棘手問題方面很有前途的方法。但漸漸有人失去了等待的耐心,人們開始質(zhì)疑是否應(yīng)該繼續(xù)下去。 Geoff Hinton. Photo: Michelle Siu/Backchannel 大約十年前,在多倫多大學(xué)Hinton的實(shí)驗(yàn)室,他和其他研究者取得了一項(xiàng)突破性進(jìn)展,突然使神經(jīng)網(wǎng)絡(luò)成為人工智能領(lǐng)域最熱門的話題。不僅是谷歌,還有一些其他公司,比如Facebook、Microsoft和IBM都開始瘋狂追求這個領(lǐng)域中為數(shù)不多的科學(xué)家,他們精通于建立多層模擬神經(jīng)元結(jié)構(gòu)以使整個系統(tǒng)能夠被訓(xùn)練,或者進(jìn)行自我訓(xùn)練,然后來預(yù)測隨機(jī)輸入值的相關(guān)性。 這更像是一個嬰兒,他學(xué)著對那些涌入到其初始感官的數(shù)據(jù)進(jìn)行組織。這種新的、有效的處理方式被稱作深度學(xué)習(xí),一些長期計算難題(比如說計算機(jī)“觀看”和“聽到”的能力等)得以解決。我們翹首期盼的擁有智能的計算機(jī)系統(tǒng)突然出現(xiàn)在我們面前,此后谷歌搜索將會變得更加好用。 深度學(xué)習(xí)的突破對谷歌搜索的下一次跨越式發(fā)展極其關(guān)鍵:理解真實(shí)世界,在為用戶提供準(zhǔn)確答案和信息方面向前邁出一大步。為保持搜索的活力,谷歌必須變得更加聰明。 這正中谷歌下懷。在公司早些年,創(chuàng)始人就認(rèn)定谷歌是一家人工智能公司。它不僅將人工智能用于搜索——盡管它的搜索引擎與人工智能正相關(guān)——還用于廣告系統(tǒng)、自動駕駛汽車,以及將納米顆粒注入人體血管來進(jìn)行早期疾病監(jiān)測的計劃中。正如Larry Page在2002年告訴我的:
當(dāng)Geoffrey Hiton實(shí)現(xiàn)這個突破時,谷歌已經(jīng)做好準(zhǔn)備走上這條道路。多年以來,公司一直通過使用機(jī)器學(xué)習(xí)這種更傳統(tǒng)的方式來使搜索引擎變得更加強(qiáng)大,而且在這方面遙遙領(lǐng)先。 曾經(jīng)有幾年,公司雇傭了一群人工智能工程師和科學(xué)家,他們使搜索引擎像synonyms一樣學(xué)習(xí)。當(dāng)數(shù)百萬用戶用到一個可以進(jìn)行替換的詞語(比如,dog和puppy)時,谷歌能迅速利用知識來更好的理解問題。當(dāng)谷歌承擔(dān)網(wǎng)站翻譯工作時,它的科學(xué)家們會將儲備的大量翻譯過的文檔和來源放入系統(tǒng)。這樣,谷歌搜索引擎就“學(xué)會”了如何將一種語言匹配到另一種。 深度學(xué)習(xí)被視為能夠超越那些更加直接的機(jī)器學(xué)習(xí)的關(guān)鍵一步 深度學(xué)習(xí)的追隨者聲稱它基于人腦結(jié)構(gòu),之前基于計算機(jī)特性實(shí)現(xiàn)智能幾乎是不可能的——至少非常難,但深度學(xué)習(xí)為其提供了可能,這就是為什么Hinton的突破會對谷歌如此重要,對于其他有搜索或類似業(yè)務(wù)的公司也是如此。過去幾年,谷歌一直努力將搜索引擎塑造成吸引討論的話題。但真正使計算機(jī)獲得初級的、人類般的智能還是需要對人工智能的前沿研究進(jìn)行擴(kuò)展,深度學(xué)習(xí)就是這樣一個能夠完成這項(xiàng)任務(wù)的當(dāng)下最流行的工具。 神經(jīng)網(wǎng)絡(luò)是對生物上大腦學(xué)習(xí)方式進(jìn)行建模。當(dāng)你嘗試進(jìn)行一個新任務(wù)時,一系列特定的神經(jīng)元集合會被激活。你觀察到結(jié)果,接下來利用反饋來調(diào)整哪些神經(jīng)元應(yīng)該被激活,以此來訓(xùn)練大腦。多次之后,一些神經(jīng)元之間的聯(lián)系將變強(qiáng)而另外一些則變?nèi)?,這就形成了記憶的基礎(chǔ)。 模擬神經(jīng)網(wǎng)絡(luò)以編碼方式在本質(zhì)上復(fù)制了這一過程。但比起復(fù)制人腦復(fù)雜的神經(jīng)元結(jié)構(gòu),模擬神經(jīng)網(wǎng)絡(luò)更小,神經(jīng)元也是整齊的分層排列。第一層(或者最初基層)是特征探測,一種人類感官的計算形態(tài)。當(dāng)計算機(jī)將數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)——比如說圖像、語言或文本文件的數(shù)據(jù)庫——系統(tǒng)通過檢測其中的特征值來進(jìn)行學(xué)習(xí)。例如,如果任務(wù)是識別垃圾郵件,神經(jīng)網(wǎng)絡(luò)研究者可能會將許多信息輸入到系統(tǒng),同時貼上“垃圾郵件”及“非垃圾郵件”標(biāo)簽。神經(jīng)網(wǎng)絡(luò)將自動察覺到一些單詞的復(fù)雜特征、模式,以及能夠確定該郵件是否為垃圾郵件的標(biāo)題信息。 在早期神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)中,計算機(jī)不能自己設(shè)計特征,因此這些特征需要人工添加。Hinton的開創(chuàng)性貢獻(xiàn)是開發(fā)了一種被稱作“Back Propagation(反向傳播算法)”的技術(shù),這是一種反饋機(jī)制,它允許系統(tǒng)更加有效的從錯誤中學(xué)習(xí)以及自己定義特征。“追溯到1986年,我們首次開發(fā)出Back Propagation算法,我們因其能學(xué)習(xí)到多層的特征探測而感到興奮,我們認(rèn)為我們解決了這個問題?!?Hinton說,“但在解決實(shí)際問題中卻沒有出現(xiàn)大的突破,這非常令人失望,我們完全猜錯了需要的計算資源和標(biāo)記案例數(shù)量?!?/p> 但是,即使多年來許多研究員不再信仰神經(jīng)網(wǎng)絡(luò),但Hinton依然強(qiáng)烈感覺到它們會有實(shí)用價值。1995年,他和他的學(xué)生嘗試著放棄手動添加標(biāo)簽,至少是學(xué)習(xí)過程的早期階段,這項(xiàng)技術(shù)被稱作“unsupervised pre-training”,是指該系統(tǒng)可以計算出如何自行組織輸入值。但Hinton說完成這項(xiàng)工作的核心是數(shù)學(xué)技巧,一種節(jié)約計算時間的近似法,當(dāng)信息通過各層神經(jīng)元時將會引發(fā)更多次迭代來改善網(wǎng)絡(luò)。如經(jīng)常遇到的,速度能夠變化,這使得之前神經(jīng)網(wǎng)絡(luò)無法完成的“學(xué)習(xí)”行為成為可能。就像是一個人突然冷靜下來說,我能用10分鐘完成5個小時的滑雪練習(xí)。 伴隨著無監(jiān)控學(xué)習(xí)的出現(xiàn),人類專家只需要在更加后面的階段對機(jī)器進(jìn)行干預(yù),他們是為更想要的結(jié)果添加標(biāo)簽并為成功的結(jié)果提供獎勵。Hinton說:“想象一下小孩子,當(dāng)他們學(xué)著辨認(rèn)牛時,并不需要去看幾百萬張媽媽們標(biāo)記上‘?!膱D片,他們僅僅是學(xué)習(xí)牛的樣子,然后問到:‘這是什么?’ 媽媽會說:‘這是一頭?!?,他們就學(xué)會了。深度學(xué)習(xí)就類似于這樣。 等到Hinton團(tuán)隊對這一模型進(jìn)行測試時,他們恰好受益于神經(jīng)網(wǎng)絡(luò)初創(chuàng)時尚不具備的條件——超高速圖形處理器(GPU)。盡管這些芯片設(shè)計之初是用于推導(dǎo)高級圖像的計算公式,但它們也非常適用于神經(jīng)網(wǎng)絡(luò)的計算需求。Hinton為實(shí)驗(yàn)室購置了一堆圖形處理器,讓兩個學(xué)生來操作該系統(tǒng)。他們進(jìn)行了一項(xiàng)測試來觀察是否能讓神經(jīng)網(wǎng)絡(luò)識別講話中的音素。這自然是許多科技公司——當(dāng)然,也包括谷歌——試圖掌握的技術(shù)。因?yàn)檎Z音會成為即將到來的移動時代的輸入方式,電腦必須學(xué)會更好地傾聽。 Geoff Hinton. Photo: Michelle Siu/Backchannel 系統(tǒng)表現(xiàn)如何呢? “他們?nèi)〉昧肆钊思拥慕Y(jié)果,” 辛頓表示,“最初結(jié)果幾乎和當(dāng)時技術(shù)一樣出色,而后者已經(jīng)調(diào)試發(fā)展了近30年,很顯然,如果在最開始嘗試中我們?nèi)〉媚敲春玫慕Y(jié)果,我們最終的結(jié)果會更好?!?在接下來幾年中,Hinton團(tuán)隊進(jìn)行了更多嚴(yán)肅的嘗試。等到結(jié)果發(fā)布時,Hinton稱系統(tǒng)已經(jīng)能與現(xiàn)存商用模型的最佳表現(xiàn)比肩。“關(guān)鍵是,這是實(shí)驗(yàn)室兩個學(xué)生做出來的?!彼f。 深度學(xué)習(xí)就此誕生。 2007年,項(xiàng)目進(jìn)行過程中,Hinton在山景城進(jìn)行了關(guān)于深度學(xué)習(xí)的谷歌技術(shù)演講,極客們踴躍出席,這一演講在YouTube上也大受歡迎。這有助于傳播這樣的理念,即神經(jīng)網(wǎng)絡(luò)將成為一個強(qiáng)大工具。這還掀起了一波爭先恐后雇傭該領(lǐng)域技術(shù)專家的浪潮。Hinton的學(xué)生去了IBM、微軟,當(dāng)然還有谷歌。這可是攻堅該領(lǐng)域的四大公司中的三家(還有一家是Nuance,它是蘋果的技術(shù)供應(yīng)商)。 所有人都能自由使用Hinton實(shí)驗(yàn)室的成果用以完善各自系統(tǒng)?!拔覀兓旧蠈Υ撕翢o保留,因?yàn)槲覀冎塾谧C明我們技術(shù)的優(yōu)勢?!?Hinton表示,“有趣的是,微軟研究院和IBM先于谷歌得到這項(xiàng)技術(shù),但是在將技術(shù)轉(zhuǎn)變成產(chǎn)品方面谷歌卻比任何人都迅速?!?/p> Hinton的加入只是谷歌那一季一系列重大聘任之一。就在幾個月前,人工智能的樂觀主義哲學(xué)家Ray Kurzweil剛剛加入包括Peter Norvig(編寫了人工智能課程的標(biāo)準(zhǔn)教科書)、Sebastian Thrun (自動駕駛汽車的主要發(fā)明者)等人工智能傳奇人物在內(nèi)的團(tuán)隊。 當(dāng)下谷歌醉心于深度學(xué)習(xí),顯然是認(rèn)為這將引發(fā)下一代搜索的重大突破。移動計算的出現(xiàn)已經(jīng)迫使谷歌改變搜索引擎的本質(zhì)特征。為了更進(jìn)一步,它必須采取和人類認(rèn)知世界相一致的方式——當(dāng)然另一方面也要執(zhí)行知曉世間一切并且在不到半秒鐘找到這些的非凡任務(wù)。所以, Jeff Dean參與進(jìn)來是遲早的事情。 建立“谷歌大腦” Dean是谷歌的傳奇人物。早在1999年加入谷歌時,他在計算機(jī)科學(xué)圈子里就已經(jīng)聲名遠(yuǎn)揚(yáng),聘任Dean是谷歌的一個里程碑,彼時谷歌還是個員工只有兩位數(shù)相對默默無聞的互聯(lián)網(wǎng)公司。在接下來的幾年里,Dean成為構(gòu)建谷歌軟件基礎(chǔ)構(gòu)架的領(lǐng)軍人物。在這一過程中,Dean粉們組建了一個極客團(tuán)體,他們用惡搞來表達(dá)對Dean耀眼才華的崇敬,叫「關(guān)于 Jeff Dean的真相」。其中大多數(shù)都涉及超級極客的編碼奧秘,但也有些相對容易理解的,比如:
現(xiàn)年46歲的Dean早已知曉神經(jīng)網(wǎng)絡(luò),他在本科論文項(xiàng)目就曾應(yīng)用過它。然而在隨后的幾年,他和大部分同行得出了相似的結(jié)論:神經(jīng)網(wǎng)絡(luò)的黃金時期尚未到來?!吧窠?jīng)網(wǎng)絡(luò)前途無量,但因?yàn)槲覀兩袥]有足夠的計算能力使其一鳴驚人,神經(jīng)網(wǎng)絡(luò)一度銷聲匿跡。" Dean說到。 不過在2011年,Jeff Dean在谷歌一間茶水間遇見了吳恩達(dá)(Andrew Ng)。吳恩達(dá)是斯坦福的人工智能教授,人工智能領(lǐng)域的巨擘,他每周會花上一天時間呆在這家搜索引擎公司。Dean問吳恩達(dá)在忙些什么,吳恩達(dá)的回答令他大吃一驚——“我們在試圖訓(xùn)練神經(jīng)網(wǎng)絡(luò)”。吳恩達(dá)告訴Dean,風(fēng)頭已變,伴隨著深度學(xué)習(xí)領(lǐng)域的突破,神經(jīng)網(wǎng)絡(luò)表現(xiàn)頗佳,如果谷歌能掌握訓(xùn)練大型網(wǎng)絡(luò)的技巧,會發(fā)生奇跡。 Jeff Dean. Photo: Talia Herman/Backchannel Dean認(rèn)為這聽上去很有意思,在“涉足”六個月后開始相信,建立一個龐大神經(jīng)網(wǎng)絡(luò)系統(tǒng)能夠很快取得實(shí)質(zhì)性成果。因此他和吳恩達(dá)將其變成了一個獨(dú)立項(xiàng)目。(吳恩達(dá)已經(jīng)離開谷歌,就在最近加入了百度,以發(fā)展中國搜索引擎領(lǐng)導(dǎo)者——百度自己的人工智能項(xiàng)目。) 大約用了一年時間,該項(xiàng)目俗稱為“谷歌大腦”,立項(xiàng)于Google X——谷歌公司高瞻遠(yuǎn)矚的研究部門。“這是我們內(nèi)部開玩笑的叫法,我們盡量不這么對外宣稱,畢竟聽起來有點(diǎn)奇怪”,Dean說。2012年,研究積累了一定成果后,項(xiàng)目組走出了純試驗(yàn)部門——Google X ,轉(zhuǎn)移到搜索部門。項(xiàng)目組也開始避免使用“大腦”一詞。在對外宣傳中,他們更青睞“谷歌深度學(xué)習(xí)項(xiàng)目”這個名字,雖然這個名稱聽起來沒有“大腦”有深意,但這也不太可能導(dǎo)致有人在Googleplex(谷歌總部)門前示威抗議。 Dean表示,項(xiàng)目組最開始嘗試的是無監(jiān)督學(xué)習(xí)(unsupervised learning),因?yàn)椤斑@個世界上監(jiān)控外的數(shù)據(jù)遠(yuǎn)多于監(jiān)控下的數(shù)據(jù)”。這反映在Dean項(xiàng)目組的第一篇論文中,在這項(xiàng)實(shí)驗(yàn)中谷歌大腦(覆蓋了1.6萬多個微處理器,創(chuàng)建了一個有數(shù)十億連接的神經(jīng)網(wǎng)絡(luò))觀看了千萬數(shù)量級的YouTube圖像,以試圖觀察該系統(tǒng)能否學(xué)會將其所見到的定義出來。沒有發(fā)生意外,有賴于YouTube的內(nèi)容,該系統(tǒng)自發(fā)辨識出了貓,并且相當(dāng)擅長于許多普通用戶通常會做的事情——搜索貓科動物明星的視頻?!霸谟?xùn)練中,我們從未告訴它(谷歌大腦)‘這是一只貓’”,Dean告訴《紐約時報》,“基本上可以說,它發(fā)明了貓這個概念?!?/p> 而這只是觀察系統(tǒng)能做些什么的測試之一。很快,深度學(xué)習(xí)項(xiàng)目組建了一個更加強(qiáng)大的神經(jīng)網(wǎng)絡(luò),并且開始承擔(dān)類似語音識別的任務(wù)?!拔覀兊难芯宽?xiàng)目集合相當(dāng)棒,在一些中短期項(xiàng)目中,系統(tǒng)對事物的超凡理解能力能迅速提升產(chǎn)品性能。還有一些中長期目標(biāo),對此我們腦海里沒有一個具體的產(chǎn)品,但是我們知道這些將會非常有用。” 在我訪談Dean后不久,一個例子就出現(xiàn)了,4位谷歌深度學(xué)習(xí)科學(xué)家發(fā)表了一篇名為《展示與講述》的論文。這不僅標(biāo)志著一個科學(xué)突破,更催生了谷歌搜索旗下的一個應(yīng)用。這篇論文介紹了“神經(jīng)圖片標(biāo)題生成器”(neural image caption generator,NIC ),旨在沒有人類介入的情況下為圖片列示標(biāo)題??梢哉f這個系統(tǒng)充當(dāng)了報紙的圖片編輯。這是一項(xiàng)包含視覺和語言的大型實(shí)驗(yàn)。這個系統(tǒng)的非凡之處在于,它將可視化圖片的學(xué)習(xí)系統(tǒng)建立在能夠用自然語言造句的神經(jīng)網(wǎng)絡(luò)基礎(chǔ)之上。 沒有人會說這個系統(tǒng)已經(jīng)擁有了優(yōu)于人類的照片分類能力。事實(shí)上,如果雇一個基于該神經(jīng)網(wǎng)絡(luò)的人為照片寫標(biāo)題的話,這個網(wǎng)絡(luò)新手可能都堅持不到午餐時間??墒沁@個系統(tǒng)在機(jī)器上卻運(yùn)行的出奇出色。其中一些無比準(zhǔn)確的例子包括:一群正在玩飛盤游戲的年輕人;一個正在泥濘路上騎著摩托的人;一群正穿過干旱草地的大象。系統(tǒng)可以對飛盤、馬路和一群大象生成自己的概念,這足以令人印象深刻。所以,當(dāng)這個系統(tǒng)錯把極限運(yùn)動的單車騎士當(dāng)成滑板者;或者錯把淡黃色的跑車認(rèn)成了校車,也是無可厚非的。畢竟這個系統(tǒng)還處于認(rèn)識繁雜世界的萌芽期。 這只是“谷歌大腦”的起始階段,Dean不打算對外宣稱說谷歌已經(jīng)擁有了世界上最大的神經(jīng)網(wǎng)絡(luò)系統(tǒng),但是他承認(rèn),這是他所知道的這個領(lǐng)域里面的領(lǐng)先者。 游戲、神經(jīng)科學(xué)和圖靈機(jī) Hinton的被雇傭以及Dean的聰明才智是公司推進(jìn)深度學(xué)習(xí)的重要舉措之一,而其中最重要的非2013年谷歌花費(fèi)4億美元收購Deepmind莫屬,這是一家倫敦的人工智能公司?;趯Υ竽X的深度研究,這家公司對于深度學(xué)習(xí)有著自己的獨(dú)到見解。谷歌擊敗了它的主要競爭對手完成此次收購。正如谷歌當(dāng)年花17億美元買下YouTube,和曾經(jīng)花5000萬美元買下羽翼未豐的開源移動操作系統(tǒng)安卓,我們有充分理由相信Deepmind是谷歌撿的另一個大便宜。 CEO和創(chuàng)始人之一的Demis Hassabis是一個滿頭黑發(fā),矮小結(jié)實(shí)的38歲男人。思路敏捷,語速之快就像播客以兩倍速快進(jìn)播放?!拔艺麄€事業(yè)都是在為人工智能做準(zhǔn)備和鋪墊,”他在倫敦市中心高聳的總部大樓里休息時說到,總部大樓坐落在St Pancras火車站旁。Deepmind剛剛從Bloomsbury的一幢不起眼的寫字樓入駐這棟新大樓。這棟大樓之不尋常是因?yàn)樗ぶ患依厢t(yī)院的副樓而建,有點(diǎn)時空穿越的不和諧感。大樓里的會議廳都是以一些著名哲學(xué)家、作家和畫家命名,因?yàn)檫@些他們代表著是人類智慧的巨大飛躍,比如達(dá)芬奇、哥德爾、瑪麗 雪萊。 這個團(tuán)隊最近開始接手兩家由Deepmind收購的以牛津大學(xué)作為實(shí)驗(yàn)基地的公司。一個是Dark Blue Labs,運(yùn)用深度學(xué)習(xí)來解決自然語言理解問題;另一家是Vision Factory,開發(fā)物體識別技術(shù)。 Hassabis 在14歲時就是個狂熱的電腦游戲程序設(shè)計者,同時也是象棋天才,師從游戲大師Peter Molyneux,在《黑與白》和《主題公園》里程碑作品中起到了重要作用。隨后在二十幾歲時開始運(yùn)營自己的游戲公司,有大約60名員工。但是他說游戲是一種達(dá)到目的的方式,而這個目的是一個擁有通用智能的人工智能機(jī)器的發(fā)展。直到2004年,他覺得他已經(jīng)把游戲智能做到極致了,可是建立人工智能公司還是有些操之過急,因?yàn)樗枰挠嬎隳芰炔怀渥悖膊粍澦?。所以他在英國倫敦大學(xué)學(xué)院修了一個認(rèn)知神經(jīng)科學(xué)的博士學(xué)位。 2007年,有一篇關(guān)于記憶神經(jīng)基礎(chǔ)的論文被《Science》評為年度十大突破之一,他是作者之一。他成為倫敦大學(xué)學(xué)院Gatsby Computational Neuroscience Unit的一員,并與UCL,MIT和Harvard展開合作。但在2010年,他覺得是時候成立一個做高級人工智能的公司了,他和蓋茨比計算神經(jīng)科學(xué)組的同事Shane Legg以及19歲就從劍橋輟學(xué)的連續(xù)創(chuàng)業(yè)家Mustafa Suleyman一起著手創(chuàng)立。投資者還包括Peter Theil的Founders Fund和Elon Musk(他對后來對人工智能的不足表示過擔(dān)憂),Geoffrey Hinton也是顧問之一。 DeepMind一直秘密運(yùn)行,在谷歌收購之前只有一次公開的結(jié)果發(fā)布。這足以引發(fā)一場炒作狂潮,同時也伴隨著一些無知的嘲笑。論文表述了DeepMind在通過被動訓(xùn)練神經(jīng)網(wǎng)絡(luò)來玩Atari游戲方面的成功。神經(jīng)網(wǎng)絡(luò)系統(tǒng)通過自身深度學(xué)習(xí)來學(xué)習(xí)游戲規(guī)則——系統(tǒng)直接嘗試百萬遍Pong, Space Invaders, Beam Rider和其他經(jīng)典游戲,通過自學(xué)達(dá)到甚至超越了一個精通游戲的青少年。更有趣的是,它許多成功的策略都是人類無法想象的?!斑@就是此類技術(shù)的一個特殊潛能,” Hassabis說,“我們灌輸給它一種能力使它像人類一樣從經(jīng)驗(yàn)中自我學(xué)習(xí),因此,它就能自行處理那些我們都不知道該如何編程的事情??吹剿氤隽顺绦蛑獾腁tari游戲的新策略,這非常令人激動?!?/p> 這朝著Hassabis的偉大目標(biāo)又前進(jìn)了一小步,他想象中的模擬大腦不僅知道大量事實(shí),還知道接下來該怎么做。 DeepMind絕不滿足于開發(fā)一種只能應(yīng)用在有限領(lǐng)域的工具,就像Atari游戲、通勤或者處理約會。他們想創(chuàng)造一種通行的人工智能機(jī)器,可以隨時隨地處理信息,并將每件事情都完成的非常漂亮。“我們現(xiàn)在所研究的通行人工智能是指將非結(jié)構(gòu)化信息轉(zhuǎn)化成有用的、可行動的知識,” 他說,“我們有模板——人類大腦。我們會系鞋帶、騎自行車、會處理建筑的物理學(xué)問題。所以我們知道這是可能的,并且我們研究項(xiàng)目的理念正在慢慢的拓寬現(xiàn)有的應(yīng)用領(lǐng)域?!?/p> 這聽起來是否令人害怕?Hassabis正在展望一種超級人工大腦,它能夠吸收全世界的信息并將其構(gòu)造成它能理解的形式,然后采取行動?至少他承認(rèn),他們團(tuán)隊所引領(lǐng)的這項(xiàng)先進(jìn)技術(shù)可能會導(dǎo)致一個問題——人工智能脫離人類控制,或至少會變得足夠強(qiáng)大,以至于它的某些功能會被限制。這就是為什么在谷歌收購DeepMind之后,Hassabis和其他創(chuàng)始人要求谷歌設(shè)立一個外部咨詢委員會來監(jiān)控公司在人工智能方面的進(jìn)步。DeepMind早已決定永遠(yuǎn)不會將自己的技術(shù)授權(quán)給軍方和間諜組織,他們也讓谷歌同意了這一點(diǎn)。 遺憾的是Hassabis并沒有透露委員會的組成人員,他只提到“由計算機(jī)、神經(jīng)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的頂級教授組成。” 因?yàn)镈eepMind的工作依然處于早期——離所謂的“奇點(diǎn)”還早——他告訴我們現(xiàn)在沒有必要把委員會成員公布出來。他說:“當(dāng)前不存在的議題有可能會在未來5年或者10年出現(xiàn)。因此,事實(shí)上,游戲剛剛開始?!?/p> 但游戲進(jìn)展飛快。去年秋天,DeepMind公布的另一篇論文描述了他們的一個新項(xiàng)目,通過綜合一些神經(jīng)科學(xué)里的記憶理論來構(gòu)建一個配備圖靈機(jī)性能的神經(jīng)網(wǎng)絡(luò),就像是通用計算設(shè)備。這意味著該系統(tǒng)在足夠的時間和內(nèi)存下能夠計算任何事情。論文重點(diǎn)關(guān)注實(shí)際應(yīng)用:記錄信息并隨后提取的能力——就像是對人類大腦“工作記憶”的人工模擬——“神經(jīng)網(wǎng)絡(luò)圖靈機(jī)”比此前的神經(jīng)網(wǎng)絡(luò)有更快的學(xué)習(xí)能力,能夠處理更加復(fù)雜的任務(wù),更重要是是“擁有在訓(xùn)練制度之外的良好的概括能力”。這不經(jīng)讓我們感到,向著Hassabis那個夢想中的通用人工智能工具又邁出了關(guān)鍵一步。 事實(shí)上,到目前為止,谷歌深度學(xué)習(xí)的成果都還未在搜索及其他產(chǎn)品上大展拳腳。但這一點(diǎn)即將改變。 自從Jeff Dean深度學(xué)習(xí)項(xiàng)目的研究方向從Google X轉(zhuǎn)移到Knowledge部門(包括搜索)之后,他的小組就一直和一些相關(guān)的搜索團(tuán)隊進(jìn)行著密切合作,包括語言和圖像識別。谷歌大腦已經(jīng)成為該公司的一個人工智能工具。Dean說道,這就像一個內(nèi)部服務(wù),如果小組的人對某個特定問題感興趣,他們會通過它找到正確的解決方法。他接著說到,谷歌現(xiàn)在有35到40個小組在使用它,除了搜索和語言,這項(xiàng)技術(shù)在廣告、街景和自動駕駛方面都有應(yīng)用。 Jeff Dean. Photo: Talia Herman/Backchannel 至于遠(yuǎn)期項(xiàng)目,Dean談到他們正嘗試做一個更好的實(shí)時翻譯軟件,這是近段時間的熱點(diǎn),除了當(dāng)前谷歌獲得高度關(guān)注的系統(tǒng)外,微軟的Skype同樣使觀察者印象深刻,這一系統(tǒng)通過遠(yuǎn)程聲音完成翻譯。但是Dean還是為自己團(tuán)隊通過努力推動項(xiàng)目向前發(fā)展感到興奮。他說,這是一個僅通過神經(jīng)網(wǎng)絡(luò)就可以實(shí)現(xiàn)首尾相連語言翻譯的模型,你可以訓(xùn)練一對用兩種語言表達(dá)但意義一致的句子。拿英語和法語來說,你一個詞一個詞的輸入英語句子,然后通過一個“英語結(jié)束”的標(biāo)記,這個模型會馬上將其翻譯成法語。 Dean在神經(jīng)模型和谷歌現(xiàn)有系統(tǒng)之間進(jìn)行了深入比較,結(jié)果表明他的新的深度學(xué)習(xí)系統(tǒng)在識別語音細(xì)節(jié)方面更勝一籌,而這被認(rèn)為是語義表達(dá)的關(guān)鍵。Dean表示:“如果對這項(xiàng)技術(shù)進(jìn)行擴(kuò)展,未來可以做更震撼的事情?!?/p> DeepMind同樣為產(chǎn)品化做好了準(zhǔn)備。Hassabis說大概需要六個月左右的時間,他們的技術(shù)就可以找到和谷歌產(chǎn)品實(shí)現(xiàn)對接的途徑。他的組織被分成了幾部門,其中一個和谷歌緊密合作,致力于人工智能的實(shí)際應(yīng)用,該部門由它的聯(lián)合創(chuàng)始人Mustafa Suleyman負(fù)責(zé)。 Hassabis希望DeepMind的技術(shù)能幫助人們提高生活水平。他相信一個更具積極主動性的搜索引擎——不只為人們提供答案,更能幫人們做決定——可能成為價值的提供者,它將為人們提供最為寶貴和稀缺的商品——時間。Hassabis舉例說世界上可能找到的有趣的書與人有限的一生中能夠讀完的書相比要多很多,既然如此,為什么每次在一個漫長的飛行途中或在某地的難得度假當(dāng)中都要去想該讀哪本書?這將永遠(yuǎn)不會發(fā)生,因?yàn)楹芏囝愃频氖虑閷⒏玫膶?shí)現(xiàn)自動化。 沿著這個思路,Hassabis設(shè)想DeepMind能夠通過自己的方式涉足谷歌更多有開創(chuàng)性意義的項(xiàng)目,比如自動駕駛汽車,甚至Calico,一個致力于延長人類壽命的公司。 最終,Deepmind、谷歌大腦連同Hinton的深度學(xué)習(xí)小組將共同組成谷歌搜索,這才是最重要的。許多年前,Larry Page 和Sergey Brin曾經(jīng)半開玩笑的說,語音將被植入我們的大腦,然而現(xiàn)在已經(jīng)沒人再討論植入了。谷歌并不是通過開發(fā)人類大腦來讓搜索變的更好,他們是在建造一個只屬于它自身的、獨(dú)一無二的大腦。 |
|
來自: 慈溪全媒體 > 《星標(biāo)》