從大腦神經(jīng)系統(tǒng)到人工智能錢沄濤 2012年,谷歌無人駕駛汽車上路,至今已累計行駛了超過300萬千米;2016年3月,谷歌公司研發(fā)的計算機程序“AlphaGo”與圍棋世界冠軍、職業(yè)9段選手李世石進行人機大戰(zhàn),并以4∶1的總比分獲勝,一時間轟動世界;2017年年初,國內(nèi)首場人機大戰(zhàn)節(jié)目中,“百度大腦”以3∶2險勝人類“最強大腦”王峰,比拼任務為跨年齡人臉識別……以上這些項目,都是近年來人工智能領域最熱門的研究方向,也是最能讓人體會到人工智能強大的表現(xiàn)。而這些項目背后的核心技術,都是深度學習技術,這種技術依賴于深層結構人工神經(jīng)網(wǎng)絡模型的支持。 模擬大腦神經(jīng)網(wǎng)絡我們知道,人工神經(jīng)網(wǎng)絡是對大腦神經(jīng)網(wǎng)絡系統(tǒng)的模擬。由于人工智能的終極目的是全面實現(xiàn)和超越人類大腦的智力水平,因此,在這一過程中對大腦神經(jīng)系統(tǒng)進行模擬是人工智能研究的主要途徑之一。 人類大腦的神經(jīng)系統(tǒng)中包含大約1011個神經(jīng)細胞(也叫神經(jīng)元)。通過它們之間的互相連接,我們得到了一個由百萬億計連接組成的復雜神經(jīng)網(wǎng)絡,實現(xiàn)感知、運動、思維等各種功能。圖1是生物神經(jīng)元的基本結構。神經(jīng)元之間依靠脈沖傳遞信息,信息內(nèi)容是由脈沖的頻率和時序決定的,與幅度無關。脈沖在神經(jīng)細胞內(nèi)運動,當神經(jīng)細胞之間需要通信時,發(fā)出信息的神經(jīng)細胞就會從軸突上釋放出小泡,脈沖通過這些小泡中的化學物質(zhì)產(chǎn)生離子流動,造成電位變化,在膜外傳播到接收神經(jīng)細胞的樹突上,這個復雜的過程就叫做“化學突觸傳遞”。包括人類在內(nèi)的很多哺乳動物,剛出生時就有很多神經(jīng)元,但是沒有多少神經(jīng)網(wǎng)絡連接。大部分神經(jīng)網(wǎng)絡連接都是在哺乳動物出生之后建立的。學習成長的過程也就是這個神經(jīng)網(wǎng)絡變得復雜有效的過程,因此,神經(jīng)元之間的連接學習是智力發(fā)展的關鍵。 圖2 多層感知器模型 兩次陷入研究的低谷截至目前,雖然我們還遠遠不能完全理解大腦的工作原理,但是人工智能從剛起步時起,就受到腦科學和神經(jīng)生理學的強烈影響,它們始終影響著人工智能的研究進程。科學家在20世紀50年代就提出了簡單模擬大腦神經(jīng)元和神經(jīng)網(wǎng)絡的感知器,在學術界引起了轟動。很多人認為,只要神經(jīng)元足夠多,網(wǎng)絡連接足夠復雜,感知器就能模擬部分人類智力。但是人工智能奠基人之一的馬文·明斯基在1969年證明,再復雜的感知器也只能實現(xiàn)線性函數(shù),甚至連簡單的“異或”邏輯都無法實現(xiàn),原因就在于感知器是單層神經(jīng)網(wǎng)絡。而多層神經(jīng)網(wǎng)絡的學習在當時被認為是不可能的。因此,人工神經(jīng)網(wǎng)絡研究在人工智能領域很快就陷入了低谷,被基于規(guī)則和邏輯推理的專家系統(tǒng)所取代。 20世紀80年代,以Hopfield網(wǎng)絡、波爾茲曼機和反向傳播算法為代表的新的人工神經(jīng)網(wǎng)絡研究突破了感知器的局限,從而開始了長達十幾年的基于神經(jīng)網(wǎng)絡的人工智能研究熱潮。神經(jīng)網(wǎng)絡被廣泛應用于圖像識別、語音識別、工業(yè)控制、機器人、智能決策等領域。特別是反向傳播算法部分解決了多層網(wǎng)絡模型的學習問題。圖2是典型的多層感知器模型,每個節(jié)點都代表著一個神經(jīng)元,通常由一個簡單的非線性函數(shù)表示,稱為“激勵函數(shù)”。兩個節(jié)點間的連接由連接強度表示,稱為“權重”。節(jié)點是分層布置的,網(wǎng)絡的輸出根據(jù)網(wǎng)絡的連接方式、權重值和激勵函數(shù)的不同而不同。 當時很多人樂觀地認為,只要節(jié)點足夠多,層數(shù)足夠多,就可以學習出任意復雜的映射函數(shù)。但是大家逐漸發(fā)現(xiàn),反向傳播算法對于大型多層神經(jīng)網(wǎng)絡的訓練效果很差,收斂速度非常慢。而與此同時,以支持向量機和概率圖模型為代表的統(tǒng)計機器學習取得了突飛猛進的發(fā)展,神經(jīng)網(wǎng)絡研究再次陷入低谷。 人類大腦 神經(jīng)元 人工神經(jīng)網(wǎng)絡 百度大腦 深度學習技術但是,科學家模擬人類大腦解決人工智能問題的研究始終沒有停止。最新的腦科學研究表明,大腦各種神經(jīng)元的信號處理機制和連接學習方式是不同的,特別是大腦的無意識感知和自我意識功能,并不需要有監(jiān)督的學習。非監(jiān)督學習和自主學習的重要性在大腦神經(jīng)系統(tǒng)中占有重要地位。在Geoffrey Hinton、Yann LeCun、YoshuaBengio等人的堅持和努力下,人工神經(jīng)網(wǎng)絡研究專家于2006年前后提出了一種非監(jiān)督和監(jiān)督學習相結合的深度神經(jīng)網(wǎng)絡模型。 該模型可以首先創(chuàng)建一些網(wǎng)絡層來提取樣本隱含的特征而不使用帶標簽的數(shù)據(jù),再創(chuàng)建少量的輸出層添加到網(wǎng)絡的頂部,使用反向傳播算法進行微調(diào)。由于非監(jiān)督層的網(wǎng)絡訓練不需要反向傳播算法,因此可以構建多達上百層的網(wǎng)絡,來模擬大腦認識和感知事物的不同層次的抽象能力。同時,近年來圖形處理單元(GPU)、高性能計算機、云計算等先進計算技術的發(fā)展,也為深度神經(jīng)網(wǎng)絡大規(guī)模計算提供了可能。 深度學習解決了人工智能界努力了很多年卻仍無進展的問題,能夠發(fā)現(xiàn)高維數(shù)據(jù)中的復雜結構。在圖像識別、語音識別等幾乎所有重要的人工智能領域都打破了其他所有方法保持的紀錄,包括預測潛在的藥物分子活性、分析粒子加速器數(shù)據(jù)、重建大腦回路、預測在非編碼DNA突變對基因表達和疾病的影響、自動問答和語言翻譯等領域。借助深度學習技術,人工智能終于踏上了“強人工智能”之路(即機器的智慧水平將超過人類)。由于我們對大腦認知和學習機理的掌握依然是膚淺的,所以深度神經(jīng)網(wǎng)絡雖然在某些領域比人類大腦要強,但在涉及到情感認知等領域就會束手無策,整體智力水平仍不如三四歲的小孩。目前,美國、中國政府和歐盟都啟動了人腦計劃項目,希望通過對大腦更深入的理解來促進人工智能的發(fā)展。深度神經(jīng)網(wǎng)絡也在通過模擬大腦的多種類節(jié)點、可塑性連接、動態(tài)演化、網(wǎng)絡集群等特征,來建立更強的人工智能。 大腦是宇宙中最復雜的系統(tǒng)之一,人工智能是人類對自我的超越,“人工大腦”在模擬人腦的基礎上也會超越人腦。這一過程充滿刺激也充滿危險,它可能會從根本上改變?nèi)祟惏l(fā)展的進程。 |
|