【靜點評】在第五屆智能產(chǎn)業(yè)高峰論壇會后的小范圍研討中,中科院計算所上海分所的孔華威老師提出一個觀點,美國在學術研究中注重原發(fā)創(chuàng)新,因此經(jīng)常涌現(xiàn)重大突破,引領領域革命。中國計算機學會通訊第8期,李國杰院士就深度學習和類腦計算這兩個熱門議題做了點評。他回顧了人工智能發(fā)展歷史上的一些浪潮,有從盲目樂觀到期望落空的規(guī)律,也對深度學習的黑盒子現(xiàn)象提出了系統(tǒng)理論支撐的期待。 而同期雜志中美國應行仁博士對人工智能的發(fā)展演進史從獨特視角重新做了梳理,并對人工智能的未來進行了有深度的哲學思辨——深度學習的黑盒子和機器智能也許能引導人類思維模式的轉(zhuǎn)變。他提出現(xiàn)在大數(shù)據(jù)深度學習的智能,已深植在聯(lián)結(jié)主義模式識別和分布式計算的方向上。人工智能在大數(shù)據(jù)時代正從理性科學方法轉(zhuǎn)向直接從數(shù)據(jù)中在線學習、即時反應的“感性”方法。
我們對世界的認知一直搖擺在感性和理性之間。藝術與科學的不同,傳統(tǒng)思維和現(xiàn)代文化的沖突,人文主義和邏輯思考的矛盾,都反映著對“智慧”理解上的博弈。即使在人工智能研究的幾十年發(fā)展史上,也是如此。 智能的進化 在今日大數(shù)據(jù)熱潮中,重新煥發(fā)青春的神經(jīng)網(wǎng)絡、模式識別、機器學習和人工智能都始于20世紀50年代。1957年美國海軍研究室弗蘭克·羅森布拉特(Frank Rosenblatt)提出了一種模擬神經(jīng)元感知、有識別智能的數(shù)學模型——感知器(Perceptron)。這個能夠在線學習、具有圖像識別功能的原型在計算機模擬試驗后,有了硬件實現(xiàn)——“Mark 1 Perceptron”(包括400個光學傳感器,用變阻器作為電導的權(quán)重,被隨機連接到一組“神經(jīng)元”)。每個神經(jīng)元電路對應于一個視覺的判斷,神經(jīng)元匯合傳感來的電流,以是否超過域值輸出來進行邏輯判斷。該感知器可以通過樣本來學習,在訓練中根據(jù)誤差的反饋,用馬達調(diào)節(jié)變阻器來改變神經(jīng)元中聯(lián)接的權(quán)重。這是一個只有輸入輸出、無隱含層的人工神經(jīng)元網(wǎng)絡。該網(wǎng)絡有n個傳感器的輸入,每個神經(jīng)元都是通過在數(shù)學上實現(xiàn)一個n維空間的超平面來區(qū)分樣本點的模型。其學習的過程是用迭代的算法調(diào)節(jié)這個超平面的參數(shù),使得它對樣本區(qū)分的誤差最小。這實際上也是一種統(tǒng)計分類,其收斂的算法成為模式識別中線性分類法的基礎。這也是認知、心理和智能研究上聯(lián)結(jié)主義的開端。 1958年,在由美國海軍組織的發(fā)布會上,羅森布拉特公布了此項研究成果。這個在當時還是雛形的人工智能社區(qū)引發(fā)了人們的熱烈討論和廣泛聯(lián)想。《紐約時報》報道說:“感知器將會是能夠行走、會交談、有視覺、能寫作、自我繁殖、感知自身存在的電腦胚胎?!边@種智能基于感知和聯(lián)想,可以對輸入的數(shù)據(jù)進行學習分類和類比判斷,是一種模擬動物本能和應用經(jīng)驗的方式。 在隨后的年代里,人們很快發(fā)現(xiàn)了它的局限性。對于許多模式,感知器并不能通過訓練來分辨。比如,在二維平面里的一、三象限上同屬一類的點與二、四象限上屬另一類的點無法用一條直線劃分,這意味著感知器不能識別異或邏輯(XOR)的模式。研究的熱情在失望中逐漸消退。1969年,當時人工智能界的領軍人物馬文·明斯基(Marvin Minsky)和西蒙·派珀特(Seymour Papert)在《感知器》(Perceptrons)一書中總結(jié)道:感知器神經(jīng)網(wǎng)絡只能區(qū)分線性可分的模式,它甚至不能學習簡單的異或邏輯。盡管這對于多層網(wǎng)絡來說并非如此,其后也有人發(fā)表了關于多層網(wǎng)絡的異或邏輯實現(xiàn)的研究,但由于人們已被新的人工智能研究方向所吸引,使得感知器已成昨日黃花,因此大家都認為明斯基權(quán)威的論斷終結(jié)了人工神經(jīng)元網(wǎng)絡的前途。這一方向的研究不幸停滯了十幾年,人工智能研究由此轉(zhuǎn)入用邏輯的方法來搜索推理知識的軌道。 正當人們對感知器失望之時,費根鮑姆(Feigenbaum)的DENDRAL專家系統(tǒng)和指導性論文出現(xiàn)了,對智能的模擬采用了一種與以往完全不同的思路。它根據(jù)給定的有機化合物分子式和質(zhì)譜圖數(shù)據(jù),在保存了化學和質(zhì)譜儀知識的數(shù)據(jù)庫中,利用邏輯推理的方法,從幾千種可能的組合中挑選出正確的分子結(jié)構(gòu)。這是一個能產(chǎn)生高端實用價值的計算機新用法。人們憬然有悟,為什么我們不參考人類理性思考的方式,直接從成熟的知識系統(tǒng)中用邏輯來猜測搜索求解?經(jīng)過幾百年發(fā)展而來的科學知識是一個巨大的寶藏,科學利用因果關系構(gòu)造出一個可以理解的世界模型,以此發(fā)現(xiàn)許多規(guī)律。作為站在智慧高端的人類,我們不必再模仿生物的低級智能,僅須模仿人類的理性,以謂詞邏輯進行運算和啟發(fā)式搜尋,就可擁有高級的智慧。如同機械放大了人力,我們可以用計算機來提高推理能力。這個基于科學推理和知識系統(tǒng)的計算主義智能研究路線使得專家系統(tǒng)在二十世紀七八十年代成為人工智能的代名詞。人們相信,實現(xiàn)具有人類智慧的機器只是一個工程問題。1981年,日本投入大量資金,雄心勃勃地開始了第五代計算機的研究。然而在長達十幾年的專家系統(tǒng)探索中,人們認識到有兩個根本問題無法繞過。一是交互問題,專家系統(tǒng)只能模擬人類深思熟慮的理性。對于機器人來說最需要的是感知、互動,而不是人類最無趣的抽象思維技能。二是規(guī)模擴展問題,想象中無限美好的前景,只限于較窄一類問題的專家咨詢,或小規(guī)模游戲問題的演示;將證明過的原理應用于實踐中時,各種復雜因素的組合需要巨大的計算量,對比人類瞬間都能按直覺做出的判斷(例如識別人臉,穿過有家具的房間)等,這些對計算機來講則十分困難。80年代,人工智能的主流研究雖然有一些商業(yè)應用,但思想上沉悶乏味,最終進入冬天。 科學研究的激情猶如新穎時裝的熱潮,各種不同的思路總要等到主流新奇窮盡、精彩衰竭之后才會引人注目。1982年,美國加州理工學院物理學家霍普菲爾德(J. J. Hopfield),在帶有隱含層的神經(jīng)網(wǎng)絡上,用反向傳播(Back Propagation, BP)算法完成了異或邏輯的學習。他對學習算法收斂性的物理解釋直觀易懂,再次掀起了聯(lián)結(jié)主義智能的熱潮。其實多層神經(jīng)網(wǎng)絡能夠?qū)崿F(xiàn)異或邏輯,早在70年代就有研究論文。1974年保羅·韋伯司(Paul Werbos)給出了如何訓練一般網(wǎng)絡的BP學習算法,當時卻無人重視。直到80年代,BP算法才被戴維·魯姆哈特(David Rumelhart)、杰弗里·欣頓(Geoffrey Hinton)、羅納德·威廉姆斯(Ronald Williams)、戴維·帕克(David Parker)和雅恩·樂昆(Yann LeCun)重新發(fā)現(xiàn)。 單層的感知器只能辨識線性可分的模式。而具有隱含層(多層)的神經(jīng)網(wǎng)絡能夠識別所有的邏輯模式,具有簡單鏈式法則的BP算法,為其奠定了學習算法的基礎。經(jīng)此突破后,由于語音和手寫體字識別的市場需求以及硬件技術的成熟,到了90年代,對人類智能模仿的研究再次回到以模式識別為主的道路上。雖然BP算法在理論上適用于任意多層的神經(jīng)網(wǎng)絡,但其誤差傳播的梯度會隨著層數(shù)的增加而擴散,易使非凸目標函數(shù)陷入局部穩(wěn)定平衡點而無法提高效益,或“死記硬背”只記住樣本而不會類推的局面。所以,單純的BP算法只對淺層的網(wǎng)絡起到作用。為此,有許多研究集中在對多層神經(jīng)網(wǎng)絡學習算法的改進上,出現(xiàn)了各種算法,如統(tǒng)計熱力學的模擬退火技術,用波耳茲曼模型說明趨于全局穩(wěn)定的學習算法,模擬進化過程能迅速收斂的遺傳算法等。但是自80年代起的20年間,各種效率較高的模式識別模型(如向量機、Boosting等)也不過是與淺層神經(jīng)網(wǎng)絡相似的數(shù)學模型。 淺層的神經(jīng)網(wǎng)絡僅僅是具有簡單分類能力的低階智能。模式識別在技術上是利用特征進行分類的,通常依賴于人工選擇辨識的特征。這對于模糊特征等復雜的情況具有極大的局限性。而人類的大腦甚至動物的大腦都具有深層的網(wǎng)絡結(jié)構(gòu),低層對感知信號進行特征的抽象,高層對這些特征進行歸納,并做進一步抽象,逐層辨識抽象,從而能夠分析復雜情況。學習的關鍵是如何將深層的潛力變成功能。在2006年欣頓(Hinton)等人發(fā)表深度學習文章之前,對深層神經(jīng)網(wǎng)絡的學習都未能在理論上有所突破。 如果把每層神經(jīng)元的映射看成對輸入屬性的抽象,那么采用某種反饋獎勵機制進行預先學習,就有可能在樣本中自動地聚合出一些屬性的抽象,而合適的抽象又能在后續(xù)樣本訓練中被強化,作為下一層模式識別所需要的特征。這種預先學習是無監(jiān)督學習,類似于人的智商悟性;有目標訓練的學習稱為監(jiān)督學習,類似于上課學習。欣頓的創(chuàng)意是基于深信度網(wǎng)(Deep Belief Networks, DBN)的深度學習,在深層網(wǎng)絡中逐層采用無監(jiān)督的預先學習和隨后的監(jiān)督學習,從而提高學習效率。該方法在語音識別上獲得了很大的成功。另一方面,動物大腦在出生之始并非是同質(zhì)通用的構(gòu)造,其低層如視神經(jīng)、聽覺神經(jīng)都是由遺傳而得的分化結(jié)構(gòu)。早在20世紀60年代休布爾(Hubel)和威賽爾(Wiesel)就發(fā)現(xiàn)貓腦皮層中獨特的網(wǎng)絡結(jié)構(gòu)可以有效降低學習的復雜性,于是人們提出了卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks, CNN)。具有局部聯(lián)接和參數(shù)共享的卷積數(shù)學模型含有較少的參數(shù)和位移以及縮放扭曲等不變性,作為神經(jīng)網(wǎng)絡的低層部分可以很容易地學習二維圖像特征提取,用于直接輸入原始圖像的監(jiān)督訓練。這種具有“先天”視覺低層結(jié)構(gòu)的人工大腦很快就在圖像識別領域大放異彩。 智能的博弈 2014年,臉譜公司采用具有9層神經(jīng)網(wǎng)絡的深度學習方法,對人臉的識別率達到了97.25%。而在語音識別系統(tǒng)(如iPad的Siri)中,各種代替人的語音辨識技術已被廣泛應用。機器在模擬視覺和聽覺的辨識能力上已經(jīng)非常接近人類了。在四五十年前的專家系統(tǒng)時代,人們曾好奇地問,計算機會比人類更聰明嗎?智能機器人會反叛嗎?有知識的人那時都很淡定:機器是在人類制定的規(guī)則中行事,其智慧是在人賦予的知識內(nèi)進行邏輯推理,可以規(guī)定機器人三個定律,第一法則是機器人不得傷害人類。但如今深度學習的聯(lián)結(jié)主義機器完全在模仿人腦的功能,雖然現(xiàn)在還需要我們幫助構(gòu)建先天的聯(lián)接拓撲結(jié)構(gòu)和挑選訓練的內(nèi)容,但未來很可能有互聯(lián)網(wǎng)中自學的機器。令人擔憂的是,這種聯(lián)結(jié)主義機器的大腦是個黑箱,它是怎么想的,知道些什么,為什么會這樣想,我們都無法了解和控制。由億萬無規(guī)則權(quán)重組成的復雜系統(tǒng),即使拆開硬件、分析數(shù)據(jù),也無濟于事。 有很多生物的大腦在某些智能方面超越了人類。比如在辨識方面,狗的鼻子遠比人靈敏,很多動物在地震前都能有所察覺,兇猛動物在判斷速度、調(diào)整機體預測反應方面都勝過人類,我們對此欣賞并不擔憂。而對于一些人造的機器設備,其力量、速度、精確性和計算能力,是人類不可企及的,我們也能泰然處之,因為在人類的智慧面前,它們都是可控的。 《圣經(jīng)》里說,全能的上帝創(chuàng)造了人類,人類無憂無慮、無知無識地生活在伊甸園里,直至受到蛇的誘惑,吃了智慧果后知善惡,自己能夠做判斷,企圖擁有不受上帝控制的能力,引起了造物主的震怒,便成為人的原罪。今天的人類憑借著智慧發(fā)展了科技,也扮演著上帝的角色,建造伊甸園,圈養(yǎng)寵物,創(chuàng)造機器。當人造的機器擁有智慧,也能獨立判斷,不再對人類唯命是從時,我們能用《圣經(jīng)》教化它們嗎?西方人的憂慮來自其文化深處信念的自省。人因智慧成為萬物之靈,替代了上帝主宰著世界。不過,當機器的智力超越人類時,我們將如何自處?有人為此大聲疾呼:要禁止人工智能的研究,它終將會奴役人類! 但這只是一元神文化孕育出的創(chuàng)造與馴服的思想模式。也許沒有全能全知的神,人類也從未真正統(tǒng)治過世界。在深思人際及環(huán)境相處的中國傳統(tǒng)文化里,著眼于博弈勝負之技只是工其“術”,而知博弈前景則要悟其“道”。既然憂心人與機器智能的博弈,那就此深思看未來吧。 智能作為動物的一種本能,確是為自然競爭而進化來的。模式識別為生存博弈之所需,識別環(huán)境分辨敵我和偽裝欺瞞都是競爭中的智能,在生物識別和欺瞞的博弈中雙方都是以最小的代價爭取最大的收益。在機器識別技術與客戶欺瞞智力的博弈中,雙方也依對手而采取具有恰當代價的策略。所以技術的升級是在博弈中交互變化的,漏洞總是有的,即所謂“道高一尺,魔高一丈”。 機器能否識別任何模式,發(fā)現(xiàn)事物的規(guī)律?其實這也是人類科研的夢想。這可能嗎? 被感知的只是事物的部分屬性,所以“識別”也只能是部分的確定,而模仿總是可能的。在識別和欺瞞的對抗競爭中,智能的升級沒有止境,這意味著識別不總是可能的。事物的規(guī)律是行為的模式。從博弈的觀點出發(fā),博弈的結(jié)果由局中各方的策略而定,沒有一方能單獨決定結(jié)果。無論是機器還是人,一旦有了自主的意志,對方就無法確定其行為,也就無法把握其規(guī)律和結(jié)果。博弈總是以不對稱的優(yōu)勢取勝,所以識別模式和掌握規(guī)律總是有限度的和暫時的。 能否通過學習逐漸逼近被識別的模式?這取決于它所在的博弈局勢。例如在“少數(shù)者勝”的局勢中,獲勝的關鍵在于與眾不同。兩條平行車道中哪一條更擠?若有確定的答案,局中的其他智者都據(jù)此行動,則原來不擠的車道就會變得擁擠,因此這答案不再是對的。對于許多博弈局勢就是沒有不變的取勝模式。 競爭中的博弈需要的不僅僅是對抗,還有合作。合作往往是雙贏的優(yōu)勢策略。識別和理性也是為合作而生的智能。對于“從眾的博弈”,即隨大流能形成合作互利的局勢,必然會出現(xiàn)“路徑依賴”的現(xiàn)象。最早被傳播的論斷、認知或應用即使不是最合適的,最終也會成為公認的正確模式。山間的小路是這樣走出來的,網(wǎng)絡語言是這樣流行起來的,鍵盤的字母分布也是這樣成為標準的。這種局勢對學習最有利。實際上,有效辨識大部分事物的模式、語言的形成、人類的交流以及學習和知識體系的成功,都是基于這類博弈局勢上的學習效率。 在充斥著“囚徒困境”的自然競爭博弈中,因合作走出困境的未滅絕的生物和人類都不是因智力而取勝的。人與智能機器的未來是陷入征服的惡斗,還是攜手合作取決于我們對機器的心態(tài)和文化傳承。 互聯(lián)網(wǎng)海量的數(shù)據(jù)、強大的并行計算能力、大量商機的即時應用需求,呼喚著大數(shù)據(jù)時代的到來,推動著工程師尋找新技術,技術也渴望智能研究的支持。傳統(tǒng)科學那種統(tǒng)計數(shù)據(jù)、總結(jié)規(guī)律、邏輯分析等,先了解“為什么”,再得出“是什么”的理性方法,已經(jīng)不敷這多變、復雜、即時的應用了。市場需要的是類似于動物的本能,那種基于經(jīng)驗即時反應的智能,現(xiàn)在大數(shù)據(jù)深度學習的智能,已深植在聯(lián)結(jié)主義模式識別和分布式計算的方向上。人工智能在大數(shù)據(jù)時代正從理性科學方法轉(zhuǎn)向直接從數(shù)據(jù)中在線學習、即時反應的“感性”方法。這值得我們反思。 客觀世界并不是由邏輯驅(qū)動或構(gòu)造的,它只因生物的智能而被感知。對智能而言,邏輯不過是一種對相同含義不同語句表達等價性進行辨識的模式,生物對事物間的感知經(jīng)驗只有關聯(lián)性,而因果性則是建立在邏輯基礎上的推理模式。它被傳播和學習后,成為現(xiàn)在人類理性認知結(jié)構(gòu)的基礎,對世界的認識就變成邏輯推理的計算。科學是建立在利用因果關系結(jié)構(gòu)模式對世界進行描繪的圖譜上的,而真實的世界不一定都能很好地納入這個模式中。實際上,我們對音樂的感受、藝術的理解、情感的交流、人性的共鳴同樣是一種智能的表現(xiàn),同樣是在學習中進步,同樣也在生存競爭中扮演著重要的角色。而這些不能納入理性模式的東西,過去都被人們忽略了。現(xiàn)在,機器智能的進化也許也正引導這人類思維模式的改變。■ |
|