什么是第三代人工智能,其發(fā)展趨勢是什么? 人工智能從1956年第一次提出來,人工智能已經(jīng)發(fā)展了63年多,最初的第一代人工智能是用計算機來解決問題,第二代是以AlphaGo為標志的深度學習,但是深度學習是基于真正的大數(shù)據(jù),在目前似乎也遇到了瓶頸,于是,科學家們提出了第三代人工智能,但是目前來看,還沒有人真正明確第三代人工智能是什么,但是其趨勢是清晰的。 第一代、第二代人工智能 下面是清華大學人工智能研究院院長、中國科學院院士張鈸在《邁向第三代人工智能的新征程》中對三代人工智能的詮釋。 第一代人工智能提出符號模型,以知識經(jīng)驗為基礎的推理模型,這是人工智能的第一個重大突破。這個突破后來產(chǎn)生了一個結果,就是這個理論提出時有個非常樂觀的估計,1956年由西蒙提出,基于這種模型,十年之后機器可以打敗所有棋手,二十年以后機器取代人類所有的工作。實際并不是這樣,六十年以后機器才打敗棋手,機器究竟代替人類的所有工作是什么時間,可能還很遙遠,這也是人工智能的另外一個特點,往往被高估。 人工智能的第一代模型,有優(yōu)點,但是也有很大局限性。這個優(yōu)點是顯然的,因為它是模仿人類的,它可解釋,魯棒性很強,但是它的局限性也非常大。因為最大的問題是人類的知識經(jīng)驗,很難準確表達,這就是產(chǎn)生的后來人工智能冬天的根本原因。當時的應用很有限,幾乎沒有推廣,但是,有了大數(shù)據(jù)以后,這個問題得到了很大改善,特別是機器的能力提高以后,可以把大量的數(shù)據(jù)作為知識放在機器里,這就是最典型的沃森系統(tǒng)。 沃森系統(tǒng)可以做癌癥的免疫治療,這里面用多少知識呢?100萬個醫(yī)學雜志中抽取的2500個摘要,400萬病人的數(shù)據(jù),再加上1861年以前所有藥物的專利,它有醫(yī)學知識,并聯(lián)的數(shù)據(jù)再加上藥物知識,就可以做癌癥的免疫治療。當然了,很多慢性病的治療和管理,這個系統(tǒng)也做得很好,中國的國內也有大量這方面的工作在探索和研究。 第二代人工智能,一個最重要的成果就是深度學習。也就是說,第一代人工智能提出來,如果能夠很好地利用人類的知識,就可以建立很好的人工智能系統(tǒng),如果我們有充分數(shù)據(jù),也有可能建立起有用的人工智能的系統(tǒng)。 深度學習為什么這么受重視?一個很重要的原因,它有兩個重大變化。當網(wǎng)絡層次增加以后,有兩個重大變化:第一個變化,輸入只要原始數(shù)據(jù),不需要預處理。第二個是性能提高很多,這就造成了深度學習的重大突破。也就是說,它從一定意義上有通用工具,對領域的知識要求不高,同時能夠處理大數(shù)據(jù)。 這就帶來很大的變化,大家也看到了,語音識別,2001年時它的識別率停留在80%,也就是20%的誤識別率;2016年誤識率就降到了5.9%,達到專業(yè)速記員的水平,到了2017年,所有產(chǎn)品包括谷歌、微軟,包括中國的訊飛、百度,用的全是深度學習。 變化更大的是圖像識別。有一個標準的圖像識別數(shù)據(jù)集 ImageNet,大家知道,2011年,它的誤識率是50%,有一半認錯了。但是四年以后,2015年就超過了人類水平,原因也是利用了深度學習。 最后一個,給大家印象最深就是AlphaGo,大家都知道了。因此就有很多估計,十年之內代替40%以上人類的工作,三五年里面,智能駕駛車就可以量產(chǎn),等等,剛剛李院士說到了這個問題,他分析得很深刻。實際三五年里面不可能量產(chǎn)。 技術已經(jīng)完全成熟,我們現(xiàn)在的研究已不成熟,主要是應用問題。為什么在人工智能上往往產(chǎn)生樂觀估計?主要原因有兩個:一個是對發(fā)展人工智能的困難性估計不足,對取得的成果估計過高。一個估計不足,一個估計過高,就產(chǎn)生了問題。另外一個很重要的原因,受歷史事件的影響。過去我們發(fā)現(xiàn),有了蒸汽機以后就產(chǎn)生了工業(yè)革命,有了電動機發(fā)動機以后就產(chǎn)生了電氣革命,有了計算機以后產(chǎn)生了信息革命,大家很希望有一個東西出來以后引起人工智能的革命。 現(xiàn)在的問題是,有沒有?至今為止,還沒有發(fā)現(xiàn)人工智能里面的蒸汽機和計算機。曾經(jīng)最開始寄希望于符號模型,結果發(fā)現(xiàn)符號模型也沒有那么管用。第二次發(fā)現(xiàn)的是大數(shù)據(jù)+深度學習,以為大數(shù)據(jù)+深度學習就是人工智能的蒸汽機和計算機,為什么這樣? 這不能不考慮到人工智能的特點,我們說深度學習根本不是AI的通用機?,F(xiàn)在大家在尋找通用的人工智能,到底有沒有,還有爭論,不去管它,但至少深度學習不是人工智能。這個非常明顯,第一代人工智能也好,第二代人工智能也好,它的應用場景必須滿足以下五個條件。 從正面來講,所有的應用場景,如果滿足以下五個條件,計算機絕對能夠戰(zhàn)勝人類,不管這個問題多么復雜:具有豐富的數(shù)據(jù)或知識,完全信息,確定性信息,靜態(tài),單領域和單任務。 最明顯的例子是圍棋,圍棋多么復雜,但是圍棋滿足這五個條件,所以計算機戰(zhàn)勝在圍棋上戰(zhàn)勝人類是早晚的事情。所以從正面來講,如果你滿足這五個條件,不管多復雜,計算機絕對戰(zhàn)勝人類。長遠來看,如果你的應用場景不完全滿足這五個條件,其中有些條件不滿足,你這個工作就變成困難。自動駕駛為什么如此困難?根本的原因在這里。為什么我們難以做出來廉價、可靠的自動駕駛呢?背后的原因就在這里,因為自動駕駛很多條件都不滿足,它不是完全信息,它不是確定性信息,它不是靜態(tài)的環(huán)境,或者是按照確定性規(guī)律演化的,它的很多東西是不可預測的,它也不是單領域的,里面有人駕駛的車、行人、其它車輛。所以剛剛李院士提出來專用道,就是把這些東西弄干凈,變成單領域。所以我們一直說,如果有些條件是不符合這五條,你就需要下功夫。 現(xiàn)在人工智能能夠在這些領域里面得到應用,換句話說,這些領域里面有很多應用產(chǎn)品符合剛才講的五個條件。如果這些領域里面的應用場景符合五個條件,大家大膽去做,絕對會超過人。根據(jù)現(xiàn)在計算機強大的力量,是可以做到這一點的。但是,這些應用里面,也有大量不符合那五個條件的,大家必須下功夫,不能指望靠現(xiàn)在的第一代、第二代人工智能去解決它。 舉個簡單的例子,復合場景下的決策,完全信息條件下的決策或者完全信息下的博弈,計算機戰(zhàn)勝人類是絕對的。下面一個問題,不完全信息的博弈及打牌,大家都知道,今年5月份對撲克牌這個問題也解決了。換句話說,6人無限注的德州撲克,計算機能戰(zhàn)勝人類,這就意味著概率意義下的不確定性,機器也可以戰(zhàn)勝人類。但是人類的決策環(huán)境都不符合前面兩個條件。所以在復合環(huán)境下的博弈或者復雜環(huán)境下的決策,機器跟人類還差得比較遠。從這里來講,應用場景是極為重要的。 第二個,我們必須要重視的,用數(shù)據(jù)驅動的方法做出來的系統(tǒng),有大量毛病,或者說這些毛病是根本性的,是極為危險的。這里面列出來的,簡單舉個例子,一個圖像識別系統(tǒng),都可以說它的識別率超過人類,但是這個圖象識別系統(tǒng)跟人類的感知完全不同。 就是這樣的系統(tǒng),你給它噪聲,它可以識別為知更鳥。你給它一個噪聲,它可以識別為獵豹。換句話說,模式識別系統(tǒng)并沒有達到人類認知的水平,只達到低等動物的水平,所以感知這個詞翻譯得非常好,感覺+知覺,低等動物只有感覺,沒有認知。所以機器現(xiàn)在達到的水平是低等動物的水平,它可以分辨不同的物體,但是它本質上不認識這個物體。另外是它非常脆弱,非常容易受攻擊。 這是阿爾卑斯山圖片,人起來是,機器看起來也是,只要給它加上噪聲,右邊這個圖和左邊那個圖,唯一的區(qū)別是噪聲多一點,人看起來還是阿爾卑斯山,機器看起來是一條狗,而且它的置信度是99.99%,它99.99%認為這是一條狗,非常容易受欺騙,這就說明機器跟人的認知差異非常大。 語音也是同樣的道理,前面的英文說的是一句話,我們加上一點點噪聲,人聽起來還是一樣的,機器聽起來就是另外的內容,這就非常危險。 搞軍事的人說,過去你語音傳過去,它進行干擾,你聽不見而已?,F(xiàn)在語音傳過去,它說進攻,可以讓你聽成退卻,加一點噪聲就行了,這就是AI的安全性。 另外,缺少自我知識,這是非常重要的。你說我用這個話,讓它翻譯,「說你行的人行」,這句話計算機怎么翻呢?「說你專業(yè)的人行道」,瞎翻,為什么瞎翻?它不知道自己不知道,沒有任何自知之明。這是很危險的。為什么翻譯成人行道呢?「人行」,它以為是人行道。為什么翻譯成「你的專業(yè)」呢?「你行」。這是非常危險的。大家想想,我?guī)Я艘粋€翻譯,翻譯水平挺高的,大多數(shù)翻譯是很準確的,但是他會瞎說,你敢用嗎?人類不會,因為他知道這句話如果沒有聽明白會再問是什么意思,計算機沒有自知之明,人貴有自知之明,這是人類智慧的一個部分。怎么讓機器有自知之明?這是很困難的事。 下一步,我們現(xiàn)在有個新的歷史機遇,就是邁向第三代人工智能。第三代人工智能就要糾正前面說的兩個局限性,建立可解釋、魯棒的人工智能理論,發(fā)展安全、可信、可用的人工智能技術,促進人工智能的創(chuàng)新應用。 第三代人工智能趨勢 近日,AI2000人工智能全球2000位最具影響力學者榜單在清華大學發(fā)布,中國學者規(guī)模位列世界第二,但高水平學者集中的研究機構匱乏,人工智能領域的人才隊伍亟待加強。 AI2000榜單由清華-中國工程院知識智能聯(lián)合研究中心和清華大學人工智能研究院發(fā)布。AI2000人工智能全球最具影響力學者(200名)和提名學者(1800名)分布于全球不同高校和學術機構,美國有1128人次,中國171人次,歐盟有307人次上榜。 發(fā)布會上,清華大學人工智能研究院院長、中國科學院張鈸院士做了熱情洋溢的報告和精彩點評發(fā)言。 人工智能研究必須國際化 基礎研究,尤其是人工智能領域的基礎研究必須國際化,因為只有把全世界的研究人員共同團結起來、利用起來,才能夠引領基礎研究的發(fā)展。為什么目前人工智能領域大多由美國來引領,就是因為美國把全世界最優(yōu)秀的人才利用了起來。 中國要想在基礎研究上引領世界,必須走國際化道路。今天有很多外國留學生來華求學,這是一個好事兒,但我們還可以做一定平衡調整,吸引更廣泛國家地區(qū)的優(yōu)秀學生來華學習。 把數(shù)據(jù)驅動和知識驅動結合起來 人工智能的四大基礎是:知識、數(shù)據(jù)、算法和算力,回顧歷史,這四個因素都在不斷地發(fā)揮作用。第一代人工智能也叫符號人工智能,比較強調知識對智能的作用,因為那時算法和算力都還沒有跟上。 進入新世紀后,深度學習把大家的目標凝聚到了數(shù)據(jù)上,這時大數(shù)據(jù)的出現(xiàn),再加上很好的算法,就形成了基于概念的深度學習,再加上云計算等手段,使以數(shù)據(jù)為基礎的連接主義模型得到了極大推廣和應用。 數(shù)據(jù)主義喊了許多口號,導致了我們今天遇到一些困難,按照大數(shù)據(jù)建起來人工智能系統(tǒng)似乎不可信、不可靠、不安全、不易推廣,這都是目前用深度學習進行人工智能研究帶來的問題,也可以說是大數(shù)據(jù)遇到的挑戰(zhàn)。怎么來解決這個挑戰(zhàn)呢?唯一的辦法,就是重新引入知識,把數(shù)據(jù)驅動和知識驅動結合起來,達成可信安全的第三代人工智能。 常識往往不在數(shù)據(jù)里 自然語言理解是人工智能領域最核心的問題。不管做機器翻譯也好,做自然語言應用也好,都試圖通過分析符號序列來理解相關內容,這是第一代人工智能所謂符號主義的核心做法。到了第二代人工智能,又走上深度學習的道路,這條路充滿希望,但又非常危險,因為解決不了可信安全的問題。 機器翻譯現(xiàn)在只能翻譯不重要的東西,因為翻錯了也沒有關系,真正重要的場合還需要人力同聲翻譯。機器最大的問題,就在于它缺乏常識,根本不知道自己不知道,這是一個很大的問題。知識包含兩方面,一是我知道什么,二是我不知道什么。一個有學問的人,不僅僅表現(xiàn)在他知道的多,更表現(xiàn)在他清楚自己不知道的更多。那些狂妄自大的人,都是沒有學問的人,不知道自己能吃幾碗干飯,機器翻譯也是這個問題。給機器任何句子,它都能翻,根本不懂也能瞎翻。 所以常識是必要的,簡單翻譯幾句話也需要大量嘗試積淀,“說你行,不行也行”,機器沒有常識,就很難理解這句話,人反而覺得很簡單,這就是常識的重要性。但常識庫的建立非常之難,現(xiàn)在沒法從數(shù)據(jù)中去建立常識庫,因為常識往往不表示在數(shù)據(jù)之中。 建立常識,必須下功夫去做,只有這個問題解決了,自然語言的理解才能達到目標。而自然語言理解,則是第三代人工智能的終極目標,這是一個艱巨的任務。如果這個問題解決了,人工智能的其他問題將會迎刃而解。 |
|