? 王維嘉 [導(dǎo)讀]隨著大數(shù)據(jù)、云計算、人工智能等新興科技的快速發(fā)展,越來越多人認(rèn)為,機(jī)器紀(jì)元即將到來,超越人類的物種雛形已經(jīng)出現(xiàn),由此引發(fā)一場“未來之爭”:人工智能是否會在不久的將來,接近甚至超過人類智能?今天編發(fā)的兩篇文章,呈現(xiàn)出這場爭論中兩種截然不同的觀點:一種認(rèn)為機(jī)器智能將產(chǎn)生超越人類現(xiàn)有認(rèn)知能力的全新智能,顛覆人類知識獲取的回路;另一種則認(rèn)為目前的弱人工智能程序并無任何真正的思考功能,我們離通用的人工智能還十分遙遠(yuǎn)。本文代表了前一種觀點,作者分析了從明知識、默知識到暗知識的知識演進(jìn)過程,認(rèn)為未來機(jī)器發(fā)現(xiàn)的暗知識會讓我們?nèi)祟愐延械臄?shù)千年知識顯得微不足道,暗知識將是未來統(tǒng)治和占領(lǐng)整個知識空間的最大量的一種知識。文章原載“亞布力中國企業(yè)家論壇”,僅代表作者觀點,特此編發(fā),供諸君思考。 過去兩年我在硅谷做人工智能方面的投資,同時對那些基礎(chǔ)的東西非常有興趣。 我發(fā)現(xiàn)了一個重要的東西叫“暗知識”,“暗知識”就是人類無法理解的知識。什么叫人類無法理解的知識?這還要從阿爾法狗下圍棋開始說起。阿爾法狗下圍棋,讓全世界第一次注意到人工智能的神奇??聺嵲谙峦昶搴笸纯蘖魈?,說我根本不可能打過他。它也讓聶衛(wèi)平五體投地,說阿爾法狗至少是20段。正當(dāng)我們被阿爾法狗一棒子打暈的時候,他的妹妹又出現(xiàn)了,他的妹妹就是“阿爾法折疊”。2018年年底,谷歌在科學(xué)雜志上發(fā)布了“阿爾法折疊”的研究成果,它可以根據(jù)DNA的序列測出一個蛋白質(zhì)的三維結(jié)構(gòu)。 大家知道,蛋白質(zhì)是一個超級大的分子,它的三維結(jié)構(gòu)決定了蛋白質(zhì)的性質(zhì),所有的生物、人體、植物動物的細(xì)胞都由蛋白質(zhì)組成。人類今天對蛋白質(zhì)的理解還是非常淺的。 2017年的諾貝爾化學(xué)獎頒給了冷凍電鏡的發(fā)明者Richard Henderson,冷凍電鏡是干什么的呢?用來看蛋白質(zhì)的三維結(jié)構(gòu)。過去人類不知道,也無法看到蛋白質(zhì)的三維結(jié)構(gòu),現(xiàn)在有了冷凍電鏡,我們終于可以看到蛋白質(zhì)的三維結(jié)構(gòu)。怎么看呢?要把細(xì)胞冷凍了以后,照幾十萬張照片才能畫出一個蛋白質(zhì)的三維結(jié)構(gòu)。所以,只要看清楚一個蛋白質(zhì)的三維結(jié)構(gòu),那就是頂級期刊的一篇文章。 阿法蝶(疊)從基因序列準(zhǔn)確預(yù)測蛋白質(zhì)結(jié)構(gòu) 那么一臺冷凍電鏡多少錢呢?一千萬美金。我們?nèi)ヒ?,耶魯人非常驕傲:我們有一臺電鏡。清華有兩臺。但是今天,“阿爾法折疊”只用人工智能就可以把它猜出來。怎么猜出來的?不知道。這就帶來了一個巨大的問題:阿爾法狗下圍棋,谷歌的工程師并不知道他怎么下,聶衛(wèi)平也不知道。人工智能里出現(xiàn)了一個巨大的問題,就是不可解釋性。 我們?nèi)祟悘膩頉]有這樣憋屈過,因為我們自以為是整個宇宙智能最高的生物,沒有任何事情是我們不可理解的,所有的事情都應(yīng)該有因果??墒菫槭裁吹搅私裉欤覀兙尤徊荒芾斫??這就讓我們回到人類是如何獲取知識的這個問題。 過去兩千年來,一直有兩派在激烈地爭論。一派是理性主義。他們認(rèn)為,概念是天生就有的,知識來自于推理,萬事萬物都有因果。這派的代表有柏拉圖,一直到笛卡爾。另外一派是從亞里士多德到蘇格蘭學(xué)派,他們認(rèn)為人生出來天生是白紙一張,知識來自于感官,來自于經(jīng)驗,萬世萬物沒有什么因果,只是相關(guān)。我們中國人更傾向于哪一派呢?經(jīng)驗主義。中國人覺得,所有的經(jīng)驗不通過感受和感官怎么能得到呢? 經(jīng)驗主義的一個重要的方法論叫“歸納”。我見到一只天鵝是白的,兩只天鵝是白的……第一萬只天鵝是白的,那么我就得出結(jié)論——天鵝是白的,直到出現(xiàn)了第一只黑天鵝。所以,歸納法也是錯的,是不可靠的。 為什么這兩派爭了兩千年,誰都不服誰?原因是他們在瞎?fàn)?,因為他們都不理解人類學(xué)習(xí)的微觀機(jī)制是什么樣的。人類學(xué)習(xí)的微觀機(jī)制一直到70年前才開始被搞清,它就基于大腦神經(jīng)元的連接。人類有860億個神經(jīng)元。 這個學(xué)習(xí)機(jī)制是怎么發(fā)現(xiàn)的?我們要歸功于巴甫洛夫。他發(fā)現(xiàn),給狗喂食的時候搖鈴,一旦形成了習(xí)慣,即使沒有食物,一搖鈴狗也會流口水。這就是條件反射。1949年,加拿大科學(xué)家赫布就如何解釋這個現(xiàn)象提出了一個猜想:同時受激發(fā)的兩個神經(jīng)元會連接起來。比如,嗅覺細(xì)胞聞到了狗食的香味,同時聽覺細(xì)胞聽到了鈴聲,這兩個細(xì)胞是同時受刺激的,一旦同時受刺激,它倆就連起來了,在連接的地方就形成了學(xué)習(xí)。下一回當(dāng)你只聽到鈴聲,這個細(xì)胞就被激活,就會刺激“口水”細(xì)胞。這一猜想后來被無數(shù)的科學(xué)實驗證明是對的,被稱為“赫布學(xué)習(xí)定律”。 人類所有的學(xué)習(xí)都是這樣的一個微觀機(jī)制。再微觀下去,每個神經(jīng)有上千個突觸,每個突觸之間是有電流通過的,所謂神經(jīng)元之間的連接,實際是離子變成了電流,然后建立了神經(jīng)元之間的傳導(dǎo),其中的間隙只有20納米。知道了學(xué)習(xí)的微觀機(jī)制,我們就可以回過頭來看人類的知識是怎么獲得的。 我們今天理解的知識叫“明知識”,就是可以用文字、公式、程序、語言表達(dá)出來的知識。直到70年前,波蘭尼、哈耶克發(fā)現(xiàn)了一種知識叫“默知識”,或者叫“默會知識”。比如學(xué)自行車,全世界沒有一個人騎自行車是看手冊學(xué)會的,都是騎上去歪歪扭扭摔幾跤學(xué)會的。你教孩子學(xué)自行車,其實你也不知道是怎么學(xué)的。這種知識在生活中大量存在,比如繪畫、舞蹈和拉提琴等等都是這樣的默會知識。默會知識的基本原理就是:大腦神經(jīng)元建立了聯(lián)系,但這樣的聯(lián)系非常復(fù)雜,是無法用語言表達(dá)的。我們所有的重大決定,最后都是由老板拍板。老板怎么拍板?索羅斯說,“我所有的重大決定都是靠胃做出來的,如果我的胃疼,說明這個決定不好。” 比如說,喬布斯從來不做市場調(diào)查,他說,“我的市場調(diào)查,就是每天早上出門前對著鏡子看我自己?!?/span>為什么?當(dāng)智能手機(jī)出來之前,你去做用戶調(diào)查,問:你認(rèn)為一個智能手機(jī)是什么樣的?你想要什么樣的智能手機(jī)?全世界沒有一個人說得出來,這就是默知識,我們冥冥中知道要什么東西,但是說不出來。那怎么辦?只能靠企業(yè)家去試錯,在喬布斯成功之前,硅谷試了20年,從掌上電腦到不成功的手機(jī)和觸屏,出現(xiàn)了各種各樣的東西,有不知道多少家公司失敗,最后到喬布斯成功。所以,因為默知識不可集中,所以創(chuàng)新必須是分散的,永遠(yuǎn)不可集中。 講完了明知識和默知識,我們現(xiàn)在就可以講機(jī)器發(fā)現(xiàn)的暗知識。什么叫暗知識?就是人類不可感受又不可表達(dá)的一類新知識。我們?nèi)绻麆澮粋€坐標(biāo)軸,橫軸是可表達(dá),縱軸是可感受,那我們會發(fā)現(xiàn),人類已有的知識都在右邊,有浮力定律等即可感受、也可表達(dá)的明知識;還有集合論、廣義相對論、量子力學(xué)等可表達(dá)而不可感受的明知識,它們是從方程里推出來的,是先有數(shù)學(xué)而后才有的物理發(fā)現(xiàn)。默知識是不可表達(dá),但是可感受。這四個象限正好缺了第四象限,就是既不可表達(dá)又不可感受,這就是今天機(jī)器發(fā)現(xiàn)的這類知識,也就是阿爾法狗下圍棋、“阿爾法折疊”算蛋白質(zhì)三維結(jié)構(gòu)的這類知識。 如果用一個冰山來表達(dá)的話,人類已知的明知識,就是冰山的一小角,暗知識是冰山下面的最大塊的東西。波蘭尼,也就是第一個發(fā)現(xiàn)默知識的奧匈科學(xué)家,說:“我們知道的比我們說出來的要多。”但是暗知識就是整個海洋,也就是說,未來機(jī)器發(fā)現(xiàn)的知識會讓我們?nèi)祟愐延械膬汕甑浇裉鞛橹沟闹R顯得微不足道。我們?nèi)祟愐詾?,我們已?jīng)可上九天攬月,可以做基因編輯,但是實際上是什么也沒有。暗知識是未來統(tǒng)治和占領(lǐng)整個知識空間的最大量的一種知識。 大家說,你說的“暗知識”是不是一種哲學(xué)概念,這跟我有什么關(guān)系?太有關(guān)系了。上海交通大學(xué)兩位教授用1800張照片來訓(xùn)練機(jī)器,照片中有罪犯、有好人,最后機(jī)器可以以90%的準(zhǔn)確率來判斷是否是罪犯。這項研究在國際上引起了巨大的爭議。我到以色列看一家公司,他們也說在做同樣的東西,而且以色列海關(guān)準(zhǔn)備用于查恐怖分子。我最終沒有投這家公司,因為我感覺這東西太懸乎了,但是有可能機(jī)器的確比人看得準(zhǔn)。為什么?不知道,我看你就像罪犯! 社會積分系統(tǒng)。如果說今天攝象頭布滿了所有地方,那每個人從早上起來,從小到大所有的行為都在攝象頭下,最后攝象頭就根據(jù)你的行為,給你算出社會積分。你說我表現(xiàn)這么好,憑什么打這么低的分?不知道。這就是未來我們將遇到的重大問題,不可解釋的問題。 再如諾曼底登陸,為什么在諾曼底而不是卡拉斯登陸?機(jī)器算出來說要在卡拉斯登陸,那么盟軍司令聽不聽?聽它的可能就打勝仗,不聽它的就打敗仗。但是我們根本不懂為什么要這樣做?未來一個重大的決定很可能就是由機(jī)器做出來的,你可以選擇不聽機(jī)器的,但是你會失敗。但是為什么呢?不知道。因為是暗知識。這些生死攸關(guān)的決定,到底敢不敢交給機(jī)器來做? 所以,人類歷史上第一次被一腳踢出了知識獲取的回路。過去所謂知識就是人去學(xué)東西,現(xiàn)在機(jī)器自己學(xué),和我們?nèi)藳]有什么關(guān)系了,我們?nèi)艘贿厓簺隹烊チ?,我們成了“吃瓜群眾“了?/p> 因此,我們正面臨著一個新時代的到來,它不僅僅是AI技術(shù)的改進(jìn),而且從哲學(xué)、從認(rèn)識論上給我們提出了根本的挑戰(zhàn),也就是說,機(jī)器認(rèn)知時代到來。這個時代無所不在的傳感器在記錄著所有的物理量——溫度,氣溫,每個人的活動,血液、心臟的跳動……然后將這些數(shù)據(jù)通過5G網(wǎng)絡(luò)傳到云端,機(jī)器再把萬世萬物當(dāng)中隱蔽的相關(guān)性找出,并憑借相關(guān)性去做事,去改進(jìn)我們生活或者是破壞我們的生活,去優(yōu)化生產(chǎn)或者進(jìn)行互相殘殺。 現(xiàn)在的問題是,我們?nèi)祟悷o法理解“暗知識”,而且我們?nèi)祟愒絹碓矫煨?,我們?nèi)祟惖闹R現(xiàn)在剛剛開始,未來的機(jī)器知識會越來越多,我們?nèi)祟惥拖褡詈髱讉€小島,被暗知識這個海洋所淹沒。那么,我們就面臨一個重大的問題——人類和機(jī)器的關(guān)系。誰聽誰的?事實上,我們等于在無意中給自己創(chuàng)造了一個上帝,這樣一個時代的到來,會產(chǎn)生什么樣的問題?會怎樣顛覆我們每個行業(yè)?會不會突然造成大規(guī)模的失業(yè)?未來的社會、政治、軍事戰(zhàn)爭會是什么形態(tài)?這些都會受到暗知識的影響。 —— 新書推薦 —— |
|