迄今為止,人腦與電腦的恐怕是最值得比較的兩件事物了。早在計(jì)算機(jī)發(fā)明的初期,著名數(shù)學(xué)家馮諾依曼就對(duì)當(dāng)時(shí)的電腦和人腦在已知的知識(shí)范圍內(nèi)進(jìn)行了系統(tǒng)性的對(duì)比。他發(fā)現(xiàn),生物的大腦與機(jī)器相比最大的優(yōu)勢(shì)就在于,它能夠利用相對(duì)落后的零部件在一個(gè)充滿隨機(jī)漲落的高度不確定的環(huán)境中非常敏捷快速的作出正確的計(jì)算,而且還是以一種相當(dāng)綠色環(huán)保的方式——能耗非常低地進(jìn)行的。恐怕在這一點(diǎn)上,連最厲害的AlphaZero也無(wú)法做到。那么,人腦是如何實(shí)現(xiàn)的呢?這就是蘊(yùn)藏在統(tǒng)計(jì)與概率之中的大數(shù)之道。 馮·諾依曼的手稿《自復(fù)制自動(dòng)機(jī)理論》,由人工智能先驅(qū) Arthur Burks 整理成書(shū)。集智俱樂(lè)部資深粉絲“東方和尚”將全書(shū)第一部分翻譯成中文,張江做了詳細(xì)點(diǎn)評(píng)。我們將其整理成“馮·諾依曼自動(dòng)機(jī)器理論”系列文章,以饗讀者。本文是第五篇。 全書(shū)綱要: 馮·諾依曼的遺產(chǎn):尋找人工生命的理論根源 探尋計(jì)算的“原力” 神經(jīng)網(wǎng)絡(luò)與圖靈機(jī)的復(fù)雜度博弈 人工智能如何擲骰子——三種概率理論 大數(shù)之道——人腦與電腦的對(duì)比 第五堂課:復(fù)雜自動(dòng)機(jī)的一些考量——關(guān)于層次與進(jìn)化的問(wèn)題 在翻譯過(guò)程中,做了以下的添加和修改: 1、為了方便閱讀,為原文進(jìn)行了分段,并加上了段標(biāo)題; 2、為了讓讀者感覺(jué)更親切,加上了若干副插圖。 3、為原文添加了大量的評(píng)論,東方和尚的評(píng)論和張江老師的評(píng)論都會(huì)標(biāo)注出來(lái),另外,因?yàn)檫@本書(shū)是馮·諾依曼的助手 Arthur W. Burks(遺傳算法之父 John Holland 的博士生導(dǎo)師),所以在框中的文字是編者加的注解。大家要注意分辨。 一、人腦與電腦的比較 上兩堂課討論了一般原理之后,我想回到我們所知道的具體自動(dòng)機(jī)的例子上面來(lái)。并把以計(jì)算機(jī)器為例的人工自動(dòng)機(jī),和以人類神經(jīng)系統(tǒng)為例的生物自動(dòng)機(jī)進(jìn)行對(duì)比。出于這個(gè)目的,請(qǐng)讓我先介紹一些單元部件的知識(shí),并把它們的尺度進(jìn)行比較。 正如我之前提到的,對(duì)人的神經(jīng)系統(tǒng),科學(xué)家還沒(méi)有足夠的研究,但大腦神經(jīng)元的數(shù)量級(jí)大致可以確定為 10^10的級(jí)別。而身體其他部分的神經(jīng)元數(shù)量大概要比這個(gè)數(shù)字小很多, 并且它們也源自大腦。最大的大腦周?chē)窠?jīng)集合是視網(wǎng)膜,從視網(wǎng)膜連到大腦的視覺(jué)神經(jīng)被認(rèn)為是大腦的一部分[68]。 相比大腦的神經(jīng)元數(shù)量,計(jì)算機(jī)器用到的電子管個(gè)數(shù)要小一百萬(wàn)倍。現(xiàn)有最大的計(jì)算機(jī)器,ENIAC 只有 2×10^4 個(gè)電子管。另一臺(tái)屬于 IBM 公司的大型計(jì)算機(jī)器,SSEC 包括了各 1 萬(wàn) 個(gè)電子管和繼電器。正在建造中的最快的計(jì)算機(jī)器,其設(shè)計(jì)包括了 3 千個(gè)電子管。電子管數(shù)量的減小是由于對(duì)內(nèi)存的處理手法有所不同,之后我會(huì)提到。因此,大致地說(shuō),人腦要比大型計(jì)算機(jī)器復(fù)雜 1 百萬(wàn)倍。大腦和這些機(jī)器相比,復(fù)雜度增加的程度要比這些機(jī)器比單個(gè)電子管更巨大。即使用更加寬松的對(duì)數(shù)坐標(biāo)表示,計(jì)算機(jī)器也還達(dá)不到大腦的一半復(fù)雜度。我認(rèn)為,無(wú)論怎么樣定義復(fù)雜度,這個(gè)比例都應(yīng)該是比一半小得多的[69]。 在這個(gè)電腦 vs 人腦的較量中,有一個(gè)因素是對(duì)于前者有利的:計(jì)算機(jī)的速度比人腦要快。人腦神經(jīng)元的反應(yīng)速度大約是半毫秒。但用這個(gè)時(shí)間來(lái)衡量人腦的速度是不公平的,因?yàn)楦匾牟皇巧窠?jīng)的激發(fā)時(shí)間,而是神經(jīng)的恢復(fù)時(shí)間,也就是從一次反應(yīng)到恢復(fù)到能夠再次反應(yīng)的時(shí)間長(zhǎng)度。神經(jīng)的恢復(fù)時(shí)間最快也需要 5 毫秒。對(duì)于電子管來(lái)說(shuō),很難估計(jì)速度, 按現(xiàn)在的設(shè)計(jì),重復(fù)的頻率(時(shí)鐘主頻)很難超過(guò)每秒一百萬(wàn)次[70]。 左腦與右腦(譯者加) 因此,神經(jīng)系統(tǒng)比這些機(jī)器的元件數(shù)量要多一百萬(wàn)倍。但是機(jī)器的每個(gè)元件的運(yùn)算速度卻又要比大腦快 5000 倍。這樣合計(jì)起來(lái),神經(jīng)系統(tǒng)比現(xiàn)有機(jī)器要快 200 倍。但是這個(gè)較量起來(lái)是自動(dòng)機(jī)略勝一籌,因?yàn)闄C(jī)器能力上的增加要遠(yuǎn)遠(yuǎn)超過(guò)了其體積上的增加。因?yàn)橐粋€(gè)系統(tǒng)的潛能可以用其元件的相互關(guān)系來(lái)估計(jì),而這個(gè)關(guān)系的總量是和元件數(shù)量的平方成正比的。此外,什么能做、什么又不能做這件事取決于一個(gè)最小的閾值。低于某個(gè)最小的復(fù)雜度,有的事情就沒(méi)有辦法做到,而一旦高于這個(gè)閾值,理論上就是有可行性的。 編者Arthur W. Burks注: 【馮紐曼接著從體積上比較了人類神經(jīng)系統(tǒng)和計(jì)算機(jī)的區(qū)別。這個(gè)區(qū)別主要來(lái)自于控制和信號(hào)放大是怎樣實(shí)現(xiàn)的。在電子管中間,運(yùn)算體積實(shí)質(zhì)上是陰極和控制柵極之間的空隙,其尺度約為 1 毫米;而在神經(jīng)細(xì)胞中,運(yùn)算對(duì)應(yīng)的是神經(jīng)膜約為 1 微米的厚度。兩個(gè)尺度的比例是 1000:1,而它們的電壓之比也是 1000:1,因此電子管和人腦信號(hào)的場(chǎng)強(qiáng)是大致相 當(dāng)?shù)?。這說(shuō)明,兩者之間能量消耗的差異主要來(lái)自于體積上的不同。尺度上 1000 倍的區(qū)別,換算成體積就要差到 10 億倍,能量消耗也差不多。請(qǐng)參見(jiàn)馮紐曼著作《計(jì)算機(jī)和人腦》[71]。 馮紐曼接著計(jì)算了“每一步基本信息操作,即每一個(gè)二義選擇以及每次傳送一個(gè)基本單位信息所需要產(chǎn)生的能量”,包括三種情形,熱力學(xué)的最小值、真空管以及神經(jīng)元[72]。 在第三堂課上,馮紐曼曾提到,熱力學(xué)信息是由對(duì)數(shù)方式來(lái)測(cè)量的。也就是對(duì)于所有的可能性用 2 為底來(lái)取對(duì)數(shù)。因此,在二選一情況下的熱力學(xué)信息等于 1 bit。問(wèn)題是,bit 不是我們用來(lái)測(cè)量能量的單位。只有當(dāng)你指定溫度之后,熵和能量才能被聯(lián)系起來(lái),在低溫下運(yùn)行可以降低消耗能量的下限?!彼又?jì)算了這個(gè)熱力學(xué)信息相對(duì)應(yīng)的最小能量值,也就是 kT logN 爾格。這里 k 是玻爾茲曼常數(shù)(1.4×10-16 爾格/度),T 是絕對(duì)溫度,而 N 則是可能性的數(shù)量。對(duì)于二進(jìn)制的基本計(jì)算 N=2,室溫下 T=300K,對(duì)應(yīng)于 1bit 的熱力學(xué)能量下限為3×10^(-14)爾格。 馮紐曼估計(jì)大腦消耗 25 瓦的能量,具有 10^10 個(gè)神經(jīng)元,因此平均來(lái)說(shuō),每個(gè)神經(jīng)元每秒激活 10 次,因此每次二進(jìn)制運(yùn)算中神經(jīng)元的能量消耗為3×10^(-3) 爾格。他估計(jì)真空管消耗6 瓦,每秒激活 100,000 次,故每次二進(jìn)制運(yùn)算中,電子管的能量消耗是 6×10^2 爾格?!縖73] 因此,我們現(xiàn)有電路機(jī)制的效率要比神經(jīng)系統(tǒng)低二十萬(wàn)倍。接下來(lái)計(jì)算機(jī)器會(huì)不斷地改良,可能用能夠放大電信號(hào)的晶體來(lái)替代電子管。但是即便如此,也要比神經(jīng)元效率低一萬(wàn)倍。值得注意的是,熱力學(xué)規(guī)定的下限(3×10^(-14 )爾格)和實(shí)際每次神經(jīng)激發(fā)所消耗的能量(3×10^(-3 )爾格)之間有一千億倍(10^11)的差距。這說(shuō)明,關(guān)于大腦和智能的本質(zhì),僅僅用熱力學(xué)來(lái)分析還是遠(yuǎn)遠(yuǎn)不夠的。以對(duì)數(shù)坐標(biāo)表示的話,生物的神經(jīng)系統(tǒng)正好處于熱力學(xué)下限 和我們現(xiàn)有的簡(jiǎn)陋計(jì)算機(jī)器的中間位置。我不知道是什么導(dǎo)致了上述差距,有可能是同時(shí)要確保操作的可靠性有關(guān)系。 因此,自然進(jìn)化并沒(méi)有選擇物理學(xué)上的最小信息單元,即氫原子這樣的雙穩(wěn)態(tài)系統(tǒng)來(lái)表示基本的信息處理。所有的開(kāi)關(guān)元件都采用了相對(duì)大很多的裝置。如果真的以這些物理學(xué)的單元來(lái)表示信息的話,那么一個(gè)元件僅需要幾埃的尺度就足夠了[74],而實(shí)際上最小的神經(jīng)元的尺度也要幾千甚至幾萬(wàn)埃。顯然有什么因素限制了神經(jīng)元的尺度,不能縮小到熱力學(xué)的。 二、記憶之謎 記憶(譯者加) 【馮紐曼接下來(lái)討論了記憶元件。電子管雖然是開(kāi)關(guān)電路,卻也可以當(dāng)作內(nèi)存來(lái)用。但因?yàn)閮?chǔ)存一個(gè)二進(jìn)制數(shù)字需要用到一對(duì)管子,另外還需要一個(gè)單獨(dú)的電子管來(lái)輸入輸出數(shù)據(jù),電路繁復(fù),所以用電子管來(lái)建造大規(guī)模的內(nèi)存缺乏可行性。“實(shí)際我們用來(lái)儲(chǔ)存數(shù)據(jù)的設(shè)備并不是像電子管這樣的大型元件,而是比較微觀的裝置,信息是以虛擬的形式存在的”,他舉了兩個(gè)儲(chǔ)存數(shù)據(jù)的例子:聲波延遲線以及陰極射線管。所謂聲波延遲線,是一個(gè)裝滿著水銀的管子,兩頭各有一個(gè)壓電陶瓷晶片。當(dāng)有電信號(hào)的時(shí)候,壓電陶瓷把信號(hào)轉(zhuǎn)變?yōu)槁暡?,并在水銀中傳送,因?yàn)槁暡ǖ膫魉退俣容^慢,經(jīng)過(guò)一段延遲之后,另一端的晶片又把聲波信號(hào)轉(zhuǎn)回成電信號(hào),經(jīng)過(guò)放大處理,再次返還到發(fā)射端晶片去。 這個(gè)聲-電循環(huán)可以無(wú)限地重復(fù)下去,從而達(dá)到儲(chǔ)存數(shù)據(jù)的目的。一個(gè)二進(jìn)制的數(shù)字可以用某個(gè)時(shí)間對(duì)應(yīng)的位置是否有脈沖存在來(lái)表示。因?yàn)檫@樣的脈沖串不斷循環(huán)于延遲線系統(tǒng)中間,所以這個(gè)數(shù)字并不是儲(chǔ)存在某一個(gè)具體位置?!捌溆洃洓](méi)有特定位置” 信息也可以用電荷的形式儲(chǔ)存在陰極射線管的內(nèi)壁上面。用一個(gè)具體區(qū)域上面的電荷對(duì)應(yīng)二進(jìn)制數(shù)字。這些電荷可以用陰極電子束來(lái)放置和檢測(cè)。因?yàn)楸仨毥?jīng)常給這些內(nèi)壁充電,而且對(duì)應(yīng)于具體數(shù)字的位置可能會(huì)發(fā)生變化。這種數(shù)據(jù)儲(chǔ)存的方式也是虛擬的?!斑@種內(nèi)存從結(jié)構(gòu)上說(shuō),也沒(méi)有確定的位置,而且對(duì)于這種內(nèi)存裝置的控制也是虛擬的,因?yàn)槲锢韺?shí)體并沒(méi)有發(fā)生改變?!薄?/p> 因此,我們沒(méi)有理由相信人腦的中樞神經(jīng)系統(tǒng)是用開(kāi)關(guān)電路(神經(jīng)元)來(lái)直接實(shí)現(xiàn)記憶的。人的記憶總量一定是非常巨大的,要比 10^10 bits 要大很多[76]。如果你計(jì)算一下一個(gè)人一生中的所有記憶以及對(duì)他重要的其他關(guān)鍵信息,估計(jì)至少需要 10^13 bits 才夠。當(dāng)然,我們不知道這樣的估計(jì)有多么可靠。但是我認(rèn)為人大腦的記憶能力,絕對(duì)要超過(guò) 10^10 bits。我也不知道把我們對(duì)于計(jì)算機(jī)器的初步了解和神經(jīng)系統(tǒng)相比較是否合理,但是,如果我們的經(jīng)驗(yàn)說(shuō)明了什么的話,這就是記憶不太可能是用神經(jīng)元直接實(shí)現(xiàn)的,也不太可能是用任何類似于開(kāi)關(guān)電路的簡(jiǎn)單粗暴的方式實(shí)現(xiàn)的。有人說(shuō)記憶來(lái)自于神經(jīng)突觸上的閾值變化。我不知道這種說(shuō)法是否成立,但是至少計(jì)算機(jī)上的內(nèi)存實(shí)現(xiàn)同網(wǎng)絡(luò)閾值還沒(méi)有關(guān)系。把人工自動(dòng)機(jī)和神經(jīng)系統(tǒng)做比較,讓我們感到后者的記憶實(shí)現(xiàn)應(yīng)該比前者先進(jìn)的多,虛擬的程度也高得多。因此我認(rèn)為現(xiàn)在要對(duì)人類的記憶機(jī)制和其物理位置做出任何猜測(cè),還為時(shí)過(guò)早[77]。 我還想談另外一件事,之前我的說(shuō)法給人一種感覺(jué),好像神經(jīng)細(xì)胞真的就是純粹的開(kāi)關(guān)元件。但是很多研究神經(jīng)的專家和生物學(xué)家都指出,神經(jīng)細(xì)胞并非純粹的一個(gè)開(kāi)關(guān),而是可以非常精巧的,工作在連續(xù)狀態(tài)下的器件,它們類似于模擬電路,而并非單純傳送脈沖的中繼。對(duì)于這個(gè)質(zhì)疑的回答是,很多電子器件,如電子管、電磁繼電器[78]同樣也不是純粹的開(kāi)關(guān)元件,因?yàn)樗鼈円灿羞B續(xù)狀態(tài)的性質(zhì)。關(guān)鍵在于,至少有一種方法讓這些器件工作在“有或無(wú)” 的二元分立狀態(tài)下,這也決定了它們的性質(zhì)。重要的是,當(dāng)生物處于正常情況下,這些元件 是如何運(yùn)行的。誠(chéng)然,神經(jīng)細(xì)胞并非總是處于“有或無(wú)”的二元狀態(tài),比如把刺激強(qiáng)度向應(yīng)激頻率的轉(zhuǎn)換就取決于神經(jīng)疲勞程度和恢復(fù)時(shí)間的長(zhǎng)短。但是,至少我們清楚地知道,“有或無(wú)”是神經(jīng)系統(tǒng)工作原理的一個(gè)重要方面。人類本身當(dāng)然也不是一臺(tái)數(shù)字設(shè)備,雖然人類的一個(gè)部分,神經(jīng)系統(tǒng)具有數(shù)字設(shè)備的性質(zhì)。幾乎所有的神經(jīng)刺激最后導(dǎo)致的結(jié)果都不是數(shù)字的,比如收縮肌肉或者產(chǎn)生內(nèi)分泌等等。 為了控制這些化學(xué)物質(zhì)的分泌,機(jī)體必須精確地微調(diào)其擴(kuò)散的速度,這些工作需要非常精密的模擬過(guò)程,要比我們?cè)谌魏文M計(jì)算機(jī)中間用到的都要先進(jìn)。在人體中間,最重要的控制環(huán)路都屬于這個(gè)性質(zhì):一系列的神經(jīng)脈沖沿著四通八達(dá)的控制網(wǎng)絡(luò)不斷前進(jìn),控制著像一座大型化工廠那么復(fù)雜的生產(chǎn)過(guò)程。其中,化學(xué)物質(zhì)的調(diào)配依賴于繁雜的液壓系統(tǒng),這些都是純粹的模擬過(guò)程;同時(shí),這些化學(xué)過(guò)程又產(chǎn)生了神經(jīng)信號(hào),以數(shù)字的方式在神經(jīng)系統(tǒng)中傳播。在以上的環(huán)路中間,數(shù)字和模擬之間的轉(zhuǎn)換一定發(fā)生了很多次[79]這樣地看,人體其實(shí)是一臺(tái)數(shù)?;旌涎b置,但是,我們首先搞懂其中的數(shù)字過(guò)程,仍然是非常必要的。 計(jì)算機(jī)器也并非是純數(shù)字的,現(xiàn)有計(jì)算機(jī)的輸入和輸出的確是數(shù)字形式的。但顯然我們也需要非數(shù)字形式的輸入和輸出。例如有時(shí)候我們需要把計(jì)算結(jié)果以非數(shù)字的形式顯示,就像示波器上面的曲線一樣,這就是模擬輸出。此外,我認(rèn)為計(jì)算機(jī)未來(lái)應(yīng)用的重要方面是用來(lái)控制復(fù)雜的機(jī)械裝置,好像導(dǎo)彈或者飛機(jī)的飛行控制。這種情況下,計(jì)算機(jī)的輸入來(lái)自一個(gè)模擬來(lái)源;而其輸出則控制一個(gè)模擬的過(guò)程。這種數(shù)模之間的來(lái)回轉(zhuǎn)換可能成為每個(gè)計(jì)算機(jī)應(yīng)用領(lǐng)域的基本性質(zhì)[80]。 現(xiàn)下我們要強(qiáng)調(diào)自動(dòng)機(jī)的數(shù)字方面,因?yàn)槲覀儸F(xiàn)有的邏輯工具能夠很好處理數(shù)字機(jī)制,并且我們對(duì)于數(shù)字機(jī)制的理解要比模擬機(jī)制的理解更加透徹。另外,看上去數(shù)字是一種更適合處理復(fù)雜功能的方式。純粹的模擬機(jī)制通常不能適應(yīng)太復(fù)雜的情形。唯一讓模擬機(jī)制去處理復(fù)雜問(wèn)題的辦法就是把問(wèn)題拆分成小塊,分而治之。而這就是數(shù)字化的思想。 三、不同的糾錯(cuò)模式 現(xiàn)在來(lái)到了以下問(wèn)題:我們制作的人工自動(dòng)機(jī)要比生物自動(dòng)機(jī)功能弱很多很多,構(gòu)件的數(shù)量也小很多很多。但是在體積和耗能上卻要高許多許多。為什么會(huì)這樣?這在現(xiàn)在,我們顯然無(wú)法給出正確的答案:如果有兩樣?xùn)|西,對(duì)于其中一件我們只是略有了解,另一件則是一無(wú)所知,那我們?cè)趺慈ケ容^它們呢?但是如果比較我們所運(yùn)用的工具,會(huì)發(fā)現(xiàn)一些明顯的差距。這導(dǎo)致我們不能依靠現(xiàn)有的工具走的更遠(yuǎn)。 同生物細(xì)胞不同,我們現(xiàn)在使用的工程材料是不適合小尺度操作的?,F(xiàn)有電路,包括導(dǎo)體、絕緣材料和真空管等等,這些元件的穩(wěn)定性都要比生物體差很多,同時(shí)這些材料的強(qiáng)度也是完全隨機(jī)的。如果生物膜被損壞了,它會(huì)自我修補(bǔ)。但是如果電子管的柵極和陽(yáng)極短路損壞了,它卻不能夠修好自己。因此,生物材料具有某種工程上的特別穩(wěn)定特性,而這種穩(wěn)定性又是同其機(jī)械、電子和可靠性要求所匹配的。而我們的人工裝置則是一種“湊合”,往往為了達(dá)到電子上的指標(biāo),結(jié)構(gòu)上卻變得多余累贅。我們用到的技術(shù),常常是適合把金屬和金屬連接在一起,卻不適用于把金屬和電子管連接起來(lái)。在難以觸及的真空管中間達(dá)到一 毫米的空間已經(jīng)是一項(xiàng)工程上的壯舉了,我們很難把這個(gè)尺度再縮小多少。因此,工程自動(dòng)機(jī)和生物細(xì)胞尺度上的差距,實(shí)質(zhì)上來(lái)自于材料性質(zhì)上的巨大不同[81]。 【馮紐曼下面談到了上述差距的深層原因。這是因?yàn)楹芏嗌锊考菫榱吮WC整個(gè)系統(tǒng)可靠運(yùn)作而存在的。在第三堂課中間曾經(jīng)講到,實(shí)際的計(jì)算過(guò)程中,每個(gè)單元僅以某一個(gè)概率正確地運(yùn)作,而不是必然如此。在零件較少的小型系統(tǒng)中間,這種整個(gè)系統(tǒng)發(fā)生故障的可能性相對(duì)很小而常被忽略。但是對(duì)于大型系統(tǒng),出錯(cuò)是必然發(fā)生的,故隨著系統(tǒng)復(fù)雜度的升高,對(duì)于錯(cuò)誤的處理也變得更加重要了起來(lái)。 為了證明這條結(jié)論,可以做一些計(jì)算。假定系統(tǒng)設(shè)計(jì)要保證單個(gè)元件的故障不會(huì)導(dǎo)致整 個(gè)系統(tǒng)崩潰,可以以元件的平均壽命來(lái)計(jì)算故障概率。以人類神經(jīng)系統(tǒng)為例:大腦有 10^10 個(gè)神經(jīng)元,每個(gè)神經(jīng)元平均每秒激發(fā) 10 次,在致命故障之間的平均的自由程長(zhǎng)度(機(jī)體的平均壽命)是 60 年。60 年等于 2×10^9 秒,這些數(shù)字乘起來(lái)得到人一生神經(jīng)元的激發(fā)總數(shù):2×10^20,因此要保證正常運(yùn)行,故障概率就應(yīng)該小于這個(gè)數(shù)字的倒數(shù),即 0.5×10^(-20),對(duì)于數(shù)字計(jì)算機(jī),電子管、每秒的運(yùn)行次數(shù)以及系統(tǒng)平均正常運(yùn)行時(shí)間分別為:5×10^3、10^5 和 7小時(shí);那么合計(jì)起來(lái),故障概率為 10^(-12) 就足夠了。在《計(jì)算機(jī)與人腦》中,有類似的比較82。 他指出了電子管以及一般的電子元件的故障概率還達(dá)不到 10^(-13) 的水平,而且神經(jīng)元可能也達(dá)不到。但是,在設(shè)計(jì)計(jì)算機(jī)的時(shí)候,我們可以把計(jì)算機(jī)設(shè)計(jì)成一旦發(fā)生錯(cuò)誤,就會(huì)停機(jī),然后操作員就可找到錯(cuò)誤并改正之。舉例來(lái)說(shuō),計(jì)算機(jī)可以把一個(gè)運(yùn)算計(jì)算兩次,比較結(jié)果,一旦有錯(cuò)誤就停機(jī)[83]?!?/p> 如果按照“有錯(cuò)必糾”的完美主義理念,像生命這樣的復(fù)雜系統(tǒng)很難持續(xù)比幾個(gè)毫秒更長(zhǎng)的時(shí)間。實(shí)際上,生命應(yīng)該是同概率完全整合在一起的,它可以在錯(cuò)誤里面持續(xù)運(yùn)行。在生命中的誤差,不會(huì)像在計(jì)算過(guò)程中那樣不斷地?cái)U(kuò)散放大。生命是十分完善且具有適應(yīng)性的系統(tǒng),一旦中間發(fā)生了某種問(wèn)題,系統(tǒng)會(huì)自動(dòng)地認(rèn)識(shí)到這個(gè)問(wèn)題的嚴(yán)重程度。如果無(wú)關(guān)緊要,那么系統(tǒng)就會(huì)無(wú)視問(wèn)題,繼續(xù)運(yùn)作;如果這個(gè)問(wèn)題對(duì)于系統(tǒng)比較重要,系統(tǒng)就會(huì)把發(fā)生故障的區(qū)域封閉來(lái),繞過(guò)它,通過(guò)其他的候補(bǔ)渠道繼續(xù)運(yùn)行等等。然后在有空的時(shí)候,系統(tǒng)回頭再去修復(fù)故障,如果不能修復(fù),那么系統(tǒng)就把這個(gè)區(qū)域永久地廢棄。所以,整個(gè)生物體的可靠性長(zhǎng)度取決于要多長(zhǎng)時(shí)間才會(huì)出現(xiàn)固定數(shù)量的不可修復(fù)故障,進(jìn)行了多少次的調(diào)整和永久繞行,以及到最后,要多久才會(huì)徹底無(wú)計(jì)可施,再也無(wú)法修復(fù)。生命同那種一觸即潰,一個(gè)錯(cuò)誤就會(huì)土崩瓦解的系統(tǒng),完全就是兩回事。 為了把埋藏在生命系統(tǒng)中的道理應(yīng)用到人工自動(dòng)機(jī)中間去,我們必須要對(duì)生物這樣的復(fù)雜機(jī)制有更深刻的理解,對(duì)錯(cuò)誤的性質(zhì)有更詳盡的描述,還要對(duì)于生物生存的環(huán)境做出更全面的統(tǒng)計(jì)。因?yàn)樽詣?dòng)機(jī)是不能同它所處的環(huán)境完全分割的,換句話說(shuō),如果不先說(shuō)明自動(dòng)機(jī)所運(yùn)作的環(huán)境,就不能判斷它是好是壞、是快是慢、是堅(jiān)強(qiáng)還是脆弱。如人類生存的環(huán)境,就可以用地球表面的狀態(tài)來(lái)粗略地對(duì)應(yīng),討論人是否能在海底或者在 1000 度的高溫下生存,是沒(méi)有意義的。根據(jù)同樣的道理,除非說(shuō)明了一臺(tái)計(jì)算機(jī)器的用途,我們也不能對(duì)它的快慢說(shuō)些什么。不同用途的計(jì)算機(jī)器可以有巨大的區(qū)別。對(duì)于不同的數(shù)學(xué)分析問(wèn)題、數(shù)論、組合數(shù)學(xué)、文檔翻譯,這些工作所需要的計(jì)算性質(zhì)都有所不同。我們現(xiàn)在比較了解怎樣設(shè)計(jì)用于典型的 數(shù)學(xué)分析問(wèn)題的機(jī)器。但是根據(jù)我們現(xiàn)有的統(tǒng)計(jì)和數(shù)論知識(shí),可能還不足以設(shè)計(jì)很好的機(jī)器。同時(shí),對(duì)于組合數(shù)學(xué)和翻譯,我們知道的還更少[84]。 計(jì)算機(jī)能夠被應(yīng)用于數(shù)學(xué)中,關(guān)鍵的一點(diǎn)就是數(shù)學(xué)分析的統(tǒng)計(jì)性質(zhì)已經(jīng)被研究得相當(dāng)透徹,并且其計(jì)算量是比較均勻的。從數(shù)學(xué)角度看起來(lái)差別很大的一些問(wèn)題,如求解一個(gè) 10次方程式的根、求一個(gè) 20 階矩陣的逆矩陣、解一個(gè)求值問(wèn)題或者求一個(gè)積分方程、微分方程的數(shù)值解等。這些問(wèn)題從計(jì)算的角度看卻令人驚奇地相似:比如乘法次數(shù)之比、每次乘法所需的內(nèi)存調(diào)用次數(shù)、以及為了優(yōu)化讀取時(shí)間建立的分級(jí)內(nèi)存結(jié)構(gòu),都很類似。但是如果進(jìn)行數(shù)論的計(jì)算,這些計(jì)算過(guò)程的統(tǒng)計(jì)性質(zhì)就會(huì)有很大的不同。當(dāng)然,也可能存在某種視角,從這個(gè)角度來(lái)看,數(shù)論計(jì)算和數(shù)學(xué)分析的計(jì)算統(tǒng)計(jì)性質(zhì)又會(huì)顯得一致。但我們現(xiàn)在還不清楚。所以,對(duì)于所有的自動(dòng)機(jī)來(lái)說(shuō),的確只能量體裁衣,按照它們要面對(duì)的環(huán)境來(lái)進(jìn)行定制。而生物自動(dòng)機(jī)在適應(yīng)環(huán)境方面,要比所有的人工制品都來(lái)得強(qiáng)。故實(shí)際情況很可能是,我們離生物達(dá)到的復(fù)雜性閾值已經(jīng)不遠(yuǎn)了,生命本身并不知道什么信息論,但它們卻自然地超越了復(fù)雜性閾值,我們也有可能做到這點(diǎn)。當(dāng)然,也有可能 5 年以后發(fā)現(xiàn)之上的說(shuō)法顯得很荒謬[85]。 【馮紐曼下面說(shuō)明,為何一旦出現(xiàn)故障,計(jì)算機(jī)就要停機(jī)的原因。因?yàn)槌霈F(xiàn)錯(cuò)誤后,技術(shù)人員就得把錯(cuò)誤找出來(lái)修改,定位往往是通過(guò)二分法進(jìn)行的,即把機(jī)器分成兩半,確定故障發(fā)生在哪一半中間,如此反復(fù)直到找到。但如果有不止一個(gè)故障,那么就很難用二分法來(lái)定位了。】 但是,生命中是沒(méi)有“停機(jī)檢修”這回事的,機(jī)器和生命對(duì)于故障,采取完全不同的處理方法。這可能同生命的某些特性有關(guān),這些特性是在人造裝置中完全找不到的。生命能夠在故障率相對(duì)很高的情況下仍然生存,而人工自動(dòng)機(jī)卻不能,這很可能需要一種非常柔軟的適應(yīng)性,以及一種“觀察自己”與自組織的能力,并且,這需要其組成部件具有高度的自治能力。在人類神經(jīng)系統(tǒng)中間,各個(gè)組件相當(dāng)程度上都是自我控制的,而不像機(jī)器,所有的指令都是來(lái)自一個(gè)中央核心。當(dāng)各組件能夠自治、自組織的時(shí)候,一旦發(fā)生意外,每個(gè)組件 都能夠獨(dú)立地?fù)?dān)負(fù)控制權(quán);但反過(guò)來(lái),組件和組件之間又會(huì)發(fā)生爭(zhēng)奪控制的“對(duì)抗”,以至于不能很好的合作,有可能所有這些現(xiàn)象都是相關(guān)的[86]。 Jake 點(diǎn)評(píng) 很贊東方和尚對(duì)這一章題目的翻譯,原文是:“The Role of High and of Extremely HighComplication”,如果直譯為“高以及超高復(fù)雜性的角色”,意境全無(wú),不知所云。但是,現(xiàn)在的題目“大數(shù)之道”則一下子說(shuō)出了這一章的精髓,即生命的本質(zhì)存在于大數(shù)的統(tǒng)計(jì)規(guī)律之中。 首先,馮紐曼對(duì)人類大腦和人工自動(dòng)機(jī)在數(shù)量級(jí)上進(jìn)行比較(更多的比較可以參考馮紐曼寫(xiě)的一本小冊(cè)子《計(jì)算機(jī)與人腦》);其次,他指出人類的大腦是用不可靠的零部件組裝出了一個(gè)可靠的系統(tǒng),而馮紐曼時(shí)代的計(jì)算機(jī)(甚至是現(xiàn)在的計(jì)算機(jī))則是用可靠的零部件組裝出了一個(gè)不可靠的系統(tǒng)(這句話的出處是在馮紐曼的文章《Probability Logics and thesynthesis of reliable organisms from unreliable components》,馮紐曼文集 5 中)。由此可見(jiàn),人工自動(dòng)機(jī)與真實(shí)生命并不在于單獨(dú)零件的好壞,也不在于運(yùn)算速度的快慢,記憶存儲(chǔ)的多少,而在于這種組裝的統(tǒng)計(jì)規(guī)律。也就是說(shuō),我們真正不理解的是一種統(tǒng)計(jì)上的法則,正是這種法則才導(dǎo)致了真實(shí)生命可以將不可靠的零部件組裝成可靠的整體;而恰恰是我們對(duì)這種統(tǒng)計(jì)規(guī)律的不認(rèn)識(shí),才導(dǎo)致我們?nèi)祟愒O(shè)計(jì)的機(jī)器雖然在局部上都能保證可靠性,但是當(dāng)把它們組裝成整體的時(shí)候卻喪失了可靠性。 接下來(lái)就要問(wèn),這種未知的統(tǒng)計(jì)規(guī)律究竟是什么呢?馮紐曼的確沒(méi)有做出正面的回答,但是它在這里對(duì)電腦與人腦的比較所使用的方法已經(jīng)給了我們一些暗示,未知的統(tǒng)計(jì)規(guī)律可能恰恰蘊(yùn)含在各種零部件、各種系統(tǒng)組分的數(shù)量級(jí)(標(biāo)度)的比例中。無(wú)獨(dú)有偶,這種對(duì)標(biāo)度統(tǒng)計(jì)規(guī)律性的認(rèn)識(shí)恰恰在近年的復(fù)雜性研究中異軍突起了,這就是 G.West 以及 J.Brown等人所號(hào)召的“代謝生態(tài)學(xué)”(參見(jiàn):《流的探索》以及 J.Brown: Toward a Metabolic Theory of Ecology, Ecology, 85(7), 2004, pp. 1771–1789)。 為什么說(shuō)代謝生態(tài)學(xué)和我們這里探討的大數(shù)之道有關(guān)呢?讓我們來(lái)看這樣一個(gè)開(kāi)放系統(tǒng)的問(wèn)題:我們知道任何一種開(kāi)放的復(fù)雜系統(tǒng)都需要跟外界進(jìn)行物質(zhì)、能量、信息的交換,而且很顯然如果系統(tǒng)自身的尺度越大,我們就需要越多的交換,關(guān)鍵的問(wèn)題是,當(dāng)給定系統(tǒng)的尺度以后,我們需要多大的開(kāi)放程度才是最好的呢? 代謝生態(tài)學(xué)從實(shí)際數(shù)據(jù)出發(fā),對(duì)這個(gè)問(wèn)題給出了很好的解答,至少對(duì)于現(xiàn)在已知的各種物種來(lái)說(shuō),物質(zhì)交換量(新陳代謝 F)與生物體體積(B)會(huì)呈現(xiàn)出一種 3/4 的冪律關(guān)系,如下圖: 橫坐標(biāo)軸是 logB,縱坐標(biāo)是 logF,則這兩個(gè)變量構(gòu)成了一條斜率為 3/4 的直線,這意味著 F 正比于 M3/4,這一法則被人們稱為 Kleiber 律。如果我們假設(shè)現(xiàn)實(shí)的生物已經(jīng)進(jìn)化出了一種最優(yōu)的結(jié)構(gòu),那么新陳代謝和生物體積之間形成的 3/4 冪律關(guān)系就是一種最優(yōu)的結(jié)構(gòu)。 反過(guò)來(lái),這樣一種認(rèn)識(shí)也許會(huì)幫助我們更好地設(shè)計(jì)人工系統(tǒng),例如對(duì)于任何計(jì)算系統(tǒng)都存在著最優(yōu)的開(kāi)放程度,也許這種開(kāi)放程度就與系統(tǒng)自身的規(guī)模存在著 3/4 的冪律關(guān)系(參見(jiàn):Jiang Zhang: Energy Flows in Complex Ecological Systems: A Review; Journal ofSystems Science and Complexity 2009 22 (3): 345-359)。 有趣的是,Kleiber 早在 1932 年就發(fā)現(xiàn)了生物體的這種統(tǒng)一的標(biāo)度規(guī)律,然而直到 1997年左右,West 和 Brown 等人開(kāi)始提出生物體的最優(yōu)輸運(yùn)網(wǎng)絡(luò)模型才使得人們?cè)絹?lái)越多地認(rèn)識(shí)到這個(gè)問(wèn)題的重要性(參見(jiàn):West,G.B., Brown,J.H., Enquist,B.J., A general model for the origin of allometric scaling laws in biology, Science, 1997,276:122 126;Banavar,J.R., Maritan,A., Rinaldo,A., Size and form in efficient transportation networks, Nature,1999,399:130 132。) 進(jìn)一步,隨著對(duì)生物體數(shù)據(jù)的大量積累,人們還發(fā)現(xiàn)不僅僅是新陳代謝,所有與時(shí)間相聯(lián)系的變量(例如懷孕時(shí)間、生物體的壽命)都與生物體體積呈現(xiàn) 1/4 的冪律關(guān)系,而頻率相關(guān)的變量(如心跳頻率、呼吸頻率等)都與生物體體積呈現(xiàn)- 1/4 的冪律關(guān)系(參考:Brown,J.H., West,G.B., Scaling in biology, Oxford University Press, 2000)。 需要強(qiáng)調(diào)的是這個(gè)頻率與體積的- 1/4 的冪律關(guān)系。在馮紐曼的論述中,他特別提到了元件發(fā)生錯(cuò)誤的概率隨著系統(tǒng)規(guī)模的增長(zhǎng)。我們不妨把原件發(fā)生錯(cuò)誤的概率也理解為一種廣義的頻率,那么這種頻率就會(huì)與系統(tǒng)整體的規(guī)模呈現(xiàn)一種冪律關(guān)系。我不知道對(duì)于目前的人工計(jì)算系統(tǒng)來(lái)說(shuō),是否有人進(jìn)行過(guò)類似的統(tǒng)計(jì)分析,但是有理由懷疑如果人工系統(tǒng)的設(shè)計(jì)達(dá)到了某種最優(yōu)的效率,那么很有可能系統(tǒng)發(fā)生錯(cuò)誤的頻率與系統(tǒng)規(guī)模之間的關(guān)系會(huì)與生物體的頻率-體積法則存在著某種聯(lián)系。 ?我們的研究還發(fā)現(xiàn),冪律關(guān)系普遍存在于復(fù)雜系統(tǒng)之中,例如國(guó)家、城市,甚至虛擬社區(qū)都存在著各種宏觀量之間的冪律關(guān)系?(參考:Jiang Zhang,Tongkui Yu: Allometric Scalingof Countries; Physica A Vol.389(2): 4887-4896;L. Bettencourt, J. Lobo, D. Helbing, C.Kuhnert, G. West, Growth,innovation, scaling, and the pace of life in cities, Proc. Natl.Acad. Sci.U. S. A. 104 (2007) 7301–7306.;Lingfei Wu, Jiang Zhang:Accelerating Growthand Size-dependent Distribution of Collective Human Activities Online,arXiv:1104.0742),只不過(guò)冪指數(shù)在這些系統(tǒng)中則都不相同。但是,直到今天,我們所給出的這些冪律關(guān)系還仍然是類似集郵一樣的工作,實(shí)際上還不理解所有這些冪律現(xiàn)象背后的大數(shù)之道。有趣的是,Geoffrey West于去年剛剛將其一生對(duì)不同復(fù)雜系統(tǒng),包括宇宙、生命、城市等的標(biāo)度率研究全部概括到了一本最新的書(shū)中《Scale》。
|
|
來(lái)自: 咖啡色的人 > 《學(xué)習(xí)》