一、20世紀(jì)數(shù)理統(tǒng)計(jì)學(xué)發(fā)展概述 20世紀(jì),特別是其上半葉,是數(shù)理統(tǒng)計(jì)學(xué)發(fā)展史上一個(gè)輝煌的時(shí)代。從現(xiàn)代數(shù)理統(tǒng)計(jì)學(xué)框架的建立到發(fā)展為一個(gè)成熟的學(xué)科,是在這個(gè)時(shí)期完成的。20世紀(jì)初,數(shù)理統(tǒng)計(jì)學(xué)面臨一個(gè)轉(zhuǎn)折點(diǎn),意思是它必須有新的突破才能獲得進(jìn)一步發(fā)展的契機(jī)。20世紀(jì)早期一批以費(fèi)歇爾為首的統(tǒng)計(jì)學(xué)大師成功地應(yīng)對了這個(gè)局面,創(chuàng)造了非凡的業(yè)績。按照國際上一些知名統(tǒng)計(jì)學(xué)家的看法,20世紀(jì)末數(shù)理統(tǒng)計(jì)學(xué)發(fā)展的態(tài)勢,與世紀(jì)初頗有相似的地方。人們在呼喚“21世紀(jì)的費(fèi)歇爾”。當(dāng)然,廣義地說,這也是每一位數(shù)理統(tǒng)計(jì)工作者所肩負(fù)的任務(wù)。中國作為一個(gè)世界大國,年輕一代的數(shù)理統(tǒng)計(jì)學(xué)者應(yīng)該也有條件在這方面作出自己的貢獻(xiàn)。 為了更清楚闡述上文的意思,需要對數(shù)理統(tǒng)計(jì)學(xué)的歷史作一個(gè)簡短的回顧。按目前數(shù)理統(tǒng)計(jì)學(xué)界公認(rèn)的看法,數(shù)理統(tǒng)計(jì)學(xué)是“收集和分析帶隨機(jī)性的數(shù)據(jù)的科學(xué)和藝術(shù)”。以筆者的看法,這個(gè)內(nèi)涵規(guī)定了它是一個(gè)中立性的工具?!爸辛ⅰ钡囊馑际侵高@門學(xué)科不帶任何社會的、政治的或意識形態(tài)上的傾向性,因而也不存在它自成學(xué)派或從屬于何學(xué)派的問題。有一種看法認(rèn)為社會經(jīng)濟(jì)統(tǒng)計(jì)學(xué)與數(shù)理統(tǒng)計(jì)學(xué)是“大統(tǒng)計(jì)學(xué)”中的兩個(gè)對立的學(xué)派。筆者認(rèn)為這種看法值得商榷。的確,在社會經(jīng)濟(jì)統(tǒng)計(jì)學(xué)中該不該使用數(shù)理統(tǒng)計(jì)方法,在哪些問題上或者在何種程度上應(yīng)否使用數(shù)理統(tǒng)計(jì)方法,是可能存在不同意見的。如果說由于對這些問題的看法不同而有學(xué)派存在,那還算言之成理。但這些問題與數(shù)理統(tǒng)計(jì)學(xué)無關(guān):數(shù)理統(tǒng)計(jì)學(xué)只是一種工具,誰如覺得這個(gè)工具對他有用,就可以使用它——當(dāng)然在使用中必須遵守這門學(xué)科的規(guī)范,否則就可能產(chǎn)生誤導(dǎo)公眾及提供錯(cuò)誤的決策依據(jù)的后果。歷史上(部分地直到如今)數(shù)理統(tǒng)計(jì)方法曾遭到一些批評和懷疑,一定程度上與上述情況有關(guān)。 數(shù)理統(tǒng)計(jì)學(xué)起源于何時(shí)?這是一個(gè)無法也不必做出定論的問題。有的學(xué)者把英國學(xué)者格朗特的著作《關(guān)于死亡公報(bào)的自然和政治觀察》發(fā)表的年份1662年定為這門學(xué)科的誕生之日,恐怕也只能算是一家之見。實(shí)際情況是,可以說直到20世紀(jì)初,并不存在一門統(tǒng)一的數(shù)理統(tǒng)計(jì)學(xué)科,而中是在各實(shí)用領(lǐng)域中的學(xué)者因工作上的需要而分頭發(fā)展了一些分析數(shù)據(jù)的方法,即統(tǒng)計(jì)方法。最主要的有3 個(gè)方面:一是天文和測地學(xué)中因誤差分析問題而導(dǎo)致最小二乘法和正態(tài)誤差的發(fā)明。起初,人們認(rèn)為“誤差分析”與“統(tǒng)計(jì)分析”是根本不同的兩回事:前者的數(shù)據(jù)是對一個(gè)對象多次測量所得;后者的數(shù)據(jù)則是對多個(gè)對象各測量一次所得。按現(xiàn)今的數(shù)理統(tǒng)計(jì)學(xué)框架,我們?nèi)菀渍J(rèn)識這是一回事,但在當(dāng)時(shí)則不然。到19世紀(jì)中、后期,經(jīng)過凱特勒、蓋爾頓等在社會學(xué)和生物學(xué)方面的實(shí)際工作,以及埃其渥斯、卡爾·皮爾遜等的數(shù)學(xué)理論工作,終于把二者統(tǒng)一起來,并在20世紀(jì)得到發(fā)揚(yáng)光大。直到如今,線性模型——最小二乘法——正態(tài)誤差這個(gè)體系下所發(fā)展的方法,在相當(dāng)大的程度上仍占據(jù)了應(yīng)用統(tǒng)計(jì)方法中的主導(dǎo)地位。所以有人說,天文學(xué)是數(shù)理統(tǒng)計(jì)學(xué)的母親。 第二個(gè)方面是人口學(xué)。前文提到的格朗特的著作是一個(gè)重要例子。這個(gè)方向發(fā)展了離散數(shù)據(jù)統(tǒng)計(jì),即以二項(xiàng)分布和波哇松分布為代表的統(tǒng)計(jì)方法。另一個(gè)重要之點(diǎn)是它在19世紀(jì)即開始孕育了抽樣調(diào)查的思想。這也在20世紀(jì)得到發(fā)揚(yáng)光大,成為現(xiàn)今統(tǒng)計(jì)方法中的重要組成部分。有的統(tǒng)計(jì)史學(xué)家評說:19世紀(jì)的統(tǒng)計(jì)就是頻率分析。那是因?yàn)?,?dāng)時(shí)處理誤差分析的一套工具尚未被視為屬于統(tǒng)計(jì)方法的范疇。 最后一個(gè)方面是生物學(xué),特別是遺傳學(xué)。英國學(xué)者蓋爾頓在1874年到1890年間到工作,引進(jìn)了相關(guān)和回歸的思想。其重大意義在于它開創(chuàng)了分析多維數(shù)據(jù)的統(tǒng)計(jì)方法。此前的統(tǒng)計(jì)方法都是單指標(biāo)性的,不能顧及指標(biāo)間的相互關(guān)系。而在實(shí)用問題中一般涉及多個(gè)彼此相依的指標(biāo),孤立地分析單個(gè)指標(biāo)無法得出符合實(shí)際的結(jié)論。蓋爾頓的工作經(jīng)過埃其渥斯、卡爾·皮爾遜和約爾在數(shù)學(xué)上的整理,到20世紀(jì)又經(jīng)過費(fèi)歇爾等一批學(xué)者的深化,直到目前仍不失為應(yīng)用統(tǒng)計(jì)方法中的重鎮(zhèn)和理論統(tǒng)計(jì)學(xué)中的主流方向之一。 有人把上面粗略描述的,大體上到19世紀(jì)末為止的統(tǒng)計(jì)學(xué)的發(fā)展圖景作了一個(gè)小結(jié),歸納為以下3點(diǎn):(1)統(tǒng)計(jì)方法是基于實(shí)用的需要,在不同領(lǐng)域中分頭發(fā)展的。(2 )沒有專職的(以統(tǒng)計(jì)學(xué)為主業(yè)的)統(tǒng)計(jì)學(xué)家。對統(tǒng)計(jì)方法作出重大貢獻(xiàn)的人,其主要身份是某個(gè)其他領(lǐng)域的學(xué)者,這在公認(rèn)是現(xiàn)代數(shù)理統(tǒng)計(jì)學(xué)的奠基者費(fèi)歇爾和卡爾·皮爾遜身上還可以看出來。(3)統(tǒng)計(jì)學(xué)沒有一個(gè)嚴(yán)整的學(xué)科框架。 費(fèi)歇爾傳記的作者J.F.Box在談到20世紀(jì)初期統(tǒng)計(jì)學(xué)狀況時(shí)曾提到, 當(dāng)時(shí)在人們的意識上連參數(shù)與統(tǒng)計(jì)量都沒有嚴(yán)格區(qū)分開。有的學(xué)者提到,當(dāng)時(shí)在統(tǒng)計(jì)方法的工具袋里已有了一些積累,包括最小二乘法(平均值可視為其特例)、方差、頻率、二項(xiàng)分布、誤差理論和正態(tài)分布、相關(guān)回歸、矩估計(jì)、皮爾遜曲線族以及稍后的Student t分布等。 但它們是一些不連貫的片段,缺乏一個(gè)完整體系。 所以,在20世紀(jì)初年,擺在數(shù)理統(tǒng)計(jì)學(xué)面前的重大問題是建立一個(gè)理論(數(shù)學(xué))上的框架。它不僅能包容已有的成果,而且還要對未來努力的方向起指引的作用。如大家所知道的,這個(gè)任務(wù)由以費(fèi)歇爾為代表的一班統(tǒng)計(jì)學(xué)大師出色地完成了。這些統(tǒng)計(jì)學(xué)大師中除費(fèi)歇爾外,還可以算上愛根·皮爾遜、奈曼及較晚的瓦爾德。至于卡爾·皮爾遜,有一種看法認(rèn)為它是“舊統(tǒng)計(jì)”的押陣大將。但平心而論,他的工作,尤其是1900年發(fā)表的關(guān)于擬合優(yōu)度檢驗(yàn)的論文,對“新統(tǒng)計(jì)”的誕生有著不可低估的影響具有劃時(shí)代的意義。至于費(fèi)歇爾,其貢獻(xiàn)更是全方位的:在理論方面,他分別于1921年和1925年發(fā)表的論文《理論統(tǒng)計(jì)學(xué)的數(shù)學(xué)基礎(chǔ)》和《點(diǎn)估計(jì)理論》,奠定了統(tǒng)計(jì)學(xué)的大體上沿用至今數(shù)學(xué)框架;在方法的層面,他提出的似然估計(jì)、試驗(yàn)設(shè)計(jì)與方差分析以及一大批小樣本抽樣分布的結(jié)果,迄今仍有著重大的影響。其業(yè)績在20世紀(jì)統(tǒng)計(jì)界確實(shí)無人可比。所以美國統(tǒng)計(jì)學(xué)家埃夫龍?jiān)?996年一篇論文中把他比作“統(tǒng)計(jì)學(xué)的凱撒”。 前文提到,臨近20世紀(jì)末,數(shù)理統(tǒng)計(jì)學(xué)發(fā)展的態(tài)勢,頗有與世紀(jì)初相似之處。這一點(diǎn)要聯(lián)系到20世紀(jì)下半葉數(shù)理計(jì)學(xué)的發(fā)展?fàn)顩r來討論。 1940年,以克拉美的《統(tǒng)計(jì)學(xué)的數(shù)學(xué)方法》一書的出版為標(biāo)志,數(shù)理統(tǒng)計(jì)學(xué)被公認(rèn)為已形成一門嚴(yán)整的數(shù)學(xué)學(xué)科——應(yīng)當(dāng)注意的是:這一點(diǎn)固然與費(fèi)歇爾等人為統(tǒng)計(jì)學(xué)制定了合適的數(shù)學(xué)框架有關(guān),更本質(zhì)的原因在于統(tǒng)計(jì)學(xué)中的“數(shù)據(jù)”已超脫了其實(shí)際含義:一組數(shù)據(jù)如假定來自正態(tài)總體,則與此有關(guān)的方法(如t區(qū)間估計(jì)、F檢驗(yàn)等)都可以使用,而無須顧及數(shù)據(jù)從何而來。正如數(shù)學(xué)中人們說1+2=3, 而不必顧及這1、2、3是什么一樣。 數(shù)理統(tǒng)計(jì)學(xué)一經(jīng)數(shù)學(xué)化,就有其自身的發(fā)展規(guī)律,一般認(rèn)為,一個(gè)數(shù)學(xué)分支中新問題的來源,有“外生”和“內(nèi)生”兩種。前者是因外部的需要,一般是實(shí)際應(yīng)用中的需要所提出的問題,而后者則是由學(xué)科的“自我擴(kuò)張”引起的問題,不必有其實(shí)際背景。如前所說,在較早的時(shí)期(約在20世紀(jì)30年代或放寬一些到50年代),數(shù)理統(tǒng)計(jì)學(xué)與實(shí)用緊密結(jié)合,所研究的問題以“外生”性的為主。此后,情況有了很大變化:相當(dāng)大部分的統(tǒng)計(jì)學(xué)理論研究轉(zhuǎn)向“內(nèi)生”性的問題,以“在預(yù)設(shè)的模型下尋求符合某種準(zhǔn)則的最優(yōu)解“及“大樣本理論”兩個(gè)方向?yàn)榇怼?yīng)當(dāng)指出的是:并非說沿著這此方向所作的工作全無實(shí)際意義。有些工作(主要在較早時(shí)期)是以往比較粗糙的結(jié)果的完善。例如有關(guān)極大似然估計(jì)的漸近性質(zhì),費(fèi)歇爾在1925年關(guān)于點(diǎn)估計(jì)的論文中就有初步的討論。到五、六十年代,在數(shù)學(xué)上得到更完滿的發(fā)展。這類工作兼有理論和實(shí)用兩方面的意義。有的在優(yōu)化理論框架下得出的結(jié)果,如算術(shù)平均值或更一般地最小二乘估計(jì)在種種條件下的優(yōu)良性質(zhì)的結(jié)果,雖則對應(yīng)用統(tǒng)計(jì)方法無所增添,但深化了我們對這些重要方法性質(zhì)的了解,也是很有意義的。至于大樣本理論,其大量的繁瑣結(jié)果可說已趨于末流——既無理論上的數(shù)學(xué)美,又對分析數(shù)據(jù)不起什么作用。但也不可否認(rèn),其中也頗有些富有實(shí)際意義的結(jié)果,特別是非參數(shù)統(tǒng)計(jì)有關(guān)的一些大樣本結(jié)果,為在免除正態(tài)假定下進(jìn)行數(shù)據(jù)分析提供了可用的替代方法。 雖然可舉出以上這些有利情況,但不能不承認(rèn),從總體上說,由這些“內(nèi)生”問題產(chǎn)生的結(jié)果,多數(shù)是與數(shù)據(jù)分析沒多大關(guān)系,從純數(shù)學(xué)的角度看也缺乏深度。這種情況引起了不少統(tǒng)計(jì)學(xué)家的憂慮和反思,以至有所謂“統(tǒng)計(jì)學(xué)危機(jī)”的呼聲。 以上的簡略描述表明,數(shù)理統(tǒng)計(jì)學(xué)在20世紀(jì)下半葉,理論上缺乏有意義的、突破性的進(jìn)展。實(shí)用的或方法層面上的情況如何?應(yīng)該說有不小的成績。其中一部分得力于功能強(qiáng)大的計(jì)算機(jī),它使一些需要大規(guī)模計(jì)算的方法能付諸實(shí)用,從而大大拓展了統(tǒng)計(jì)方法的應(yīng)用面。在方法本身的研究上也有不少進(jìn)展。不久前出版的一本論述“統(tǒng)計(jì)學(xué)中的突破”的著作,列舉了到1980年為止統(tǒng)計(jì)學(xué)方面的40項(xiàng)“突破”,就其內(nèi)容看(如赤池弘次的AIC準(zhǔn)則, 維爾考克森的秩和檢驗(yàn)之類)大都是局部范圍內(nèi)的方法性的成果,并非有全局意義的“突破”。統(tǒng)計(jì)學(xué)家休伯1997年在北京的一次講演,認(rèn)為近幾十年來數(shù)理統(tǒng)計(jì)學(xué)只有3 項(xiàng)值得一提的重要成果:其一是他自己發(fā)展的穩(wěn)健統(tǒng)計(jì)(這概念可追溯到費(fèi)歇爾在1920年的一項(xiàng)關(guān)于比較絕對平均差和標(biāo)準(zhǔn)差的優(yōu)劣的工作),另有埃夫龍?jiān)?979年提出的“自助法”(bootstrap)和生存分析。若情況果真如此,則20世紀(jì)下半葉統(tǒng)計(jì)學(xué)的成績可說是很暗淡了。依筆者所見,情況要樂觀一些,比如回歸分析和多元分析中諸多的理論和方法進(jìn)展、模型選擇、試驗(yàn)設(shè)計(jì)、生存分析、貝葉斯統(tǒng)計(jì)等方面,都頗有一些富有實(shí)用意義的成果。 但不容否認(rèn)的是,20世紀(jì)下半葉數(shù)理統(tǒng)計(jì)學(xué)方面的成就,主要限于若干局部性的、具體問題的方法性的層面上,全局性的、涉及根本的統(tǒng)計(jì)思想的成果,絕無僅有,拿一句人文科學(xué)講座中常提到的套話來形容,可說是“學(xué)問家凸顯,思想家淡出”。 以上種種情況使不少統(tǒng)計(jì)學(xué)家認(rèn)為,統(tǒng)計(jì)學(xué)又面臨一個(gè)新的突破的形勢,或者也可以說,到了一個(gè)需要變革的時(shí)期,這與20世紀(jì)初的情況有其相似之處。 二、數(shù)理統(tǒng)計(jì)學(xué)未來的發(fā)展 這種突破會指向何方?要采取怎樣的措施以有利于促成這種突破或變革?自20世紀(jì)60年代以來,不少學(xué)者,通過在有關(guān)會議上發(fā)表講演或在刊物上發(fā)表論文,表達(dá)了各自的看法。有些看法有很大的一致性,例如主張統(tǒng)計(jì)學(xué)要回到以前那種重視聯(lián)系實(shí)際的傳統(tǒng);主張“推倒圍墻”,即重視與其他學(xué)科的交流和滲透;主張?jiān)诮y(tǒng)計(jì)教育上實(shí)行與此相應(yīng)的變革等。在預(yù)測未來發(fā)展的主流上,則多有分歧。下面對一些較有影響的觀點(diǎn)擇要介紹一下。 1.數(shù)據(jù)分析。美國資深統(tǒng)計(jì)學(xué)家圖基在1962年發(fā)表了一篇題為《數(shù)據(jù)分析的未來》的長文,大約“數(shù)據(jù)分析”一詞即起源于此文。這是第一次由一個(gè)極有影響的統(tǒng)計(jì)學(xué)家對當(dāng)時(shí)的數(shù)理統(tǒng)計(jì)學(xué)發(fā)展?fàn)顩r作出反思并提出一種變革的方向,因此有重要的意義。直到今天,該文所表述的觀點(diǎn)還經(jīng)常得到統(tǒng)計(jì)學(xué)家們的征引。 此文主要的精神是對當(dāng)時(shí)統(tǒng)計(jì)界流行的以模型為出發(fā)點(diǎn)的做法提出反思,主張讓數(shù)據(jù)多起作用。模型應(yīng)當(dāng)從分析數(shù)據(jù)中產(chǎn)生而不應(yīng)讓數(shù)據(jù)去曲合預(yù)設(shè)的模型。為此他主張對現(xiàn)行統(tǒng)計(jì)學(xué)的根基“用概率刻畫統(tǒng)計(jì)推斷的不確定性”作出松動(dòng)——概率只是作為一種工具而非基礎(chǔ),適合使用時(shí)則用,不合用時(shí)就不用。提出這一主張與打破“以模型為出發(fā)點(diǎn)”或“預(yù)設(shè)模型”有關(guān):沒有一個(gè)充分簡化的模型,就無法對統(tǒng)計(jì)推斷的概率性質(zhì)作深入探討,以致一些“為發(fā)表文章而作研究”的工作不能不預(yù)設(shè)模型。除此以外圖基還提出了一些原則性的主張。如果研究有現(xiàn)實(shí)意義的新問題,在更現(xiàn)實(shí)的條件下研究老問題,把統(tǒng)計(jì)學(xué)定位為一門科學(xué)而非數(shù)學(xué)——這意味著實(shí)用性優(yōu)先于推理的嚴(yán)格性等等。圖基及其支持者以后在一些文章和專著中進(jìn)行一步闡發(fā)了他們的主張。所有這些人們現(xiàn)在將其歸在尚未成形的“數(shù)據(jù)分析”的名目下。 筆者認(rèn)為,雖然目前講圖基的主張?jiān)诮y(tǒng)計(jì)學(xué)界的支持率還不能算是很高,但由于以下兩個(gè)情況,在未來可能發(fā)展為一個(gè)很有影響的思潮,并在相當(dāng)程度上改變現(xiàn)行統(tǒng)計(jì)學(xué)的面貌。一是功能強(qiáng)大的計(jì)算機(jī)的廣泛使用;二是在各個(gè)領(lǐng)域里不斷提出的帶有復(fù)雜結(jié)構(gòu)數(shù)據(jù)的問題,如高維模擬仿真、模式識別、圖像和信號處理、人工智能、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)采掘(data mining)等。由于數(shù)據(jù)的隨機(jī)性, 這類問題在一定程度上和統(tǒng)計(jì)學(xué)有關(guān),又因其復(fù)雜性使概率方法難于充分有效地使用,因此可能需要某種“折衷”的辦法:既考慮到數(shù)據(jù)的大量性和復(fù)雜性而不能拘泥于一定的概率模式,又能使因數(shù)據(jù)的隨機(jī)性而產(chǎn)生結(jié)論的不確定性有著某種科學(xué)的評價(jià)標(biāo)準(zhǔn)。也許這是一個(gè)使現(xiàn)行統(tǒng)計(jì)學(xué)產(chǎn)生“突破”的地方? 2.“邊緣學(xué)科”。如前所說,在19世紀(jì)末之前,統(tǒng)計(jì)學(xué)尚未成為一個(gè)今天意義下的獨(dú)立學(xué)科,其發(fā)展是為應(yīng)付現(xiàn)實(shí)的需要,結(jié)合其他學(xué)科來進(jìn)行的。近若干年來,這個(gè)發(fā)展模式受到一些有影響的統(tǒng)計(jì)學(xué)家的推崇,認(rèn)為有可能是將來的主流模式。統(tǒng)計(jì)學(xué)家休伯1997年在北京的一次講演中,把統(tǒng)計(jì)學(xué)發(fā)展的歷程畫成一條螺旋線而非直線,意謂其發(fā)展不是直線式的,而是可能具有某種“回歸”的性質(zhì)或我們常說的“螺旋式進(jìn)展”——當(dāng)然是在提高的基礎(chǔ)上回歸而非簡單重復(fù)。他還發(fā)表了一個(gè)“盛世危言”式的見解:如果統(tǒng)計(jì)學(xué)家的研究成果脫離實(shí)際應(yīng)用的狀況得不到改變,則這種形式的統(tǒng)計(jì)學(xué)將走向消亡,我們將像以往那樣回到各個(gè)學(xué)科去發(fā)展適用的統(tǒng)計(jì)方法。這類方法不必具有通用的性質(zhì)(比如像回歸分析、方差分析這類統(tǒng)計(jì)方法,都具有很廣的通用性)。 他描述的這種圖景眼下大概還不會成為現(xiàn)實(shí)——相信“通用的”統(tǒng)計(jì)方法仍有很大的發(fā)展余地,數(shù)理統(tǒng)計(jì)學(xué)作為一門獨(dú)立學(xué)科的地位還沒有動(dòng)搖的跡象,但其思想則頗有可取之處?!巴ㄓ梅椒ā钡陌l(fā)展也不可能是純數(shù)學(xué)思維、閉門造車式的。如蓋爾頓——皮爾遜發(fā)明的相關(guān)回歸、費(fèi)歇爾發(fā)明的方差分析這類“通用”方法,是結(jié)合像遺傳學(xué)和農(nóng)業(yè)試驗(yàn)的需要而得到。一位有名的華人生物統(tǒng)計(jì)學(xué)家曾指出搞統(tǒng)計(jì)必須結(jié)合一個(gè)area,也是這個(gè)意思。另一位美籍華人學(xué)者李景均(C.C.Li)教授因研究群體遺傳學(xué)的需要而發(fā)明被稱為“路徑分析”(path ananlysis)的統(tǒng)計(jì)方法,曾應(yīng)某刊物之約發(fā)表長達(dá)80余頁的專題論文,成為該領(lǐng)域國際公認(rèn)的權(quán)威。其方法不止適用于遺傳學(xué)。他并不以數(shù)學(xué)見長,如果投身到統(tǒng)計(jì)學(xué)的純理論研究,也許不一定能做出達(dá)到這個(gè)水平的成就??傊瑲v史和現(xiàn)實(shí)都證明了:統(tǒng)計(jì)學(xué)和其他學(xué)科結(jié)合發(fā)展是一個(gè)正確的方向,也極可能成為未來發(fā)展的主流之一。 3.貝葉斯統(tǒng)計(jì)。頻率學(xué)派和貝葉斯學(xué)派的對立是20世紀(jì)數(shù)理統(tǒng)計(jì)學(xué)發(fā)展中一道亮麗的風(fēng)景線。臨到世紀(jì)末,早期那種情緒性的對立局面似乎已逐漸消退。原因之一是早期那些大師都已去世或淡出舞臺,后繼者不一定那么執(zhí)著于“純哲學(xué)”式的爭論。也因?yàn)榻?jīng)過幾十年的實(shí)踐,統(tǒng)計(jì)學(xué)界大體上有了一種共識:至少在參數(shù)統(tǒng)計(jì)的范圍內(nèi),這兩個(gè)學(xué)派所達(dá)致的結(jié)論,所提供的方法基本相似。另外在局部范圍而言,兩派的方法也確實(shí)各有短長。 英國老牌的貝葉斯派統(tǒng)計(jì)學(xué)家在近年的一次訪談中預(yù)言,21世紀(jì)將是貝葉斯統(tǒng)計(jì)一統(tǒng)天下的局面。在另一個(gè)場合中他把時(shí)間具體化到2020年。這后一點(diǎn)看來不像會成為現(xiàn)實(shí)。但近年來統(tǒng)計(jì)刊物上發(fā)表的一些學(xué)者的見解,確給筆者這樣一個(gè)印象,即貝葉斯學(xué)派正在取得上風(fēng)。這有多方面的原因,不在此細(xì)論。其中一個(gè)因素可能是:在對20世紀(jì)統(tǒng)計(jì)學(xué)的狀況進(jìn)行反思時(shí),幾乎所有的負(fù)面因素都與頻率學(xué)派有牽涉,如過分的數(shù)學(xué)化而形成“兩張皮”的現(xiàn)象。其中尤以將統(tǒng)計(jì)問題歸結(jié)為最優(yōu)化數(shù)學(xué)問題的見解倍受非議,有人譏之為“錯(cuò)誤問題的正確解答”。 如果貝葉斯統(tǒng)計(jì)真成為主流,在未來世紀(jì)它的主攻方向如何?有的學(xué)者也對此發(fā)表了見解。 如所周知,貝葉斯學(xué)派有“主觀”和“客觀”兩個(gè)系統(tǒng)。主觀貝葉斯學(xué)派認(rèn)為先驗(yàn)分布的選擇純是使用者個(gè)人的事,不可能也不應(yīng)該去尋求某種公認(rèn)的、“客觀”的選擇。進(jìn)一步的引伸是統(tǒng)計(jì)推斷純粹是主觀行為,不可能用一種科學(xué)標(biāo)準(zhǔn)去規(guī)范它。學(xué)者們認(rèn)為,這一學(xué)派會有其存在余地。它主要適用于經(jīng)濟(jì)決策中。在這種問題中,決策主體的條件和掌握信息資源的不同當(dāng)然會影響其做出的決策,不可能是統(tǒng)一的標(biāo)準(zhǔn)。但是在科學(xué)研究(以尋求客觀真理為目標(biāo))性質(zhì)的問題中,或一般地說,在主觀因素影響較少的問題中,這種思維模式恐難于為人們所接受。 客觀貝葉斯學(xué)派主張的核心在于給先驗(yàn)分布的選定制定一種大家都遵守的“客觀”規(guī)則,而不由人隨意地主觀選定。這里所謂“客觀”,不應(yīng)理解為在頻率意義下與實(shí)際情況符合——即同類問題大量出現(xiàn)而按參數(shù)值的頻率去確定先驗(yàn)分布(果真有這個(gè)情況,問題可納入頻率學(xué)派的體系下)。因?yàn)樵诮^大多數(shù)情況下,問題是一次性的,不存在按這種方式?jīng)Q定先驗(yàn)分布的可能。因此,真正的貝葉斯派所持的立場是:先驗(yàn)分布的選取純粹因?yàn)樗墙y(tǒng)計(jì)推斷工作得以完成的一個(gè)必須的成分,不存在它與現(xiàn)實(shí)符合與否的“客觀性”問題。 客觀貝葉斯學(xué)派源起于貝葉斯本人,后曾被拉普拉斯廣泛使用,所以也有人把它稱為拉普拉斯學(xué)派(相應(yīng)地,主觀貝葉斯學(xué)派有時(shí)被稱為芬內(nèi)迪—賽瓦奇學(xué)派)。其時(shí)公認(rèn)的先驗(yàn)分布是根據(jù)“同等無知”原則而確定的均勻分布。后來的學(xué)者用稍廣一些的“無信息先驗(yàn)分布”來取代它。費(fèi)歇爾早就指出過這樣確定先驗(yàn)分布的一個(gè)問題,即隨著參數(shù)取法的不同會導(dǎo)致不同的先驗(yàn)分布。針對這一點(diǎn)杰弗里斯引進(jìn)了一種選擇先驗(yàn)分布的方法,可以避免這個(gè)困難,但仍不是能很令人滿意。例如對二項(xiàng)分布B(n,θ)的參數(shù)θ(0≤θ≤1),按“同等無知”原則取先驗(yàn)密度p(θ)=1,而按杰弗里斯的方法則應(yīng)為p(θ)=(θ(1-θ))[-1/2]。從實(shí)用的角度看,這個(gè)選擇似乎不比p (θ)=1更有吸引力。 有些學(xué)者認(rèn)為,21世紀(jì)統(tǒng)計(jì)學(xué)的一個(gè)動(dòng)向是“頻率學(xué)派與客觀貝葉斯學(xué)派的合流”。而在這個(gè)進(jìn)程中,有兩個(gè)問題是主要的:一是研究更合理的制定先驗(yàn)分布的準(zhǔn)則。這里“合理”的含義恐怕主要不是某種抽象的理論標(biāo)準(zhǔn),而是看在這個(gè)體制下所作出的統(tǒng)計(jì)推斷的合理性即在應(yīng)用上的有效性。在此,已有的大批“經(jīng)過考驗(yàn)的”成果會成為一個(gè)重要的參照標(biāo)準(zhǔn)。(另一個(gè)問題是在非參數(shù)模型之下,亦即在函數(shù)空間中如何確定先驗(yàn)分布。早在20世紀(jì)70年代有人作過嘗試,引進(jìn)狄利希萊分布去定義非參數(shù)先驗(yàn)分布,后來也沒有值得注意的進(jìn)一步發(fā)展。這個(gè)問題無疑是一個(gè)富有挑戰(zhàn)性的困難問題。 從廣義的意義說,費(fèi)歇爾在1930年提出的“信任推斷”可納入貝葉斯學(xué)派的體系內(nèi)。費(fèi)歇爾一貫不贊成先驗(yàn)分布的提法,但卻接受了貝葉斯學(xué)派的核心思想——由樣本產(chǎn)生一個(gè)關(guān)于參數(shù)的分布,這在貝葉斯學(xué)派中稱為后驗(yàn)分布。費(fèi)歇爾提出“信任推斷”的客觀效果等同于一種不要先驗(yàn)分布的貝葉斯統(tǒng)計(jì)。由于一些內(nèi)在的困難,幾十年以來沿著這個(gè)方向沒有取得多少進(jìn)展,不少統(tǒng)計(jì)學(xué)家把費(fèi)歇爾的主張看作他諸多成就之下的一個(gè)引人注目的失敗。不過仍有少數(shù)學(xué)者,如費(fèi)雷塞,堅(jiān)持在這個(gè)領(lǐng)域工作。最近關(guān)于這個(gè)問題的興趣有復(fù)活的趨勢。有人甚至預(yù)言,費(fèi)歇爾在20世紀(jì)提出的這個(gè)倍受冷落的概念,很可能在21世紀(jì)開花結(jié)果。 以上所論的是一些屬于大的趨勢方面的問題。至于更具體領(lǐng)域中可能的進(jìn)展,也有學(xué)者討論。如模型選擇,基于似然函數(shù)和條件推斷的結(jié)構(gòu);離散和非線性多元分析;不完全數(shù)據(jù)分析;(廣義的)經(jīng)驗(yàn)貝葉斯方法;定性、不回答和缺落數(shù)據(jù)的處理等。因篇幅關(guān)系均不一一細(xì)論。筆者總的看法是:雖則20世紀(jì)末統(tǒng)計(jì)學(xué)發(fā)展的態(tài)勢確有某種與世紀(jì)初相似的地方,但仍有著根本的不同。這種不同表現(xiàn)在世紀(jì)初時(shí)數(shù)理統(tǒng)計(jì)學(xué)的學(xué)科框架尚未建立,而目前已在相對成熟階段上走了相當(dāng)一段距離。局部性的重要成就時(shí)有發(fā)生,而全局性的甚至根本改變本學(xué)科面貌的那種突破,在可預(yù)見的將來不大可能發(fā)生:“21世紀(jì)的費(fèi)歇爾”產(chǎn)生的時(shí)機(jī)還未到來。 熱門圖文推薦 1、頤和園經(jīng)濟(jì)計(jì)量學(xué)講習(xí)班:中國計(jì)量經(jīng)濟(jì)學(xué)家的掃盲班 3、現(xiàn)代經(jīng)濟(jì)學(xué)的十個(gè)理解誤區(qū) 4、計(jì)量經(jīng)濟(jì)學(xué)模型對數(shù)據(jù)的依賴性 5、發(fā)表超過1450篇論文的怪才——“論文合作之王” 6、量化歷史研究告訴我們什么?人類歷史中其實(shí)只發(fā)生了一件事? 7、如何才能講好《計(jì)量經(jīng)濟(jì)學(xué)》課程 9、洪永淼等:計(jì)量經(jīng)濟(jì)學(xué)與實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的若干新近發(fā)展及展望
計(jì)量經(jīng)濟(jì)學(xué)服務(wù)中心 |
|