一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

正態(tài)分布的前世今生(2)

 QuanLiRen2016 2016-03-20


出自統(tǒng)計(jì)之都

原文地址:http:///2013/01/story-of-normal-distribution-1/


更多正態(tài)分布的介紹,參見正態(tài)分布的前世今生(1)。

四、眾里尋她千百度,誤差分布曲線的確立



第三個(gè)故事有點(diǎn)長(zhǎng),主角是高斯和拉普拉斯,故事的主要內(nèi)容尋找隨機(jī)誤差分布的規(guī)律。

天文學(xué)是第一個(gè)被測(cè)量誤差困擾的學(xué)科,從古代至十八世紀(jì)天文學(xué)一直是應(yīng)用數(shù)學(xué)最發(fā)達(dá)的領(lǐng)域,到十八世紀(jì),天文學(xué)的發(fā)展積累了大量的天文學(xué)數(shù)據(jù)需要分析計(jì)算,應(yīng)該如何來(lái)處理數(shù)據(jù)中的觀測(cè)誤差成為一個(gè)很棘手的問題。我們?cè)跀?shù)據(jù)處理中經(jīng)常使用平均的常識(shí)性法則,千百年來(lái)的數(shù)據(jù)使用經(jīng)驗(yàn)說(shuō)明算術(shù)平均能夠消除誤差,提高精度。平均有如此的魅力,道理何在,之前沒有人做過理論上的證明。算術(shù)平均的合理性問題在天文學(xué)的數(shù)據(jù)分析工作中被提出來(lái)討論:測(cè)量中的隨機(jī)誤差服應(yīng)該服從怎樣的概率分布?算術(shù)平均的優(yōu)良性和誤差的分布有怎樣的密切聯(lián)系?

伽利略在他著名的《關(guān)于兩個(gè)主要世界系統(tǒng)的對(duì)話》中,對(duì)誤差的分布做過一些定性的描述,主要包括:

·        誤差是對(duì)稱分布的;

·        大的誤差出現(xiàn)頻率低,小的誤差出現(xiàn)頻率高。


用數(shù)學(xué)的語(yǔ)言描述,也就是說(shuō)誤差分布函數(shù)f(x)關(guān)于0對(duì)稱分布,概率密度隨|x|增加而減小,這兩個(gè)定性的描述都很符合常識(shí)。

許多天文學(xué)家和數(shù)學(xué)家開始了尋找誤差分布曲線的嘗試。托馬斯·辛普森(Thomas Simpson,1710-1761)先走出了有意義的一步。設(shè)真值為θ,而x1,,xnn次測(cè)量值,每次測(cè)量的誤差為ei=xiθ,若用算術(shù)平均xˉ=(ni=1xi)/n去估計(jì)θ,其誤差為eˉ=(ni=1ei)/n。Simpson證明了,對(duì)于如下的一個(gè)概率分布,


Simpson的誤差態(tài)分布曲線】

有下面的估計(jì):

P(|eˉ|x)P(|e1|x)


也就是說(shuō),|eˉ|相比于|e1|取小值的機(jī)會(huì)更大。辛普森的這個(gè)工作很粗糙,但是這是第一次在一個(gè)特定情況下,從概率論的角度嚴(yán)格證明了算術(shù)平均的優(yōu)良性。

1772-1774年間,拉普拉斯也加入到了尋找誤差分布函數(shù)的隊(duì)伍中。拉普拉斯假定誤差分布函數(shù)f(x)滿足如下性質(zhì)

f(x)=mf(x).

由此最終求得的分布函數(shù)為

f(x)=m2em|x|

這個(gè)概率密度函數(shù)現(xiàn)在被稱為拉普拉斯分布。


Laplace的誤差態(tài)分布曲線】

以這個(gè)函數(shù)作為誤差分布,拉普拉斯開始考慮如何基于測(cè)量的結(jié)果去估計(jì)未知參數(shù)的值。拉普拉斯可以算是一個(gè)貝葉斯主義者,他的參數(shù)估計(jì)的原則和現(xiàn)代貝葉斯方法非常相似:假設(shè)先驗(yàn)分布是均勻的,計(jì)算出參數(shù)的后驗(yàn)分布后,取后驗(yàn)分布的中值點(diǎn),即1/2分位點(diǎn),作為參數(shù)估計(jì)值??墒腔谶@個(gè)誤差分布函數(shù)做了一些計(jì)算之后,拉普拉斯發(fā)現(xiàn)計(jì)算過于復(fù)雜,最終沒能給出什么有用的結(jié)果。

拉普拉斯可是概率論的大牛,寫過兩本極有影響力的《概率分析理論》,不過以我的數(shù)學(xué)審美,實(shí)在無(wú)法理解拉普拉斯這樣的大牛怎么找了一個(gè)零點(diǎn)不可導(dǎo)的誤差的分布函數(shù),拉普拉斯最終還是沒能搞定誤差分布的問題。

現(xiàn)在輪到高斯登場(chǎng)了,高斯在數(shù)學(xué)史中的地位極高,號(hào)稱數(shù)學(xué)史上的狐貍,數(shù)學(xué)家阿貝爾對(duì)他的評(píng)論是“他像狐貍一樣,用其尾巴把其在沙灘上的蹤跡清除掉”(He is like the fox, who effaces histracks in the sand with his tail.)我們的數(shù)學(xué)大師陳省身把黎曼和龐加萊(Henri Poincaré)稱為數(shù)學(xué)家中的菩薩,而稱自己為羅漢;高斯是黎曼的導(dǎo)師,數(shù)學(xué)圈里有些教授把高斯稱為數(shù)學(xué)家中的佛。在數(shù)學(xué)家中既能仰望理論數(shù)學(xué)的星空,又能腳踏應(yīng)用數(shù)學(xué)的實(shí)地的可不多見,高斯是數(shù)學(xué)家中少有的頂“天”立“地”的人物,他既對(duì)純理論數(shù)學(xué)有深刻的洞察力,又極其重視數(shù)學(xué)在實(shí)踐中的應(yīng)用。在誤差分布的處理中,高斯以極其簡(jiǎn)單的手法確立了隨機(jī)誤差的概率分布,其結(jié)果成為數(shù)理統(tǒng)計(jì)發(fā)展史上的一塊里程碑。

高斯的介入首先要從天文學(xué)界的一個(gè)事件說(shuō)起。18011月,天文學(xué)家Giuseppe Piazzi發(fā)現(xiàn)了一顆從未見過的光度8等的星在移動(dòng),這顆現(xiàn)在被稱作谷神星(Ceres)的小行星在夜空中出現(xiàn)6個(gè)星期,掃過八度角后在就在太陽(yáng)的光芒下沒了蹤影,無(wú)法觀測(cè)。而留下的觀測(cè)數(shù)據(jù)有限,難以計(jì)算出他的軌道,天文學(xué)家也因此無(wú)法確定這顆新星是彗星還是行星,這個(gè)問題很快成了學(xué)術(shù)界關(guān)注的焦點(diǎn)。高斯當(dāng)時(shí)已經(jīng)是很有名望的年輕數(shù)學(xué)家了,這個(gè)問題也引起了他的興趣。高斯以其卓越的數(shù)學(xué)才能創(chuàng)立了一種嶄新的行星軌道的計(jì)算方法,一個(gè)小時(shí)之內(nèi)就計(jì)算出了行星的軌道,并預(yù)言了它在夜空中出現(xiàn)的時(shí)間和位置。18011231日夜,德國(guó)天文愛好者奧伯斯(Heinrich Olbers)在高斯預(yù)言的時(shí)間里,用望遠(yuǎn)鏡對(duì)準(zhǔn)了這片天空。果然不出所料,谷神星出現(xiàn)了!

高斯為此名聲大震,但是高斯當(dāng)時(shí)拒絕透露計(jì)算軌道的方法,原因可能是高斯認(rèn)為自己的方法的理論基礎(chǔ)還不夠成熟,而高斯一向治學(xué)嚴(yán)謹(jǐn)、精益求精,不輕易發(fā)表沒有思考成熟的理論。直到1809年高斯系統(tǒng)地完善了相關(guān)的數(shù)學(xué)理論后,才將他的方法公布于眾,而其中使用的數(shù)據(jù)分析方法,就是以正態(tài)誤差分布為基礎(chǔ)的最小二乘法。那高斯是如何推導(dǎo)出誤差分布為正態(tài)分布的?讓我們看看高斯是如何猜測(cè)上帝的意圖的。

設(shè)真值為θ,而x1,,xnn次獨(dú)立測(cè)量值,每次測(cè)量的誤差為ei=xiθ,假設(shè)誤差ei的密度函數(shù)為f(e),則測(cè)量值的聯(lián)合概率為n個(gè)誤差的聯(lián)合概率,記為

L(θ)=L(θ;x1,,xn)=f(e1)f(en)=f(x1θ)f(xnθ).                       (4)

但是高斯不采用貝葉斯的推理方式,而是直接取L(θ)達(dá)到最大值的θ^=θ^(x1,,xn)作為θ的估計(jì)值,即

θ^=argmaxθL(θ).

現(xiàn)在我們把L(θ)稱為樣本的似然函數(shù),而得到的估計(jì)值θ^稱為極大似然估計(jì)。高斯首次給出了極大似然的思想,這個(gè)思想后來(lái)被統(tǒng)計(jì)學(xué)家R.A.Fisher系統(tǒng)地發(fā)展成為參數(shù)估計(jì)中的極大似然估計(jì)理論。

高斯接下來(lái)的想法特別牛,他開始揣度上帝的意圖,而這充分體現(xiàn)了高斯的數(shù)學(xué)天才。他把整個(gè)問題的思考模式倒過來(lái):既然千百年來(lái)大家都認(rèn)為算術(shù)平均是一個(gè)好的估計(jì),那我就認(rèn)為極大似然估計(jì)導(dǎo)出的就應(yīng)該是算術(shù)平均!所以高斯猜測(cè)上帝在創(chuàng)世紀(jì)中的旨意就是:

誤差分布導(dǎo)出的極大似然估計(jì) = 算術(shù)平均值.


然后高斯去找誤差密度函數(shù)f以迎合這一點(diǎn)。即尋找這樣的概率分布函數(shù)f,使得極大似然估計(jì)正好是算術(shù)平均θ^=xˉ。通過應(yīng)用數(shù)學(xué)技巧求解這個(gè)函數(shù)f,高斯證明(證明不難,后續(xù)給出)了所有的概率密度函數(shù)中,唯一滿足這個(gè)性質(zhì)的就是

f(x)=12πσexp(x22σ2).

瞧,正態(tài)分布的密度函數(shù)N(0,σ2)被高斯他老人家給解出來(lái)了!

進(jìn)一步,高斯基于這個(gè)誤差分布函數(shù)對(duì)最小二乘法給出了一個(gè)很漂亮的解釋。對(duì)于最小二乘公式中涉及的每個(gè)誤差ei(見前面的公式(3),eiN(0,σ2),(e1,,en)的聯(lián)合概率分布為

(e1,,en)1(2πσ)nexp(12σ2i=1ne2i).

要使得這個(gè)概率最大,必須使得ni=1e2i取最小值,這正好就是最小二乘法的要求。

高斯所拓展的最小二乘法成為了十九世紀(jì)統(tǒng)計(jì)學(xué)的最重要成就,它在十九世紀(jì)統(tǒng)計(jì)學(xué)的重要性就相當(dāng)于十八世紀(jì)的微積分之于數(shù)學(xué)。而勒讓德和高斯的最小二乘發(fā)明權(quán)之爭(zhēng),成了數(shù)學(xué)史上僅次于牛頓、萊布尼茨微積分發(fā)明權(quán)的爭(zhēng)端。相比于勒讓德1805給出的最小二乘法描述,高斯基于誤差正態(tài)分布的最小二乘理論顯然更高一籌,高斯的工作中既提出了極大似然估計(jì)的思想,又解決了誤差的概率密度分布的問題,由此我們可以對(duì)誤差大小的影響進(jìn)行統(tǒng)計(jì)度量了。高斯的這項(xiàng)工作對(duì)后世的影響極大,而正態(tài)分布也因此被冠名高斯分布。估計(jì)高斯本人當(dāng)時(shí)是完全沒有意識(shí)到他的這個(gè)工作給現(xiàn)代數(shù)理統(tǒng)計(jì)學(xué)帶來(lái)的深刻影響。高斯在數(shù)學(xué)上的貢獻(xiàn)特多,去世前他要求給自己的墓碑上雕刻上正十七邊形,以說(shuō)明他在正十七邊形尺規(guī)作圖上的杰出工作。而后世的德國(guó)鈔票和鋼镚上是以正態(tài)密度曲線來(lái)紀(jì)念高斯,這足以說(shuō)明高斯的這項(xiàng)工作在當(dāng)代科學(xué)發(fā)展中的份量。

十七、十八世紀(jì)科學(xué)界流行的做法,是盡可能從某種簡(jiǎn)單明了的準(zhǔn)則(firstprinciple)出發(fā)進(jìn)行邏輯推導(dǎo)。高斯設(shè)定了準(zhǔn)則“最大似然估計(jì)應(yīng)該導(dǎo)出優(yōu)良的算術(shù)平均”,并導(dǎo)出了誤差服從正態(tài)分布,推導(dǎo)的形式上非常簡(jiǎn)潔優(yōu)美。但是高斯給的準(zhǔn)則在邏輯上并不足以讓人完全信服,因?yàn)樗阈g(shù)平均的優(yōu)良性當(dāng)時(shí)更多的是一個(gè)經(jīng)驗(yàn)直覺,缺乏嚴(yán)格的理論支持。高斯的推導(dǎo)存在循環(huán)論證的味道:因?yàn)樗阈g(shù)平均是優(yōu)良的,推出誤差必須服從正態(tài)分布;反過來(lái),又基于正態(tài)分布推導(dǎo)出最小二乘和算術(shù)平均,來(lái)說(shuō)明最小二乘法和算術(shù)平均的優(yōu)良性。這陷入了一個(gè)雞生蛋蛋生雞的怪圈,邏輯上算術(shù)平均的優(yōu)良性到底有沒有自行成立的理由呢?

高斯的文章發(fā)表之后,拉普拉斯很快得知了高斯的工作。拉普拉斯看到,正態(tài)分布既可以從拋鋼镚產(chǎn)生的序列求和中生成出來(lái),又可以被優(yōu)雅地作為誤差分布定律,這難道是偶然現(xiàn)象?拉普拉斯不愧為概率論的大牛,他馬上將誤差的正態(tài)分布理論和中心極限定理聯(lián)系起來(lái),提出了元誤差解釋。他指出如果誤差可以看成許多微小量的疊加,則根據(jù)他的中心極限定理,隨機(jī)誤差理所當(dāng)然是高斯分布。而20世紀(jì)中心極限定理的進(jìn)一步發(fā)展,也給這個(gè)解釋提供了更多的理論支持。因此有了這個(gè)解釋為出發(fā)點(diǎn),高斯的循環(huán)論證的圈子就可以打破。估計(jì)拉普拉斯悟出這個(gè)結(jié)論之后一定想撞墻,自己辛辛苦苦尋尋覓覓了這么久的誤差分布曲線就在自己的眼皮底下,自己卻長(zhǎng)年來(lái)視而不見,被高斯給占了先機(jī)。

至此,誤差分布曲線的尋找塵埃落定,正態(tài)分布在誤差分析中確立了自己的地位,并在整個(gè)19世紀(jì)不斷地開疆?dāng)U土,直至在統(tǒng)計(jì)學(xué)中鶴立雞群,傲世其它一切概率分布;而高斯和拉普拉斯的工作,為現(xiàn)代統(tǒng)計(jì)學(xué)的發(fā)展開啟了一扇大門。

在整個(gè)正態(tài)分布被發(fā)現(xiàn)與應(yīng)用的歷史中,棣莫弗、拉普拉斯、高斯各有貢獻(xiàn),拉普拉斯從中心極限定理的角度解釋它,高斯把它應(yīng)用在誤差分析中,殊途同歸。正態(tài)分布被人們發(fā)現(xiàn)有這么好的性質(zhì),各國(guó)人民都爭(zhēng)搶它的冠名權(quán)。因?yàn)槔绽故欠▏?guó)人,所以當(dāng)時(shí)在法國(guó)被稱為拉普拉斯分布;而高斯是德國(guó)人,所以在德國(guó)叫做高斯分布;中立國(guó)的人稱它為拉普拉斯-高斯分布。后來(lái)法國(guó)的大數(shù)學(xué)家龐加萊建議改用正態(tài)分布這一中立名稱,而隨后統(tǒng)計(jì)學(xué)家卡爾·皮爾森使得這個(gè)名稱被廣泛接受:

Manyyears ago I called the Laplace-Gaussian curve the normal curve, which name,while it avoids an international question of priority, has the disadvantage ofleading people to believe that all other distributions of frequency are in onesense or another 'abnormal'.

-KarlPearson(1920)

不過因?yàn)楦咚乖跀?shù)學(xué)家中的名氣實(shí)在是太大,正態(tài)分布的桂冠還是更多的被戴在了高斯的腦門上,目前數(shù)學(xué)界通行的用語(yǔ)是正態(tài)分布、高斯分布,兩者并用。

正態(tài)分布在高斯的推動(dòng)下,迅速在測(cè)量誤差分析中被廣泛使用,然而早期也僅限于測(cè)量誤差的分析中,其重要性遠(yuǎn)沒有被自然科學(xué)和社會(huì)科學(xué)領(lǐng)域中的學(xué)者們所認(rèn)識(shí),那正態(tài)分布是如何從測(cè)量誤差分析的小溪,沖向自然科學(xué)和社會(huì)科學(xué)的汪洋大海的呢?

五、曲徑通幽處,禪房花木深

在介紹正態(tài)分布的后續(xù)發(fā)展之前,我們來(lái)多講一點(diǎn)數(shù)學(xué),也許有些人會(huì)覺得枯燥,不過高斯曾經(jīng)說(shuō)過:“數(shù)學(xué)是上帝的語(yǔ)言”。所以要想更加深入地理解正態(tài)分布的美,唯有通過上帝的語(yǔ)言。

造物主造物的準(zhǔn)則往往是簡(jiǎn)單明了的,只是在紛繁蕪雜的萬(wàn)物之中,我們要發(fā)現(xiàn)并領(lǐng)會(huì)它并非易事。之前提到過,十七、十八世紀(jì)科學(xué)界流行的做法,是盡可能從某種簡(jiǎn)單明了的準(zhǔn)則(first principle)出發(fā)作為科學(xué)探求的起點(diǎn);而后來(lái)的數(shù)學(xué)家和物理學(xué)家們的研究發(fā)現(xiàn),屢次從一些給定的簡(jiǎn)單的準(zhǔn)則出發(fā),我們總是被引領(lǐng)到了正態(tài)分布的家門口,這讓人感覺到正態(tài)分布的美妙。

達(dá)爾文的表弟高爾頓是生物學(xué)家兼統(tǒng)計(jì)學(xué)家,他對(duì)正態(tài)分布非常的推崇與贊美:“我?guī)缀醪辉娺^像誤差呈正態(tài)分布這么激發(fā)人們無(wú)窮想象的宇宙秩序”。當(dāng)代兩位偉大的概率學(xué)家LevyKac都曾經(jīng)說(shuō)過,正態(tài)分布是他們切入概率論的初戀情人,具有無(wú)窮的魅力。如果古希臘人知道正態(tài)分布,想必奧林匹斯山的神殿里會(huì)多出一個(gè)正態(tài)女神,由她來(lái)掌管世間的混沌。

要拉下正態(tài)分布的神秘面紗展現(xiàn)她的美麗,需要高深的概率論知識(shí),本人在數(shù)學(xué)方面知識(shí)淺薄,不能勝任。只能在極為有限的范圍內(nèi)嘗試掀開她的面紗的一角。棣莫弗和拉普拉斯以拋鋼镚的序列求和為出發(fā)點(diǎn),沿著一條小徑第一次把我們領(lǐng)到了正態(tài)分布的家門口,這條路叫做中心極限定理。而這條路上風(fēng)景秀麗,許多概率學(xué)家都為之傾倒。這條路在20世紀(jì)被概率學(xué)家門越拓越寬,成為了通往正態(tài)曲線的一條康莊大道。而數(shù)學(xué)家和物理學(xué)家們發(fā)現(xiàn):條條小路通正態(tài)。著名的物理學(xué)家E.T.Jaynes在他的名著《Probability Theory:the Logic of Science(中文譯書《概率論沉思錄》)中,描繪了四條通往正態(tài)分布的小徑;曲徑通幽處,禪房花木深,讓我們一起來(lái)欣賞一下四條小徑上的風(fēng)景吧。

1. 高斯的推導(dǎo)(1809)

第一條小徑是高斯找到的,高斯以如下準(zhǔn)則作為小徑的出發(fā)點(diǎn)

誤差分布導(dǎo)出的極大似然估計(jì) = 算術(shù)平均值

設(shè)真值為θ,而x1,,xnn次獨(dú)立測(cè)量值,每次測(cè)量的誤差為ei=xiθ,假設(shè)誤差ei的密度函數(shù)為f(e),則測(cè)量值的聯(lián)合概率為n個(gè)誤差的聯(lián)合概率,記為

L(θ)=L(θ;x1,,xn)=f(e1)f(en)=f(x1θ)f(xnθ)                       (5)

為求極大似然估計(jì),令

dlogL(θ)dθ=0.

整理后可以得到

i=1nf(xiθ)f(xiθ)=0.

g(x)=f(x)/f(x),由上式可以得到

i=1ng(xiθ)=0.

由于高斯假設(shè)極大似然估計(jì)的解就是算術(shù)平均xˉ,把解帶入上式,可以得到

                      i=1ng(xixˉ)=0.                                            (6)

在上式中取n=2,有

g(x1xˉ)+g(x2xˉ)=0.

由于此時(shí)有x1xˉ=(x2xˉ),并且x1,x2是任意的,由此得到:g(x)=g(x).再在(6)式中取n=m+1,并且要求x1==xm=x,且xm+1=mx,則有xˉ=0,并且

i=1ng(xixˉ)=mg(x)+g(mx).

所以得到g(mx)=mg(x).而滿足上式的唯一的連續(xù)函數(shù)就是g(x)=cx,從而進(jìn)一步可以求解出

f(x)=Mecx2.

由于f(x)是概率分布函數(shù),把f(x)正規(guī)化一下就得到正態(tài)分布密度函數(shù)N(0,σ2).

2. Herschel(1850)和麥克斯韋(1860)的推導(dǎo)

第二條小徑是天文學(xué)家John Hershcel和物理學(xué)家麥克斯韋(Maxwell)發(fā)現(xiàn)的。1850年,天文學(xué)家Herschel在對(duì)星星的位置進(jìn)行測(cè)量的時(shí)候,需要考慮二維的誤差分布,為了推導(dǎo)這個(gè)誤差的概率密度分布f(x,y),Herschel設(shè)置了兩個(gè)準(zhǔn)則:

·        x軸和y軸的誤差是相互獨(dú)立的,即誤差的概率在正交的方向上相互獨(dú)立;

·        誤差的概率分布在空間上具有旋轉(zhuǎn)對(duì)稱性,即誤差的概率分布和角度沒有關(guān)系。

這兩個(gè)準(zhǔn)則對(duì)于Herschel考慮的實(shí)際測(cè)量問題看起來(lái)都很合理。由準(zhǔn)則1,可以得到f(x,y)應(yīng)該具有如下形式

f(x,y)=f(x)f(y).

把這個(gè)函數(shù)轉(zhuǎn)換為極坐標(biāo),在極坐標(biāo)下的概率密度函數(shù)設(shè)為g(r,θ),有

f(x,y)=f(rcosθ,rsinθ)=g(r,θ)

由準(zhǔn)則2,g(r,θ)具有旋轉(zhuǎn)對(duì)稱性,也就是應(yīng)該和θ無(wú)關(guān),所以g(r,θ)=g(r),綜合以上,我們可以得到

f(x)f(y)=g(r)=g(x2+y2).

y=0,得到g(x)=f(x)f(0),所以上式可以轉(zhuǎn)換為

log[f(x)f(0)]+log[f(y)f(0)]=log[f(x2+y2)f(0)].

log(f(x)/f(0))=h(x),則有

h(x)+h(y)=h(x2+y2).

從這個(gè)函數(shù)方程中可以解出h(x)=ax2,從而可以得到f(x)的一般形式如下

f(x)=απeαx2

f(x)就是正態(tài)分布N(0,1/2α),而f(x,y)就是標(biāo)準(zhǔn)二維正態(tài)分布函數(shù)。

f(x,y)=απexp(α(x2+y2)).

1860年,我們偉大的物理學(xué)家麥克斯韋在考慮氣體分子的運(yùn)動(dòng)速度分布的時(shí)候,在三維空間中基于類似的準(zhǔn)則推導(dǎo)出了氣體分子運(yùn)動(dòng)的分布是正態(tài)分布ρ(vx,vy,vz)exp(α(v2x+v2y+v2z))。這就是著名的麥克斯韋分子速率分布定律。大家還記得我們?cè)谄胀ㄎ锢碇袑W(xué)過的麥克斯韋-波爾茲曼氣體速率分布定律嗎?

             F(v)==(m2πkT)3/2exp(mv22kT)(m2πkT)1/2exp(mv2x2kT)(m2πkT)1/2exp(mv2y2kT)(m2πkT)1/2exp(mv2z2kT)                   (7)

所以這個(gè)分布其實(shí)是三個(gè)正態(tài)分布的乘積。你的物理老師是否告訴過你其實(shí)這個(gè)分布就是三維正態(tài)分布?反正我是一直不知道,直到今年才明白。

Herschel-Maxwell推導(dǎo)的神妙之處在于,沒有利用任何概率論的知識(shí),只是基于空間幾何的不變性,就推導(dǎo)出了正態(tài)分布。美國(guó)諾貝爾物理學(xué)獎(jiǎng)得主費(fèi)曼(Feymann)每次看到一個(gè)有π的數(shù)學(xué)公式的時(shí)候,就會(huì)問:圓在哪里?這個(gè)推導(dǎo)中使用到了x2+y2,也就是告訴我們正態(tài)分布密度公式中有個(gè)π,其根源來(lái)在于二維正態(tài)分布中的等高線恰好是個(gè)圓。

3. Landon的推導(dǎo)(1941)

第三條道是一位電氣工程師,Vernon D. Landon 給出的。1941年,Landon 研究通信電路中的噪聲電壓,通過分析經(jīng)驗(yàn)數(shù)據(jù)他發(fā)現(xiàn)噪聲電壓的分布模式很相似,不同的是分布的層級(jí),而這個(gè)層級(jí)可以使用方差σ2來(lái)刻畫。因此他推理認(rèn)為噪聲電壓的分布函數(shù)形式是p(x;σ2)?,F(xiàn)在假設(shè)有一個(gè)相對(duì)于σ而言很微小的誤差擾動(dòng)e,且e的分布函數(shù)是q(e),那么新的噪聲電壓是x=x+e。Landon提出了如下的準(zhǔn)則

·        隨機(jī)噪聲具有穩(wěn)定的分布模式

·        累加一個(gè)微小的隨機(jī)噪聲,不改變其穩(wěn)定的分布模式,只改變分布的層級(jí)(用方差度量)

用數(shù)學(xué)的語(yǔ)言描述:如果

xp(x;σ2),  eq(e),  x=x+e,

則有xp(x;σ2+var(e)).現(xiàn)在我們來(lái)推導(dǎo)函數(shù)p(x;σ2)應(yīng)該長(zhǎng)成啥樣。按照兩個(gè)隨機(jī)變量和的分布的計(jì)算方式,x的分布函數(shù)將是x的分布函數(shù)和e的分布函數(shù)的卷積,即有

f(x)=p(xe;σ2)q(e)de.

p(xe;σ2)x處做泰勒級(jí)數(shù)展開(為了方便,展開后把自變量由x替換為x),上式可以展開為

f(x)=p(x;σ2)p(x;σ2)xeq(e)de+122p(x;σ2)x2e2q(e)de+

p=p(x;σ2),則有

f(x)=ppxeˉ+122px2e2ˉ+o(e2ˉ)

對(duì)于微小的隨機(jī)擾動(dòng)e,我們認(rèn)為他取正值或者負(fù)值是對(duì)稱的,所以eˉ=0。所以有

f(x)=p+122px2e2ˉ+o(e2ˉ)                                          (8)

對(duì)于新的噪聲電壓是x=x+e,方差由σ2增加為σ2+var(e)=σ2+e2ˉ,所以按照Landon的分布函數(shù)模式不變的假設(shè),新的噪聲電壓的分布函數(shù)應(yīng)該為f(x)=p(x;σ2+e2ˉ)。把p(x;σ2+e2ˉ)σ2處做泰勒級(jí)數(shù)展開,得到

f(x)=p+pσ2e2ˉ+o(e2ˉ).                                           (9)

比較(8)(9)這兩個(gè)式子,可以得到如下偏微分方程

122px2=pσ2.

而這個(gè)方程就是物理上著名的擴(kuò)散方程(diffusion equation),求解該方程就得到

p(x;σ2)=12πσexp(x22σ2)

又一次,我們推導(dǎo)出了正態(tài)分布!

E.T.Jaynes對(duì)于這個(gè)推導(dǎo)的評(píng)價(jià)很高,認(rèn)為Landon的推導(dǎo)本質(zhì)上給出了自然界的噪音形成的過程。他指出這個(gè)推導(dǎo)基本上就是中心極限定理的增量式版本,相比于中心極限定理來(lái)說(shuō),是一次性累加所有的因素,Landon的推導(dǎo)是每次在原有的分布上去累加一個(gè)微小的擾動(dòng)。而在這個(gè)推導(dǎo)中,我們看到,正態(tài)分布具有相當(dāng)好的穩(wěn)定性;只要數(shù)據(jù)中正態(tài)的模式已經(jīng)形成,他就容易繼續(xù)保持正態(tài)分布,無(wú)論外部累加的隨機(jī)噪聲q(e)是什么分布,正態(tài)分布就像一個(gè)黑洞一樣把這個(gè)累加噪聲吃掉。

4. 正態(tài)分布和最大熵

還有一條小徑是基于最大熵原理的,物理學(xué)家E.T.Jaynes在最大熵原理上有非常重要的貢獻(xiàn),他在《概率論沉思錄》里面對(duì)這個(gè)方法有描述和證明,沒有提到發(fā)現(xiàn)者,我不確認(rèn)這條道的發(fā)現(xiàn)者是否是Jaynes本人。

熵在物理學(xué)中由來(lái)已久,信息論的創(chuàng)始人香農(nóng)(Claude ElwoodShannon)把這個(gè)概念引入了信息論,讀者中很多人可能都知道目前機(jī)器學(xué)習(xí)中有一個(gè)非常好用的分類算法叫最大熵分類器。要想把熵和最大熵的來(lái)龍去脈說(shuō)清楚可不容易,不過這條道的風(fēng)景是相當(dāng)獨(dú)特的,E.T.Jaynes對(duì)這條道也是偏愛有加。

對(duì)于一個(gè)概率分布p(x),我們定義它的熵為

H(p)=p(e)logp(e)de.

如果給定一個(gè)分布函數(shù)p(x)的均值μ和方差σ2(給定均值和方差這個(gè)條件,也可以描述為給定一階原點(diǎn)矩和二階原點(diǎn)矩,這兩個(gè)條件是等價(jià)的)則在所有滿足這兩個(gè)限制的概率分布中,熵最大的概率分布p(x|μ,σ2)就是正態(tài)分布N(μ,σ2)。

這個(gè)結(jié)論的推導(dǎo)數(shù)學(xué)上稍微有點(diǎn)復(fù)雜,不過如果已經(jīng)猜到了給定限制條件下最大熵的分布是正態(tài)分布,要證明這個(gè)猜測(cè)卻是很簡(jiǎn)單的,證明的思路如下。

考慮兩個(gè)概率分布p(x)q(x),使用不等式logxx1,

p(x)logq(x)p(x)dx≤∫p(x)(q(x)p(x)1)dxbr/>=q(x)dxp(x)dx=0.

于是

p(x)logq(x)p(x)dx=p(x)1p(x)dx+p(x)logq(x)dx0;

所以

            H(p)≤?∫p(x)logq(x)dx                                          (10)

熟悉信息論的讀者都知道,這個(gè)式子是信息論中的很著名的結(jié)論:一個(gè)概率分布的熵總是小于相對(duì)熵。上式要取等號(hào)只有取q(x)=p(x)。

對(duì)于p(x),在給定的均值μ和方差σ2下,我們?nèi)?/span>q(x)=N(μ,σ2),則可以得到

H(p)==p(x)log(12πσexp((xμ)22σ2))dxp(x)((xμ)22σ2+log2πσ)dx                             (11)12σ2p(x)(xμ)2dx+log2πσ.

由于p(x)的均值方差有如下限制:p(x)(xμ)2dx=σ2,于是

H(p)12σ2σ2+log2πσ=12+log2πσ

而當(dāng)p(x)=N(μ,σ2)的時(shí)候,上式可以取到等號(hào),這就證明了結(jié)論。

E.T.Jaynes顯然對(duì)正態(tài)分布具有這樣的性質(zhì)極為贊賞,因?yàn)檫@從信息論的角度證明了正態(tài)分布的優(yōu)良性。而我們可以看到,正態(tài)分布熵的大小,取決于方差的大小。這也容易理解,因?yàn)檎龖B(tài)分布的均值和密度函數(shù)的形狀無(wú)關(guān),正態(tài)分布的形狀是由其方差決定的,而熵的大小反應(yīng)概率分布中的信息量,顯然和密度函數(shù)的形狀相關(guān)。

好的,風(fēng)景欣賞暫時(shí)告一段落。所謂橫看成嶺側(cè)成峰,遠(yuǎn)近高低各不同,正態(tài)分布給人們提供了多種欣賞角度和想象空間。法國(guó)菩薩級(jí)別的大數(shù)學(xué)家龐加萊對(duì)正態(tài)分布說(shuō)過一段有意思的話,引用來(lái)作為這個(gè)小節(jié)的結(jié)束:

Physicistsbelieve that the Gaussian law has been proved in mathematics whilemathematicians think that it was experimentally established in physics.

Henri Poincaré


    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    91插插插外国一区二区婷婷| 日本少妇中文字幕不卡视频 | 九七人妻一区二区三区| 欧美一级不卡视频在线观看| 亚洲精品福利视频你懂的| 暴力性生活在线免费视频| 91精品视频全国免费| 亚洲国产欧美久久精品| 国产精品视频第一第二区| 国产一区二区三区草莓av| 草草视频精品在线观看| 国产女性精品一区二区三区| 久久精品国产第一区二区三区| 日韩一级一片内射视频4k| 国产老熟女乱子人伦视频| 日韩不卡一区二区三区色图| 欧美精品亚洲精品日韩专区| 欧美亚洲另类久久久精品| 日韩精品一级一区二区| 极品少妇一区二区三区精品视频 | 老司机精品线观看86| 国产视频一区二区三区四区| 亚洲中文字幕高清乱码毛片| 国产伦精品一一区二区三区高清版 | 亚洲男人的天堂就去爱| 隔壁的日本人妻中文字幕版| 日韩精品综合免费视频| 激情五月天深爱丁香婷婷| 日韩国产亚洲欧美激情| 国产欧美一区二区色综合| 夜夜躁狠狠躁日日躁视频黑人| 日韩午夜老司机免费视频| 国内真实露脸偷拍视频| 欧美日韩国产综合特黄| 国产又黄又爽又粗视频在线| 99久久精品午夜一区| 中文字幕久热精品视频在线| 日韩欧美一区二区不卡看片| 亚洲精品中文字幕在线视频| 国语久精品在视频在线观看| 黄片免费观看一区二区|