神說(shuō),要有正態(tài)分布 于是便有了正態(tài)分布 正態(tài)分布(Normal distribution),相信各位模友都很熟悉,不過(guò),相對(duì)于課本直接將概念砸出來(lái),超模君更想跟大家談?wù)勥@些。。。 正態(tài)分布是最重要的一種概率分布,超模君今天也打算從早期的概率論說(shuō)起。 /前方高能,數(shù)位著名數(shù)學(xué)家輪番出場(chǎng)。/ 如何分賭金 早期概率論,永遠(yuǎn)離不開(kāi)賭場(chǎng)上的那些事,可以說(shuō)早期概率論的發(fā)展都是得益于當(dāng)時(shí)有點(diǎn)泛濫的賭博活動(dòng)。 那時(shí),惠更斯、帕斯卡、費(fèi)馬、雅各布·伯努利等這些早期概率論的奠基人,所研究的概率問(wèn)題基本都是來(lái)自于賭場(chǎng)。 最早的概率論問(wèn)題就是賭徒梅類(lèi)在1654年向帕斯卡提出的“如何分賭金”的問(wèn)題。
根據(jù)我們學(xué)過(guò)的概率論知識(shí),易知,甲獲勝就有兩種情況:①甲贏了第四局,比賽結(jié)束;②甲輸?shù)袅说谒木侄A了第五局。于是有,概率P(甲)=1/2+(1/2)*(1/2)=3/4。 而乙獲勝的情況就只有一種,同時(shí)贏下第四局和第五局,那么,概率P(乙)=(1/2)*(1/2)=1/4。 因此,這100法郎就應(yīng)該分給甲100*3/4=75法郎,分給乙100*1/4=25法郎。 這就是數(shù)學(xué)期望的雛形。 荷蘭物理學(xué)家、天文學(xué)家、數(shù)學(xué)家惠更斯: 不好意思,來(lái)客串一下 1657年,惠更斯發(fā)表了《論賭博中的計(jì)算》,在當(dāng)時(shí)還沒(méi)有完全明確的關(guān)于“概率”的概念的情況下,從一條“公平賭博值”的公理出發(fā),首次推導(dǎo)出3個(gè)關(guān)于“數(shù)學(xué)期望”的基本定理,具有劃時(shí)代的意義。
不過(guò),有點(diǎn)遺憾的是,惠更斯對(duì)概率論的討論僅僅局限在擲篩子等賭博活動(dòng)中,并沒(méi)有將其擴(kuò)展運(yùn)用到其他概率事件里。 瑞士數(shù)學(xué)家雅各布·伯努利: 沒(méi)錯(cuò),就是伯努利家族里最紅的那個(gè) 直到1713年,雅各布·伯努利的代表作《猜度術(shù)》終于出版(此時(shí),伯努利已經(jīng)去世有8年了)。 在《猜度術(shù)》中,伯努利不僅對(duì)惠更斯的關(guān)于賭博中出現(xiàn)各種情況的概率進(jìn)行了大量計(jì)算,還提出了著名的“大數(shù)定律”。
大數(shù)定律自誕生開(kāi)始,便產(chǎn)生了極其深遠(yuǎn)的影響,為后來(lái)的很多統(tǒng)計(jì)方法和理論的建立奠定了堅(jiān)實(shí)的基礎(chǔ)。 /模友:說(shuō)好的正態(tài)分布呢!正太在哪里了??/ /超模君:來(lái)了來(lái)了。。。/ 正態(tài)分布的發(fā)現(xiàn) 超模君說(shuō)了怎么多,正態(tài)分布的發(fā)現(xiàn)者終于表示受不了,要自己出場(chǎng)了。。。 他就是法國(guó)數(shù)學(xué)家棣莫弗。 棣莫弗:終于到我出場(chǎng)了 雖然伯努利得出了“無(wú)限地連續(xù)進(jìn)行試驗(yàn),我們終能正確地計(jì)算任何事物的概率,并從偶然現(xiàn)象之中看到事物的秩序”這樣的結(jié)論,但并沒(méi)有表述出這種偶然現(xiàn)象中的秩序,而棣莫弗便是第一個(gè)將這種秩序表述出來(lái)的人。 其實(shí),在伯努利《猜度術(shù)》出版之前,棣莫弗就對(duì)概率論進(jìn)行了廣泛且深入的研究,已于1711年在英國(guó)皇家學(xué)會(huì)的《哲學(xué)學(xué)報(bào)》上發(fā)表了《抽簽的測(cè)量》,這就是早期概率論史上三大著作之一的《機(jī)遇論》的前身。
不過(guò),比較搞笑的是,棣莫弗關(guān)于概率論的研究依然離不開(kāi)賭博問(wèn)題。。。 偶然的一天,一賭徒向棣莫弗提出了一個(gè)與賭博有關(guān)的問(wèn)題。
這是一個(gè)二項(xiàng)分布問(wèn)題,可知答案是2npqb(n,p,np),其中b(n,p,np)為二項(xiàng)概率。 不過(guò),這只是理論結(jié)果,而對(duì)于具體的n值(尤其是n值較大時(shí)),計(jì)算實(shí)際的期望值并不是一件容易的事,于是,棣莫弗決定找出一個(gè)更方便計(jì)算的近似公式。 只見(jiàn)棣莫弗直接令p=?,嘗試攻破這一特定概率的近似公式,就這樣幾年過(guò)去了,在1733年,終于取得了重要進(jìn)展。他結(jié)合斯特林公式,進(jìn)行了一系列研究,然后出現(xiàn)了神奇的一幕: 正態(tài)分布的概率密度函數(shù)就這樣出現(xiàn)了,由此可知,二項(xiàng)分布的極限分布就是正態(tài)分布。 當(dāng)時(shí),棣莫弗是瞥見(jiàn)了正態(tài)曲線(xiàn)的雛形的,而最后正態(tài)分布的主要功勞給了高斯(正態(tài)分布也稱(chēng)高斯分布),很大程度是因?yàn)?span>棣莫弗不是一個(gè)統(tǒng)計(jì)學(xué)家,他當(dāng)初的這項(xiàng)工作也沒(méi)有得到重視,他也從來(lái)沒(méi)有從統(tǒng)計(jì)學(xué)的角度上考慮過(guò)這個(gè)問(wèn)題。。。 不過(guò),棣莫弗雖然“無(wú)視”了正態(tài)分布(當(dāng)時(shí)也還沒(méi)叫正態(tài)分布),但這幾年的研究也不是沒(méi)有收獲,概率論中的“首席定理”——中心極限定理就是他首次提出的。 接著,拉普拉斯在他發(fā)表的《分析概率論》對(duì)棣莫弗的結(jié)論進(jìn)行了拓展(對(duì)于p≠?的情況的更多分析結(jié)果),人們稱(chēng)之為棣莫弗-拉普拉斯中心極限定理。
拉普拉斯:這里不可能沒(méi)有我。 1780年,拉普拉斯建立了中心極限定理的一般形式,隨后,中心極限定理又被其他數(shù)學(xué)家推廣到不限于二項(xiàng)分布的其他任意分布,再后來(lái),統(tǒng)計(jì)學(xué)家發(fā)現(xiàn),一系列的重要統(tǒng)計(jì)量,當(dāng)樣本量 N 趨于無(wú)窮時(shí), 其極限分布均有正態(tài)的形式。 作為概率論的大牛,拉普拉斯表示既然來(lái)了,就不會(huì)輕易退場(chǎng)。于是,他開(kāi)始搗鼓人們一直疑惑的隨機(jī)誤差(這在當(dāng)時(shí)需要處理大量測(cè)量數(shù)據(jù)的天文學(xué)界是一個(gè)很棘手的問(wèn)題)。 遺憾的是,研究了好幾年,拉普拉斯仍然沒(méi)法搞定誤差分布的問(wèn)題,盡管他已經(jīng)假定了誤差分布函數(shù),但由于計(jì)算過(guò)于復(fù)雜只好放棄。 拉普拉斯誤差分布曲線(xiàn) 這時(shí),終極大佬高斯姍姍來(lái)遲,大手一揮便解決了這個(gè)問(wèn)題。。。。 高斯:不好意思,我來(lái)晚了。 也許他天才的直覺(jué)準(zhǔn)得有點(diǎn)過(guò)分了,正當(dāng)別人費(fèi)盡腦筋都想不出的時(shí)候,高斯有點(diǎn)雞賊地選擇將問(wèn)題反過(guò)來(lái)想。 只見(jiàn)高斯提出了極大似然估計(jì)的思想,并猜想人們公認(rèn)的“算術(shù)平均是不會(huì)錯(cuò)的估計(jì)”等價(jià)于對(duì)真值的極大似然估計(jì),然后反過(guò)來(lái)尋找怎樣的誤差分布能使這一猜想成立。 與常人顛倒的思路竟然讓高斯一路暢通無(wú)阻,很快,他便證明了在所有的概率密度函數(shù)中,使得猜想成立的只有以下一種情況: 正態(tài)分布密度函數(shù)就這樣被高斯推出來(lái)了,與此同時(shí),高斯根據(jù)他的正態(tài)誤差理論,確立了最小二乘法的概念。 有了高斯的認(rèn)證,正態(tài)分布迅速活躍在誤差分析中,人們可以輕松對(duì)誤差大小的影響進(jìn)行統(tǒng)計(jì)度量,由于高斯的這幾項(xiàng)關(guān)鍵性工作,人們將正態(tài)分布命名為“高斯分布”。 正態(tài)分布的完善 雖然說(shuō),要成為一個(gè)好的數(shù)學(xué)家,你首先必須得是一個(gè)好的猜想家。盡管高斯得出的結(jié)論是正確的,但當(dāng)初推導(dǎo)的思路確實(shí)有點(diǎn)“雞生蛋,蛋生雞”的嫌疑。(人們都說(shuō)高斯是接受了神的旨意。) 于是,正態(tài)分布的理論完善就交給了其他數(shù)學(xué)家。 拉普拉斯看到了高斯發(fā)表的理論之后,驚奇地發(fā)現(xiàn)這個(gè)密度函數(shù)分明在自己之前的研究里出現(xiàn)過(guò),并且認(rèn)定這肯定不是巧合! 拉普拉斯馬上將自己的中心極限定理與正態(tài)分布理論聯(lián)系起來(lái):如果將誤差看成許多的微小量(稱(chēng)為“元誤差”)疊加的總和,根據(jù)中心極限定理,隨機(jī)誤差便服從正態(tài)分布。 隨著中心極限定理的不斷完善,高斯的結(jié)論也得到了越來(lái)越多的理論支持,正態(tài)分布逐漸在誤差分析中確立了地位,稱(chēng)霸于其他一切概率分布。 正態(tài)誤差態(tài)分布律 而關(guān)于它的命名,自它火了之后,各國(guó)人民都爭(zhēng)先恐后幫它起名字:由于拉普拉斯是法國(guó)人,于是,法國(guó)人民稱(chēng)之為“拉普拉斯分布”;高斯是德國(guó)人,當(dāng)時(shí)德國(guó)就喜歡叫它“高斯分布”;其他國(guó)家的人們呢,嗯,不知道站哪邊,便直接叫它“拉普拉斯-高斯分布”。 俺明明叫正太! 正當(dāng)人們吵得不可開(kāi)交的時(shí)候,龐加萊站了出來(lái),他建議改用正態(tài)分布這一中立名稱(chēng),后來(lái),統(tǒng)計(jì)學(xué)家卡爾·皮爾森也說(shuō)了一句公道話(huà),使得人們接受了正態(tài)分布這個(gè)名字:
不過(guò),高斯的名氣實(shí)在太大了,高斯分布的名字并不是想去掉就去掉的,因此,現(xiàn)在數(shù)學(xué)界正太分布、高斯分布兩個(gè)名字通用。 最后,超模君只想感嘆一下,高斯的力量一如既往的強(qiáng)??! |
|
來(lái)自: 長(zhǎng)沙7喜 > 《科學(xué)》