重磅干貨,第一時間送達(dá) 前言 前面兩文介紹了貝葉斯學(xué)派的思想和先驗分布、后驗分布的相關(guān)知識,古典頻率學(xué)派認(rèn)為拋硬幣的概率是常數(shù),本文從貝葉斯學(xué)派的角度看待拋硬幣的概率問題。本文詳細(xì)介紹了 β分布,重述貝葉斯思想,對于拋硬幣的概率問題作各種情況的分析,最后總結(jié)本文。 目錄 1、為什么選擇β分布作為先驗分布 2、重述貝葉斯思想 3、拋硬幣問題的多情況分析 4、總結(jié) 1、為什么選擇β分布作為先驗分布 本節(jié)詳細(xì)介紹β分布的定義及解釋選擇β分布作為先驗分布的原因。 1、β分布 β函數(shù)的定義:
其中α,β > 0,對等式兩邊各除以B(α,β),字母p代替x,得: 選積分項作為β分布函數(shù),由積分項可知β分布已完成標(biāo)準(zhǔn)化(總積分等于1)。 因此,β分布: β分布的期望和方差: 2、β分布作為先驗分布的原因 由β分布定義可知,β分布是概率分布的分布,β分布常作為先驗分布的原因: (1)、貝葉斯對參數(shù)的估計與先驗分布的選擇有很重要的關(guān)系,先驗分布不同,貝葉斯對參數(shù)的估計也不同。先驗分布往往是人們根據(jù)以往經(jīng)驗去設(shè)計,β分布是概率分布的分布,涵蓋了所有參數(shù)空間出現(xiàn)的概率大小,并通過設(shè)置參數(shù)α和β,可以使先驗分布與你的先驗經(jīng)驗基本符合。 i) α=1,β=1 由上圖可知,α=1,β=1,β分布符合均勻分布,即參數(shù)空間所有取值的概率相等。 因此,當(dāng)你對參數(shù)沒有任何的先驗知識時,建議你假設(shè)先驗參數(shù)符合均勻分布,參數(shù)的后驗分布由你的實際觀測數(shù)據(jù)決定。 ii) α=10,β=10 由上圖可知,α=10,β=10時,β分布符合高斯分布,且在概率為0.5取得最大值,由β分布期望和方差的公式可知期望和方差分別等于0.5和0.01。 假設(shè)參數(shù)的先驗分布是高斯分布,設(shè)置參數(shù)α和β相等(α>1)使β分布成為高斯分布,α越大方差越小。 因此,設(shè)置α和β使參數(shù)的先驗分布符合你對參數(shù)的先驗認(rèn)知。 (2)、上節(jié)已提到,參數(shù)的先驗分布是β分布時,則先驗分布和后驗分布形式一樣,且可以形成先驗鏈,方便分析問題。 2、重述貝葉斯思想 因人而異,因閱歷而異 關(guān)于頻率學(xué)派和貝葉斯學(xué)派對頻率的理解可以參考我前面的文章《淺談頻率學(xué)派和貝葉斯學(xué)派》。 貝葉斯思想是量化事件發(fā)生的不確定性,是主觀評價。不同人評價同一事件發(fā)生的概率不同,因為不同人的生活經(jīng)歷不同,對某一事件的先驗知識很可能不同,比如一個博士生和一個小學(xué)生對某一事件的看法可能不同;同一個人對同一事件發(fā)生的概率也隨著自身閱歷的增加而不同,例如某個人做了九件好事,你評估他是好人的概率為0.9,當(dāng)他做了一件大逆不道的事情后,你評估他是好人的概率降到了0.1。貝葉斯評價事件發(fā)生的概率帶有主觀性,因人而異,因閱歷而異。 凡事要講數(shù)據(jù) 我們根據(jù)自己的閱歷對某一事件作一個先驗假設(shè),先驗假設(shè)是否正確需要經(jīng)過時間的檢驗,即是否有足夠多的觀測數(shù)據(jù)符合先驗假設(shè)。先驗假設(shè)和觀測數(shù)據(jù)是影響后驗假設(shè)的兩個因素,若觀測數(shù)據(jù)不符合先驗假設(shè),則后驗假設(shè)在先驗假設(shè)的基礎(chǔ)上開始向觀測的數(shù)據(jù)偏斜,若觀測的數(shù)據(jù)為無窮大時,則先驗假設(shè)可以忽略不計,直接通過觀測數(shù)據(jù)來估計后驗假設(shè)。因此,貝葉斯思想評價事件發(fā)生概率的準(zhǔn)則是凡事要講數(shù)據(jù)。 PS:有點繞口,希望大家看完筆者介紹拋硬幣的例子,再來悟一悟這幾句話,若還有疑問請微信我 3、拋硬幣問題的多情況分析 拋硬幣問題的公式說明 由于《淺談先驗分布和后驗分布》已經(jīng)通過例子推導(dǎo)了拋硬幣正面向上的后驗概率,因此,本文不做推論,具體可參考上篇文章,若有疑問請微信我。本文只引用一些結(jié)論性的公式。 假設(shè)硬幣正面向上的概率為u,正面向上記為1,反面向上記為0。 則硬幣正面向上的先驗分布如下: 硬幣正面向上的期望: 其中a,b表示虛擬的硬幣正面向上的次數(shù)和反面向上的次數(shù),根據(jù)自己的先驗知識來設(shè)置a,b值。 若后續(xù)的觀測結(jié)果為m次正面向上,l次反面向上,共N次。 則硬幣正面向上的后驗分布如下: 硬幣為正面向上的概率:
多情況的拋硬幣問題 (1)第1次拋硬幣為正面向上的概率; (2)9次硬幣正面向上,1次反面向上,第十一次硬幣正面向上的概率; (3)90次硬幣正面向上,10次硬幣反面向上,求101次正面向上的概率; (4)900次硬幣正面向上,100次硬幣反面向上,求第1001次硬幣正面向上的概率。 解: 貝葉斯的后驗分布受先驗分布的影響,不同的先驗分布會有不同的后驗分布。請參考第一節(jié),假設(shè)硬幣正面向上的分布符合高斯分布(a=10,b=10),高斯分布符合大部分人的思想,認(rèn)為硬幣為正面向上的概率在0.5達(dá)到最大,方差表示先驗分布的確定程度,若你堅信硬幣向上的概率肯定是0.5,那么可以調(diào)大a和b值。 筆者就先驗分布為高斯分布來解答拋硬幣的四個問題。其他先驗分布可通過調(diào)節(jié)a,b的值來實現(xiàn),后面的計算過程一致。 正面向上的后驗概率: a,b,m,l分別表示先驗分布的正面向上次數(shù),反面向上次數(shù),已觀測數(shù)據(jù)的正面向上次數(shù),反面向上次數(shù)。 先驗分布為高斯分布: (1)由于沒有任何觀測數(shù)據(jù),因此第一次正面向上的分布為先驗分布,先驗分布在在參數(shù)為0.5時,概率最大,即正面向上的概率為0.5。 (2)正面向上的概率為: (3)計算過程與(2)一樣,正面向上的概率:0.83 (4)正面向上的概率:0.89 討論: 頻率學(xué)派認(rèn)為硬幣向上的概率是0.5,與觀測數(shù)據(jù)無關(guān)。貝葉斯學(xué)派是通過數(shù)據(jù)來主觀評價硬幣向上的概率,由例子可知,即使先驗分布符合高斯分布且正面向上的概率在0.5達(dá)到最大,但是如果觀測數(shù)據(jù)傾向于正面向上,則最終的判斷結(jié)果會傾向于正面向上,貝葉斯思想有點像是風(fēng)往哪邊吹樹就往哪邊倒的意思。當(dāng)觀測結(jié)果的正面向上次數(shù)遠(yuǎn)遠(yuǎn)大于正面向下次數(shù),也遠(yuǎn)遠(yuǎn)大于先驗分布的正面向下次數(shù),則判斷下次為正面向上的概率無限接近1(若不理解請參考公式)。 4、總結(jié) 本文首先詳細(xì)介紹了β分布,通過調(diào)節(jié)參數(shù)a和b使β分布符合假設(shè)的先驗分布,β分布使后驗分布和先驗分布為共軛分布,形成先驗鏈,便于分析問題。后面講的內(nèi)容是貝葉斯思想,貝葉斯是主觀評價事件發(fā)生的概率,根據(jù)先驗知識來假設(shè)先驗分布,若觀測的數(shù)據(jù)符合先驗分布,則后驗分布與先驗分布類似;若觀測的數(shù)據(jù)不符合先驗分布,則后驗分布開始向觀測數(shù)據(jù)傾斜,若觀測數(shù)據(jù)為無窮大時,那么前驗分布可以忽略不計,最大似然函數(shù)估計參數(shù)與后驗分布估計參數(shù)相同,直接可以用最大似然函數(shù)來估計參數(shù)。 參考: Christopher M.Bishop <<Pattern Reconition and Machine Learning>> 轉(zhuǎn)載自:機(jī)器學(xué)習(xí)算法那些事
|
|
來自: mynotebook > 《待分類》