數(shù)據(jù)分析的獨(dú)孤九劍—— 貝 葉 斯 統(tǒng) 計(jì) 學(xué) 在上一集里,我們展示了一個(gè)也許有些嚇人的事實(shí): 即便你的科學(xué)假說經(jīng)受住了p<0.05的考驗(yàn),它真的成立的概率卻是一個(gè)跟p值沒太大關(guān)系的數(shù)字。它可能很大,也可能很小,具體會(huì)是多大的一個(gè)數(shù)取決于一些其他因素。 然而,很多時(shí)候情況并不樂觀(上一集的例子就是一個(gè)相當(dāng)具有一般性的情形),你引以為豪的科學(xué)發(fā)現(xiàn)也許只是個(gè)假陽性結(jié)果,也就是俗稱的“詐和”了。 更糟糕的是,當(dāng)今學(xué)術(shù)界的文化、科學(xué)文獻(xiàn)的審查和出版機(jī)制存在著種種弊端,這些都會(huì)給魚龍混雜的文獻(xiàn)注入更多的水分,使得假陽性結(jié)果進(jìn)一步增多。這也是為什么有人雖有些危言聳聽卻又不無根據(jù)地疾呼:絕大多數(shù)科研成果都是假的!(戳這里回顧上一集《你的科研成果都是真的嗎?》) 看完了上一集,你也許會(huì)說:好吧,學(xué)術(shù)界自己的這些問題咱們就先不說了,可是那些個(gè)統(tǒng)計(jì)學(xué)家干嘛一上來就把事情搞得那么糾結(jié)呢?什么p值啊、原假設(shè)啊、功效啊,一個(gè)個(gè)定義都繞得要死,弄得我們頭都大了,為什么不發(fā)明一些統(tǒng)計(jì)檢驗(yàn)直接算出假設(shè)成立的可能性呢? 答案是, 那樣的統(tǒng)計(jì)學(xué)方法是有的! 而且值得一提的是,那一套由貝葉斯(Bayes)、拉普拉斯(Laplace)兩位數(shù)學(xué)大神在18世紀(jì)就發(fā)展起來的統(tǒng)計(jì)學(xué)理論,相比起近幾十年來才流行起來的由p值唱主角兒的“頻率學(xué)派”假設(shè)檢驗(yàn)方法,歷史要悠久得多。 于是你更奇怪了:那既然貝葉斯學(xué)派資格老,還容易理解,為什么統(tǒng)計(jì)學(xué)家后來還要另辟蹊徑弄出一套完全不同的東西?為什么現(xiàn)在似乎大多數(shù)人學(xué)的、用的不是貝葉斯統(tǒng)計(jì)學(xué)? 為了解答這個(gè)問題,我們今天就來研究一下貝葉斯統(tǒng)計(jì)學(xué)到底是怎么一回事,看看我們是不是也能玩得轉(zhuǎn)這統(tǒng)計(jì)學(xué)中的“獨(dú)門秘器”。 條件概率 與 貝葉斯定理 環(huán)顧各式各樣的概率論和統(tǒng)計(jì)學(xué)入門書,你會(huì)發(fā)現(xiàn)滿眼都是t檢驗(yàn)、方差分析、線性回歸等等“頻率學(xué)派”的統(tǒng)計(jì)學(xué)方法。然而有意思的是,這些書幾乎都會(huì)用不少的篇幅來講一個(gè)叫做貝葉斯定理的東西,可是講完之后似乎又再?zèng)]什么下文了。 這個(gè)定理和我們今天要講的主題都被冠上了貝葉斯的大名,這可不是出于巧合——貝葉斯定理恰恰就是整個(gè)貝葉斯統(tǒng)計(jì)學(xué)的理論基礎(chǔ),我們?cè)谏弦患睦又杏?jì)算得到顯著結(jié)果的藥物到底有多大可能真的有效,實(shí)際上用的也是它(如果你在閱讀上一集時(shí)就已經(jīng)反應(yīng)過來,“哎喲我去,這不就是貝葉斯定理嘛!”,那么不妨直接跳到下一節(jié))。 貝葉斯定理是一條關(guān)于條件概率的定理。 所謂概率,就是用0和1之間的數(shù)來表示某件事情發(fā)生的可能性大小,如果我們感興趣的事件用A表示,那么它的概率就寫成P(A)。 概率為0就是不可能事件,概率為1就是必然事件,而在這兩者之間,概率越大則可能性越大。(其實(shí)“頻率派”和“貝葉斯派”在概率的定義上就開始吵了,這也是兩者最根本的分歧,我們暫時(shí)按下不表,只采用比較籠統(tǒng)的理解。) 條件概率指的是,在某件事情A發(fā)生的前提下,另一件事情B發(fā)生的概率,用P(B | A)表示(注意在豎線后面的是條件,前面的是我們感興趣的事件)。 比如說,東單某著名醫(yī)學(xué)院一共有1000個(gè)學(xué)生,其中400個(gè)男生,600個(gè)女生。我們知道女生里頭有一半穿裙子,一半穿褲子,而在男生中,不知道出于什么原因也有40個(gè)穿裙子,剩下的男生則都是穿褲子。如果我們想知道男生中穿裙子的比例,那么這就是條件概率P(裙|男)。 這個(gè)條件概率怎么算呢?這好辦,我們就數(shù)數(shù)在所有人里有多少個(gè)穿裙子的男生,然后除以男生的總數(shù)就行了。根據(jù)上述條件,有:
用數(shù)學(xué)的語言來說,現(xiàn)在你想知道的是,在已知眼前這人穿裙子的前提下,此人是男生的條件概率,也就是P(男 | 裙)??墒?,我們之前算過的只是把性別作為條件、穿著作為事件的概率,比如說P(裙 | 男)。 怎樣能把這個(gè)次序翻過來呢? 根據(jù)條件概率的定義((2)式),我們可以寫出:
記住,我們已經(jīng)知道條件概率P(裙 | 男)的值,因此,我們套用(3)式把右邊的分子拆開:
怎么算呢? 你一定很快就能想到,根據(jù)男女生的人數(shù)和各自穿裙子的比例,算出穿裙子的男生人數(shù)和穿裙子的女生人數(shù),然后除以總?cè)藬?shù)不就行了? 沒錯(cuò)!如果把這個(gè)思路寫成數(shù)學(xué)式子,實(shí)際上就是把P(裙)拆成P(男&裙)與P(女&裙)之和,然后再分別套用一次(3)式:
推導(dǎo)出了貝葉斯定理,我們立刻就來用它驗(yàn)證一下上一集藥物有效性的例子。 如果我們把一個(gè)藥物實(shí)際有效和無效分別用√和X表示,而實(shí)驗(yàn)結(jié)果有無統(tǒng)計(jì)學(xué)顯著性分別用+和-表示,那么當(dāng)我們得到顯著結(jié)果時(shí)藥物真正有效的可能性就是條件概率P(√ | +)。 回顧顯著性和功效的定義, 顯著性是原假設(shè)成立(即藥物無效)時(shí)錯(cuò)誤地得到顯著結(jié)果的概率,即P(+ | X) = 0.05; 功效是假設(shè)的效應(yīng)真實(shí)存在(即藥物有效)時(shí)正確地得到顯著結(jié)果的概率,即P(+ | √)=0.8。 而且,在我們的例子里,100種被測(cè)試藥物中只有5種實(shí)際有效,也就是P(√) = 5/100 = 0.05,P(X)=95/100=0.95。用貝葉斯公式我們可以寫出:
從 貝葉斯定理 到 貝葉斯統(tǒng)計(jì)學(xué) 你也許要說:So what?從小到大,什么定理我沒見過? 英國(guó)的牛頓、美國(guó)的愛因斯坦,比貝葉斯不知道有名多少倍,我在中學(xué)課堂上就跟他們談笑風(fēng)生了,這定理有啥了不起? 貝葉斯定理牛掰的地方,不僅在于它獨(dú)力撐起了一整個(gè)統(tǒng)計(jì)學(xué)流派,也不只因?yàn)樗乾F(xiàn)在最火熱的“大數(shù)據(jù)”機(jī)器學(xué)習(xí)的核心,還在于它與我們?nèi)祟惖乃季S方法十分貼近。 在日常生活中,我們總是在不斷觀察周圍的環(huán)境,然后把觀察到的現(xiàn)象用某種假說來解釋。我們?nèi)绾沃肋@種假說有多大可能成立呢?注意到在(7)式中,A和B只是抽象的符號(hào),可以代表任何的事物。因此,我們把“假說”和“現(xiàn)象”分別代替A和B,就能得到:
它告訴我們,在觀察到某個(gè)現(xiàn)象之后,某一假說成立的概率(即等式左邊的P(假說 | 現(xiàn)象),又稱為“后驗(yàn)概率”)由三個(gè)因素決定: 一、在這個(gè)假說成立的前提下產(chǎn)生這么一個(gè)現(xiàn)象的可能性P(現(xiàn)象 | 假說),或者說是現(xiàn)象有多符合假說的預(yù)測(cè),我們稱為 “似然”(likelihood); 二、這個(gè)假說本身成立的可能性大小,由于這是對(duì)觀察到現(xiàn)象之前來說的,因此我們稱為 “先驗(yàn)概率”(prior probability); 三、在萬事萬物中出現(xiàn)這一現(xiàn)象本身的可能性P(現(xiàn)象),我們稱為 “證據(jù)”(evidence)。 假設(shè)我們只考慮兩種解釋,分別稱為“假說1”和“假說2”。于是我們把兩種解釋分別套進(jìn)上面的(9)式里,就寫出了兩條式子:
-X3 / 11 + 9/11*X2 + 23/11 每項(xiàng)把前項(xiàng)作為 X 代入后算出來的數(shù)列? 我們稍微計(jì)算一下,就會(huì)發(fā)現(xiàn)這兩個(gè)假說都可以完美地解釋看到的數(shù)列(也就是說觀察到的數(shù)列在兩個(gè)假說之下的似然分別都是1)。但是你一定會(huì)說,雖然數(shù)字上都說得通,可是這后一種說法簡(jiǎn)直太扯了,誰沒事折騰一這么復(fù)雜的多項(xiàng)式呢?在這時(shí),你實(shí)際上就是在比較這兩種假說的先驗(yàn)概率P(假說1)和P(假說2)。所以,貝葉斯定理只不過是把我們習(xí)慣的思考方式用數(shù)學(xué)語言表達(dá)出來而已。 在這里我們也可以回想上一集說過的“基數(shù)謬誤”,為什么在具有顯著結(jié)果的藥物中真正有效的比例并不高呢?這恰恰就是因?yàn)樗幬镉行У南闰?yàn)概率(100種里只有5種)太低了,盡管得到的顯著結(jié)果與藥物有效這個(gè)假說看起來十分符合(即“似然”很大),得到的后驗(yàn)概率仍然不大。 說了這么多,我們離貝葉斯統(tǒng)計(jì)學(xué)只有一步之遙了。 我們剛剛講過,貝葉斯定理可以描述現(xiàn)象與假說之間的關(guān)系。那么在統(tǒng)計(jì)學(xué)的眼里, 現(xiàn)象是什么呢?自然是我們做研究得到的數(shù)據(jù)了。 那么假說呢?既然統(tǒng)計(jì)學(xué)是一門定量的學(xué)問,我們同樣需要量化的方法來描述我們的假說。比如說,你想研究一個(gè)區(qū)域的人均期望壽命, 或者不同干預(yù)手段對(duì)病人存活率的影響,又或者是家庭收入與某種疾病發(fā)病年齡的相關(guān)關(guān)系,所有這些假說都需要有特定的數(shù)量來表述,這些數(shù)量我們稱為“參數(shù)”。 統(tǒng)計(jì)學(xué)的目的,就是考察在既有的數(shù)據(jù)之下,以某些參數(shù)來表示的假說成立的可能性。因此,我們?cè)侔沿惾~斯定理改頭換面一下:
通過這樣的分析,我們可以算出在給定我們當(dāng)前已有數(shù)據(jù)的前提下,某個(gè)假說(由一系列參數(shù)表示)成立的概率。 了解了貝葉斯統(tǒng)計(jì)學(xué)的思想方法,它和當(dāng)今主流的頻率學(xué)派統(tǒng)計(jì)學(xué)的區(qū)別在哪里?既然說是“獨(dú)孤九劍”,為何它又曾沉寂多時(shí)?我們能在自己的數(shù)據(jù)分析中運(yùn)用貝葉斯統(tǒng)計(jì)學(xué)嗎? 所有這些問題,諸位看官請(qǐng)聽下回分解。 ? 回復(fù)「說人話的統(tǒng)計(jì)學(xué)」查看本系列全部文章。 參考文獻(xiàn): 1. Kruschke, J. (2014). Doing Bayesian data analysis: A tutorial with R, JAGS, and Stan. Academic Press. 2. 劉未鵬 《平凡而又神奇的貝葉斯方法》http:///2008/09/21/the-magical-bayesian-method/ 3. MacKay, D. J. (2003). Information theory, inference and learning algorithms. Cambridge university press. 4. Carlin, B. P., & Louis, T. A. (2008). Bayesian methods for data analysis. CRC Press. 作者:張之昊 編輯:燈盞細(xì)辛 |
|