一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

見識(shí)數(shù)據(jù)分析的「獨(dú)孤九劍」 | 說人話的統(tǒng)計(jì)學(xué)·協(xié)和八

 協(xié)和八 2020-09-18

數(shù)據(jù)分析的獨(dú)孤九劍——

貝 葉 斯 統(tǒng) 計(jì) 學(xué)

在上一集里,我們展示了一個(gè)也許有些嚇人的事實(shí):

即便你的科學(xué)假說經(jīng)受住了p<0.05的考驗(yàn),它真的成立的概率卻是一個(gè)跟p值沒太大關(guān)系的數(shù)字。它可能很大,也可能很小,具體會(huì)是多大的一個(gè)數(shù)取決于一些其他因素。

然而,很多時(shí)候情況并不樂觀(上一集的例子就是一個(gè)相當(dāng)具有一般性的情形),你引以為豪的科學(xué)發(fā)現(xiàn)也許只是個(gè)假陽性結(jié)果,也就是俗稱的“詐和”了。

更糟糕的是,當(dāng)今學(xué)術(shù)界的文化、科學(xué)文獻(xiàn)的審查和出版機(jī)制存在著種種弊端,這些都會(huì)給魚龍混雜的文獻(xiàn)注入更多的水分,使得假陽性結(jié)果進(jìn)一步增多。這也是為什么有人雖有些危言聳聽卻又不無根據(jù)地疾呼:絕大多數(shù)科研成果都是假的!戳這里回顧上一集《你的科研成果都是真的嗎?

看完了上一集,你也許會(huì)說:好吧,學(xué)術(shù)界自己的這些問題咱們就先不說了,可是那些個(gè)統(tǒng)計(jì)學(xué)家干嘛一上來就把事情搞得那么糾結(jié)呢?什么p值啊、原假設(shè)啊、功效啊,一個(gè)個(gè)定義都繞得要死,弄得我們頭都大了,為什么不發(fā)明一些統(tǒng)計(jì)檢驗(yàn)直接算出假設(shè)成立的可能性呢?

答案是,

那樣的統(tǒng)計(jì)學(xué)方法是有的!

而且值得一提的是,那一套由貝葉斯(Bayes)、拉普拉斯(Laplace)兩位數(shù)學(xué)大神在18世紀(jì)就發(fā)展起來的統(tǒng)計(jì)學(xué)理論,相比起近幾十年來才流行起來的由p值唱主角兒的“頻率學(xué)派”假設(shè)檢驗(yàn)方法,歷史要悠久得多。

于是你更奇怪了:那既然貝葉斯學(xué)派資格老,還容易理解,為什么統(tǒng)計(jì)學(xué)家后來還要另辟蹊徑弄出一套完全不同的東西?為什么現(xiàn)在似乎大多數(shù)人學(xué)的、用的不是貝葉斯統(tǒng)計(jì)學(xué)?

為了解答這個(gè)問題,我們今天就來研究一下貝葉斯統(tǒng)計(jì)學(xué)到底是怎么一回事,看看我們是不是也能玩得轉(zhuǎn)這統(tǒng)計(jì)學(xué)中的“獨(dú)門秘器”。

條件概率 與 貝葉斯定理

環(huán)顧各式各樣的概率論和統(tǒng)計(jì)學(xué)入門書,你會(huì)發(fā)現(xiàn)滿眼都是t檢驗(yàn)、方差分析、線性回歸等等“頻率學(xué)派”的統(tǒng)計(jì)學(xué)方法。然而有意思的是,這些書幾乎都會(huì)用不少的篇幅來講一個(gè)叫做貝葉斯定理的東西,可是講完之后似乎又再?zèng)]什么下文了。

這個(gè)定理和我們今天要講的主題都被冠上了貝葉斯的大名,這可不是出于巧合——貝葉斯定理恰恰就是整個(gè)貝葉斯統(tǒng)計(jì)學(xué)的理論基礎(chǔ),我們?cè)谏弦患睦又杏?jì)算得到顯著結(jié)果的藥物到底有多大可能真的有效,實(shí)際上用的也是它(如果你在閱讀上一集時(shí)就已經(jīng)反應(yīng)過來,“哎喲我去,這不就是貝葉斯定理嘛!”,那么不妨直接跳到下一節(jié))。

貝葉斯定理是一條關(guān)于條件概率的定理。

所謂概率,就是用0和1之間的數(shù)來表示某件事情發(fā)生的可能性大小,如果我們感興趣的事件用A表示,那么它的概率就寫成P(A)。

概率為0就是不可能事件,概率為1就是必然事件,而在這兩者之間,概率越大則可能性越大。(其實(shí)“頻率派”和“貝葉斯派”在概率的定義上就開始吵了,這也是兩者最根本的分歧,我們暫時(shí)按下不表,只采用比較籠統(tǒng)的理解。)

條件概率指的是,在某件事情A發(fā)生的前提下,另一件事情B發(fā)生的概率,用P(B | A)表示(注意在豎線后面的是條件,前面的是我們感興趣的事件)。

比如說,東單某著名醫(yī)學(xué)院一共有1000個(gè)學(xué)生,其中400個(gè)男生,600個(gè)女生。我們知道女生里頭有一半穿裙子,一半穿褲子,而在男生中,不知道出于什么原因也有40個(gè)穿裙子,剩下的男生則都是穿褲子。如果我們想知道男生中穿裙子的比例,那么這就是條件概率P(裙|男)。

這個(gè)條件概率怎么算呢?這好辦,我們就數(shù)數(shù)在所有人里有多少個(gè)穿裙子的男生,然后除以男生的總數(shù)就行了。根據(jù)上述條件,有:


用類似的方法我們可以算出P(褲 | 男) = 0.9,P(裙 | 女) = P(褲 | 女) = 0.5。因此,
?條件概率的一般公式是:


簡(jiǎn)單來說,
就是條件A之下B發(fā)生的概率等于A和B同時(shí)發(fā)生的概率除以B發(fā)生的概率。如果等式兩邊同時(shí)乘以P(B),我們還可以得到:


現(xiàn)在問題來了,某一天,重度近視的你忘了戴眼鏡,朦朦朧朧間你看見一個(gè)穿裙子的身影翩然而至,可是你怎么也看不清來人到底是男是女。那么,眼前這人是男生的概率是多少?

用數(shù)學(xué)的語言來說,現(xiàn)在你想知道的是,在已知眼前這人穿裙子的前提下,此人是男生的條件概率,也就是P(男 | 裙)??墒?,我們之前算過的只是把性別作為條件、穿著作為事件的概率,比如說P(裙 | 男)。

怎樣能把這個(gè)次序翻過來呢?

根據(jù)條件概率的定義((2)式),我們可以寫出:


先看右邊的分子,P(男 & 裙)是“一個(gè)人是男生”和“一個(gè)人穿裙子”這兩個(gè)事件同時(shí)發(fā)生的概率,根據(jù)(3)式我們可以把它改寫成含有條件概率的形式。

記住,我們已經(jīng)知道條件概率P(裙 | 男)的值,因此,我們套用(3)式把右邊的分子拆開:


現(xiàn)在你會(huì)發(fā)現(xiàn),等式右邊分子上相乘的兩項(xiàng)都是已知的了,所以我們只剩下分母P(裙)了。它實(shí)際上就是在所有學(xué)生里穿裙子的人的比例。

怎么算呢?

你一定很快就能想到,根據(jù)男女生的人數(shù)和各自穿裙子的比例,算出穿裙子的男生人數(shù)和穿裙子的女生人數(shù),然后除以總?cè)藬?shù)不就行了?

沒錯(cuò)!如果把這個(gè)思路寫成數(shù)學(xué)式子,實(shí)際上就是把P(裙)拆成P(男&裙)與P(女&裙)之和,然后再分別套用一次(3)式:


如果我們把(6)代入(5),所有的項(xiàng)就都是已知的了,由此我們就能算出眼前這個(gè)穿裙子的同學(xué)是男生的概率:


拋開這個(gè)具體的例子,把前面得到的(5)式寫成一般的形式:


這就是大名鼎鼎的貝葉斯定理了!

推導(dǎo)出了貝葉斯定理,我們立刻就來用它驗(yàn)證一下上一集藥物有效性的例子。

如果我們把一個(gè)藥物實(shí)際有效和無效分別用√和X表示,而實(shí)驗(yàn)結(jié)果有無統(tǒng)計(jì)學(xué)顯著性分別用+和-表示,那么當(dāng)我們得到顯著結(jié)果時(shí)藥物真正有效的可能性就是條件概率P(√ | +)。

回顧顯著性和功效的定義,

顯著性是原假設(shè)成立(即藥物無效)時(shí)錯(cuò)誤地得到顯著結(jié)果的概率,即P(+ | X) = 0.05

功效是假設(shè)的效應(yīng)真實(shí)存在(即藥物有效)時(shí)正確地得到顯著結(jié)果的概率,即P(+ | √)=0.8。

而且,在我們的例子里,100種被測(cè)試藥物中只有5種實(shí)際有效,也就是P(√) = 5/100 = 0.05,P(X)=95/100=0.95。用貝葉斯公式我們可以寫出:


把已知條件代入,我們會(huì)算出45.7%,和上一集我們用數(shù)格子的辦法得到的結(jié)果相同(算出來的數(shù)值有細(xì)微的差別是因?yàn)樯弦患覀儼?.75種假陽性藥物四舍五入成了5種)。

從 貝葉斯定理 到 貝葉斯統(tǒng)計(jì)學(xué)

你也許要說:So what?從小到大,什么定理我沒見過?

英國(guó)的牛頓、美國(guó)的愛因斯坦,比貝葉斯不知道有名多少倍,我在中學(xué)課堂上就跟他們談笑風(fēng)生了,這定理有啥了不起?

貝葉斯定理牛掰的地方,不僅在于它獨(dú)力撐起了一整個(gè)統(tǒng)計(jì)學(xué)流派,也不只因?yàn)樗乾F(xiàn)在最火熱的“大數(shù)據(jù)”機(jī)器學(xué)習(xí)的核心,還在于它與我們?nèi)祟惖乃季S方法十分貼近。

在日常生活中,我們總是在不斷觀察周圍的環(huán)境,然后把觀察到的現(xiàn)象用某種假說來解釋。我們?nèi)绾沃肋@種假說有多大可能成立呢?注意到在(7)式中,A和B只是抽象的符號(hào),可以代表任何的事物。因此,我們把“假說”和“現(xiàn)象”分別代替A和B,就能得到:


于是,貝葉斯定理就搖身一變,從一條關(guān)于條件概率的定理變成了描述人們認(rèn)知規(guī)律的工具。

它告訴我們,在觀察到某個(gè)現(xiàn)象之后,某一假說成立的概率(即等式左邊的P(假說 | 現(xiàn)象),又稱為“后驗(yàn)概率”)由三個(gè)因素決定:

一、在這個(gè)假說成立的前提下產(chǎn)生這么一個(gè)現(xiàn)象的可能性P(現(xiàn)象 | 假說),或者說是現(xiàn)象有多符合假說的預(yù)測(cè),我們稱為

“似然”(likelihood);

二、這個(gè)假說本身成立的可能性大小,由于這是對(duì)觀察到現(xiàn)象之前來說的,因此我們稱為

“先驗(yàn)概率”(prior probability);

三、在萬事萬物中出現(xiàn)這一現(xiàn)象本身的可能性P(現(xiàn)象),我們稱為

“證據(jù)”(evidence)。

假設(shè)我們只考慮兩種解釋,分別稱為“假說1”“假說2”。于是我們把兩種解釋分別套進(jìn)上面的(9)式里,就寫出了兩條式子:


注意到兩式右邊的分母都是一樣的,所以我們實(shí)際上是要比較P(現(xiàn)象 | 假說1)*P(假說1)和P(現(xiàn)象 | 假說2)*P(假說2)這兩個(gè)乘積哪個(gè)大。比如說,我們看到數(shù)列 -1, 3, 7, 11,你說它是一個(gè)以4為公差的等差數(shù)列呢,還是

-X3 / 11 + 9/11*X2 + 23/11

每項(xiàng)把前項(xiàng)作為 X 代入后算出來的數(shù)列?

我們稍微計(jì)算一下,就會(huì)發(fā)現(xiàn)這兩個(gè)假說都可以完美地解釋看到的數(shù)列(也就是說觀察到的數(shù)列在兩個(gè)假說之下的似然分別都是1)。但是你一定會(huì)說,雖然數(shù)字上都說得通,可是這后一種說法簡(jiǎn)直太扯了,誰沒事折騰一這么復(fù)雜的多項(xiàng)式呢?在這時(shí),你實(shí)際上就是在比較這兩種假說的先驗(yàn)概率P(假說1)和P(假說2)。所以,貝葉斯定理只不過是把我們習(xí)慣的思考方式用數(shù)學(xué)語言表達(dá)出來而已。

在這里我們也可以回想上一集說過的“基數(shù)謬誤”,為什么在具有顯著結(jié)果的藥物中真正有效的比例并不高呢?這恰恰就是因?yàn)樗幬镉行У南闰?yàn)概率(100種里只有5種)太低了,盡管得到的顯著結(jié)果與藥物有效這個(gè)假說看起來十分符合(即“似然”很大),得到的后驗(yàn)概率仍然不大。

說了這么多,我們離貝葉斯統(tǒng)計(jì)學(xué)只有一步之遙了。

我們剛剛講過,貝葉斯定理可以描述現(xiàn)象與假說之間的關(guān)系。那么在統(tǒng)計(jì)學(xué)的眼里,

現(xiàn)象是什么呢?自然是我們做研究得到的數(shù)據(jù)了。

那么假說呢?既然統(tǒng)計(jì)學(xué)是一門定量的學(xué)問,我們同樣需要量化的方法來描述我們的假說。比如說,你想研究一個(gè)區(qū)域的人均期望壽命, 或者不同干預(yù)手段對(duì)病人存活率的影響,又或者是家庭收入與某種疾病發(fā)病年齡的相關(guān)關(guān)系,所有這些假說都需要有特定的數(shù)量來表述,這些數(shù)量我們稱為“參數(shù)”

統(tǒng)計(jì)學(xué)的目的,就是考察在既有的數(shù)據(jù)之下,以某些參數(shù)來表示的假說成立的可能性。因此,我們?cè)侔沿惾~斯定理改頭換面一下:


這就是貝葉斯統(tǒng)計(jì)學(xué)所有方法追根溯源的核心了!

通過這樣的分析,我們可以算出在給定我們當(dāng)前已有數(shù)據(jù)的前提下,某個(gè)假說(由一系列參數(shù)表示)成立的概率。

了解了貝葉斯統(tǒng)計(jì)學(xué)的思想方法,它和當(dāng)今主流的頻率學(xué)派統(tǒng)計(jì)學(xué)的區(qū)別在哪里?既然說是“獨(dú)孤九劍”,為何它又曾沉寂多時(shí)?我們能在自己的數(shù)據(jù)分析中運(yùn)用貝葉斯統(tǒng)計(jì)學(xué)嗎?

所有這些問題,諸位看官請(qǐng)聽下回分解。

?

回復(fù)說人話的統(tǒng)計(jì)學(xué)」查看本系列全部文章。

參考文獻(xiàn):

1. Kruschke, J. (2014). Doing Bayesian data analysis: A tutorial with R, JAGS, and Stan. Academic Press.

2. 劉未鵬 《平凡而又神奇的貝葉斯方法》http:///2008/09/21/the-magical-bayesian-method/

3. MacKay, D. J. (2003). Information theory, inference and learning algorithms. Cambridge university press.

4. Carlin, B. P., & Louis, T. A. (2008). Bayesian methods for data analysis. CRC Press.

作者:張之昊

編輯:燈盞細(xì)辛


    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    亚洲最新的黄色录像在线| 欧美丝袜诱惑一区二区| 麻豆果冻传媒一二三区| 日韩欧美国产三级在线观看| 国产级别精品一区二区视频| 国产午夜精品在线免费看| 欧美在线观看视频三区| 国产精品刮毛视频不卡| 午夜国产成人福利视频| 亚洲日本加勒比在线播放 | 亚洲一区二区三区福利视频| 美女被后入视频在线观看| 欧美字幕一区二区三区| 黄色国产一区二区三区| 日韩精品中文字幕亚洲| 日本精品视频一二三区| 久久人妻人人澡人人妻| 欧美日韩国产综合特黄| 国产精品亚洲综合色区韩国| 久久三级国外久久久三级| 精品人妻一区二区三区免费| 欧美日韩乱一区二区三区| 午夜福利国产精品不卡| 久久亚洲成熟女人毛片| 成人午夜免费观看视频| 亚洲夫妻性生活免费视频| 不卡中文字幕在线免费看| 日本妇女高清一区二区三区| 欧美精品中文字幕亚洲| 久久亚洲精品中文字幕| 五月综合婷婷在线伊人| 亚洲中文字幕日韩在线| 日韩在线精品视频观看| 乱女午夜精品一区二区三区| 国产成人精品一区二区三区| 激情内射亚洲一区二区三区| 国语对白刺激高潮在线视频| 翘臀少妇成人一区二区| 国产欧美日韩一级小黄片| 亚洲中文字幕人妻av| 老司机这里只有精品视频|