【原】沒有統(tǒng)計學差異？看看貝葉斯能不能救你（文末有驚喜）

解螺旋 2020-08-27

展開全文

作者：麥子（轉載請注：解螺旋·醫(yī)生科研助手）

假如P值欺負了你，不要悲傷，不要心急，你的文章或許還是可以搶救一下的。辦法嘛，除了檢查各種技術環(huán)節(jié)外，統(tǒng)計學上還有兩條路可走：

1）調(diào)整統(tǒng)計功效，簡單說就是擴大樣本量；

2）貝葉斯。

今天咱們來聊聊歪萌邪道的小貝。

不過在搶救之前先要明確一個前提，做出實驗結果P>0.05有兩種可能，一是有真實的效應存在，而當前實驗數(shù)據(jù)不靈敏，沒有檢測到，這是可以搶救一下的；另一種則是真的沒什么效應，原假設拒絕不了，棄療。知情同意了哈，開始吧。

小貝是何方神圣？

貝葉斯分析法是18世紀的英國數(shù)學家托馬斯?貝葉斯開發(fā)的。與貝葉斯分析法相對的，是我們熟悉的頻率分析法，就是特別講究P<0.05的那個。

小貝沒有這道檻，卻更為精妙：它是一個迭代的過程，需要研究者先利用所有現(xiàn)有的資源，包括其他研究者的實驗和既往知識、經(jīng)驗等，得到一個"先驗概率"。

然后做自己的實驗，用實驗數(shù)據(jù)跟那個"先驗概率"一起，計算出"后驗概率"。這個后驗概率也會成為下一個事件的先驗概率，一次次積累，極盡精微。

所以兩種分析法的思路是不一樣的，貝葉斯的理念可以理解成"溫故知新"，更接近我們的日常思維。

用數(shù)學語言來說，頻率學派的目的是計算"P（數(shù)據(jù)|參數(shù)）"，即假定某參數(shù)（假設）真實存在的前提下，我們的實驗能獲得當前數(shù)據(jù)的概率；而貝葉斯學派則專注于"P（參數(shù)|數(shù)據(jù)）"，即我們有了這份數(shù)據(jù)，推算在真實世界中存在某種參數(shù)（效應）的概率。

"P(A|B)"這樣的表述格式就是條件概率，即在B事件發(fā)生的條件下，A事件會發(fā)生的概率。貝葉斯公式便是建立在條件概率之上：

這是從更基礎的P(A|B)=P(B|A)P(A)/P(B)推導出來的，推導過程有點復雜就不管了，咱直接上能用的

A表示發(fā)生A事件，A^C 表示與A相反的事件，即A=1-A^C 。B當然就是發(fā)生了B事件了。

話說回來，條件概率的表述，有沒有那么一點似曾相識的感覺？

統(tǒng)計功效的概念正與此類似，在假定效應真實存在的情況下，能得到顯著結果的概率。類似的，顯著性是指，在效應不存在（藥物無效）的情況下，得到顯著結果的概率。

我們常說的原假設一般都指效應不存在，記為H0；備擇假設便是效應存在，記為H1。咱們做實驗得到陽性結果（p <0.05）拒絕原假設，這一事件記為"+"，得到陰性結果(P>0.05)接受原假設記為"-"，那么統(tǒng)計功效就是P(+|H1)，顯著性就是P(+|H0)。

小貝教你咸魚翻身

檢測某藥物的降糖作用。然后很（按）不（劇）幸（本）咱們得到了陰性結果，干預組和對照組的差異沒有統(tǒng)計學意義(P>0.05)。

但我不死心，仍想知道P(H1|-)是多少，即P>0.05的情況下，該降糖藥其實是有效只是我沒檢測到的概率。

按那個公式就是：

似乎公式中一個值都代不進去……不過仔細看，P(-|H1)即效應真實存在（藥物有效）的情況下，未能檢測到（錯誤地拒絕原假設）的概率，不正是II類錯誤嘛，不正是1-P(+|H1)嘛！如果我的實驗將統(tǒng)計功效P(+|H1)控制在0.8，那么P(-|H1)就是0.2。

同理，P(-|H0)就是置信區(qū)間，即為1-P(+|H0)=1-0.05=0.95。

那么P(H1)和P(H0)怎么辦？這就要靠所謂的"溫故知新"了。查了查既往文獻，發(fā)現(xiàn)有20篇相關報道中，18篇支持該藥有降糖作用，那么P(H1)=18/20=0.9，則P(H0)=0.1。

P(H1)和P(H0)就是剛才提到的"先驗概率"，是根據(jù)既往知識得到的，而我們所要計算的P(H1|-)稱為"后驗概率"。

現(xiàn)在可以代入了，計算得P(H1|-)=0.2×0.9/(0.2×0.9+0.95×0.1)=0.655。

即，當我做出P>0.05的實驗結果，該藥物仍然有效的概率是65.5%。然而這個數(shù)字有什么用？65.5%算大還是算小呢？這還不能直接挪用舊知識說5%算小概率事件，之后就大了。

這里還有一個概念叫貝葉斯因子，記作B，B=P（H1）/P（H0）（此處略去了概率的條件），意為本實驗所得數(shù)據(jù)支持備擇假設的可能性是支持原假設的B倍。

顯然， B>1即數(shù)據(jù)支持備擇假設，B<1則支持原假設，B越接近1，就是越中立，數(shù)據(jù)越不敏感，證據(jù)越弱。

不過多接近算是"接近"？在經(jīng)典教材《概率論》中Jeffreys等人提倡，1/3~3之間算是接近，即目前所得證據(jù)較弱。這區(qū)間倒也不完全是空穴來風，當效應量還過得去的情況下，B=3基本上相當于P=0.05。

不過這也不是死定的，B和P之間也沒有固定的對應關系，B值和效應量、備擇假設的選定都有關，如果備擇假設太粗糙，B=3時P也有可能是0.01或更小。

后來Lee等人在《貝葉斯認知建模》中補充，B<1/3和B>3為中度證據(jù)，B<1/10和B>10為強證據(jù)。

在本實驗中，條件即做出了陰性結果，所以B=P(H1|-)/P(H0|-)。

還得先照公式計算P(H0|-)=0.95×0.1/(0.95×0.1+0.2×0.9)=0.345

那么B=0.655/0.345=1.895，落在1~3之間，可以認為是支持備擇假設的弱證據(jù)。

你說，那B值不是也有個檻？沒錯，但這能給我們的信息比P值更多了。

看公式又雙叒叕頭大？用在線計算器吧：

地址：http://psych./mbirnbaum/bayes/BayesCalc.htm

這個網(wǎng)站也是用了一個例子來解釋計算器怎么用，所以括號內(nèi)的字母是根據(jù)它的例子來設定的，跟我的例子不一樣@_@所以要你消化一下公式嘛。

實在不消化也沒關系，我就用咱們的例子上的數(shù)字填了進去，這樣大概可以對應讓誰是誰了吧？右下的W1就是我們最后要的那個B值。

不過，別高興太早，有幾點還要嘮叨一下：

貝葉斯因子其實挺復雜的，以上只是入門簡版；
貝葉斯分析法比頻率分析法歷史悠久，卻直到近年才被重視。在醫(yī)學研究中，還只是個在嘗試、被倡導的小地位。
聰明的你也看出來了，先驗概率的設定是有運氣和主觀成份的，你拿這個去跟審稿人argue，也看審稿人的眼見，我就在遠方祝福你~

參考資料：

1.Using Bayes to get the most outof non-significant results

2.A comparison of two worlds: Howdoes Bayes hold up to the status quo for the analysis of clinical trials?

3.貝葉斯vs頻率派：武功到底哪家強？

4.Ta有多大可能，成為你的理想伴侶？

轉藏分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：解螺旋 > 《待分類》

舉報/認領

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

解螺旋

關注對話

TA的最新館藏

來自今年斬獲38分的STTT的超重磅綜述，帶你深入了解炎癥與腫瘤！
2021年影響因子新鮮出爐！CA影響因子腰斬！
近100分的Nature頂級子刊重磅綜述揭秘這個研究熱點！快收藏！
為了幫師妹搞定論文，我14天搞定了12個信號通路，卻被群嘲論文癩皮狗！
Dove旗下的這三本國人友好期刊，已進最新中科院預警名單！
MAPK信號通路取得重要進展，這個熱門信號通路必須學！

喜歡該文的人也喜歡更多

熱門閱讀換一換

一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

【原】沒有統(tǒng)計學差異？看看貝葉斯能不能救你（文末有驚喜）

【原】沒有統(tǒng)計學差異？看看貝葉斯能不能救你（文末有驚喜）