一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

沒有統(tǒng)計學差異?看看貝葉斯能不能救你(文末有驚喜)

 解螺旋 2020-08-27

作者:麥子(轉載請注:解螺旋·醫(yī)生科研助手)

假如P值欺負了你,不要悲傷,不要心急,你的文章或許還是可以搶救一下的。辦法嘛,除了檢查各種技術環(huán)節(jié)外,統(tǒng)計學上還有兩條路可走:

1)調(diào)整統(tǒng)計功效,簡單說就是擴大樣本量;

2)貝葉斯。

今天咱們來聊聊歪萌邪道的小貝。

不過在搶救之前先要明確一個前提,做出實驗結果P>0.05有兩種可能,一是有真實的效應存在,而當前實驗數(shù)據(jù)不靈敏,沒有檢測到,這是可以搶救一下的;另一種則是真的沒什么效應,原假設拒絕不了,棄療。知情同意了哈,開始吧。

小貝是何方神圣?

貝葉斯分析法是18世紀的英國數(shù)學家托馬斯?貝葉斯開發(fā)的。與貝葉斯分析法相對的,是我們熟悉的頻率分析法,就是特別講究P<0.05的那個。

小貝沒有這道檻,卻更為精妙:它是一個迭代的過程,需要研究者先利用所有現(xiàn)有的資源,包括其他研究者的實驗和既往知識、經(jīng)驗等,得到一個"先驗概率"。

然后做自己的實驗,用實驗數(shù)據(jù)跟那個"先驗概率"一起,計算出"后驗概率"。這個后驗概率也會成為下一個事件的先驗概率,一次次積累,極盡精微。

所以兩種分析法的思路是不一樣的,貝葉斯的理念可以理解成"溫故知新",更接近我們的日常思維。

用數(shù)學語言來說,頻率學派的目的是計算"P(數(shù)據(jù)|參數(shù))",即假定某參數(shù)(假設)真實存在的前提下,我們的實驗能獲得當前數(shù)據(jù)的概率;而貝葉斯學派則專注于"P(參數(shù)|數(shù)據(jù))",即我們有了這份數(shù)據(jù),推算在真實世界中存在某種參數(shù)(效應)的概率。

"P(A|B)"這樣的表述格式就是條件概率,即在B事件發(fā)生的條件下,A事件會發(fā)生的概率。貝葉斯公式便是建立在條件概率之上:

這是從更基礎的P(A|B)=P(B|A)P(A)/P(B)推導出來的,推導過程有點復雜就不管了,咱直接上能用的

A表示發(fā)生A事件,AC 表示與A相反的事件,即A=1-AC 。B當然就是發(fā)生了B事件了。

話說回來,條件概率的表述,有沒有那么一點似曾相識的感覺?

統(tǒng)計功效的概念正與此類似,在假定效應真實存在的情況下,能得到顯著結果的概率。類似的,顯著性是指,在效應不存在(藥物無效)的情況下,得到顯著結果的概率。

我們常說的原假設一般都指效應不存在,記為H0;備擇假設便是效應存在,記為H1。咱們做實驗得到陽性結果(p <0.05)拒絕原假設,這一事件記為"+",得到陰性結果(P>0.05)接受原假設記為"-",那么統(tǒng)計功效就是P(+|H1),顯著性就是P(+|H0)。

小貝教你咸魚翻身

檢測某藥物的降糖作用。然后很(按)不(劇)幸(本)咱們得到了陰性結果,干預組和對照組的差異沒有統(tǒng)計學意義(P>0.05)。

但我不死心,仍想知道P(H1|-)是多少,即P>0.05的情況下,該降糖藥其實是有效只是我沒檢測到的概率。

按那個公式就是:

似乎公式中一個值都代不進去……不過仔細看,P(-|H1)即效應真實存在(藥物有效)的情況下,未能檢測到(錯誤地拒絕原假設)的概率,不正是II類錯誤嘛,不正是1-P(+|H1)嘛!如果我的實驗將統(tǒng)計功效P(+|H1)控制在0.8,那么P(-|H1)就是0.2。

同理,P(-|H0)就是置信區(qū)間,即為1-P(+|H0)=1-0.05=0.95。

那么P(H1)和P(H0)怎么辦?這就要靠所謂的"溫故知新"了。查了查既往文獻,發(fā)現(xiàn)有20篇相關報道中,18篇支持該藥有降糖作用,那么P(H1)=18/20=0.9,則P(H0)=0.1。

P(H1)和P(H0)就是剛才提到的"先驗概率",是根據(jù)既往知識得到的,而我們所要計算的P(H1|-)稱為"后驗概率"。

現(xiàn)在可以代入了,計算得P(H1|-)=0.2×0.9/(0.2×0.9+0.95×0.1)=0.655。

即,當我做出P>0.05的實驗結果,該藥物仍然有效的概率是65.5%。然而這個數(shù)字有什么用?65.5%算大還是算小呢?這還不能直接挪用舊知識說5%算小概率事件,之后就大了。

這里還有一個概念叫貝葉斯因子,記作B,B=P(H1)/P(H0)(此處略去了概率的條件),意為本實驗所得數(shù)據(jù)支持備擇假設的可能性是支持原假設的B倍。

顯然, B>1即數(shù)據(jù)支持備擇假設,B<1則支持原假設,B越接近1,就是越中立,數(shù)據(jù)越不敏感,證據(jù)越弱。

不過多接近算是"接近"?在經(jīng)典教材《概率論》中Jeffreys等人提倡,1/3~3之間算是接近,即目前所得證據(jù)較弱。這區(qū)間倒也不完全是空穴來風,當效應量還過得去的情況下,B=3基本上相當于P=0.05。

不過這也不是死定的,B和P之間也沒有固定的對應關系,B值和效應量、備擇假設的選定都有關,如果備擇假設太粗糙,B=3時P也有可能是0.01或更小。

后來Lee等人在《貝葉斯認知建模》中補充,B<1/3和B>3為中度證據(jù),B<1/10和B>10為強證據(jù)。

在本實驗中,條件即做出了陰性結果,所以B=P(H1|-)/P(H0|-)。

還得先照公式計算P(H0|-)=0.95×0.1/(0.95×0.1+0.2×0.9)=0.345

那么B=0.655/0.345=1.895,落在1~3之間,可以認為是支持備擇假設的弱證據(jù)。

你說,那B值不是也有個檻?沒錯,但這能給我們的信息比P值更多了。

看公式又雙叒叕頭大?用在線計算器吧:

地址:http://psych./mbirnbaum/bayes/BayesCalc.htm

這個網(wǎng)站也是用了一個例子來解釋計算器怎么用,所以括號內(nèi)的字母是根據(jù)它的例子來設定的,跟我的例子不一樣@_@所以要你消化一下公式嘛。

實在不消化也沒關系,我就用咱們的例子上的數(shù)字填了進去,這樣大概可以對應讓誰是誰了吧?右下的W1就是我們最后要的那個B值。

不過,別高興太早,有幾點還要嘮叨一下:

  1. 貝葉斯因子其實挺復雜的,以上只是入門簡版;

  2. 貝葉斯分析法比頻率分析法歷史悠久,卻直到近年才被重視。在醫(yī)學研究中,還只是個在嘗試、被倡導的小地位。

  3. 聰明的你也看出來了,先驗概率的設定是有運氣和主觀成份的,你拿這個去跟審稿人argue,也看審稿人的眼見,我就在遠方祝福你~

參考資料:

1.Using Bayes to get the most outof non-significant results

2.A comparison of two worlds: Howdoes Bayes hold up to the status quo for the analysis of clinical trials?

3.貝葉斯vs頻率派:武功到底哪家強?

4.Ta有多大可能,成為你的理想伴侶?

    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    欧美人禽色视频免费看| 国产肥妇一区二区熟女精品| 日本女人亚洲国产性高潮视频| 国产一区二区三区口爆在线| 夫妻性生活动态图视频| 欧美日韩国产一级91| 国产一区二区不卡在线播放 | 亚洲中文字幕在线视频频道| 国产成人精品久久二区二区| 黄色片一区二区在线观看| 丰满人妻熟妇乱又伦精另类视频 | 亚洲国产丝袜一区二区三区四| 欧美成人欧美一级乱黄| 激情内射亚洲一区二区三区| 国产高清三级视频在线观看| 91亚洲精品国产一区| 国产传媒中文字幕东京热| 国产精品内射视频免费| 日本淫片一区二区三区| 欧美野外在线刺激在线观看| 日韩人妻中文字幕精品| 日本女优一色一伦一区二区三区| 在线观看视频国产你懂的| 日本不卡视频在线观看| 国产日韩综合一区在线观看| 中文字字幕在线中文乱码二区| 在线观看那种视频你懂的| 麻豆精品视频一二三区| 国产亚洲精品久久99| 免费人妻精品一区二区三区久久久 | 国产精品内射婷婷一级二级| 国产传媒中文字幕东京热| 国产日韩欧美在线播放| 欧美日韩精品一区二区三区不卡| 国产免费成人激情视频| 日韩一区二区三区久久| 亚洲成人久久精品国产| 在线免费国产一区二区| 麻豆精品在线一区二区三区| 国产一二三区不卡视频| 神马午夜福利一区二区|