作者:麥子(轉載請注:解螺旋·醫(yī)生科研助手) 假如P值欺負了你,不要悲傷,不要心急,你的文章或許還是可以搶救一下的。辦法嘛,除了檢查各種技術環(huán)節(jié)外,統(tǒng)計學上還有兩條路可走: 1)調(diào)整統(tǒng)計功效,簡單說就是擴大樣本量; 2)貝葉斯。 今天咱們來聊聊歪萌邪道的小貝。 不過在搶救之前先要明確一個前提,做出實驗結果P>0.05有兩種可能,一是有真實的效應存在,而當前實驗數(shù)據(jù)不靈敏,沒有檢測到,這是可以搶救一下的;另一種則是真的沒什么效應,原假設拒絕不了,棄療。知情同意了哈,開始吧。 小貝是何方神圣? 貝葉斯分析法是18世紀的英國數(shù)學家托馬斯?貝葉斯開發(fā)的。與貝葉斯分析法相對的,是我們熟悉的頻率分析法,就是特別講究P<0.05的那個。 小貝沒有這道檻,卻更為精妙:它是一個迭代的過程,需要研究者先利用所有現(xiàn)有的資源,包括其他研究者的實驗和既往知識、經(jīng)驗等,得到一個"先驗概率"。 然后做自己的實驗,用實驗數(shù)據(jù)跟那個"先驗概率"一起,計算出"后驗概率"。這個后驗概率也會成為下一個事件的先驗概率,一次次積累,極盡精微。 所以兩種分析法的思路是不一樣的,貝葉斯的理念可以理解成"溫故知新",更接近我們的日常思維。 用數(shù)學語言來說,頻率學派的目的是計算"P(數(shù)據(jù)|參數(shù))",即假定某參數(shù)(假設)真實存在的前提下,我們的實驗能獲得當前數(shù)據(jù)的概率;而貝葉斯學派則專注于"P(參數(shù)|數(shù)據(jù))",即我們有了這份數(shù)據(jù),推算在真實世界中存在某種參數(shù)(效應)的概率。 "P(A|B)"這樣的表述格式就是條件概率,即在B事件發(fā)生的條件下,A事件會發(fā)生的概率。貝葉斯公式便是建立在條件概率之上: 這是從更基礎的P(A|B)=P(B|A)P(A)/P(B)推導出來的,推導過程有點復雜就不管了,咱直接上能用的 A表示發(fā)生A事件,AC 表示與A相反的事件,即A=1-AC 。B當然就是發(fā)生了B事件了。 話說回來,條件概率的表述,有沒有那么一點似曾相識的感覺? 統(tǒng)計功效的概念正與此類似,在假定效應真實存在的情況下,能得到顯著結果的概率。類似的,顯著性是指,在效應不存在(藥物無效)的情況下,得到顯著結果的概率。 我們常說的原假設一般都指效應不存在,記為H0;備擇假設便是效應存在,記為H1。咱們做實驗得到陽性結果(p <0.05)拒絕原假設,這一事件記為"+",得到陰性結果(P>0.05)接受原假設記為"-",那么統(tǒng)計功效就是P(+|H1),顯著性就是P(+|H0)。 小貝教你咸魚翻身 檢測某藥物的降糖作用。然后很(按)不(劇)幸(本)咱們得到了陰性結果,干預組和對照組的差異沒有統(tǒng)計學意義(P>0.05)。 但我不死心,仍想知道P(H1|-)是多少,即P>0.05的情況下,該降糖藥其實是有效只是我沒檢測到的概率。 按那個公式就是: 似乎公式中一個值都代不進去……不過仔細看,P(-|H1)即效應真實存在(藥物有效)的情況下,未能檢測到(錯誤地拒絕原假設)的概率,不正是II類錯誤嘛,不正是1-P(+|H1)嘛!如果我的實驗將統(tǒng)計功效P(+|H1)控制在0.8,那么P(-|H1)就是0.2。 同理,P(-|H0)就是置信區(qū)間,即為1-P(+|H0)=1-0.05=0.95。 那么P(H1)和P(H0)怎么辦?這就要靠所謂的"溫故知新"了。查了查既往文獻,發(fā)現(xiàn)有20篇相關報道中,18篇支持該藥有降糖作用,那么P(H1)=18/20=0.9,則P(H0)=0.1。 P(H1)和P(H0)就是剛才提到的"先驗概率",是根據(jù)既往知識得到的,而我們所要計算的P(H1|-)稱為"后驗概率"。 現(xiàn)在可以代入了,計算得P(H1|-)=0.2×0.9/(0.2×0.9+0.95×0.1)=0.655。 即,當我做出P>0.05的實驗結果,該藥物仍然有效的概率是65.5%。然而這個數(shù)字有什么用?65.5%算大還是算小呢?這還不能直接挪用舊知識說5%算小概率事件,之后就大了。 這里還有一個概念叫貝葉斯因子,記作B,B=P(H1)/P(H0)(此處略去了概率的條件),意為本實驗所得數(shù)據(jù)支持備擇假設的可能性是支持原假設的B倍。 顯然, B>1即數(shù)據(jù)支持備擇假設,B<1則支持原假設,B越接近1,就是越中立,數(shù)據(jù)越不敏感,證據(jù)越弱。 不過多接近算是"接近"?在經(jīng)典教材《概率論》中Jeffreys等人提倡,1/3~3之間算是接近,即目前所得證據(jù)較弱。這區(qū)間倒也不完全是空穴來風,當效應量還過得去的情況下,B=3基本上相當于P=0.05。 不過這也不是死定的,B和P之間也沒有固定的對應關系,B值和效應量、備擇假設的選定都有關,如果備擇假設太粗糙,B=3時P也有可能是0.01或更小。 后來Lee等人在《貝葉斯認知建模》中補充,B<1/3和B>3為中度證據(jù),B<1/10和B>10為強證據(jù)。 在本實驗中,條件即做出了陰性結果,所以B=P(H1|-)/P(H0|-)。 還得先照公式計算P(H0|-)=0.95×0.1/(0.95×0.1+0.2×0.9)=0.345 那么B=0.655/0.345=1.895,落在1~3之間,可以認為是支持備擇假設的弱證據(jù)。 你說,那B值不是也有個檻?沒錯,但這能給我們的信息比P值更多了。 看公式又雙叒叕頭大?用在線計算器吧: 地址:http://psych./mbirnbaum/bayes/BayesCalc.htm 這個網(wǎng)站也是用了一個例子來解釋計算器怎么用,所以括號內(nèi)的字母是根據(jù)它的例子來設定的,跟我的例子不一樣@_@所以要你消化一下公式嘛。 實在不消化也沒關系,我就用咱們的例子上的數(shù)字填了進去,這樣大概可以對應讓誰是誰了吧?右下的W1就是我們最后要的那個B值。 不過,別高興太早,有幾點還要嘮叨一下:
參考資料: 1.Using Bayes to get the most outof non-significant results 2.A comparison of two worlds: Howdoes Bayes hold up to the status quo for the analysis of clinical trials? 3.貝葉斯vs頻率派:武功到底哪家強? 4.Ta有多大可能,成為你的理想伴侶? |
|