Contrast Between Two Schools of Thought on Hypothesis Test Zhang gaokui,et al., PLA post-graduate medical school(100853).Beijing 【Abstract】 Objective To discuss differences between classical and Bayesian testing thoughts.Methods First these two thoughts are summarized,and then they are compared through an example.Results It is pointed out that these two thoughts are united on Bayes‘s Theorem,that they are equal on given occasions,and that Bayesian testing approaches have more advantages than classical approaches in using prior information,indicating the hazard of testing,considering the loss,and dealing with the problem of multi-hypotheses.Conclusion Great attention should be paid to Bayesian theory. 【Key words】 hypothesis test Classical school Bayesian school 假設(shè)檢驗問題是統(tǒng)計學的傳統(tǒng)問題,對于該問題,經(jīng)典統(tǒng)計學派與貝葉斯學派有不同的處理思想。目前,經(jīng)典統(tǒng)計方法占據(jù)著統(tǒng)計學的主導地位,但是,貝葉斯方法正在國外迅速發(fā)展并得到日益廣泛的應(yīng)用,我們有必要給以足夠的重視。本文結(jié)合一個例子,對兩大學派的假設(shè)檢驗思想進行初步比較,以揭示兩種思想的區(qū)別與聯(lián)系,并著重探討貝葉斯方法的優(yōu)勢。 兩種假設(shè)檢驗思想 一、經(jīng)典統(tǒng)計學派的假設(shè)檢驗思想 經(jīng)典統(tǒng)計學派運用反證的思想進行推斷,即:在認定一次實驗中小概率事件不會出現(xiàn)的前提下,若觀察到的事件是H0為真時不合理的小概率事件,則拒絕H0。 上述思想可以用如下決策函數(shù)表示: 其中x代表樣本信息。Φ(x)取值為0時即為通常的“拒絕H0”。 二、貝葉斯學派的假設(shè)檢驗思想 貝葉斯學派直接討論H0和H1的后驗概率,依據(jù)后驗概率的大小進行推斷。 其基本的解決方案是:在先驗分布π下,有決策函數(shù) Φ(x)取值為0時即“拒絕H0”。很明顯,它選擇了后驗概率較大的假設(shè)。 三、兩種思想的聯(lián)系與分歧 在經(jīng)典統(tǒng)計學中,參數(shù)被看作未知常數(shù),不存在參數(shù)空間,因而不存在H0和H1的概率,給出的是P(x|H0真),其中x代表樣本信息。在貝葉斯方法中,參數(shù)被看成隨機變量,在參數(shù)空間內(nèi)直接討論樣本x下H0和H1的后驗概率,給出的是P(H0真|x)和P(H0不真|x)。 事實上,兩個學派的方法在一定程度上統(tǒng)一于貝葉斯公式。 由貝葉斯公式容易得到: 因此,當P(H0)=P(H1),即H0與H1居于平等地位時,經(jīng)典學派與貝葉斯學派的結(jié)果是一致的。 然而,H0與H1地位往往不一致,H0常居于將被否定的位置,因而上述一致性并不總能成立。貝葉斯學派對此進行了深入的探討,他們的結(jié)果很有意義。 對于正態(tài)分布前提下的單側(cè)檢驗:X~N(θ,1),H0:θ≤0 H1:θ>0,經(jīng)典方法得到的P值與貝葉斯方法在無信息先驗分布下的后驗概率相等,此結(jié)論可以推廣到正態(tài)分布前提下其他類似的單側(cè)檢驗。 對于形如H0:θ=0,H1:θ>0,(或H1:θ<0)的單側(cè)檢驗,情況則不同,與下述的雙側(cè)檢驗有類似結(jié)果。 對于形如H0∶θ=0, H1:θ≠0的雙側(cè)檢驗,經(jīng)典方法得到的P值與貝葉斯方法的后驗概率大不相同。在Berger和Sellke 1987年對正態(tài)分布前提下二者的比較研究中,當經(jīng)典方法得到的P在0.01~0.1之間時,貝葉斯方法得到H0為真的后驗概率大于P,因而此時拒絕H0所承擔的實際風險大于P,而這個區(qū)間對于經(jīng)典方法下結(jié)論是非常重要的。Hwang和Pematle 1994年提出,對這類雙側(cè)檢驗,類似結(jié)果始終存在,因而P值應(yīng)該由其他判斷標準來替代。但他們還沒有找到這種標準。 兩種思想的應(yīng)用 下面我們通過一個例子對兩種假設(shè)檢驗思想進行一些比較。 例:以隨機變量θ代表某人群中個體的智商真值,θi為第i個個體的智商真值,隨機變量Xi代表第i個個體的智商測驗得分,若該人群的期望智商為μ,則第i個個體在一次智商測驗中的得分可以表示為:xij=θi+eij=μ+ei+eij,其中ei為第i個個體的自然變異,eij為第i個個體第j次測量的測量誤差。根據(jù)以往積累的資料,已知在某年齡兒童的智商真值θ~N(μ,τ2),其中μ=100,τ=15,個體智商測驗得分Xi~N(θi,σ2),其中σ=10?,F(xiàn)在一名該年齡兒童智商測驗得分為115,問:(1)該兒童智商真值是否高于同齡兒童的平均水平(即θi>100)?(2)若取θi在(a,b)為正常,問該兒童智商是否屬于正常? 一、用經(jīng)典統(tǒng)計方法解答 對第一問,設(shè)H0:θi≤100 H1:θi>100,按照經(jīng)典統(tǒng)計學方法,若H0成立,則有: 因此,α水平下的拒絕域為{x:x>100+σ·u1-α} 已知σi=10,若取α=0.05,有u0.95=1.645,100+10×1.645=116.45。 現(xiàn)有x=115,因此,在0.05水平尚不能認為該兒童智商高于平均水平。 對第二問,經(jīng)典方法需要進行兩次分別針對a、b的單側(cè)檢驗。過程與第一問相似,這里不再敘述。 二、用貝葉斯方法解答 在貝葉斯學派中,當θi未知時,將其看作隨機變量,與θ具有相同的分布,這是貝葉斯學派與經(jīng)典學派的一個重大區(qū)別。 根據(jù)貝葉斯理論,若X~N(θ,σ2),其中σ2已知,θ未知,但已知θ的先驗分布是N(μ,τ2),其中μ和τ2均已知,則給定x后θ的后驗分布為N(μ(x),ρ-1,)其中(證明參見文獻[1])。 由此得到,本例中該兒童智商θi的后驗分布為N(110.38,69.23)。 對第一問,同樣設(shè)H0:θi≤100 H1:θi>100,查正態(tài)分布表可以得到: P(H0:θi≤100|x=115)=0.106, P(H1:θi>100|x=115)=0.894 根據(jù)風險最小原則拒絕H0,接受H1。 對第二問,設(shè)H0:a<θi<b H1:θi<a或θi>b,查正態(tài)分布表可以分別得到P{H0:a<θi<b|x=115}和P{H1:θi<a或θi>b|x=115},類似第一問,依據(jù)風險最小原則作出推斷。 討 論 由上述分析和例子,我們可以看出,用貝葉斯方法處理假設(shè)檢驗問題至少在下述幾方面具有明顯優(yōu)勢。 一、先驗信息利用的充分性和風險的直觀性 從前述問題的處理,我們清楚地看到,經(jīng)典方法只使用了Xi的已有信息(貝葉斯學派稱之為先驗信息),而貝葉斯方法則同時利用了Xi和θ的先驗信息。因而在第二問的解決上,貝葉斯方法較經(jīng)典方法少進行一次假設(shè)檢驗。 在貝葉斯方法中,由于導出了樣本x下的后驗分布,可以對風險給出正面的回答,因而較經(jīng)典方法下的間接判斷更直觀。 二、可以將后續(xù)問題納入考慮范圍 如果推斷錯誤在后續(xù)問題的解決過程中會造成一定損失,貝葉斯方法在進行推斷時可將這一損失考慮在內(nèi)。如: 在假設(shè)H0∶θ∈Θ0,H1∶θ∈Θ1(Θ0、Θ1是參數(shù)空間內(nèi)兩個互補子集)下,有: Φ等于0,1分別代表拒絕、接受H0,a0、a1分別代表了第一、第二類錯誤造成的損失,這時,貝葉斯方法給出如下決策函數(shù): 由于可以將假設(shè)檢驗結(jié)果帶來的損失納入檢驗考慮的范疇之內(nèi),因而對問題的回答更接近實用。 三、多重假設(shè)的處理不存在困難 對多重假設(shè),如將前例第二問改為:若θi∈(a,b)為智力正常,θi<a為智力低下,θi≥b為智力超常,問該兒童智力屬何種類型? 在現(xiàn)有條件下,經(jīng)典方法很難處理這一問題。而貝葉斯方法對這一問題的解答并不存在特殊的困難,只需將假設(shè)設(shè)為:H0∶a≤θi<b H1∶θi<a H2∶θi≥b,多計算一個后驗概率便可 貝葉斯方法的上述優(yōu)勢對于解決實際問題很有幫助。 盡管在理論方面還存在一些困難,但不容否認的是,貝葉斯方法已經(jīng)成為決策論的一個基本工具,在社會學、經(jīng)濟學等領(lǐng)域發(fā)揮著重要作用。在臨床醫(yī)學、預防醫(yī)學、衛(wèi)生事業(yè)管理等決策領(lǐng)域也一定能發(fā)揮重要作用。國內(nèi)醫(yī)學統(tǒng)計學界目前對貝葉斯方法的關(guān)注較少,加強這方面的研究工作,無疑將是有益的。 (在此特別感謝張堯庭教授、余松林教授對本文的指點。) 參考文獻 1.James O.Berger著.賈乃光譯.統(tǒng)計決策論及貝葉斯分析.中國統(tǒng)計出版社,1998,159~172. 2.Christian P.Robert.The Bayesian Choice:A Decision-Theoretic Motivation.Spring-Verlag New York,Inc.1994,179~209 3.張堯庭,陳漢峰編著.貝葉斯統(tǒng)計推斷.北京:中國統(tǒng)計出版社,1994,78~88 4.張堯庭著.統(tǒng)計中的三大學派.統(tǒng)計教育,1995,1:35~39 |
|
來自: superlee > 《統(tǒng)計人生》