科學(xué)常識(shí)與素養(yǎng)是公民素質(zhì)的重要組成部分,反映一個(gè)國(guó)家或地區(qū)的軟實(shí)力,從根本上制約著創(chuàng)新能力的提升和社會(huì)經(jīng)濟(jì)發(fā)展。英國(guó)劍橋大學(xué)教授蘇斯倫德(William J. Sutherland)等在《自然》雜志2013年第503卷21期上提出“解讀科學(xué)觀點(diǎn)時(shí)應(yīng)該知道的20個(gè)事實(shí)”,閱后發(fā)現(xiàn)其中提到的科學(xué)事實(shí)都與統(tǒng)計(jì)思維有關(guān)?,F(xiàn)代科學(xué)研究中統(tǒng)計(jì)學(xué)是最重要的工具之一,英國(guó)著名生物學(xué)家高爾頓曾說過:“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問題的非凡能力,當(dāng)科學(xué)的探索者在前進(jìn)的過程中荊棘載途時(shí),唯有統(tǒng)計(jì)學(xué)可以幫助他們打開一條通道?!?/span>當(dāng)然,統(tǒng)計(jì)也很容易被誤用或?yàn)E用,《自然》雜志2014年第506卷13期刊發(fā)評(píng)論《數(shù)字危機(jī)》,宣稱“很多研究者缺乏統(tǒng)計(jì)學(xué)基本知識(shí),普遍存在統(tǒng)計(jì)誤用現(xiàn)象,在一些基礎(chǔ)科學(xué)領(lǐng)域這種情況十分嚴(yán)重”。所以,運(yùn)用科學(xué)研究結(jié)論輔助現(xiàn)實(shí)決策時(shí),須具備良好的統(tǒng)計(jì)思維,才能對(duì)科學(xué)結(jié)論保持清晰認(rèn)識(shí),更準(zhǔn)確地解讀結(jié)論背后的科學(xué)真相。 蘇斯倫德等教授認(rèn)為將科學(xué)結(jié)論應(yīng)用于政策分析,目前仍存在許多嚴(yán)峻的問題,當(dāng)務(wù)之急是要讓政策制定者認(rèn)識(shí)到科學(xué)那不完美的本質(zhì),具備解讀科學(xué)結(jié)論的能力。鑒于此,與科學(xué)打交道的各界非專業(yè)人士,在根據(jù)相關(guān)研究結(jié)論制定政策時(shí)都需要知道20個(gè)基本事實(shí)。 事實(shí)差異和偶然都會(huì)引起變化 現(xiàn)實(shí)世界的變化是不可預(yù)測(cè)的,而科學(xué)竭力探究是什么因素造成這些變化,譬如為什么現(xiàn)在比過去十年更熱?等等。對(duì)于這些現(xiàn)象的科學(xué)解釋,最大挑戰(zhàn)是從無數(shù)可能因素中梳理出我們感興趣的過程所起到的作用。 沒有絕對(duì)準(zhǔn)確的測(cè)量 事實(shí)上,所有測(cè)量都存在誤差,每一次重復(fù)試驗(yàn)都可能得到不同的結(jié)果。在某些情況下,與實(shí)際變化相比測(cè)量誤差也許會(huì)很大。提出結(jié)論時(shí)應(yīng)該給出結(jié)果的誤差范圍,以避免對(duì)精確度的不合理判斷。 偏倚是很普遍的 實(shí)驗(yàn)設(shè)計(jì)或測(cè)量裝置可能對(duì)結(jié)果造成影響,容易在某一特定方向上產(chǎn)生非典型結(jié)果。樣本的構(gòu)成不同,可能得到不同的結(jié)果。那些“統(tǒng)計(jì)上顯著”的結(jié)果更可能被報(bào)道和出版,只看文獻(xiàn)易讓人產(chǎn)生錯(cuò)覺——問題的嚴(yán)重性或方案的有效性往往被夸大。 樣本量通常越大越好 大樣本得到的觀測(cè)結(jié)果往往比小樣本更穩(wěn)定,這一點(diǎn)對(duì)那些變量多、容易產(chǎn)生測(cè)量誤差的復(fù)雜體系尤為重要。譬如,藥物測(cè)試中為了更可靠、準(zhǔn)確地估計(jì)藥物的平均功效,一個(gè)有數(shù)以萬計(jì)樣本量的實(shí)驗(yàn)要比一個(gè)只有數(shù)百個(gè)樣本量的實(shí)驗(yàn)好得多。 相關(guān)不一定意味著因果 相關(guān)關(guān)系的得出有時(shí)候是出于偶然,看似存在的相關(guān)關(guān)系可能是由復(fù)雜的或潛在的第三方因素所導(dǎo)致。譬如,生態(tài)學(xué)家曾一度認(rèn)為有毒的藻類殺死了一條河流入??谔幍聂~,但后來發(fā)現(xiàn)是因?yàn)轸~死了所以藻類繁盛起來。 均值回歸效應(yīng)可能造成誤導(dǎo) 單次測(cè)量中有一部分極端數(shù)據(jù)是由于偶然或誤差造成的,另一次測(cè)量中數(shù)據(jù)可能就沒有那么極端。比如,在經(jīng)常發(fā)生車禍的地方放置一個(gè)測(cè)速相機(jī),隨后事故率的下降并不能歸因于放了測(cè)速相機(jī),只是事故率回歸到正常水平而已。 超越數(shù)據(jù)范圍的推斷存在風(fēng)險(xiǎn) 某一范圍得到的模型如果超出這個(gè)范圍可能就不再適用,譬如如果現(xiàn)在的氣候變化速度比現(xiàn)存物種在進(jìn)化史中所經(jīng)歷過的任何時(shí)期都要快,或是出現(xiàn)一個(gè)全新的極端天氣系統(tǒng)時(shí),評(píng)價(jià)生態(tài)系統(tǒng)對(duì)于氣候變化的反饋就十分困難。 注意基礎(chǔ)比率謬誤 一個(gè)不完美的檢驗(yàn)到底有多準(zhǔn)?不僅與檢驗(yàn)的好壞有關(guān),還與檢測(cè)狀態(tài)本身發(fā)生的概率有關(guān)。譬如,一個(gè)人做了有99%準(zhǔn)確度的血液測(cè)試來檢測(cè)一種罕見疾病,結(jié)果雖呈陽性,但受基礎(chǔ)比率的影響他健康的可能性比生病的可能性更大。 對(duì)照組很重要 對(duì)照組可以幫助科學(xué)家確保沒有額外的因素在干擾結(jié)果,沒有對(duì)照組就難以知道實(shí)驗(yàn)處理究竟對(duì)結(jié)果有沒有影響。有時(shí)人們?cè)谒幬餃y(cè)試中表現(xiàn)出陽性,可能受到環(huán)境、提供測(cè)試的人甚至藥丸顏色的影響,此時(shí)設(shè)置對(duì)照組(安慰劑組)非常重要。 隨機(jī)化能夠避免偏倚 實(shí)驗(yàn)應(yīng)盡可能隨機(jī)地采集樣本。例如,直接比較有參與健康計(jì)劃的家庭和沒有參與健康計(jì)劃的家庭中孩子的學(xué)習(xí)成績(jī),很容易帶上偏倚(受教育程度較高的家庭更可能參與健康計(jì)劃),好的實(shí)驗(yàn)設(shè)計(jì)應(yīng)當(dāng)隨機(jī)地選擇參與或不參與的家長(zhǎng)。 尋求“重復(fù)”而非“偽重復(fù)” 在多個(gè)研究、獨(dú)立總體中重復(fù)出現(xiàn)的結(jié)論更為可靠,如果直接把在某一總體中得到的實(shí)驗(yàn)結(jié)果推廣到其他不具有相同特點(diǎn)的總體,就犯了“偽重復(fù)”的錯(cuò)誤,偽重復(fù)導(dǎo)致研究者對(duì)結(jié)果產(chǎn)生虛假信心。 科學(xué)家也是人 科學(xué)家也從工作中獲得一些既得利益,包括地位、研究經(jīng)費(fèi)甚至是直接的經(jīng)濟(jì)利益,這可能導(dǎo)致研究結(jié)論的刻意選擇與夸大。同行評(píng)價(jià)并非絕對(duì)可靠,期刊編輯可能更支持積極、富有新聞價(jià)值的結(jié)果。多渠道、獨(dú)立來源的數(shù)據(jù)及可重復(fù)結(jié)果才更可信。 顯著性很重要 統(tǒng)計(jì)顯著性表示一個(gè)事件出于偶然而發(fā)生的概率,科學(xué)家習(xí)慣將P<0.05的情況稱為顯著。比如一項(xiàng)實(shí)驗(yàn)中實(shí)驗(yàn)組與對(duì)照組的差異顯著性是P=0.01,表示有百分之一的可能性是:實(shí)驗(yàn)處理其實(shí)沒有效果,只是偶然因素導(dǎo)致了實(shí)驗(yàn)組和對(duì)照組的差異。 不顯著不代表沒效果 統(tǒng)計(jì)上不顯著(P>0.05)并不代表真正的無效,只意味著影響效應(yīng)未被檢測(cè)到而已。譬如用基因改造的抗蟲棉和抗蟲馬鈴薯做一組實(shí)驗(yàn)顯示,這些作物對(duì)傳粉者等益蟲不存在不利影響,事實(shí)可能是實(shí)驗(yàn)的樣本量不夠大,不足以檢測(cè)到影響效應(yīng)。 “效應(yīng)量”很重要 顯著性可以衡量差異是“真”還是“假”,但如果差異是“真的”,還需進(jìn)一步考察具體效應(yīng)有多大?一項(xiàng)多次重復(fù)的實(shí)驗(yàn)也許得到統(tǒng)計(jì)上顯著、效應(yīng)量很小的結(jié)果,這種結(jié)果可能并沒有實(shí)際意義。 “關(guān)聯(lián)性”限制結(jié)論的推廣 科學(xué)研究結(jié)論能否應(yīng)用于實(shí)際問題,取決于研究條件和實(shí)際情況的相似程度。譬如,如果將從動(dòng)物實(shí)驗(yàn)或?qū)嶒?yàn)室實(shí)驗(yàn)中得到的結(jié)果推廣到人類的時(shí)候,就存在較大的局限性。 感覺會(huì)影響風(fēng)險(xiǎn)感知 很多因素都對(duì)人類的風(fēng)險(xiǎn)感知造成不同程度的影響,包括事件的罕見性、人們自以為對(duì)事件的掌控程度、結(jié)果的不利影響等。比如,美國(guó)人往往嚴(yán)重低估在家攜帶手槍的危險(xiǎn)(縮小100倍),而嚴(yán)重高估住在核反應(yīng)堆旁邊的危險(xiǎn)(擴(kuò)大10倍)。 相關(guān)性會(huì)改變風(fēng)險(xiǎn) 計(jì)算獨(dú)立事件的后果較為容易,像極潮、強(qiáng)降水和關(guān)鍵員工的缺席等,但如果這些事件相互關(guān)聯(lián)(風(fēng)暴導(dǎo)致高水位,而強(qiáng)降水導(dǎo)致關(guān)鍵員工的缺席),它們共同發(fā)生的概率就比預(yù)期大得多。 數(shù)據(jù)可以選擇性呈現(xiàn) 有時(shí)為了支持自己的觀點(diǎn),實(shí)驗(yàn)者會(huì)選擇對(duì)預(yù)期結(jié)果有利的證據(jù)。譬如,一項(xiàng)研究認(rèn)為懷孕時(shí)的酸奶攝入量和后代患哮喘之間顯著相關(guān),解讀結(jié)論首先要知道研究者是預(yù)先打算驗(yàn)證這一假說,還是從一大堆數(shù)據(jù)中偶然發(fā)現(xiàn)這一相關(guān)性的。 極端測(cè)量值可能引起誤導(dǎo) 極端測(cè)量值可能引起誤導(dǎo)。由于個(gè)體能力差異、取樣、偏見、測(cè)量誤差等因素的影響,所有測(cè)量結(jié)果都具有可變性。在解釋研究結(jié)果的時(shí)候,除個(gè)體差異之外的因素常被忽略,如果討論的是極端結(jié)果,僅比較極端值和平均值的偏離幅度,就可能帶來嚴(yán)重的誤導(dǎo)。 上述20個(gè)科學(xué)事實(shí),基本上都與統(tǒng)計(jì)常識(shí)有關(guān),可見在開展科學(xué)研究、理解研究結(jié)論以及利用科學(xué)結(jié)論指導(dǎo)現(xiàn)實(shí)決策的過程中,需要具備一定的統(tǒng)計(jì)思維,如此才能避免統(tǒng)計(jì)陷阱和統(tǒng)計(jì)謬誤。正如C·R·勞教授所講:“對(duì)統(tǒng)計(jì)學(xué)的一知半解,常常造成不必要的上當(dāng)受騙;對(duì)統(tǒng)計(jì)學(xué)的一概排斥,往往造成不必要的愚昧無知?!?/span> 統(tǒng)計(jì)思維對(duì)于理解科學(xué)事實(shí)的重要性科學(xué)研究的特征之一是理論體系的邏輯性,從假設(shè)到理論再到推論,一定要有邏輯性,而且理論必須能夠解釋現(xiàn)實(shí),即理論與現(xiàn)實(shí)要有一致性。檢驗(yàn)理論與現(xiàn)實(shí)之間的一致性,通常是統(tǒng)計(jì)學(xué)的工作,統(tǒng)計(jì)學(xué)家在其中扮演著重要角色,包括幫助設(shè)計(jì)收集數(shù)據(jù)的方法,提供數(shù)據(jù)特征的描述方法,以及利用樣本數(shù)據(jù)對(duì)總體特征做出估計(jì)、檢驗(yàn)和預(yù)測(cè)。 現(xiàn)代社會(huì)從信息不足轉(zhuǎn)變?yōu)樾畔⒎簽E,信息匱乏的危機(jī)讓位給信息甄別的困難,如此背景下科學(xué)方法成為每個(gè)人的必修課。在日益依賴數(shù)據(jù)的今天,樹立正確的統(tǒng)計(jì)思維,才能有效地開展數(shù)據(jù)處理與分析。邏輯思維往往隱含一定的前提條件,即使邏輯思維過程非常正確,如果前提條件不滿足或者錯(cuò)了,得到的結(jié)論可能與現(xiàn)實(shí)不符,所以需要利用統(tǒng)計(jì)方法來對(duì)研究結(jié)論進(jìn)行經(jīng)驗(yàn)驗(yàn)證。當(dāng)今世界正步入信息爆炸的大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)越顯重要,驗(yàn)證了英國(guó)科幻小說作家H·G·威爾斯的預(yù)言:“統(tǒng)計(jì)思維總有一天會(huì)像讀寫一樣,成為一個(gè)有效率公民的必備能力?!?/span> 從隨機(jī)性中尋找規(guī)律性,是統(tǒng)計(jì)的基本思想,也是統(tǒng)計(jì)的魅力所在。統(tǒng)計(jì)學(xué)被廣泛應(yīng)用于各門學(xué)科之中,從自然科學(xué)到人文社會(huì)科學(xué),甚至是工商業(yè)及政府的情報(bào)決策。作為認(rèn)識(shí)自然、社會(huì)的工具和手段,統(tǒng)計(jì)研究客觀現(xiàn)象的數(shù)量關(guān)系,幫助政策制定者理解科研證據(jù)對(duì)決策的作用。正如現(xiàn)代統(tǒng)計(jì)學(xué)的奠基人費(fèi)歇爾所講:“給20世紀(jì)帶來了人類進(jìn)步的獨(dú)特方面是統(tǒng)計(jì)學(xué),統(tǒng)計(jì)學(xué)的普遍存在以及在開拓新知識(shí)領(lǐng)域方面的應(yīng)用已遠(yuǎn)遠(yuǎn)超過20世紀(jì)內(nèi)的任何技術(shù)或科學(xué)發(fā)明?!保ɡ罱鸩?,2009) 馬寅初曾說:“學(xué)者不能離開統(tǒng)計(jì)而究學(xué),實(shí)業(yè)家不能離開統(tǒng)計(jì)而執(zhí)業(yè),政治家不能離開統(tǒng)計(jì)而施政?!苯y(tǒng)計(jì)思維是在獲取數(shù)據(jù)、從數(shù)據(jù)中提取信息、論證結(jié)論可靠性等過程中表現(xiàn)出來的一種思維模式,對(duì)于人類提高認(rèn)知起到巨大的作用。無論是解開自然奧秘的科學(xué)調(diào)查,或是考查早期匿名文學(xué)作品的作者、給出考古文物的時(shí)間年表,或是解決法庭爭(zhēng)端以及做出最佳決策等,統(tǒng)計(jì)思維都起到不可替代的重要作用。 統(tǒng)計(jì)學(xué)是一種由經(jīng)驗(yàn)到理性的認(rèn)識(shí),是一種運(yùn)用偶然發(fā)現(xiàn)規(guī)律的科學(xué)。它不只是一種方法或技術(shù),還含有世界觀的成分——看待世界上萬千事物的一種方法,人們常講某事從統(tǒng)計(jì)角度看如何,指的就是這個(gè)意思。統(tǒng)計(jì)思維的養(yǎng)成不但需要學(xué)習(xí)一些具體的指示,還要能夠從發(fā)展的眼光,把這些指示連綴成一個(gè)有機(jī)的、清晰的圖景,獲得一種歷史的厚重感(陳希孺,2002)。正如德國(guó)的斯勒茲曾講道“統(tǒng)計(jì)是動(dòng)態(tài)的歷史,歷史是靜態(tài)的統(tǒng)計(jì)?!?/span> 從統(tǒng)計(jì)學(xué)的角度看,人們從經(jīng)驗(yàn)或?qū)嶒?yàn)中所獲取的知識(shí)是含有不確定性的,統(tǒng)計(jì)關(guān)注的是這種知識(shí)當(dāng)中所含不確定性的度量問題,一旦能得到不確定性的量度,人們的知識(shí)就得到擴(kuò)充,對(duì)世界的認(rèn)知就朝前跨越,這個(gè)過程在人類知識(shí)積累的進(jìn)程中不斷重復(fù)。所以,C·R·勞教授總結(jié)道:“在終極的分析中,一切知識(shí)都是歷史;在抽象的意義下,一切科學(xué)都是數(shù)學(xué);在理性的基礎(chǔ)上,所有的判斷都源于統(tǒng)計(jì)學(xué)?!?/span> 透過統(tǒng)計(jì)思維理解科學(xué)事實(shí)的應(yīng)有態(tài)度統(tǒng)計(jì)方法作為一種實(shí)證主義的方法,目的是從偶然性中發(fā)現(xiàn)必然性,對(duì)真理做出探究。當(dāng)今,在人類活動(dòng)努力的一切范圍內(nèi),統(tǒng)計(jì)學(xué)已經(jīng)成為一種萬能的、強(qiáng)有力的和不可缺少的研究工具(C·R·勞,2004)。統(tǒng)計(jì)作為探求真理的一種手段、工具,其效果如何還取決于運(yùn)用的過程。 現(xiàn)實(shí)中源于多種原因,存在對(duì)統(tǒng)計(jì)有意或無意的誤用、濫用,從而造成了一些統(tǒng)計(jì)陷阱。達(dá)萊爾·哈夫在《統(tǒng)計(jì)陷阱》一書中展示了各種利用統(tǒng)計(jì)陷阱,如今經(jīng)濟(jì)和社會(huì)實(shí)證分析中對(duì)統(tǒng)計(jì)數(shù)據(jù)的“斷章取義”和片面使用成為較普遍的現(xiàn)象(朱玲,2002)。無論是對(duì)自然現(xiàn)象還是人文社科現(xiàn)象的分析研究,隨便提出幾個(gè)例子和片面尋找?guī)讉€(gè)數(shù)據(jù)以佐證某種事物優(yōu)于另一種事物的研究方式,不僅違背統(tǒng)計(jì)學(xué)研究方法中系統(tǒng)性原則,也與一般科學(xué)研究的方法論背道而馳。面對(duì)眾多的統(tǒng)計(jì)謊言與陷阱,如何煉就火眼金睛?達(dá)萊爾·哈夫在書中提出識(shí)破統(tǒng)計(jì)陷阱的方法,即對(duì)統(tǒng)計(jì)資料提出五個(gè)問題:誰說的?他是如何知道的?遺漏了什么?是否有人偷換了概念?這個(gè)資料有意義嗎?通過尋找這5個(gè)問題的答案,讀者能夠初步確定統(tǒng)計(jì)資料是否真實(shí)可信。 首先,數(shù)據(jù)采集及整理時(shí)要特別注意數(shù)據(jù)質(zhì)量問題,避免操作失誤和人為篡改,防止由錯(cuò)誤的數(shù)據(jù)引出荒謬的結(jié)論。如果原始數(shù)據(jù)的質(zhì)量有問題,統(tǒng)計(jì)分析只能是“垃圾進(jìn),垃圾出”。應(yīng)用研究學(xué)者須對(duì)數(shù)據(jù)質(zhì)量有一個(gè)清醒的判斷,考慮到數(shù)據(jù)質(zhì)量對(duì)實(shí)證結(jié)果可能產(chǎn)生的影響。數(shù)據(jù)處理必須通過嚴(yán)謹(jǐn)細(xì)密的數(shù)據(jù)錄入、預(yù)處理、分析和檢驗(yàn)工序構(gòu)筑基礎(chǔ),加強(qiáng)過程的質(zhì)量控制,否則即使擁有再高超的統(tǒng)計(jì)技巧,也難免會(huì)不自覺地制造出統(tǒng)計(jì)謊言。 其次,根據(jù)研究目的,結(jié)合數(shù)據(jù)的類型及特點(diǎn),選擇合適的統(tǒng)計(jì)方法。開展統(tǒng)計(jì)分析之前,必須認(rèn)真考慮研究的主要目的是什么,希望解決什么問題,有哪些待檢驗(yàn)的基本假設(shè);分析過程中應(yīng)針對(duì)資料類型和具體問題,從現(xiàn)有的方法庫中選擇合適的統(tǒng)計(jì)方法,如果現(xiàn)有方法不能滿足要求,可以根據(jù)實(shí)際需要開展方法上的創(chuàng)新。 最后,不輕信自己的分析結(jié)果,多用常識(shí)和業(yè)務(wù)知識(shí)去檢驗(yàn)。很多時(shí)候,統(tǒng)計(jì)分析方法都含有一些潛在的假設(shè)條件,實(shí)際分析過程中往往被忽略,故不要輕信統(tǒng)計(jì)分析結(jié)論,尤其是不能給自己的分析結(jié)論牽強(qiáng)地尋找理由!統(tǒng)計(jì)分析不能脫離背景知識(shí)和客觀規(guī)律,如果得到與理論預(yù)設(shè)相反的統(tǒng)計(jì)結(jié)果,應(yīng)回頭檢查自己的假設(shè)條件,更深入地多方論證,而不能為了證明預(yù)先設(shè)想而擺弄統(tǒng)計(jì)游戲。 此外,統(tǒng)計(jì)結(jié)果的發(fā)布要全面、真實(shí),而不能利用一些統(tǒng)計(jì)技巧隱藏真實(shí)的結(jié)果、有選擇性地給用戶以假象和誘導(dǎo)。 為達(dá)到對(duì)事物的全面、正確的科學(xué)認(rèn)識(shí),還應(yīng)把以統(tǒng)計(jì)學(xué)為主的實(shí)證方法與規(guī)范方法結(jié)合起來使用。以規(guī)范分析為基礎(chǔ),才能保證統(tǒng)計(jì)等實(shí)證方法應(yīng)用的有效性和適用性;實(shí)證分析的結(jié)果也只有進(jìn)一步利用規(guī)范方法加以深入分析和研究,才能充分闡明數(shù)字背后科學(xué)含義和價(jià)值判斷。 ( (轉(zhuǎn)自:中國(guó)統(tǒng)計(jì)雜志;作者:程開明;) |
|