歡迎報(bào)名2023年鄭老師團(tuán)隊(duì)系列科研統(tǒng)計(jì)課程! 題目取得可能有點(diǎn)標(biāo)題黨,但真實(shí)情況也差不多:相比隨機(jī)對(duì)照研究與隊(duì)列研究,“病例對(duì)照研究”的文章很難在頂級(jí)醫(yī)學(xué)期刊發(fā)表。病例對(duì)照研究是醫(yī)學(xué)研究進(jìn)行病因推斷的重要方法。它在醫(yī)學(xué)研究中,將研究對(duì)象分為病例組/ 對(duì)照組(更廣泛來(lái)說(shuō)是,陽(yáng)性組/陰性組) ,比較發(fā)病/陽(yáng)性事件發(fā)生前接觸某暴露因素的狀況,比較暴露水平的差異性,初步分析暴露因素與陽(yáng)性事件之間的因果關(guān)系。比如,歷史上最有名的一個(gè)病例對(duì)照研究是,英國(guó)著名流行病學(xué)家Hill爵士在20世紀(jì)40年代發(fā)起的吸煙與肺癌的研究,他通過比較肺癌患者和非肺癌患者的過去的吸煙狀況,發(fā)現(xiàn)肺癌患者吸煙比例遠(yuǎn)高于正常的人群,因此證明了吸煙(暴露因素)與肺癌(陽(yáng)性事件)的因果關(guān)系。但是病例對(duì)照研究存在著很多缺陷,導(dǎo)致這類研究的因果推斷結(jié)論不那么可靠。主要的問題有三點(diǎn):(1)病例對(duì)照研究存在著回憶偏倚 (2)病例對(duì)照研究的暴露因素與結(jié)局的發(fā)生時(shí)間在順序上可能無(wú)法厘清,可能會(huì)出現(xiàn)因果顛倒(先發(fā)生結(jié)果,再出現(xiàn)原因) ;(3)暴露因素與結(jié)局的關(guān)系可能存在著干擾因素,很多人把干擾因素直接認(rèn)定為混雜因素,通過回歸分析來(lái)控制。但實(shí)際上,很多干擾因素可能是中介變量,但病例對(duì)照研究很難區(qū)別中介還是混雜。 今天我要說(shuō)的是12月初發(fā)表在BMJ的雜志的論文,它用一張圖,成功地理清了暴露因素與結(jié)局、暴露因素與干擾因素的關(guān)系,當(dāng)然最終贏得了審稿人的認(rèn)可!四大醫(yī)學(xué)頂級(jí)醫(yī)學(xué)期刊之一的BMJ發(fā)表過一篇病例對(duì)照研究 :“出生缺陷患者的癌癥風(fēng)險(xiǎn):基于北歐兒童、青少年和成人的病例對(duì)照大型研究” 。該研究就是研究“癌癥----出生缺陷”兩個(gè)變量的關(guān)系。為了探討出生缺陷與癌癥發(fā)生之間的聯(lián)系,該研究收集了四個(gè)北歐國(guó)家、總共62295例癌癥病例和724542例對(duì)照樣本的出生缺陷和癌癥診斷信息,以兒童、青少年和成人 (0~46歲) 為研究對(duì)象評(píng)估出生缺陷與癌癥類型的關(guān)系,癌癥發(fā)生風(fēng)險(xiǎn)是否隨出生缺陷的數(shù)量而改變,并評(píng)估這些聯(lián)系是否會(huì)持續(xù)到成年。點(diǎn)評(píng):這篇文章能發(fā)表,大樣本量是關(guān)鍵的原因之一。對(duì)于病例對(duì)照研究,logistic回歸是不二選擇,同時(shí)計(jì)算OR值;由于癌癥發(fā)生率很低,因此這里的OR值幾乎等同于RR值。 本研究收集了四個(gè)北歐國(guó)家 (丹麥、芬蘭、挪威和瑞典) 1967至2014年間所有活產(chǎn)兒信息 (出生情況及出生缺陷信息等)、1943年以來(lái)的癌癥患者信息 (Table 1)??傃芯咳藬?shù)為62,295例癌癥患者 (其中2160例患有嚴(yán)重出生缺陷,占3.5%),724542例對(duì)照樣本 (其中15,826例患有嚴(yán)重出生缺陷,占2.2%)。摘要:癌癥患者,出生缺陷比例3.5%;對(duì)照組,出生缺陷比例2.2%,差別顯著。(2)出生缺陷患者患癌癥的總體風(fēng)險(xiǎn)與沒有嚴(yán)重出生缺陷的人相比,有嚴(yán)重出生缺陷的人總體患癌風(fēng)險(xiǎn)增加 (OR=1.74)。患有嚴(yán)重出生缺陷的人群中,染色體異常患者的患癌風(fēng)險(xiǎn)最高 (OR=5.53),遺傳綜合征/微缺失綜合征患者 (OR=5.44)、非染色體異常出生缺陷患者的癌癥風(fēng)險(xiǎn)也較高 (OR=1.54)。此外,還觀察到患有眼睛、消化系統(tǒng)、泌尿器官、心臟、生殖器和四肢先天缺陷的人患癌癥的風(fēng)險(xiǎn)增加。(3)出生缺陷患者患特定癌癥的風(fēng)險(xiǎn)◆與沒有嚴(yán)重出生缺陷的人相比,非染色體異常出生缺陷的人群患泌尿器官癌 (主要是腎癌,OR=2.7)、周圍神經(jīng)和自主神經(jīng)系統(tǒng)癌 (OR=2.4)、中樞神經(jīng)系統(tǒng)癌 (OR=2.3) 的相對(duì)風(fēng)險(xiǎn)最高。◆ 染色體異常人群患淋巴組織癌和造血組織癌的風(fēng)險(xiǎn)增加,其中急性髓系白血病的風(fēng)險(xiǎn)最高 (OR=88)。其實(shí),很多人采用logistic回歸開展病例對(duì)照研究,一般是多因素logistic回歸,而且最常見的方法是“先單因素后多因素”---先單因素logistic回歸,將P值<0.2或者P<0.05的挑選出來(lái),和出生缺陷一起開展多因素回歸,探討出生缺陷和癌癥發(fā)生的關(guān)系。logistic回歸分析中,除了缺失缺陷之外,其它的自變量可能是干擾因素,一般我們?nèi)苏J(rèn)為是混雜因素。現(xiàn)在用logistic回歸控制了混雜因素,似乎結(jié)果相對(duì)可靠。對(duì)不對(duì)?諸位一直以來(lái),可能就是這么干的! 來(lái)~~~~來(lái)個(gè)笑容 實(shí)際上,大家很多時(shí)候,忽視了一個(gè)重要的概念--中介變量,并在回歸中錯(cuò)誤地把它認(rèn)為是混雜因素,并把它納入回歸分析中。我在這里想告訴大家,回歸分析時(shí),千萬(wàn)記住一句話:回歸分析,混雜變量一定要納入模型,中介變量,一般不要納入模型。在本病例對(duì)照研究,干擾因素中,既有干擾因素又有混雜因素。比如:混雜因素包括母親年齡、是否吸煙、是否試管嬰兒;而中介變量,則包括出生體重,早產(chǎn)等。所以作者也說(shuō):我們不把中介變量納入到回歸分析中。那么問題就來(lái)了,如何篩選混雜變量納入模型呢? 于是作者就搞了一張大家想看到的圖!DAG圖(有向無(wú)環(huán)圖)!這張圖闡明了作者因果推斷的思維方式,向?qū)徃迦私淮俗髡呷绾魏Y選混雜變量。 這張圖具有很重的份量,特別是對(duì)于病例對(duì)照研究,一個(gè)在充斥著各種中介和混雜變量的設(shè)計(jì)方法。關(guān)于DAG圖(有向無(wú)環(huán)圖),我已經(jīng)在之前的文章中詳細(xì)地闡述它的重要性,有興趣可以點(diǎn)擊學(xué)習(xí)。諸位,我在這里想說(shuō)的是:病因推斷研究時(shí),無(wú)論是采用隊(duì)列研究還是病例對(duì)照研究,我們首先得有個(gè)病因假設(shè)模型。任何直接上回歸的方法都是不可靠的研究。特別是,當(dāng)心中介變量對(duì)觀察性研究的干擾!2022年以來(lái),我們召集了一批富有經(jīng)驗(yàn)的高校專業(yè)隊(duì)伍,著手舉行短期統(tǒng)計(jì)課程培訓(xùn)班,包括R語(yǔ)言、meta分析、臨床預(yù)測(cè)模型、真實(shí)世界臨床研究、問卷與量表分析、醫(yī)學(xué)統(tǒng)計(jì)與SPSS、臨床試驗(yàn)數(shù)據(jù)分析、重復(fù)測(cè)量資料分析、結(jié)構(gòu)方程模型、孟德爾隨機(jī)化等10門課。如果您有需求,不妨點(diǎn)擊查看:
|