郵箱:econometrics666@126.com所有計量經(jīng)濟圈方法論叢的code程序, 宏微觀數(shù)據(jù)庫和各種軟件都放在社群里.歡迎到計量經(jīng)濟圈社群交流訪問.①有意思的實證計量討論帖, 熬夜肝完了一直的計量困惑!②QA: 平方項的IV, 加時間固定符號相反, 滾動窗口回歸, 面板分位數(shù)輸出圖, 機制分析中IV, pre5顯著咋辦,③主回歸不顯著, 分組回歸卻異常顯著的研究來了!④城市*年份聯(lián)合的FE與他們分開的FE有什么區(qū)別? FE如何從一維進化到二維, 三維的? ⑤DID可以有2個處理組和1個對照組么? 有相關(guān)的參考文獻嗎? 上一日推送了”當把交互項加入后, 主項的系數(shù)符號竟變相反了, 這是咋回事? 如何處理呢?“ 之后引起了很多的關(guān)注,其中咱們計量社群群友@包寒吳霜說:其實,這個問題很多大牛都存在很多誤解。一句話概括,如果加入交互項,必須對相應(yīng)的自變量進行中心化處理,只有這樣才能把結(jié)果中自變量的回歸系數(shù)稱為“主效應(yīng)”,否則是不能叫“主效應(yīng)”的!有交互的情況下,自變量的回歸系數(shù),本質(zhì)上是調(diào)節(jié)變量等于0的時候,該自變量的簡單效應(yīng),并不是任何情況下都能叫“主效應(yīng)”。*當然對學術(shù)感興趣的學者都可以到社群進一步交流和討論。
不少大牛的論文也存在這個誤解。我們專門發(fā)表過一篇Commentary。 用統(tǒng)計軟件(如SPSS、R)進行回歸分析,預測變量涉及X、M及兩者的交互作用,當你看到模型結(jié)果中X的回歸系數(shù)、M的回歸系數(shù),就直接把這些回歸系數(shù)解讀為X的「主效應(yīng)」、M的「主效應(yīng)」。
起初只放一個自變量X來預測因變量Y,發(fā)現(xiàn)X對Y的「主效應(yīng)」顯著(或不顯著),但是,當考慮調(diào)節(jié)變量M與自變量X的交互作用之后,發(fā)現(xiàn)X對Y的「主效應(yīng)」突然不顯著了(或突然顯著了)。 不要小看這些問題,真的有很多人對此是不求甚解、想當然的,其中甚至包括領(lǐng)域大牛!本文針對上述常見的對回歸分析結(jié)果的錯誤解讀,辨析三個重要概念「固定效應(yīng)、主效應(yīng)、簡單效應(yīng)」,借此促進更多研究者關(guān)注和重視這個看似“差之毫厘”的問題,避免結(jié)論“謬以千里”。
主效應(yīng)與交互作用(p. 420, Statistical Methods for Psychology) 1 / 如何理解主效應(yīng)?1.1 / 從回歸方程講起對于一個最簡單的回歸模型: 橫坐標為自變量X,縱坐標為因變量Y
橫坐標為調(diào)節(jié)變量M,縱坐標為X對Y的效應(yīng) 1.2 / 教科書中的界定我們不妨參考一下統(tǒng)計學經(jīng)典教科書中的定義和解釋。Main Effect: Arising from ANOVA terminology, the effect of an independent variable on Y averaged across the (main or interaction) effects of other independent variables.”(主效應(yīng)是指某個自變量在其他自變量/調(diào)節(jié)變量不同取值下的平均效應(yīng);p. 676)“In general, in a regression equation containing an interaction, the first-order regression coefficient for each predictor involved in the interaction represents the regression of Y on that predictor, only at the value of zero on all other individual predictors with which the predictor interacts.”(在考慮交互作用的回歸模型中,某個自變量本身的低階回歸系數(shù),僅表示當與之交互的其他變量都等于0的時候,該自變量的效應(yīng);p. 260)“Centering is also important if the multiple regression model includes interactions. For each of the two explanatory variables involved in an interaction, the interpretation of its slope is that it is the expected value of the slope when the other variable has the value zero. Again, since 'zero’ may not even be a possible value, the value of the slope for the interaction term may not be interpretable at all. Since multilevel regression models often include cross-level interactions, this is a serious interpretation problem. When both variables in the interaction are centered on their grand mean, the problem disappears.”(多水平回歸模型的情況與普通OLS回歸的情況類似;變量中心化對于主效應(yīng)的解釋很重要;p. 49) 1.3 / 深入理解所謂“主效應(yīng)”的問題,只出現(xiàn)在考慮交互作用的情況下。如果不考慮交互作用,那么某個變量的回歸系數(shù)就是它對因變量的效應(yīng),不受其他變量取值或編碼的影響。需要注意的是:無論你使用哪種變量編碼方式、是否對變量進行中心化處理,模型擬合(包括R2、AIC、BIC等)都不會變,交互作用項的系數(shù)和顯著性也不會變,并且模型直接輸出的X的回歸系數(shù)(固定效應(yīng))也始終代表與之交互的其他變量等于0的時候,X對Y的簡單效應(yīng)。真正關(guān)鍵在于如何解讀X的固定效應(yīng):如果自變量都經(jīng)過中心化,那么中心化后的變量取0也就意味著原來的變量取均值,根據(jù)主效應(yīng)的定義,這時可以認為X的固定效應(yīng)是其主效應(yīng);否則,不能把X的回歸系數(shù)直接解讀為主效應(yīng)!? 但這里還要注意一些技術(shù)細節(jié):
1.4 / 拓展:二分變量上面已經(jīng)解釋,當連續(xù)變量中心化后,其均值變?yōu)?,從而可以使固定效應(yīng)具有主效應(yīng)的含義。實際上,不僅是連續(xù)變量,二分變量也是可以中心化的,因為二分變量本質(zhì)上是0/1數(shù)值型變量(回歸模型無法直接處理分類變量,都是轉(zhuǎn)換成數(shù)值型處理的)。不過,二分變量更推薦轉(zhuǎn)換成“–0.5/0.5”編碼。不同編碼有什么區(qū)別呢?在分析交互作用的時候,不同編碼都可以使用嗎?二分變量的“1/2”編碼:此時變量取0沒有意義,因為這種編碼的二分變量是取不到0的,所以不推薦在有交互作用的時候使用這種編碼。 二分變量的“0/1”編碼:此時變量取0意味著取到0對應(yīng)的類別,并以該類別作為參照基線,然后拿1對應(yīng)的類別與之作比較,稱為“treatment”編碼(R語言中對應(yīng)contr.treatment() 函數(shù));可以用,但必須清楚與之交互的另一個變量的固定效應(yīng)的含義(此時不能解讀為主效應(yīng))。 二分變量的“–1/1”編碼:此時變量取0意味著兩個類別的簡單平均(不受樣本中兩個類別不平衡的影響),但該變量對應(yīng)的回歸系數(shù)(變化1個單位帶來的效應(yīng))代表的是從–1的類別變?yōu)閮深惼骄?,或從兩類平均變?yōu)?的類別,而不是從一類變?yōu)榱硪活?,稱為“sum”編碼(R語言中對應(yīng)contr.sum() 函數(shù));可以用,但也必須明確解釋其含義。 二分變量的“–0.5/0.5”編碼:與“–1/1”編碼類似,好處在于,此時該變量變化1個單位,就意味著從一類變?yōu)榱硪活悾梢员3峙c“0/1”編碼的一致,所以兼具“0/1”和“–1/1”編碼的優(yōu)勢,非常推薦使用。 二分變量的中心化處理(均值為0):如果樣本中的兩類均衡,各有50%,那么中心化后就等同于“–0.5/0.5”編碼;但如果兩類不均衡,那么中心化的二分變量取0就不意味著兩個類別的簡單平均,而是樣本中的實際均值——這樣的話,模型沒有對類別不均衡的情況進行控制,會使另一個變量的“主效應(yīng)”偏向于二分變量中數(shù)量多的那一類。 那么,到底是用“–0.5/0.5”編碼,還是用中心化處理的二分變量呢?實際上這個問題沒有唯一答案,取決于研究問題,以及研究者希望考察怎么樣的“主效應(yīng)”。在實驗設(shè)計中,分類自變量往往是實驗條件,比如因素A有兩個水平A1和A2,因素B有兩個水平B1和B2,那么研究者一般希望考察A在B不同水平上的總體效應(yīng)(而不是A在B樣本平均值上的效應(yīng)),并且A1與A2、B1與B2在理想情況下數(shù)量應(yīng)該是均衡的,不會出現(xiàn)某個水平下的數(shù)據(jù)量遠遠大于另一個水平的情況,這就是經(jīng)典的方差分析ANOVA,放在回歸分析里面就是“–0.5/0.5”編碼(或“–1/1”編碼)。 在社會調(diào)查中,情況略有不同,舉例來說,性別是二分變量,人口中男女比例一般是比較均衡的,但在一次調(diào)查中,性別比例很可能不均衡(比如,師范類院校女生數(shù)量遠大于男生),這就會使性別二分變量經(jīng)過中心化后的0的含義變成“在樣本中的平均水平”,如果女性樣本量大于男性樣本量,則反映的是偏向于女性的一種“主效應(yīng)”——如果研究者認為女性居多就是研究總體的特征,那么可以中心化處理;但如果研究者希望“主效應(yīng)”能夠反映男女比例均衡時的效應(yīng),那么就需要考慮“–0.5/0.5”編碼,并納入其與主要自變量的交互作用,這樣就可以校正由樣本的類別比例失衡或取樣偏差帶來的影響。 在醫(yī)學研究中,情況還有差異,舉例來說,健康狀況可以是一個二分變量(健康=0,患病=1),但很顯然,在整個人群中,健康人的比例遠大于患者。那么健康狀況二分變量經(jīng)過中心化后的0的含義就是“在樣本中的平均水平”,反映的是整個人群的特征;而如果采用“–0.5/0.5”編碼,其等于0的含義就變成了“健康人”和“患者”之間的簡單平均狀態(tài)(也許是“亞健康”?)——這仍然取決于研究問題和研究假設(shè),以及研究者到底希望考察什么效應(yīng)。 所以,對于二分變量,視不同情況,建議采用“–0.5/0.5”編碼或中心化,同時要注意兩者在解讀方面的差異。2 / 并不少見的誤區(qū)!通過上面的解釋,我們可以進一步澄清這些容易混淆的概念:固定效應(yīng)(fixed effect):自變量的回歸系數(shù)(僅在某些情況下等價于主效應(yīng)或簡單效應(yīng))。(在多水平模型中,“固定效應(yīng)”雖然也指回歸系數(shù),但還需要與“隨機效應(yīng)”區(qū)分開。 主效應(yīng)(main effect):在有交互項的模型中,自變量在調(diào)節(jié)變量不同水平下的平均(總)效應(yīng)。 簡單效應(yīng)(simple effect):在有交互項的模型中,自變量在調(diào)節(jié)變量取某個值時的特定效應(yīng)。 不少人在看到回歸模型的結(jié)果后,想當然地就把回歸系數(shù)解讀成了「主效應(yīng)」,但其實這些回歸系數(shù)只代表與這個自變量交互的其他變量等于0的時候該自變量的「簡單效應(yīng)」。我在近半年里,就接觸到至少3次身邊同學或網(wǎng)友沒搞清楚“主效應(yīng)”的情況。他們可能很敏銳地指出了本文開篇舉例的情形,但其實并沒有解釋完整為什么主效應(yīng)會在加入調(diào)節(jié)變量之后產(chǎn)生戲劇性的變化(真正原因是:此時自變量的“主效應(yīng)”并不是主效應(yīng),而是調(diào)節(jié)變量等于0時的簡單效應(yīng))。實際上,在科學研究中,由于一時疏忽而混淆「固定效應(yīng)、主效應(yīng)、簡單效應(yīng)」的情況也并不少見。例如,日裔澳大利亞文化心理學家Takeshi Hamamura與合作者在American Psychologist發(fā)表論文,考察了中國在1950~1999年間,個人主義/集體主義文化與其他10個概念(如積極/消極、成就、金錢、休閑、工作、家庭等)之間關(guān)系的變化。然而,由于變量編碼不當,他們對統(tǒng)計結(jié)果的解讀有誤,將多水平回歸模型中的固定效應(yīng)(實際反映了簡單效應(yīng))錯誤地解讀為主效應(yīng),而實際的主效應(yīng)他們并沒有計算和報告,最終導致10個模型中的4個關(guān)鍵結(jié)果完全錯誤!我們已發(fā)表一篇評論文章(Commentary),客觀指出了他們的統(tǒng)計錯誤,并希望借此引起更多人的重視。針對這類問題,一位老師感慨:“一定要讓更多人看到,不然成千上萬的科研經(jīng)費相當于白花了,產(chǎn)出一堆廢紙……”3 / 總結(jié)在回歸模型考慮交互作用的情況下(比如X和M的交互),「主效應(yīng)」是指在M不同取值下X的平均效應(yīng)/總效應(yīng)(也可以理解為M取平均值時X的效應(yīng)),「簡單效應(yīng)」是指M取某個特定值時X的效應(yīng)(也稱為簡單主效應(yīng)),「固定效應(yīng)」(模型直接輸出的回歸系數(shù))是指M取0時X的效應(yīng)。 4 / 其他參考資料 Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2003). Applied multiple regression/correlation analysis for the behavioral sciences (3rd ed.). Mahwah, NJ: Lawrence Erlbaum Associates.Hox, J. J., Moerbeek, M., & van de Schoot, R. (2018). Multilevel analysis: Techniques and applications (3rd ed.). New York, NY: Routledge.Hamamura, T., Chen, Z., Chan, C. S., Chen, S. X., & Kobayashi, T. (2021). Individualism with Chinese characteristics? Discerning cultural shifts in China using 50 years of printed texts. American Psychologist, 76(6), 888–903. https:///10.1037/amp0000840Bao, H.-W.-S., Cai, H., & Huang, Z. (2022). Discerning cultural shifts in China? Commentary on Hamamura et al. (2021). American Psychologist, 77(6), 786–788. https:///10.1037/amp0001013 Source: https://zhuanlan.zhihu.com/p/513227882 一些社群學術(shù)討論:1.“顯著不顯著的后背是什么, 非(半)參估計里解決內(nèi)生性”,2.“計量社群里關(guān)于使用交互項還是中介效應(yīng)分析開展機制研究的討論”,3.“為啥面板數(shù)據(jù)回歸中, 即使X對Y的解釋程度很大, 但R-square一般都很小?”,4.多期DID中使用雙向固定效應(yīng)可能有問題! 又如何做平行趨勢檢驗? 多期DID方法的最新進展如何?,5.收入和年齡等變量是將其轉(zhuǎn)化成有序離散變量還是當成連續(xù)變量進行回歸呢?6.控制變量就能影響結(jié)果顯著性, 所以存在很大操作空間, 調(diào)參數(shù)是常用手段嗎?7.回歸中常數(shù)項顯著說明模型中有遺漏變量問題?8.審稿人有義務(wù)告訴你回歸中可能的遺漏變量么?9.針對很多實證問題的討論, 隨手保存的部分內(nèi)容以饗學者,10.未引入交互項主效應(yīng)為正, 引入后變?yōu)樨? 解釋出來的故事特別好, 主效應(yīng)符號確實增強了故事性,11.雙向固定效應(yīng)多期DID最新進展和代碼匯總, 關(guān)于控制變量和固定效應(yīng)選取的討論,12.逐年匹配的PSM-DID操作策略, 多時點panel政策評估利器,13.多期DID前沿方法大討論, e.g., 進入-退出型DID, 異質(zhì)性和動態(tài)性處理效應(yīng)DID, 基期選擇問題等,14.針對經(jīng)濟學領(lǐng)域中介效應(yīng)模型問題的回應(yīng)和理性討論,15.討論a(b)對b(a)的新方向論文, 經(jīng)濟學期刊分區(qū)問題, 3個機制存在時計量模型設(shè)計問題,16.如果解決了內(nèi)生性, 那么是否意味著證實了變量之間的因果關(guān)系呢?17.解釋變量提升一個標準差,被解釋變量提升幾個百分比呢?18.關(guān)于DID中對照組與處理組的比例問題?19.雙重差分法和事件研究法的區(qū)別主要在哪里?20.雙重差分法和事件研究法的區(qū)別主要在哪里?21.統(tǒng)計上不顯著的變量表明該變量對結(jié)果變量沒有影響嗎?22.IV與Y在理論上無直接關(guān)系, 但用Y對IV做回歸發(fā)現(xiàn)IV是顯著的, 這是咋回事?23.Heckman模型和工具變量IV之間的差異?24.被質(zhì)疑: X與Y相關(guān)系數(shù)與回歸系數(shù)截然相反, 你咋想的?25.審稿人質(zhì)問: 通篇都基于OLS估計, 卻把它放到穩(wěn)健性檢驗或進一步討論中!26.異質(zhì)性和機制檢驗都用交互項做會被審稿人質(zhì)疑么? 27.所有控制變量都不顯著行不行呢?審稿人啥看法,28.審稿人: 實證論文必須先提出假說, 再依次進行實證檢驗么?
|