目錄 1. 背景介紹實證研究大都致力于回答因果推斷問題,例如:
一直以來,「隨機(jī)實驗」被認(rèn)為是回答上述因果推斷問題的 “黃金法則”。但是,由于社會生活的不可操縱性,隨機(jī)實驗又很難應(yīng)用于社科類研究中。因此,學(xué)者們不得不利用觀測數(shù)據(jù)來進(jìn)行因果推斷。 在因果推斷中,「反向因果問題」又是一個不可忽視的問題。重新回顧上述因果問題,人們不禁會問:
可以看出,上述問題的因果關(guān)系可能是雙向的,這也是我們在進(jìn)行因果推斷過程中面臨的關(guān)鍵挑戰(zhàn)。 當(dāng)然,說起來容易,如何解決「反向因果問題」也絕非易事。為此,本文將系統(tǒng)介紹「反向因果問題」偏誤的來源,并在此基礎(chǔ)上,結(jié)合現(xiàn)有文獻(xiàn)案例為讀者提供一些可行的解決方法。 2. 偏誤來源通常,未考慮反向因果問題,會導(dǎo)致估計結(jié)果產(chǎn)生偏誤。接下來,以面板數(shù)據(jù)為例,分別用 POLS、FE、RE、以及 FD 等方法估計 X 對 Y 的影響,來分析偏誤的來源。 2.1 POLS 方法回歸方程為: 其中,yit 為被解釋變量,xit 為解釋變量,?it 為滿足獨立同分布的誤差項。為了使估計得到的參數(shù)具備無偏性,回歸方程中的誤差項需要滿足同期外生性,即: 在 POLS 方法下,允許反向因果關(guān)系存在時,只有當(dāng)所有同時對 X 和 Y 都產(chǎn)生影響的變量被捕捉到時,參數(shù)估計才是有效的。但這樣嚴(yán)格的條件在實證研究中往往難以滿足,估計偏誤也由此產(chǎn)生。 2.2 FE 和 RE 方法進(jìn)一步,將代表個體特征的 αi 從誤差項中分離。根據(jù)對 αi 的處理方式不同,又可以分為 FE (固定效應(yīng)) 模型和 RE (隨機(jī)效應(yīng)) 模型。 在 FE 模型下,回歸方程為: 其中,F(xiàn)E 模型允許代表個體特征的 αi 與解釋變量相關(guān)。 在 RE 模型下,回歸方程為: 其中,RE 模型認(rèn)為代表個體特征的 αi 與解釋變量不相關(guān),即: 盡管上述模型在處理 αi 的方式上有所不同,但都需要滿足嚴(yán)格外生性的假設(shè): 當(dāng)反向因果關(guān)系存在時,嚴(yán)格外生性的假設(shè)往往不能滿足,故 FE 模型和 RE 模型的估計結(jié)果也會產(chǎn)生偏誤。 2.3 FD 方法在 FD 模型的基礎(chǔ)上,可以將原回歸方程減去個體水平上的均值,消去 αi,再對參數(shù)進(jìn)行估計。 相減,得到下式: 與 FE 模型和 RE 模型相比,F(xiàn)D 模型放松了 αi 的外生性假設(shè),但仍需要滿足嚴(yán)格外生性假設(shè)。因此,與 FE 模型和 RE 模型類似,反向因果關(guān)系的存在仍會使 FD 模型的估計結(jié)果出現(xiàn)偏誤。 3. 解決方法接下來,本文將介紹幾種反向因果問題的解決方法,輔以論文實例進(jìn)行說明。 3.1 解釋變量滯后項的引入及 LFD 模型將解釋變量的滯后項代替解釋變量進(jìn)入回歸,可能有助于解決反向因果問題。假設(shè)回歸方程如下: 盡管解釋變量滯后項的引入有助于擺脫嚴(yán)格外生性假設(shè),但它引入了同樣強(qiáng)而不可測的假設(shè),即未觀測變量序列不相關(guān)。由此可見,在 FE 模型和 RE 模型中,簡單地引入解釋變量的滯后項并不能很好地解決反向因果問題。 進(jìn)一步,我們可以在引入解釋變量滯后項的基礎(chǔ)上使用一階差分的方法得到 LFD 模型。假設(shè)兩個時點上的回歸方程分別為: 將兩個式子相減,可得: LFD 模型允許 X 影響 Y 時因果反饋過程的存在,即允許 xit 和 ?it 之間存在相關(guān)性。然而,LFD 模型對因果關(guān)系描述的準(zhǔn)確性要求很高。LFD 模型建立在一個關(guān)鍵的假設(shè)上,即 Y 在兩個時點間的變化量是 X 在先前兩個時點間變化量的函數(shù)。因此,若現(xiàn)實中的因果間的滯后關(guān)系并非如模型所示,則 LFD 模型的估計結(jié)果就會產(chǎn)生偏誤。 3.2 被解釋變量滯后項的引入和 AB 模型在回歸模型的右邊引入被解釋變量的滯后項的方法被稱為 LDV 模型。假設(shè)回歸方程為: 此時,被解釋變量滯后項的引入導(dǎo)致誤差項 ?is 與被解釋變量的滯后項之間存在相關(guān)性,違背了嚴(yán)格外生性的假設(shè),因而造成偏誤。 在 LDV 模型的基礎(chǔ)上,做一階差分即可得到 AB 模型。差分后的回歸方程為: 接著,我們可以利用 yit?2 等更高階滯后項或 Δyit?2 等更高階滯后項的差分項來為 Δyit?1 的工具變量。解釋變量的處理方法與被解釋變量類似。在此基礎(chǔ)上,我們可以利用標(biāo)準(zhǔn) GMM 或系統(tǒng) GMM 等方法進(jìn)行估計。 但是,AB 模型也存在一些弊端:
3.3 交叉滯后的固定效應(yīng)和 ML-SEM 方法在上述分析中,我們分別將解釋變量和被解釋變量滯后項引入模型,來緩解反向因果問題。自然地,也可以同時將解釋變量和被解釋變量的滯后項引入回歸模型,即交叉滯后的固定效應(yīng)模型。假設(shè)回歸方程如下: 針對上式,有學(xué)者利用 ML-SEM 方法 (最大似然估計 結(jié)構(gòu)方程模型) 進(jìn)行估計。與 LFD 模型和 AB 模型類似,ML-SEM 方法通過假設(shè)解釋變量的序列外生性來允許反向因果關(guān)系的存在,即允許誤差項 ?it 與解釋變量的未來值相關(guān)。值得注意的是,ML-SEM 方法的使用需要建立在誤差項序列無關(guān)的假設(shè)之上。此外,ML-SEM 方法同樣面臨與 LFD 模型類似的 “滯后關(guān)系識別問題”。 Maghyereh 和 Abdoh (2020) 在討論油價變動的不確定性和企業(yè)投資間的關(guān)系時考慮了反向因果問題。作者利用交叉滯后的固定效應(yīng)模型進(jìn)行估計?;貧w方程如下所示: 其中,INVit 表示企業(yè)投資水平,OVolt 表示原油價格的不確定性 (波動性),Xitk 表示企業(yè)層面的控制變量,Xtm 表示金融市場不確定性的變量,Drt 表示原油價格不確定性沖擊的虛擬變量,τi 表示不隨時間變化的企業(yè)層面?zhèn)€體效應(yīng),δt 表示時間趨勢,?it 為獨立同分布的誤差項。 在此基礎(chǔ)上,作者還將所有的解釋變量滯后一期來控制可能的內(nèi)生性問題和反向因果問題。之后,作者利用系統(tǒng) GMM 方法進(jìn)行估計,并利用兩階段最小二乘 (two-stage least squares) 進(jìn)行穩(wěn)健性檢驗。 3.4 影響渠道或機(jī)制分析以上三種應(yīng)對反向因果問題的方法多是在回歸方程上做文章,即通過滯后項的引入來放松原有的嚴(yán)格外生性假設(shè)。此外,也有學(xué)者通過影響渠道或機(jī)制分析來應(yīng)對可能存在的反向因果問題。 Pagano 和 Schivardi (2003) 分析了企業(yè)規(guī)模和增長率之間的因果關(guān)系。作者利用影響渠道的分析來應(yīng)對其中可能存在的反向因果問題?;净貧w方程為: 其中,g 表示國家 j 部門 i 的人均增加值的增長率,X 為控制變量,S 為國家 j 部門 i 的平均企業(yè)規(guī)模加上1的對數(shù),λi 表示部門的虛擬變量,? 表示誤差項。 接著,作者借鑒 Rajan 和 Zingales (1998) 的方法對反向因果關(guān)系進(jìn)行了檢驗。為此,作者將企業(yè)的研發(fā)強(qiáng)度作為中介變量加入回歸方程,具體如下所示: 其中,D 為研發(fā)強(qiáng)度,其捕捉了企業(yè)規(guī)模對增長率影響的部門差異化效應(yīng)。若部門差異化效應(yīng)識別正確且因果關(guān)系由企業(yè)規(guī)模到增長率,則參數(shù) θ3 應(yīng)為正且顯著。若企業(yè)規(guī)模通過研發(fā)強(qiáng)度影響增長率的論點成立,則我們應(yīng)該能觀測到企業(yè)規(guī)模和增長率總體相關(guān)性估計的減少,即 θ2 的估計值相對于 α2 的估計值的減少。若研發(fā)強(qiáng)度是企業(yè)規(guī)模對增長率影響的唯一渠道,則 θ2 應(yīng)接近于零。 通過檢驗,作者發(fā)現(xiàn)了企業(yè)規(guī)模通過研發(fā)強(qiáng)度對增長率產(chǎn)生影響,表明基礎(chǔ)回歸中企業(yè)規(guī)模與增長率的相關(guān)關(guān)系不是由反向因果關(guān)系造成的。 3.5 線性反饋檢驗Chong 和 Calderon (2000) 利用線性反饋檢驗 (linear feedback test) 證明了制度有效性和經(jīng)濟(jì)增長之間的雙向因果關(guān)系。借鑒 Geweke (1982) 的方法,作者利用線性反饋檢驗將制度有效性和經(jīng)濟(jì)增長之間的相關(guān)性分解成三個部分,分別是正向影響 (from 制度有效性 to 經(jīng)濟(jì)增長 )、反向影響 (from 經(jīng)濟(jì)增長 to 制度有效性) 和當(dāng)期影響 (instantaneous)。線性反饋檢驗的具體步驟如下所示: 首先,作者考慮了兩個回歸方程: 其中,xt 表示制度有效性的測量值,yt 表示 GDP 的人均增長率。在此基礎(chǔ)上,作者還控制了以下變量:初等教育的初始入學(xué)率、國內(nèi)生產(chǎn)總值 (期初水平) 和區(qū)域虛擬變量 (拉丁美洲和非洲)。 基于以上回歸,作者得到如下的方差協(xié)方差矩陣: 其中,∑ij=E[ξit,ξjt′],i,j,=1,2。 接著,作者另外考慮了兩個回歸: 基于以上回歸,作者得到 ∑1=E[ε1t,ε1t′] 和 ∑2=E[ε2t,ε2t′]。 最后,作者將當(dāng)期因果也納入回歸方程內(nèi): 基于以上回歸,作者得到 ∑ξi=E[ξit,ξit′],i=1,2。 在以上計算的基礎(chǔ)上,作者利用如下方法測量因果關(guān)系: 其中,F(xiàn)x,y 表示制度有效性和經(jīng)濟(jì)增長之間的線性關(guān)系,可以被分解成三個部分:制度有效性對經(jīng)濟(jì)增長的影響 Fx→y,經(jīng)濟(jì)增長對制度有效性的影響 Fy→x 和當(dāng)期影響 Fx·y。 3.6 結(jié)構(gòu)方程組法若反向因果關(guān)系存在,則解釋變量和被解釋變量之間的關(guān)系往往可以用方程組來表示。此時,若只估計方程組中的某一個方程,則會因內(nèi)生性問題而造成估計偏誤。因此,有學(xué)者利用結(jié)構(gòu)方程組法來應(yīng)對反向因果問題。 Sridhar 等 (2007) 探究了電信普及率和經(jīng)濟(jì)增長之間的關(guān)系。為了應(yīng)對可能存在的反向因果問題,作者建立了一個內(nèi)化電信普及率和經(jīng)濟(jì)增長的結(jié)構(gòu)方程組。具體來看,作者估計了四個回歸方程:
4. 參考文獻(xiàn)
5. 相關(guān)推文
相關(guān)課程
課程一覽
|
|