來源:不止點(diǎn)滴 作者:秋楓瀾
一般來說,經(jīng)濟(jì)數(shù)據(jù)有三種類型:橫截面數(shù)據(jù)(包括混合橫截面數(shù)據(jù))、面板數(shù)據(jù)和時(shí)間序列數(shù)據(jù)。對(duì)于應(yīng)用微觀研究而言,主要還是采用前兩種數(shù)據(jù)類型,時(shí)間序列數(shù)據(jù)多應(yīng)用于金融等方面的研究,由于我基本不做時(shí)間序列分析,以下就不再提及該數(shù)據(jù)類型。在有選擇權(quán)的情況下(對(duì)于同一個(gè)研究主題,同時(shí)有橫截面和面板數(shù)據(jù)可供選擇),建議毫不猶豫地采用面板數(shù)據(jù)。 理由在于,相對(duì)于橫截面數(shù)據(jù),面板數(shù)據(jù)具有眾多優(yōu)勢(shì)。簡(jiǎn)單講三個(gè)優(yōu)勢(shì):一是面板數(shù)據(jù)具有更多的樣本量和信息量,可以降低變量之間共線性的可能性、增加檢驗(yàn)統(tǒng)計(jì)量的自由度和增強(qiáng)估計(jì)結(jié)果的有效性;二是面板數(shù)據(jù)除了截面維度外,還具有時(shí)間維度,從而可以考察效應(yīng)的時(shí)間變化趨勢(shì),進(jìn)行動(dòng)態(tài)分析;三是面板數(shù)據(jù)一定程度上可以減輕萬(wàn)惡的內(nèi)生性問題(由遺漏變量引起的內(nèi)生性),至于原因,將是下面要講的重點(diǎn)。 在建立好計(jì)量模型和選用了面板數(shù)據(jù)后,接下來就是用適當(dāng)?shù)挠?jì)量方法對(duì)模型進(jìn)行估計(jì)了。對(duì)于面板數(shù)據(jù)下的模型,有三種常用的估計(jì)方法:固定效應(yīng)估計(jì)、隨機(jī)效應(yīng)估計(jì)和混合效應(yīng)估計(jì)。什么叫混合效應(yīng)估計(jì)呢?就是把時(shí)間維度和截面維度的數(shù)據(jù)混合起來,極端地將面板數(shù)據(jù)看成一般的截面數(shù)據(jù),然后用OLS來估計(jì)。可以發(fā)現(xiàn),混合效應(yīng)估計(jì)根本就沒有發(fā)揮出面板數(shù)據(jù)應(yīng)有的優(yōu)勢(shì),因而在實(shí)踐中并不推薦使用。從而面對(duì)面板數(shù)據(jù)時(shí),或者用固定效應(yīng)估計(jì),或者用隨機(jī)效應(yīng)估計(jì)。 什么叫固定效應(yīng)模型或者隨機(jī)效應(yīng)模型呢?對(duì)于如下的靜態(tài)面板模型(解釋變量中不包含被解釋變量的滯后項(xiàng),否則叫動(dòng)態(tài)面板模型): 其中,下表i表示個(gè)體,t表示時(shí)間。對(duì)于所有的解釋變量,可以將其劃分為隨時(shí)間變化的個(gè)體特征(比如年齡和收入)以及不隨時(shí)間變化的個(gè)體特征(比如性別)??梢赃M(jìn)一步將擾動(dòng)項(xiàng)進(jìn)行劃分: 其中,為擾動(dòng)項(xiàng)中不可觀測(cè)的不隨時(shí)間變化的個(gè)體上的差異,具體叫做個(gè)體效應(yīng);為擾動(dòng)項(xiàng)中不可觀測(cè)的不隨個(gè)體變化的時(shí)間上的差異,具體叫做時(shí)間效應(yīng)。為擾動(dòng)項(xiàng)中的余下部分,并假定其滿足球形擾動(dòng)方差等假設(shè)。 此時(shí),可以根據(jù)個(gè)體效應(yīng)或者時(shí)間效應(yīng)與解釋變量的關(guān)系來定義固定效應(yīng)模型與隨機(jī)效應(yīng)模型: (1)如果個(gè)體效應(yīng)與某個(gè)解釋變量相關(guān),則模型可稱之為“個(gè)體固定效應(yīng)模型”; (2)如果時(shí)間效應(yīng)與某個(gè)解釋變量相關(guān),則模型可稱之為“時(shí)間固定效應(yīng)模型”; (3)如果個(gè)體效應(yīng)和時(shí)間效應(yīng)均與某個(gè)解釋變量相關(guān),則模型可稱之為“雙向固定效應(yīng)模型”; (4)如果個(gè)體效應(yīng)和時(shí)間效應(yīng)與所有的解釋變量均不相關(guān),則模型可稱之為“隨機(jī)效應(yīng)模型”。 從以上的定義可以發(fā)現(xiàn),在隨機(jī)效應(yīng)假設(shè)滿足的情況下,復(fù)合擾動(dòng)項(xiàng)與解釋變量無(wú)關(guān),因而可以得到一致估計(jì)。但是,由于此時(shí)不是球形擾動(dòng)項(xiàng)(為球形擾動(dòng)項(xiàng),但不是),從而OLS估計(jì)不是最優(yōu)效率的,此時(shí)采用廣義最小二乘法(GLS)可以得到最佳線性無(wú)偏估計(jì),這也是用Stata進(jìn)行隨機(jī)效應(yīng)回歸時(shí)軟件采用GLS的原因,如下圖: 而在固定效應(yīng)假設(shè)滿足的情況下,復(fù)合擾動(dòng)項(xiàng)與解釋變量相關(guān),從而無(wú)法得到一致估計(jì)(回憶一下,假設(shè)不成立是造成內(nèi)生性的原因)。因此,固定效應(yīng)模型估計(jì)方法的核心思想就在于消除擾動(dòng)項(xiàng)中與解釋變量相關(guān)的個(gè)體效應(yīng)或者隨機(jī)效應(yīng)。一般來說,固定效應(yīng)模型的估計(jì)方法有如下幾種: (1)組內(nèi)估計(jì)(Withinestimate):即組內(nèi)去均值處理; (2)一階差分估計(jì)(FD); (3)最小二乘虛擬變量法(LSDV):在模型中加入固定效應(yīng)的虛擬變量。 這里以個(gè)體固定效應(yīng)模型為例講一下組內(nèi)去均值估計(jì)的基本思想,組內(nèi)估計(jì)也是Stata默認(rèn)采用的估計(jì)方式。對(duì)于如下的個(gè)體固定效應(yīng)模型(3): 用模型中的每一項(xiàng)減去其均值,得到新的模型,如下所示: 由于u、Z和α均為不隨時(shí)間改變的值,因而其均值就是其本身,也就是說 ,從而模型(4)可以轉(zhuǎn)化為: 其中。此時(shí)可以發(fā)現(xiàn),新的擾動(dòng)項(xiàng)h與新的解釋變量k明顯不相關(guān),因而通過OLS可以得到一致估計(jì)?,F(xiàn)在應(yīng)該能理解固定效應(yīng)估計(jì)為什么能夠一定程度上緩解因遺漏變量造成的內(nèi)生性了吧? |
|