在進行多元回歸分析時,當回歸模型中使用兩個或以上的自變量彼此相關時,則稱回歸模型中存在多重共線性(multicollinearity)。嚴重的多重共線性可能會使回歸分析的結果混亂,甚至會把分析引入歧途。1、最簡單的一種方法是計算模型中各對自變量之間的相關系數(shù),如果一個或多個相關系數(shù)是顯著的,就表示存在多重共線性問題。2、當模型的線性關系檢驗(F檢驗)顯著時,幾乎所有回歸系數(shù)β的t檢驗卻不顯著。4、容忍度(tolerance)與方差擴大因子(VIF)。某個自變量的容忍度等于1減去該自變量為因變量而其他自變量為預測變量時所得到的線性回歸模型的判定系數(shù)。容忍度越小,多重共線性越嚴重。通常認為容忍度小于0.1時,存在嚴重的多重共線性。方差擴大因子等于容忍度的倒數(shù)。顯然,VIF越大,多重共線性越嚴重。一般認為VIF大于10時,存在嚴重的多重共線性。一旦發(fā)現(xiàn)模型中存在多重共線性問題,就應采取解決措施。至于采取什么樣的方法來解決,要看多重共線性的嚴重程度。 (1)將一個或多個相關的自變量從模型中剔除。實際操作中常用逐步法作為自變量篩選方法。 (2)如果要在模型中保留所有的自變量,那就應該:避免根據(jù)t統(tǒng)計量對單個參數(shù)β進行檢驗;對因變量y值得推斷限定在自變量樣本值的范圍內。 (4)偏最小二乘法。偏最小二乘回歸≈多元線性回歸分析+典型相關分析+主成分分析 (5)嶺回歸法。嶺回歸法是通過最小二乘法的改進允許回歸系數(shù)的有偏估計量存在而補救多重共線性的方法。 (6)增加樣本容量。多重共線性問題的實質是樣本信息的不充分而導致模型參數(shù)的不能精確估計,因此追加樣本信息是解決該問題的一條有效途徑。
松哥:在進行多元回歸時,多重共線性問題是大家容易忽視的地方。充分考慮該問題,才可以讓多元回歸的分析方向正確,得出正確結果。
|