在數(shù)學(xué)上,特別是線性代數(shù)中, A為n階矩陣,若數(shù)λ和n維非0列向量v,滿足Av=λv,那么數(shù)λ稱為A的特征值,v稱為A的對應(yīng)于特征值λ的特征向量。 在多元統(tǒng)計中,特征值和特征向量主要在PCA主成分分析及FA因子分析中發(fā)揮作用。 在主成分分析中
在因子分析中
進一步解釋特征值/向量的作用,本文假設(shè)一個雙變量模型。 給定相關(guān)系數(shù)矩陣R,從中得出2對特征值和特征向量。 特征向量描述了這個橢圓的兩條軸的方向。橢圓軸的半長和特征值的平方根是成比例的。所以,在2個變量時,特征值比較大的特征向量對應(yīng)的就是長軸方向。因為這里只有2個維度,所以是一個平面圖形。 原坐標系中,每個樣本都對應(yīng)了一個橫縱坐標?,F(xiàn)在,有了特征向量后,我們順著特征向量的方向畫兩條新軸,也就是圍繞橢圓建立新軸。因為軸心沒有改變,所以每個樣本與軸心的距離是不會改變的。改變的只有橫縱坐標。 因為軸的順序是按照特征值的大小排序的,所以在解釋樣本變異方向時,排序在前的軸重要性更高。 實例:如下圖,特征值總和都是2。但是每張圖有不一樣的特征值和特征向量。 左圖:兩個特征值很接近,因此橢圓的兩條軸長度就相近。因此,樣本的散落的位置接近于一個圓形。λ1稍微大一些,因此,紅軸重要性稍微更高一些,我們可以推測可能存在一些負相關(guān)性,但也非常微小,接近于0,幾乎不相關(guān)。 中間:λ1對應(yīng)紅軸,負方向。λ2對應(yīng)綠軸,正方向。λ1>λ2,推斷負相關(guān)是更加普遍的趨勢,但是正相關(guān)也是存在的,所以這描述的是程度中等的負相關(guān)關(guān)系。 右圖:λ1遠大于λ2。說明紅軸代表的正相關(guān)關(guān)系非常強烈,沿著綠軸可以發(fā)現(xiàn),樣本變異程度很小,因此推斷,本樣本間仍然以正相關(guān)關(guān)系為主。 |
|