主成分分析和因子分析是多元統(tǒng)計(jì)方法中關(guān)系密切的兩種方法,應(yīng)用范圍十分廣泛,可以解決經(jīng)濟(jì)、教育、科技、社會(huì)等領(lǐng)域中的綜合評(píng)價(jià)問(wèn)題。主成分分析采用降維的思想,將研究對(duì)象的多個(gè)相關(guān)變量(指標(biāo))綜合為少數(shù)幾個(gè)不相關(guān)的變量,反映原變量提供的主要信息。因子分析是主成分分析的推廣和發(fā)展,它將具有錯(cuò)綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個(gè)因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,同時(shí)根據(jù)不同因子還可以對(duì)變量進(jìn)行分類,它屬于多元分析中處理降維的一種統(tǒng)計(jì)方法。但是,在許多論文中用SPSS進(jìn)行綜合分析時(shí),出現(xiàn)這兩種方法運(yùn)用混淆的錯(cuò)誤。比如,主成分分析中對(duì)變量進(jìn)行了因子旋轉(zhuǎn),因子分析的公因子系數(shù)錯(cuò)誤等問(wèn)題。本文就此對(duì)主成分分析和因子分析的異同進(jìn)行比較,并在SPSS和DPS軟件上如何實(shí)現(xiàn)給予說(shuō)明。一、主成分分析與因子分析的異同點(diǎn)
兩者的相同點(diǎn):1、思想一致:都是降維的思想;2、應(yīng)用范圍一致:都要求變量之間具有不完全的相關(guān)性;3、數(shù)據(jù)處理過(guò)程一致:數(shù)據(jù)的無(wú)量綱化,求相關(guān)系數(shù)矩陣的特征值和特征向量,通過(guò)累計(jì)貢獻(xiàn)率確定主成分個(gè)數(shù)、因子個(gè)數(shù);4、合成方法一致:都沒(méi)有考慮原始變量之間的關(guān)系,直接用線性關(guān)系處理變量與主成分和因子之間的關(guān)系。 兩者的不同點(diǎn):1、方差損失上:主成分解釋了原始變量的全部方差,無(wú)方差損失;因子模型中除了有公因子外還有特殊因子,公因子只解釋了部分信息,有方差損失;2、唯一性:主成分分析不存在因子旋轉(zhuǎn),主成分是唯一的;因子分析進(jìn)行因子旋轉(zhuǎn),解不唯一;3、實(shí)際意義:主成分沒(méi)有實(shí)際意義;公因子有實(shí)際意義;4、應(yīng)用:主成分側(cè)重信息貢獻(xiàn)、影響力綜合評(píng)價(jià);因子分析側(cè)重成因清晰性的綜合評(píng)價(jià)。 二、SPSS上的實(shí)現(xiàn) 1、主成分分析在SPSS上的實(shí)現(xiàn) ?。?)將原始數(shù)據(jù)無(wú)量綱化。傳統(tǒng)主成分分析進(jìn)行無(wú)量綱化處理的方法是“中心標(biāo)準(zhǔn)化”,這在SPSS中通過(guò)Analyse-Descriptive Statistics-Descriptive中Save standardized values as variables執(zhí)行。但是,該方法把各指標(biāo)的方差化為1,這就消除了各指標(biāo)變異程度上的差異,進(jìn)而從丟失一部分信息的數(shù)據(jù)中提取主成分是不可取的??梢圆捎?#8220;均值化”或“初始化”的方法進(jìn)行處理。(2)Analyse-Data Reduction-Factor Analysis,彈出Factor Analysis對(duì)話框。(3)Descriptives:Correlation Matrix框中選Coefficients,Statistics框中選Initial solution。(4)Extraction:Method框中選Principal components;Analyze框中選Correlation matrix;Display框中選Unrotated factor solution;Extract框中選Eigenvalues over,數(shù)值為0;Maxium Iteration for convergence中默認(rèn)值為25。(5)結(jié)果顯示在Output中:提取“Total Variance Explained”中主成分的累計(jì)貢獻(xiàn)率大于等于85%的主成分個(gè)數(shù);“Component Matrix”中第i個(gè)主成分的列向量除以相應(yīng)特征根的平方根后就得到這個(gè)主成分的變量系數(shù)向量,可以利用“Transform-compute”來(lái)實(shí)現(xiàn)。(6)寫(xiě)出主成分表達(dá)式及主成分命名:利用(5)中的結(jié)果寫(xiě)出主成分表達(dá)式,F(xiàn)i=x1×a1i+x2×a2i+……+xp×api,其中x1、x2、……、xp是無(wú)量綱化處理后的向量,a1i、a2i……、api是第i個(gè)主成分的變量系數(shù)向量;根據(jù)“Component Matrix”中第i列中系數(shù)絕對(duì)值大的對(duì)應(yīng)變量對(duì)Fi命名。(7)寫(xiě)出綜合主成分:其中 為第i主成分的貢獻(xiàn)率??衫?#8220;Transform-compute”來(lái)實(shí)現(xiàn)。 2、因子分析在SPSS上的實(shí)現(xiàn)。(1)—(4)步同主成分分析;(5)Rotation:Method框中選Varimax(方差最大法);Display框中選Rotated solution;Maxium Iteration for convergence中默認(rèn)值為25。(6)Scores:選中Save as variables;Method框中選Regression;選中Display factor score coefficient matrix。(7)結(jié)果顯示在Output中:提取“Total Variance Explained”中特征值累計(jì)貢獻(xiàn)率大于等于85%的因子個(gè)數(shù);“Rotated Component Matix”為因子載荷陣B。(8)求因子得分函數(shù)并對(duì)因子命名:因子得分函數(shù)為,Zi=x1×bi1+x2×bi2+……xp×bip,其中bi1、bi2、……bip為Output中“Component Score Coefficient Matrix”的第i列向量;將因子載荷陣B中的第i列絕對(duì)值大的對(duì)應(yīng)變量歸為一類,并命名。(9)求綜合因子得分值: ,其中vi/p,為Output中“Total Variance Explained”中的“Rotation Sum of Squared Loadings”欄下的“% of Variance”列。(10)對(duì)綜合因子得分進(jìn)行排序。 由以上可以看出,在用SPSS實(shí)現(xiàn)主成分分析和因子分析時(shí),是從因子旋轉(zhuǎn)開(kāi)始有所不同的,主成分分析不用進(jìn)行因子旋轉(zhuǎn),也不用計(jì)算因子得分,而因子分析通過(guò)進(jìn)行因子旋轉(zhuǎn),使得公因子上有較大的載荷,因子的意義更加明顯。 三、運(yùn)用DPS分析的簡(jiǎn)單介紹 在DPS上進(jìn)行主成分分析和因子分析更加簡(jiǎn)便、快捷。進(jìn)入DPS界面,選中進(jìn)行分析的數(shù)據(jù),從工具欄中選擇多元分析—多因素分析—主成分分析/因子分析,就可以直接顯示出結(jié)果。相比較SPSS而言,DPS分析減少了很多步驟,例如關(guān)于提取出的主成分和因子的系數(shù)向量,不必再進(jìn)行運(yùn)算,直接給出最后結(jié)果,關(guān)于原始變量的均值化、初始化可以直接運(yùn)用菜單一步生成,不必手工操作,而且,DPS軟件是漢化版,操作簡(jiǎn)便直觀。 |
|
來(lái)自: 米木十一 > 《統(tǒng)計(jì)方法》