SPSS之因子分析
SPSS之因子分析
因子分析是一种降维技术,主要用于从大量变量中提取出少数几个能够解释大部分变异的公因子。本文将详细介绍如何使用SPSS软件进行因子分析,包括数据预处理、相关性检验、公因子选取、因子载荷矩阵分析以及因子得分计算等关键步骤,并通过两个具体案例展示因子分析的实际应用过程。
因子分析的基本原理
因子分析的求解通常从分析原始变量的协方差矩阵或相关矩阵着手:
- 当变量取值的度量单位相同时,选择从协方差矩阵求解;
- 当变量取值的度量单位不同时,为了消除不同量纲带来的不利影响,应先对数据进行标准化处理,即选择从相关矩阵求解(SPSS默认)。
数据标准化可以通过SPSS中的【分析】--【描述统计】--【描述】功能实现,勾选“将标准化得分另存为变量”选项,SPSS会自动将标准化后的数据存入数据表。
因子分析的前提条件
进行因子分析的前提是变量之间存在较高程度的相关性,即信息冗余。可通过以下指标完成变量相关性的检验:
- 相关系数矩阵(大部分>0.3)
- KMO值(KMO值至少≥0.5)
- Bartlett球形度检验(p<α)
在SPSS中,这些检验可以通过【分析】--【降维】--【因子分析】--【描述】对话框中的相应选项完成。
公因子的选取原则
公因子的选取与主成分选取类似,主要遵循以下原则:
- 方差累积贡献率达到80%或85%及以上
- 特征值对应的主成分
- 碎石图
因子载荷矩阵分析
SPSS输出结果中可以直接得到因子载荷矩阵。需要注意的是,因子载荷矩阵不是主成分系数矩阵。通过旋转后的因子载荷矩阵,可以更容易解释公因子的意义。
案例1:学生成绩的因子分析
数据描述
数据集包含52名学生的数学(x1)、物理(x2)、化学(x3)、语文(x4)、历史(x5)和英语(x6)成绩。
分析步骤
- 打开SPSS,选择【Analyze】→【Dimension Reduction】→【Factor Analysis】,将所有变量添加到“Variables”中。
- 在【Descriptives】对话框中勾选“Coefficients”、“Significance levels”、“KMO and Bartlett’s test of sphericity”,点击【Continue】。
- 在【Extraction】对话框中勾选“Scree plot”,其他选项保持默认,点击【Continue】。
- 在【Rotation】对话框中选择“varimax”方法,输出选中“Rotated solution”和“Loading plot”,点击【Continue】。
- 最后单击【OK】输出结果。
结果分析
- 相关系数矩阵:数学、物理、化学存在较高程度的相关性,语文、历史、英语存在较高程度的相关性。
- KMO与Bartlett检验:KMO=0.804 > 0.5;Bartlett球形度检验P值小于0.001 <α,适合做因子分析。
- 特征值与方差贡献率:选取前两个主成分,累积方差贡献率达到了 82.317%。旋转后,第一个公因子贡献率为38.745%,第二个公因子贡献率为43.572%。
- 共同度:提取两个公因子对原始6个变量的方差贡献率都很高,说明提取的两个公因子可以有效地反映出6个变量的原始信息。
- 旋转后的因子解:第一个因子主要和语文、历史、英语有很强的正相关,可称为文科科目;第二个因子主要和数学、物理、化学有很强的正相关,可称为理科科目。
案例2:上市公司经营业绩的因子分析
数据描述
数据集包含2017年汽车零配件行业上市公司的12个主要财务指标,包括存货周转率、总资产周转率、流动资产周转率、营业利润率、毛利率、成本费用利润率、总资产报酬率、每股收益、扣除非经常性损益每股收益、每股未分配利润、每股净资产等。
数据预处理
由于指标间存在量纲差异,需要进行数据标准化处理。采用“Z-标准化”方法,即每一变量值与其平均值之差除以该变量的标准差,使得各变量的平均值为0,标准差为1。
分析步骤
分析步骤与案例1类似,但需要在开始前完成数据标准化处理。
结果分析
- 相关系数矩阵:各变量之间的相关系数大部分都大于0.3,说明变量之间存在一定程度的相关性,适合做主成分分析。
- KMO与Bartlett检验:KMO = 0.763 > 0.5;Bartlett球形度检验P值小于0.001 <α,适合做因子分析。
- 特征值与方差贡献率:选取前三个主成分,累积方差贡献率达到了88.935%。旋转后,第一个公因子贡献率为37.080%,第二个公因子贡献率为33.862%,第三个公因子贡献率为17.993%。
- 共同度:提取三个公因子对原始12个变量的覆盖率都非常高,说明三个公因子可以有效地反映出原始12个变量的原始信息。
- 旋转后的因子解:第一个因子主要反映企业获利能力,第二个因子反映企业资产实力,第三个因子反映企业资金周转率。
通过因子得分可以绘制出2017年上市公司中的汽车零配件行业的各个企业的因子得分图,直观反映分析结果。
总结
因子分析是一种强大的降维工具,能够帮助我们从复杂的数据集中提取出关键的公因子。通过SPSS软件,我们可以轻松地完成因子分析的全过程,从数据预处理到结果解释。本文通过两个实际案例展示了因子分析的具体应用,希望对读者有所帮助。
本文原文来自CSDN