主成分、因子分析报告步骤
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实用文案
主成分分析、因子分析步骤
不同点
主成分分析因子分析
概念具有相关关系的p 个变量,经过线性组合后成为k 个不相关的新变量将原数据中多个可能相关的变量综合成少数几个不相关的可反映原始变量的绝大多数信息的综合变量
主要目标减少变量个数,以较少的主成分来解释原有变量间的大部分变异,适合于数据
简化找寻变量间的内部相关性及潜在的共同因素,
适合做数据结构检测
强调重点强调的是解释数据变异的能力,以方
差为导向,使方差达到最大
强调的是变量之间的相关性,以协方差为导向,关心
每个变量与其他变量共同享有部分的大小
最终结果
应用
形成一个或数个总指标变量反映变量间潜在或观察不到的因素
变异解释
程度它将所有的变量的变异都考虑在内,因
而没有误差项
只考虑每一题与其他题目共同享有的变异,因
而有误差项,叫独特因素
是否需要
旋转主成分分析作综合指标用,不需要旋转因子分析需要经过旋转才能对因子作命名与解
释
是否有假
设只是对数据作变换,故不需要假设
因子分析对资料要求需符合许多假设,如果假设条件不
符,则因子分析的结果将受到质疑
因子分析
1 【分析】→【降维】→【因子分析】
(1)描述性统计量(Descriptives )对话框设置
KMO和Bartlett 的球形度检验(检验多变量正态性和原始变量是否适合作因子分析)
实用文案
( 2)因子抽取( Extraction )对话框设置方法:默认主成分法。主成分分析一定要选主成分法分析:主成分分析:相关性矩阵。输出:为旋转的因子图抽取:默认选1.
最大收敛性迭代次数:默认25.
( 3)因子旋转( Rotation )对话框设置因子旋转的方法,常选择“最大方差法” 。“输出”框中的“旋转解”
4)因子得分(Scores )对话框设置
保存为变量” ,则可将新建立的因子得分储存至数据文件中,并产生新的变量名称。
5)选项(Options )对话框设置
点,当KMO>0.9 (很棒)、KMO> 0.8 (很好)、KMO>0.7 (中等)、KMO> 0.6 (普通)、KMO> 0.5 (粗劣)、
KMO<0.5 (不能接受)。
2)公因子方差
公因子方差起始撷取
卫生 1.000 .855
饭量 1.000 .846
等待时间 1.000 .819
味道 1.000 .919
亲切 1.000 .608
撷取方法:主体元件分析。
Communalities (称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的基准是<0.4 就可以认为是比较低,这时变量在分析中去掉比较好。
(3)解释的总方差
元件
各因子的特征值因子贡献率因子累积贡献率
总计变异的 % 累加 % 总计变异的 % 累加 % 总计变异的 % 累加 %
取样足够度的 Kaiser-Meyer-Olkin 度量。 Bartlett 的球形度检验近似卡方
df
Sig.
.515 3.784
6 .706
2 结果分析
(1)KMO及Bartlett ' s 检验
KMO和 Bartlett 的检验
当KMO值愈大时,表示变量间的共同因子愈多,
愈适合作因子分析。根据Kaiser 的观
撷取方法:主体元件分析。
第二列:各因子的统计值第三列:各因子特征值与全体特征值总和之比的百分比。也称因子贡献率。第四列:累积百分比也称因子累积贡献率第二列统计的值是各因子的特征值,即各因子能解释的方差,一般的,特征值在1 以上就是重要的因子;第三列%是各因子的特征值与所有因子的特征值总和的比,也称因子贡献
率;第四列是因子累计贡献率。
如因子1 的特征值为2.451 ,因子2的特征值为1.595 ,因子3,4,5 的特征值在1 以下。因子1 的贡献率为49.0%,因子2 的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。
成分矩阵是 未旋转前的因子矩阵, 从该表中并无法清楚地看出每个变量到底应归属于哪个因 子。旋转后的因子矩阵, 从该表中可清楚地看出每个变量到底应归属于哪个因子。 此表显示 旋转后原始的所有变量与新生的
2 个公因子之间的相关程度 。
一般的, 因子负荷量的 绝对值 0.4 以上 ,认为是 显著的变量 ,超过 0.5 时可以说是非常重要 的变量 。如味道与饭量关于因子 1 的负荷量高, 所以聚成因子 1,称为饮食因子; 等待时间、 卫生、亲切关于因子 2 的负荷量高,所以聚成因子 2,又可以称为服务因子。
)因子得分系数矩阵
元件评分系数矩阵
元件 1
2 卫生 -.010 .447 饭量 .425 -.036 等待时间
-.038
.424
至此已经将 5 个问项降维到两个因子
fac2_1 ,即为 因子得分 。
(4)成分矩阵与旋转成分矩阵
2 个变量, fac1_1 、
,在数据文件中可以看到增加了
味道亲切.480
-.316
.059
-.371
撷取方法:主体元件分析。
转轴方法:具有 Kaiser 大变
异法。
元件评分。
正规化的最
因子得分系数矩阵给出了因子与各变量的线性组合系数。
因子1 的分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5
因子2 的分数=0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5
6)因子转换矩阵
撷取方法:主体元件分析。
转轴方法:具有 Kaiser 正规化的最大变异法。
因子转换矩阵是主成分形式的系数。
(7)因子得分协方差矩阵
撷取方法:主体元件分析。
转轴方法:具有 Kaiser 正规化
的最大变异法。
元件评分。
看各因子间的相关系数,若很小,则因子间基本是两两独立的,说明这样的分类是较合理的。
主成分分析
1 【分析】——【降维】——【因子分析】