因子分析与对应分析

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

输出对应分析表（列联表）输出行点概述表输出列点概述表指定的前n个维度输出基于行列得分的原始表格
输出行轮廓表输出列轮廓表（输出行点和列点的标准差、以及各维度坐标间的相关系数）
第48页，此课件共58页哦
Plots：设置需要输出图形
（输出对应分析图）
双变量散点图行点图
列点图
限制标签长度
输出各行变量分类对应于行得分的散点图
• 5、因子得分
第10页，此课件共58页哦
• 因子分析的一般步骤
第11页，此课件共58页哦
二、引例（练习一）
例1 利用因子分析过程分析各个城市的市政设施建设情况。
数据文件：“各地区城市市政设施.sav”，下表是部分数据。
第12页，此课件共58页哦
【Analyze】/【Data Reduction】/【Factor】
自定义提取因子的数量
（收敛时的最大迭代次数）
公共因子的提取方法：（1）主成分分析法（默认）；（2）不加权最小二乘法；（3）广义最小二乘法；（4）极大似然法；（5）主轴因子法；（6）因子法；（7）影像因子法
第15页，此课件共58页哦
Rotation：选择因子旋转的方法
（因子旋转的方法）
关于因子分析与对应分析
第1页，此课件共58页哦
主成分分析——【Factor】过程
对观测量数目没有严格要求
主成分分析是将多个指标化为少数相互无关的综合指标的统计方法，通常数学上的处理就是将原来的p个指标做线性组合，作为新的综合指标，记第一个综合指标为F1。
选取这个线性组合的原则是令F1的方差大，称F1为第一主成分；然后选取第二主成分F2，且F1与F2的协方差为0，类似构造其余的主成分。
3、变量共同度表
给出了提取公共因子前后各变量的共同度（衡量公共因子的相对重要性指标）
该变量95.4％的信息已
经被提取
第21页，此课件共58页哦
说明：比如变量X1的共同度位0.954，即提取的公共因子对变量X1的方差做出了 95.4%的贡献。
4、主成分表
列出了所有的主成分，且按照特征根从大到小次序排列。
X10.852F10.435F20.015F3 X2 0.854F10.419F20.115F3
X12 0.562F10.164F20.715F3
第36页，此课件共58页哦
6、旋转后因子载荷矩阵
经过正交旋转后的因子载荷矩阵，给出旋转后的各变量的因子表达式。
第37页，此课件共58页哦
X10.837F10.014F20.463F3 X20.882F10.013F20.375F3
分组在第一、第二维度的坐标值
每组所占百分比
（点对维度惯量的贡献量）
每组所对各个维度的贡献量
（维度对点惯量的贡献量）
第52页，此课件共58页哦
4、列点概述表
给出列变量的4个分组在两个维度中的分值
分组在第一、第二维度的坐标值
每组所占百分比
每组所对各个维度的贡献量
维数
奇异值
特征根
总的卡方检验
注：惯量用于说明对应分析各个维度的结果能够解释列联表中两个变量联系的程度。
说明：表中两个维度分别解释了总信息量的99.6%和0.4%，说明二维图形完全可以表示
两个变量间的信息，且观察时以第一维度为主。
第51页，此课件共58页哦
3、行点概述表
给出行变量的3个分组在两个维度中的分值
说明：因子得分的协方差矩阵为单位阵，得出提取的3个公共因子之间是不相关的。
第41页，此课件共58页哦
第二节简单对应分析
——【Correspondebce Analysis】过程
又称列联表对应分析
一、对应分析简介
对应分析是通过进行主成分分析来描述两个或多个分类变量各水平间相关性的分析方法，它的分析结
果主要采用反映变量间相互关系的对应分析图来表示
。
第42页，此课件共58页哦
对应分析在SPSS中分为两类：
简单对应分析——【Correspondebce Analysis】过程：主要研究两个分类变量之间的关系。
多元对应分析—— 【Optimal Scaling】过程
对应分析表（列联表）：
第43页，此课件共58页哦
第27页，此课件共58页哦
要求：输出因子分析适用条件的检验
第28页，此课件共58页哦
要求：输出碎石图
第29页，此课件共58页哦
要求：输出因子得分系数阵
第30页，此课件共58页哦
要求：采用方差最大化正交旋转；输出因子载荷图
第31页，此课件共58页哦
结果解读：
1、 KMO检验和Bartlett球形检验结果表
说明：第一主成分特征根为5.280，方差贡献率为88.001%，前两个主成分的累计贡献率为94.504%，根据提取因子的条件——特征值大于1，本例只选出一个因子。
第22页，此课件共58页哦
5、碎石图
按照特征根大小排列的主成分散点图。纵坐标为特征值，横坐标为因子数。
提取一个主成分即可
第23页，此课件共58页哦
第8页，此课件共58页哦
• 4、因子旋转
因子旋转的目的是为了使得因子载荷阵的结构简化，便于对公共因子进行解释。
这里所谓的结构简化是使每个变量仅在一个公共因子上有较大的载荷，而在其余公共因子上载荷比较小。
这种变换因子载荷阵的方法称为因子轴的旋转。旋转的方法有很多种，如正交旋转，斜交旋轴等。
第9页，此课件共58页哦
（行变量）定义行变量取值范围
（列变量）
定义列变量取值范围
第46页，此课件共58页哦
Model：模式子对话框
（设置分析结果维数）（选择距离测量方式）
卡方距离欧氏距离，主要用于连续变量
（变量的标准化方式）
对称法（默认）第47页，此课件共58页哦
（正则化方法）
Satistics：设置需要输出的统计量
（输出因子得分系数矩阵及因子协方差矩阵）
第17页，此课件共58页哦
Options对话框
要求：用均值代替缺失值
（选择缺失值处理方法）
因子载荷矩阵和结构矩阵按数值大小排序
不显示绝对值小于指定数的载荷系数
（选择系数的输出方式）
第18页，此课件共58页哦
结果解读：
1、相关系数矩阵表
第19页，此课件共58页哦
第3页，此课件共58页哦
依据处理的对象不同，可以分为两类：
R型因子分析，对变量做降维处理
Q型因子分析，对样本做降维处理 •R型因子分析
第4页，此课件共58页哦
第5页，此课件共58页哦
因子分析的几个概念：
• 1、因子载荷
第6页，此课件共58页哦
• 2、变量共同度
第7页，此课件共58页哦
• 3、公因子Fj的方差贡献
8、因子得分的协方差矩阵
反映各因子间的联系程度。
注：本例只提取了一个公共因子，故表格内容无实际意义。
第26页，此课件共58页哦
例2 利用因子分析过程分析一年内各个城市的日照情况。
数据文件：“主要城市日照数.sav” 。
【Analyze】/【Data Reduction】/【Factor】要求：选入分析变量
第2页，此课件共58页哦
第一节因子分析——【Factor】过程
主成分分析的推广和发展，对观测量数目要求至少是变量的5倍以上，且越多越
好
一、因子分析简介
• 做什么？
因子分析是多元统计分析中处理降维的一种统计方法，它主要将具有错综复杂关系的变量或者样品综合为数量较少的几个因子，以再现原始变量与因子之间的相互关系。
要求：选入分析变量
（因子分析的变量）
（定义记录旋转条件）
第13页，此课件共58页哦
Descriptives：选择需要输出的统计量
要求：输出相关系数矩阵；进行因子分析适用条件的检验
所有变量间的相关系数矩阵
显著性水平
相关系数矩阵的行列式值 KMO 检验和Bartlett球形检验
（统计量）
单变量描述统计量：各分析变量的均值、标准差及观测数原始分析结果：原变量的公因子方差、与变量相同个数的因子、各因子的特征根及其所占总方差的百分比和累计百分比
输出各列变量分类对应于列得分的散点图
（图形维度）
输出分析结果的所有维度
限制输出维度的数目
第49页，此课件共58页哦
结果解读：
1、对应分析表
给出不同年龄阶段的人群分别投票给三位总统候选人的人数。
第50页，此课件共58页哦
2、结果汇总表
列出维数、奇异值（惯量的平方根）、惯量（又指特征根）、总的卡方检验及Sig.值
最后分别对行剖面点集和列剖面点集做主成分分析，以判断两个变量的联系情况。
第44页，此课件共58页哦
二、引例（练习二）
例2 利用简单对应分析过程分析不同年龄段选民的倾向。数据文件：voter.sav
第45页，此课件共58页哦
【Analyze】/【Dimension Reduction】/【Correspondence Analysis】要求：选入行变量（取值范围为1~3）与列变量（取值范围为1~4）
说明： KMO检验结果为0.798，大于0.5，比较适合作因子分析； Bartlett球形检验的 Sig.值为0，各变量不独立。
第32页，此课件共58页哦
2、变量共同度表
第33页，此课件共58页哦
说明：变量“Jan”的共同度为0.915，即选取的公共因子提取了变量“Jan”91.5%的信
息。
3、主成分表
6、因子负荷矩阵
用来反映各个变量的变异主要由哪些因子解释。
第24页，此课件共58页哦
X 1 0 . 9 7 7 F 1 1 ,,X 6 0 . 9 2 7 F 1 6
7、因子得分系数矩阵
得出用各个变量的线性组合表达的主成分。
第25页，此课件共58页哦
F 1 0 . 1 8 5 X 1 0 . 1 8 2 X 2 0 . 1 6 3 X 3 0 . 1 8 2 X 4 0 . 1 7 8 X 5 0 . 1 7 6 X 6
（相关矩阵）
相关系数矩阵的逆矩阵
再生相关系数矩阵反映像协方差阵和相关阵
第14页，此课件共58页哦
Extraction：选择因子提取的方法
要求：输出碎石图
（选择公共因子的提取方法）
相关矩阵协方差矩阵
（设定公共因子提取标准）
显示未经旋转变换的因子提取结果
显示碎石图，体现各因子重要程度
以特征根大于指定数值为提取标准
X120.140F10.018F20.913F3
说明：第一主因子主要由前5个变量决定，第二主因子主要由中间4个变量决定，第三主因子主要由最后3个变量决定
。
7、因子转换矩阵
旋转前的因子载荷矩阵乘以因子转换矩阵等于旋转后的因子载荷矩阵。
第38页，此课件共58页哦
8、因子旋转后的因子载荷图
图中的坐标轴就是各个主因子。
• 基本思想：
（1）首先，通过变量（或样品）的相关系数矩阵（或相似系数矩阵）内部结构的研究，找出能控制所有变量（或样品）的少数几个随机变量（常称为因子）去描述多个变量（或样品）之间的相关（相似）关系；
（2）然后，根据相关性（或相似性）的大小把变量（或样品）分组，使得同组内的变量
（或样品）之间的相关性（或相似性）较高，但不同组的变量相关性（或相似性）较低。
第39页，此课件共58页哦
9、因子得分系数矩阵
得到因子得分表达式。
F10.195X10.229X20.252X3 0.169X12 F20.142X10.126X20.048X3 0.100X12 F30.081X10.015X20.086X3 0.516X12
第40页，此课件共58页哦
10、因子得分的协方差矩阵
变量间相关性很高
2、 KMO检验和Bartlett球形检验结果表
接近0.9，适合做因子分析
第20页，此课件共58页哦
拒绝原假设，认为各变量之间不独立
注：
KMO检验用于检验变量间的偏相关系数是否过小，一般， KMO大于0.9 时效果最佳，小于0.5时不适宜做因子分析。
Bartlett球形检验用于检验相关系数矩阵是否是单位阵，如果结论是不拒绝该假设，则表示各个变量都是各自独立的。
方差最大化正交旋转
斜交旋转法
四分旋转法平均正交旋转法
斜交旋转法
输出主成分转换矩阵
（设置旋转解的输出）
输出二维或三维的因子载荷图
第16页，此课件共58页哦
Factor Scores：因子得分
要求：输出因子得分系数矩阵
回归法巴特列特法
安德森-鲁宾法
（在数据文件中建立一个新变量，用于保存各观测量的因子得分）（因子得分计算方法）
说明：第一主成分特征根为6.854，方差贡献率为57.041%，前3个主成分的累积贡献率为84.421%，根据提取因子的条件——特征值大于1，本例选出3个因子。
第34页，此课件共58页哦
4、碎石图
第35页，此课件共58页哦
说明：前3个主成分的特征根都在1以上。
5、因子载荷矩阵
给出各变量的因子表达式。