第8讲因子分析与对应分析优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、主成分表
列出了所有的主成分,且按照特征根从大到小次序排列。
说明:第一主成分特征根为5.280,方差贡献率为88.001%,前两个主成 分的累计贡献率为94.504%,根据提取因子的条件——特征值大于1, 本例只选出一个因子。
5、碎石图
按照特征根大小排列的主成分散点图。纵坐标为特征值,横坐标为因子数。
8、因子得分的协方差矩阵
反映各因子间的联系程度。
注:本例只提取了一个公共因子,故表格内容无实际意义。
例2 利用因子分析过程分析一年内各个城市的日照情况。 数据文件:“主要城市日照数.sav” 。
【Analyze】/【Data Reduction】/【Factor】 要求:选入分析变量
要求:输出因子分析适用条件的检验
(相关矩阵)
相关系数矩阵的逆矩阵 再生相关系数矩阵
反映像协方差阵和相关阵
Extraction:选择因子提取的方法
要求:输出碎石图
(选择公共因子的提取方法)
相关矩阵 协方差矩阵
(设定公共因子提取标准)
显示未经旋转变换的因子提取结果 显示碎石图,体现各因子重要程度
以特征根大于指定数值为提取标准
自定义提取因子的数量
输出主成分转换矩阵
(设置旋转解的输出)
输出二维或三维的因子载荷图
FactHale Waihona Puke Baidur Scores:因子得分
要求:输出因子得分系数矩阵
回归法 巴特列特法 安德森-鲁宾法
(在数据文件中建立一个新变量,用于保存各观测量的因子得分) (因子得分计算方法)
(输出因子得分系数矩阵及因子协方差矩阵)
Options对话框
Descriptives:选择需要输出的统计量
要求:输出相关系数矩阵;进行因子分析适用条件的检验
所有变量间的相关系数矩阵 显著性水平
相关系数矩阵的行列式值 KMO 检验和Bartlett球形检验
(统计量)
单变量描述统计量:各分析变量的均值、标准差及观测数 原始分析结果:原变量的公因子方差、与变量相同个数的因 子、各因子的特征根及其所占总方差的百分比和累计百分比
KMO大于0.9时效果最佳,小于0.5时不适宜做因子分析。 Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果
结论是不拒绝该假设,则表示各个变量都是各自独立的。
3、变量共同度表
给出了提取公共因子前后各变量的共同度(衡量公共因子的相对重要性指标)
该变量95.4%的 信息已经被提取
说明:比如变量X1的共同度位0.954,即提取的公共因子对变量X1的 方差做出了95.4%的贡献。
(收敛时的最大迭代次数)
公共因子的提取方法: (1)主成分分析法(默认); (2)不加权最小二乘法; (3)广义最小二乘法; (4)极大似然法; (5)主轴因子法; (6) 因子法; (7)影像因子法
Rotation:选择因子旋转的方法
方差最大化正交旋转 斜交旋转法
(因子旋转的方法)
四分旋转法 平均正交旋转法 斜交旋转法
第一节 因子分析——【Factor】过程
主成分分析的推广和发展,对观测量数目要求至少是变量的5倍以上, 且越多越好
一、因子分析简介
• 做什么? 因子分析是多元统计分析中处理降维的一种统计方法,它主要将 具有错综复杂关系的变量或者样品综合为数量较少的几个因子, 以再现原始变量与因子之间的相互关系。
• 基本思想: (1)首先,通过变量(或样品)的相关系数矩阵(或相似系数矩 阵)内部结构的研究,找出能控制所有变量(或样品)的少数几 个随机变量(常称为因子)去描述多个变量(或样品)之间的相 关(相似)关系;
要求:输出碎石图
要求:输出因子得分系数阵
要求:采用方差最大化正交旋转;输出因子载荷图
• 2、变量共同度
• 3、公因子Fj的方差贡献
• 4、因子旋转
因子旋转的目的是为了使得因子载荷阵的结构简化,便于 对公共因子进行解释。
这里所谓的结构简化是使每个变量仅在一个公共因子上有 较大的载荷,而在其余公共因子上载荷比较小。
这种变换因子载荷阵的方法称为因子轴的旋转。旋转的方 法有很多种,如正交旋转,斜交旋轴等。
• 5、因子得分
• 因子分析的一般步骤
二、引例(练习一)
例1 利用因子分析过程分析各个城市的市政设施建设情况。 数据文件:“各地区城市市政设施.sav”,下表是部分数据。
【Analyze】/【Data Reduction】/【Factor】 要求:选入分析变量
(因子分析的变量)
(定义记录旋转条件)
提取一个主成分即可
6、因子负荷矩阵
用来反映各个变量的变异主要由哪些因子解释。
X 1 0 . 9 7 7 F 1 1 ,,X 6 0 . 9 2 7 F 1 6
7、因子得分系数矩阵
得出用各个变量的线性组合表达的主成分。
F 1 0 . 1 8 5 X 1 0 . 1 8 2 X 2 0 . 1 6 3 X 3 0 . 1 8 2 X 4 0 . 1 7 8 X 5 0 . 1 7 6 X 6
要求:用均值代替缺失值
(选择缺失值处理方法)
因子载荷矩阵和结构矩阵按数值大小排序 不显示绝对值小于指定数的载荷系数
(选择系数的输出方式)
结果解读:
1、相关系数矩阵表
变量间相关性很高
2、 KMO检验和Bartlett球形检验结果表
接近0.9,适合 做因子分析
拒绝原假设,认为 各变量之间不独立
注: KMO检验用于检验变量间的偏相关系数是否过小,一般,
(2)然后,根据相关性(或相似性)的大小把变量(或样品)分 组,使得同组内的变量(或样品)之间的相关性(或相似性)较 高,但不同组的变量相关性(或相似性)较低。
依据处理的对象不同,可以分为两类: R型因子分析,对变量做降维处理 Q型因子分析,对样本做降维处理
•R型因子分析
因子分析的几个概念: • 1、因子载荷
第8讲因子分析与对 应分析
主成分分析——【Factor】过程
对观测量数目没有严格要求
主成分分析是将多个指标化为少数相互无 关的综合指标的统计方法,通常数学上的处理 就是将原来的p个指标做线性组合,作为新的综 合指标,记第一个综合指标为F1。
选取这个线性组合的原则是令F1的方差最 大,称F1为第一主成分;然后选取第二主成分 F2,且F1与F2的协方差为0,类似构造其余的 主成分。