SPSS数据分析教程12因子分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
begin data. N 220 220 220 220 220 220 SD 1 1 1 1 1 1 CORR 1.00 CORR 0.439 1.00 CORR 0.410 0.351 1.00 CORR 0.288 0.354 0.164 1.0 CORR 0.329 0.320 0.190 0.595 1.00 CORR 0.248 0.329 0.181 0.470 0.464 1.00 END data.
案例1:探索变量间的结构关系
直接从相关系数矩阵或者协方差矩阵开始,用 语法命令的方式来进行因子分析。
为了分析(英格兰)盖尔语、英语、历史、算 术、几何和代数6门学科之间的相互关系, Lawley和Maxwell调查了220名男学生的6门 学科的成绩,并记录下它们的相关系数矩阵
输入数据
MATRIX DATA variables=ROWTYPE_ Gaelic English History Arithmeti Algebra Geometry.
SPSS数据分析教程12因子分 析
ห้องสมุดไป่ตู้
第12章 因子分析
目录
12.1 因子分析简介 12.2 因子分析法的统计理论
12.2.1 因子分析的模型 12.2.2 因子分析模型的求解方法 12.2.3 因子分析的应用前提 12.2.4 因子个数的确定 12.2.5 因子的解释 12.2.6 因子旋转 12.2.7 因子得分 12.3 因子分析案例 12.3.1 探索变量间的结构关系 12.3.2 因子分析在市场调查中的应用 12.4 因子分析结果的有效性 12.5 因子分析和主成分分析的比较
本章要求
了解因子分析模型的基本理论; 了解因子分析法的应用条件 因子分析模型的求解方法; 掌握因子分析法的应用; 掌握因子分析法输出结果的解释; 了解因子旋转的方法。
12.1 因子分析简介
有时侯,我们要考察的指标是无法直接测量的 。比如考察学生的学习能力,可以直接测试的 指标有数学、语文、物理等科目的考试成绩, 但是一些抽象的指标,譬如运算能力、表达能 力则无法通过直接测试的方法得到,然而这些 抽象指标却体现在上述可以测试的指标之中。 因子分析法就是研究如何来表达这两类不同性 质的指标之间的关系的。
根据原始变量之间是否有先验的关系结构,因 子分析法又可以分为探索性因子分析和验证性 因子分析。探索性因子分析事前没有原始变量 之间、原始变量和因子之间以及因子之间关系 的先验知识,而验证性因子分析事前给出原始 变量和因子的结构关系。
12.2 因子分析的统计理论
因子分析假设每一个原始变量都可以表示成不 可观测的公共因子的线性组合和一个特殊因子 之和。
因子分析是一种数据降维方法
因子分析试图用最少个数的不可观测的互不相 关的公共因子(例如运算能力、表达能力等公 共因子)的线性组合,再加上特殊因子来描述 原来一组可观测的有相互关系的变量。其目的 是尽可能合理地解释存在于原始变量之间的相 关性,并且简化变量的维数和结构。
因子分析的分类
因子分析既可以对变量作因子分析,也可以对 样品作因子分析。前者称为R型因子分析,后 者称为Q型因子分析。
建议如果变量中有分类变量,那么分类变量的可取 值个数要不小于5。
因子个数的确定
有3个方法可以用来确定因子的个数
方差贡献率 设定特征值条件 碎石图
因子旋转
当因子分析模型得到的公共因子没有较好的解 释时,一般可以对因子进行旋转以得到原始变 量和公共因子之间关系的较好解释。
因子旋转分为正交旋转和非正交旋转。在正交 旋转下,特殊因子的协方差、公共因子的协方 差都不变,因此旋转之后的因子仍然是不相关 的。
因子得分
因子分析中各个变量的公共因子取值称为因子 得分。从因子分析模型知道,原始变量是公共 因子的线性组合和特殊因子之和。
SPSS提供了三种估计因子得分的方法,它们 是Thomson回归法、Bartlett法和AndersonRubin法。
因子分析案例
SPSS因子分析的菜单是【分析】→【降维】 →【因子分析】
结果分析(1):相关系数矩阵
KMO和Bartlett检验
特征值、方差贡献率和累积方差贡献率
初始因子载荷矩阵
旋转因子载荷矩阵
碎石图
因子载荷图
案例2:因子分析在市场调查中的应用
数据文件cereals.sav 某市场调查项目需要了解消费者是否偏爱某个
谷物品牌。现有117个受访者对12个销量比较 好的谷物产品的25个属性进行评分。现在用因 子分析法对消费者的偏好习惯进行分析。哪些 品牌的谷物产品易受消费者青睐?消费者喜欢 哪些属性?这些属性之间有什么关系?
正交旋转
SPSS提供了3种正交旋转的方法,它们是
最大四次方值法(Q: Quartmax Rotaiton) 最大方差法(V:Kaiser’s Varimax Rotation 最大平衡值法(E: Equamax)
这三种方法的目的都是简化因子载荷矩阵,使 得某些元素为0或者接近于0。并且这三种方法 的坐标轴都是正交的,旋转后的公共因子仍然 是相互无关的。
第二个因子上载荷较大的原始变量有Sugar、Salt、 Calories、Sweet和Process,所有这些都是谷物产品 的人工添加成分所体现的属性,称为“人工成分因子” 。
第三个因子上载荷较大的原始变量有Kids、Family和 Fun,称为“群体因子”。
前两个主成分的因子载荷图
产品在前两个公共因子上的定位图
SPSS中给出了7种求解因子分析模型的方法
主成分 未加权的最小平方法 综合最小平方法 最大似然(K) 主轴因子分解 α因子分解 映像因子分解法。
因子分析模型的求解方法(2)
这7种求解因子分析模型的方法都可以基于相 关系数矩阵 。
主成分、主轴因子分解和映像因子分解 3种方 法既可以基于相关系数矩阵,也可以基于协方 差矩阵。
因子分析选项设置(1)
因子分析选项设置(2)
如果因子分析的结果输出错误信息“解不收敛” ,可以考虑更改 “最大收敛性迭代次数”为一个 较大的值,然后重新进行因子分析。
因子分析选项设置(3)
因子分析结果(1)
因子分析结果(2)
因子分析结果(3)
旋转后的因子载荷矩阵
因子的解释
第一个因子上载荷较大的原始变量有Fibre、 Nutritious、Health、Natural、Regular、Filling、 Quality、Energy和Satisfying,所有这些变量都描述 了谷物产品的自然健康属性,我们称之为“健康因子” 。
因子分析的应用前提
因子分析的主要目的是数据降维,如果原始变 量之间没有相关性,因子分析的意义不大。
判断原始变量之间是否有相关性。判断的方法 为Bartlett球形检验和KMO方法。
经验上,因子分析方法要求个案个数是变量个数的 10到25倍。如果个案个数相对于变量个数而言较 少,那么考虑用主成分法来替代。
各个特殊因子不相关,但是方差不要求相等。
因子分析结果解释
因子载荷的意义
在因子上的因子载荷实际上是原始变量和公共因子 的相关系数。它们的大小反映了原始变量对公共因 子的重要性。
变量共同度
它反映了公共因子对原始变量的影响程度
公共因子的方差贡献
它衡量公共因子的重要性。
因子分析模型的求解方法 (1)
因子分析模型(1)
这里q为公共因子的个数 ,F1,…,Fq表示公共
因子 , 也可以表示为下列矩阵形式: (1)
其中,A称为载荷矩阵
因子分析模型(2)
因子分析模型要求方程(1)满足下列条件:
q<p:公共因子的个数不大于原始变量的个 数 公共因子和特殊因子是不相关的,即:
公共因子F1,…,Fq不相关且方差为1
相关文档
最新文档