第8章:SPSS因子分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k
hi 2
2 a ij j 1
3、因子的方差贡献 因子方差贡献是因子载荷矩阵中第j列元素的平方和,反 映了第j个因子对原有变量总方差的解释能力。该数值越高, 说明相应因子的重要性越高。
S j 2 aij 2
i 1
p
2. 因子分析的基本内容
1)因子分析的基本步骤
①因子分析的前提条件 因子分析的前提条件是原始变量之间应存在较强的相关关系。 ②因子提取; ③使因子更具有命名可解释性; ④计算各样本的因子得分。
估计因子得分系数的方法有很多,通常采用最小二乘意 义下的回归法进行估计。
3. 因子分析的基本操作
【分析】----【降维】----【因子分析】
因子分ห้องสมุดไป่ตู้的应用举例
为研究全国各地区年人均收入的差异性和相似性,收集
到1997年全国31个省市自治区各类经济单位包括国有经济单
位、集体经济单位、联营经济单位、股份制经济单位、外商 投资经济单位、港澳台经济单位和其他经济单位的年人均收
入数据。由于涉及的变量较多,直接进行地区间的比较分析
较为繁琐,因此首先考虑采用因子分析方法减少变量个数, 之后再进行比较和综合评价。
1 考察原有变量是否适合进行因子分析
这里借助变量的相关系数矩阵、巴特利特球度检验和KMO 检验方法进行分析。 同时,由于数据中存在缺失值,采用均值替代法处理缺失 值。 2 提取因子 首先进行尝试性分析,根据原有变量的相关系数矩阵,采 用主成分分析法提取因子并选取特征根值大于1的特征根,输出 因子分析的初始解。 重新指定提取特征根的标准,指定提取两个因子。
在这个数学模型中,F称为公共因子,因为它出现在每个
变量的线性表达式中,简称因子。因子可理解为高维空间中 互相垂直的k个坐标轴;A称为因子载荷矩阵,a 载荷,是第i个原始变量在第j个因子上的负荷; 当于多元线性回归模型中的残差。
ij
因子,表示原始变量不能被因子解释的部分。其均值为0,相

称为因子 称为特殊
4)因子的命名
观察因子载荷矩阵,如果因子载荷的绝对值在第j列的
多个行上都有较大的取值,则表明因子fj能够同时解释许多 变量的信息,且对每个变量只能揭示较少部分信息,但不能 代表任何一个原有变量。这种情况下,因子fj的含义是模糊 不清的,为解决这个问题,可通过因子旋转的方式是一个变 量值在尽可能少的因子上有比较高的载荷。因子旋转一般采 用正交旋转使新生成的变量仍可保持不相关,正交旋转一般 采用方差最大法(varimax)。然后再根据各因子对各原始 变量的解释程度进行命名。
因子分析的几个相关概念
1、因子载荷
在因子不相关的前提下,因子载荷是第i个变量与第j个 因子的相关系数。因子载荷越大说明因子与变量的相关性越 强,所以因子载荷说明了因子对变量的重要作用和程度。 2、变量共同度 变量共同度也称为公共方差。第i个变量的共同度定义为 因子载荷矩阵中第i行元素的平方和,即:
2)因子分析的的前提条件
① 计算相关系数并进行统计检验 如果相关系数矩阵中的大部分相关系数小于0.3,那么这些 变量不适合进行因子分析。 ②计算反映象相关矩阵
MSAi
r r p
2 i j 2 ij i j ij i j
2
ij
其中rij 为第i个变量与第j个变量的简单相关系数; pij 为第i个变量与第j个变量在控制了剩余变量下 的偏相关系数。
表示,且每个变量的均值是0,标准差是1,现将每个原有变 量用k(k<p)个因子
f1、f 2、、 ... f k
的线性组合来表示,
即:
x1 a11 f1 a12 f 2 ......a1k f k 1 x2 a21 f1 a22 f 2 ......a2 k f k 2 ..................................................... x p a p1 f1 a p 2 f 2 ......a pk f k p 用矩阵表示为X AF
因子得分变量的散点图;其次,对各地区人均年收入进行综合
评价,采用计算因子加权总分的方法,以两个因子的方差贡献 率为权数。
练习
根据基本建设投资数据判断是否适合作因子分析,
如果可以作,提取几个因子比较合适?并对因子进
行命名,计算综合得分。
3 因子的命名解释
采用方差最大法对因子载荷矩阵实施正交旋转以使因子具 有命名解释性。指定按第一因子载荷降序的顺序输出旋转后的 因子载荷以及旋转后的因子载荷图。 4 计算因子得分 采用回归法估计因子得分系数,并输出因子得分系数。 5 各省市自治区的综合评价 可利用因子得分变量对地区进行对比研究。首先,绘制两
③Bartlett’s球度检验
以原有变量的相关系数矩阵为出发点,假设相关系数为单位
矩阵,如果该检验对应的P值小于给定的显著性水平a,则应拒 绝原假设,认为原有变量适合进行因子分析。
④KMO检验
该统计量取值在0-1之间,越接近于1说明变量间的相关性 越强,原有变量适合做因子分析。0.9以上表示非常合适;0.8-
5)计算因子得分
在因子分析实际应用中,当因子确定以后,便可计算各 因子在每个样本上的具体数值,这些数值称为因子得分,形 成的变量称为因子变量。计算因子得分的途径是用原有变量 描述因子,第j个因子在第i个样本上的值可表示为:
f j w j1x1 w j2 x 2 ... w jp x p (j =1、 2、 .... 、k)
SPSS统计分析方法及应用第七章
因子分析
8.1 因子分析概述
8.2 因子分析的基本内容
8.3 因子分析的基本操作及案例
1. 因子分析概述
1)因子分析的意义
在实际问题的分析过程中,人们往往希望尽可能多的搜
集关于分析对象的数据信息,进而能够比较全面的、完整的
把握和认识它。于是,对研究对象的描述就会有很多指标。 但是效果如何呢?如果搜集的变量过多,虽然能够比较全面 精确的描述事物,但在实际建模时这些变量会给统计分析带 来计算量大和信息重叠的问题。而消减变量个数必然会导致 信息丢失和信息不完整等问题的产生。 因子分析是解决上述问题的一种非常有效的方法。它以 最少的信息丢失,将原始众多变量综合成较少的几个综合指 标(因子),能够起到有效降维的目的。
0.9表示合适;0.7-0.8表示一般;0.6-0.7表示尚可;0.5-0.6
表示不太合适;0.5以下表示极不合适。
3)因子个数的确定方法
① 根据特征根确定因子数:一般选取大于1的特征根,还可规 定特征根数与特征根值的碎石图并通过观察碎石图确定因子数; ②根据因子的累计方差贡献率确定因子数:通常选取累计方差 贡献率大于85%的特征根个数为因子个数。
对于量表而言,因子分析的目地在于找出量表潜在 的结构,减少题项的数目,使之成为一组较少而彼 此相关较大的变量。
因子分析的特点
因子个数远远少于原有变量的个数;
因子能够反应原有变量的绝大部分信息; 因子之间不存在线性关系; 因子具有命名解释性。
2)因子分析的数学模型
数学模型
假设原有变量有p个,分别用 x1、x2、x3、、 ... x p
相关文档
最新文档