第8章因子分析与聚类分析(含SPSS)

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、因子的方差贡献
因子 f j 的方差贡献是因子载荷矩阵 A中第 j 列元素的平方
和,反映了因子 f j 对原有变量总方差的解释能力,是衡量公 共因子相对重要性的指标。此值越大,表明相应因子的重要 性越高。计算出所有的指标,按其大小排序,就可以提炼出 最有影响的公共因子。
三、因子分析的步骤
(一)因子分析的适合性检验
SPSS中有5种因子旋转的方式可供选择:Varimax选项,方 差最大旋转;Direct Oblimin 选项,直接斜交旋转; Quartimax 选项,四次最大正交旋转;Equamax 选项,平 均正交旋转;Promax 选项,斜交旋转方法。
(四)计算因子得分,然后将它们用于各种进一步的分析中
当因子确定以后,便可以计算各因子在每个样本上的具体数 值,这些数值称为因子得分,形成的变量称为因子变量。于 是在以后的分析中就可以因子变量代替原有变量进行数据建 模,或者利用因子变量对样本进行分类或评价等研究,进而 实现降维和简化问题的目标。
1、相关矩阵和反映像相关矩阵 相关矩阵中大部分相关系数都小于0.3,那么原则上这些数 据不适合做因子分析。另外,如果反映像相关矩阵中除对 角元素外,其他大多数元素的绝对值均较小,对角线上元 素的值较接近1,则适合进行因子分析。 2、 KMO 检验 KMO检验统计量是用于比较变量间简单相关系数和偏相 关系数的指标,取值在0和1之间。值越接近于1,意味着 变量间的相关性越强,原有变量越适合做因子分析。
3、 巴特利特球度检验(Bartlett test of sphericity )
巴特利特球度检验以原有变量的相关系数矩阵为出 发点,其零假设是:相关矩阵为单位阵,即相关系 数矩阵为对角矩阵。巴特利特球度检验的检验统计 量是根据相关系数矩阵的行列式计算得到,且近似 服从卡方分布。如果该统计量的观察值比较大且相 伴概率 值小于或等于给定的显著性水平,则应拒 绝原假设;反之,如果该统计量的观察值比较小且 相伴概率值大于给定的显著性水平,则不应拒绝原 假设。
(二)因子分析的特点 1、因子变量的数量远少于原有指标变量的数 量。 2、因子变量并不是原有变量的简单取舍,而 是对原有变量的重新组构。 3、因子之间线性关系不显著。 4、因子变量具有命名解释性。
二、因子分析的数学模型和相关概念 (一)因子分析的数学模型
因子分析的数学模型为:
x1 a11f1 a12f2 a13f3 a1k fk 1
第8章 因子分析与 聚类分析(含
SPSS)
本章内容
第一节 因子分析 第二节 聚类分析
第一节 因子分析
一、因子分析的概念和特点 (一)因子分析的概念
因子分析(factor analysis)是利用降维的思 想,由研究原始变量相关矩阵内部的依赖关系出 发,把一些具有错综复杂关系的变量归结为少数 几个综合因子的一种多变量统计分析方法。 在会计实证研究中,因子分析发挥着重要的作 用,如变量构造、变量筛选和综合评价等。
(二)因子分析中的基本概念
1、因子的含义 因子分析法中提到两种因子:公共因子和特殊因子。
公共因子是每个原有变量的线性表达式中都共同出现的因子, 各公因子都是均值为0,方差为1的独立正态随机变量。其协 方差矩阵为单位矩阵。
特殊因子表示原有变量不能被公共因子解释的部分,其均值 为0。 各特殊因子之间以及特殊因子与所有公共因子之间都是互相 独立的。
2、因子载荷 模型中各公共因子的系数 称a ij 为因子载荷,反映了第 个i 变 量在第 j 个公共因子上的相对重要性,aij 1,a ij 的绝对值
越大,表明 x i 与 F j 的相依程度越大。
3、变量共同度
i 因子载荷矩阵中第 行元素的平方和,称为变量 的x i 共同度,
即变量方差。此值越接近1,表明该变量的几乎全部原始信 息都被所选择的公共因子说明了。此值接近于0,说明公共 因子对 的影x i 响很小,主要由特殊因子来描述。
(三)因子命名
在因子分析模型中,公共因子与因子载荷阵的解不是唯一的。 因子分析的目的不仅是找出主因子,更重要的是知道每个主 因子的意义,以利于对公共因子命名和解释结果,便于进一 步的分析。若每个公共因子的涵义不清,难以找到合理的解 释,可对因子载荷矩阵实行旋转,使每个变量仅在一个公共 因子上有较大的载荷,而在其他公共因子上的载荷较小。
xx32
a21f1 a31f1
a22f2 a32f2
a23f3 a33f3
a2k a3k
f源自文库 fk
2(8.1) 3

xp ap1f1 ap2 f2 ap3 f3 apkfk p
写成矩阵形式为 XA F,其中 X为原始变量向量,A
为公因子载荷矩阵,F 为公共因子, 为特殊因子。
由于因子得分函数中方程的个数小于变量的个数,因此不能 精确的计算出因子得分,只能对因子得分进行估计。估计的 方法很多,SPSS中列示了三种方法,常用的是 Regression回归法。 用因子得分还可以计算因子总分,根据因子总分可对样本 (变量)进行排序或归类,作为评价的依据。
四、因子分析在SPSS中的实现 1、建立或打开数据文件后,进入Analyze→Data
Reduction→Factor Analysis主对话框,如图8-1所示。
图8-1 因子分析主对话框
2、把参与分析的变量选到Variables框中。 3、Selection Variable选择变量栏,用于限制有特殊值的 样本子集的分析,当一个变量进入该栏时,激活右侧的 “Value”按钮。待“Value”按钮激活后,单击该键,打开 Set Value对话框,如图8-2 所示,可在该对话框键入标识 参与分析的观测量所具有的该变量值。
(二)因子提取和因子载荷矩阵的求解
因子分析的关键是根据样本数据求解因子载荷矩阵,SPSS 提供了7种提取因子的方法,其中占主要地位且使用最为广 泛的是主成分分析法。
因子提取通常有以下三种方法:(1)特征值准则,即取特 征值大于等于1的主成分作为初始因子,放弃特征值小于1 的主成分。(2)累积方差贡献率,因子累积解释的方差比 例也是确定因子个数时可以参考的指标,一般应达到70%85%或以上。(3)碎石检验准则,按照因子被提取的顺序, 画出因子的特征值随因子个数变化的散点图,图形由陡变 平,曲线开始变平的前一个点被认为是提取的最大因子数。
相关文档
最新文档