【SPSS精品资源】第21章 主成分与因子分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)因子分析的目的 理论上讲:研究原始变量的内部关系,简化原变量的内部结构,
分析变量中存在的相关关系。 从应用上讲:寻求众多变量的共同因子,即: 探讨 多个能直接测量的且有一定相关性的实测指标是如何受少数
几个不能直接测量的相对独立的因子支配的。
‹# ›
(3)因子分析的基本思想 根据变量间相关性的大小把变量分组,使得同组内的变量之间的 相关性(共性)较高,并用一个因子来代表这个组的变量,而不 同组的变量相关性较低(个性)。
‹# ›
② 主成分回归 将计算出的主成分作为新的自变量,与应变量做多元回归分析。 优点: 主要解决自变量间的共线性问题,避免回归系数的不合理现象, 揭示变量间的真实关系
‹# ›
实例详解
例21.1:某研究单位测得20名肝病患者4项肝功能指标(数据文件 见“例21.1.sav”):转氨酶(x1)、肝大指数(x2)、硫酸锌浊 度(x3)、甲胎球蛋白(x4),是做主成分分析。
的结果一般不需要进行统计检验。 确定性因子分析是确定性地描述了观察变量与潜在因子之
间的关系,具有有效的实际意义,因此需要进行统计检 验。
‹# ›
(5)因子分析的相关概念 1.因子载荷aij:为第i个变量与第j个公共因子上的相关系数,反映了
第i个变量在第j个公共因子的相对重要性。 2.变量共同度:也称公共方差,反映全部公共因子对原有变量xi的
‹# ›
②确定性因子分析(confirmatory factor analysis) 确定性因子分析:是在探索性因子分析的基础上进一步 确定每一个潜在因子对可测变量的影响程度,以及了解 这些潜在因子之间的关联程度。 何时使用确定性因子分析? 如果根据以往的经验或根据探索性因子分析的结果已经 清楚哪些可测变量可能被那一个潜在因子所影响,而只 需进一步确定每一个潜在因子对可测变量的影响程度, 以及了解这些潜在因子之间的关联程度,这时可用确定 性因子分析。
‹# ›
主成分的性质
‹# ›
‹# ›
(4)主成分分析的用途 主成分评价 主成分回归
‹# ›
① 主成分评价 在进行多指标综合评价时,由于要求结果客观、全面,就需要从 各方面用多个指标进行测量,但这样就会使得个观测指标间存在 信息重叠,同时还存在量纲、类家室如何确定权重系数等问题。 因此使用主成分分析方法进行信息的浓缩,并解决权重的确定等 问题。 优点: 1、消除各指标不同量纲产生的影响; 2、对于相互之间有相关性的指标,不存在信息的重叠。
IBM-SPSS
Leabharlann Baidu本节内容结束
第21章 主成分与因子分析
主要内容
第一节 主成分分析 第二节 因子分析 第三节 主成分分析与因子分析的区别与联系
‹# ›
第一节 主成分分析 Principal Components Analysis
‹# ›
(1)定义 从多个数值变量(指标)之间的相互关系入手,利用降维的思 想,将多个变量(指标)化为少数几个互不相关的综合变量 (指标)的统计方法。
‹# ›
(3)主成分的计算及性质 1.主成分的确定方法 ①累计贡献率:当前k各主成分的累计贡献率达到某一特定值 (一般采用70%以上)时,则保留前k个主成分 ②特征根:一般选取特征根≥1的主成分。
‹# ›
2. 几个相关的术语及统计量 ① 特征跟(Eigenvalue ) Var(Ci)= λi 各主成分所提供的信息量多少,常用其方差的大小(即特征根λ )
‹# ›
③两种因子分析的假设条件 探索性因子分析要求寻找出的这些潜在因子是相互独立的,
有实际意义的,而且这些独立的潜在因子尽可能多地概 括了原可测变量的信息。 确定性因子分析不要求寻找出的这些潜在因子是相互独立 的,它的目的是研究潜在因子之间的关联性。
‹# ›
④两种因子分析的使用区别 探索性因子分析仅仅用在研究初期对原始数据的探讨,它
‹# ›
(4)因子分析的分类 探索性因子分析(exploratory factor analysis) 确定性因子分析(confirmatory factor analysis)
‹# ›
①探索性因子分析(exploratory factor analysis) 探索性因子分析:是去探讨一组可测变量的特征,性质 和内部的关联性,并揭示有多少主要的潜在因子可能影 响这些可测变量。 何时使用探索性因子分析? 如果所进行的一项研究涉及到很多的可测变量,而且在 研究之前,并不清楚有哪些可能的潜在因子会影响这些 可测变量,这时可作探索性因子分析。
总方差的解释说明比例。原有变量xi的共同度为因子载荷矩阵A 中第i行因素的平方和。 3.公共因子Fj的方差贡献:因子载荷矩阵A中第j列各元素的平方和, 反映的是因子Fj对原有变量总方差的解释能力,其值越高,说明 因子的重要程度越高。
‹# ›
(6)因子分析的计算步骤 确定待分析的原有如干变量是否适合做因子分析。 构造因子变量。 利用旋转方法是因子变量更具有可解释性。 计算因子得分。
‹# ›
(2)基本思想 数据的降维、数据的解释 将原来众多具有一定相关性的指标,组合成一组新的相互无关的综合
指标。从中选取几个较少的综合指标尽可能多的反映原来众多指标的 信息。 这种既减少了指标的数目又抓住了主要矛盾的做法有利于问题的分析 和处理。 主成分分析的关键是:计算综合指标 主成分即综合指标,它在个体间的变异应该越大越好。
来衡量, λ 愈大,该主成分提供的信息量就愈大,可见:λ1>λ2 > … > λm。
‹# ›
② 主成分Zi方差贡献率 计算式为: λi表示主成分Zi的方差在全部方差中的比重。这个值越大,表明 主成分Zi综合原始变量信息的能力越强。
‹# ›
③ 累计贡献率 前k个主成分的贡献率之和为前k个主成分的累积贡献率,表示前k 个主成分累计提取了原始变量多少的信息 。
‹# ›
第二节 因子分析
Factor Analysis
‹# ›
(1)定义 因子分析(factor analysis)是用来寻找那些隐藏在可测变量中的, 无法直接观察到的,却影响或支配可测变量的潜在因子;并估计 潜在因子对可测变量的影响程度以及潜在因子之间的关联性的一 种多元统计分析方法。
‹# ›