第21章 主成分与因子分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

② 主成分回归
将计算出的主成分作为新的自变量,与应变量做多元回 归分析。
优点:
主要解决自变量间的共线性问题,避免回归系数的不合 理现象,揭示变量间的真实关系
实例详解
例21.1:某研究单位测得20名肝病患者4项肝功 能指标(数据文件见“例21.1.sav”):转氨酶 (x1)、肝大指数(x2)、硫酸锌浊度(x3) 、甲胎球蛋白(x4),是做主成分分析。
第三节
§THE END
§ 从应用上讲:寻求众多变量的共同因子,即:
探讨 多个能直接测量的且有一定相关性的实测指标是 如何受少数几个不能直接测量的相对独立的因子支配的 。
(3)因子分析的基本思想
根据变量间相关性的大小把变量分组,使得同组 内的变量之间的相关性(共性)较高,并用一 个因子来代表这个组的变量,而不同组的变量 相关性较低(个性)。
(2)基本思想 § 数据的降维、数据的解释
§ 将原来众多具有一定相关性的指标,组合成一组新的相互 无关的综合指标。从中选取几个较少的综合指标尽可能多的 反映原来众多指标的信息。
§ 这种既减少了指标的数目又抓住了主要矛盾的做法有利于问 题的分析和处理。
§ 主成分分析的关键是:计算综合指标
§ 主成分即综合指标,它在个体间的变异应该越大越好。
IBM-SPSS
第21章 主成分与因子分析
主要内容
第一节 主成分分析 第二节 因子分析 第三节 主成分分析与因子分析的区别与联系
第一节
Principal Components Analysis
(1)定义
从多个数值变量(指标)之间的相互关系入手,利用 降维的思想,将多个变量(指标)化为少数几个互不 相关的综合变量(指标)的统计方法。
① 主成分评价
在进行多指标综合评价时,由于要求结果客观、全面, 就需要从各方面用多个指标进行测量,但这样就会使得 个观测指标间存在信息重叠,同时还存在量纲、类家室 如何确定权重系数等问题。因此使用主成分分析方法进 行信息的浓缩,并解决权重的确定等问题。
优点:
1、消除各指标不同量纲产生的影响; 2、对于相互之间有相关性的指标,不存在信息的重叠。
(4)因子分析的分类
探索性因子分析(exploratory factor analysis) 确定性因子分析(confirmatory factor analysis)
①探索性因子分析(exploratory factor analysis)
探索性因子分析:是去探讨一组可测变量的特征,性质和内部的关 联性,并揭示有多少主要的潜在因子可能影响这些可测变量。
(3)主成分的计算及性质 1.主成分的确定方法
①累计贡献率:当前k各主成分的累计贡献率达到某一
特定值(一般采用70%以上)时,则保留前k个主成分
②特征根:一般选取特征根≥1的主成分。
2. 几个相关的术语及统计量
① 特征跟(Eigenvalue )
§ Var(Ci)= λi
§ 各主成分所提供的信息量多少,常用其方差的 大小(即特征根λ )来衡量, λ 愈大,该主成 分提供的信息量就愈大,可见:λ1>λ2 > … > λm。
Factor Analysis
(1)定义
因子分析(factor analysis)是用来寻找那些隐藏 在可测变量中的,无法直接观察到的,却影响 或支配可测变量的潜在因子;并估计潜在因子 对可测变量的影响程度以及潜在因子之间的关 联性的一种多元统计分析方法。
(2)因子分析的目的
§ 理论上讲:研究原始变量的内部关系,简化原 变量的内部结构,分析变量中存在的相关关系 。
和,反映的是因子Fj对原有变量总方差的解释能力,其值越高,说
明因子的重要程度越高。
(6)因子分析的计算步骤
§ 确定待分析的原有如干变量是否适合做因子分析。 § 构造因子变量。 § 利用旋转方法是因子变量更具有可解释性。 § 计算因子得分。
实例详解
例21.2为了研究大学生的价值观,某研究人员抽样调查 了20名大学生关于价值观的9项检验结果。包括合作性 、对分配的看法、行为出发点、工作投入程度、对发展 机会的看法、对社会地位的看法、权力距离、对职位升 迁的态度、领导风格的偏好等,分值区间为[1,20],我 们分别对这些指标定义为X1——X9,具体数据见图2110所示。根据这9项指标进行因子分析,得到较少维度 的几个因子。 (文件见例21.1.sav )
§ 确定性因子分析不要求寻找出的这些潜在因子是相互独立的,它的 目的是研究潜在因子之间的关联性。
④两种因子分析的使用区别
§ 探索性因子分析仅仅用在研究初期对原始数据的探讨,它的结果一 般不需要进行统计检验。
§ 确定性因子分析是确定性地描述了观察变量与潜在因子之间的关系 ,具有有效的实际意义,因此需要进行统计检验。
何时使用确定性因子分析?
如果根据以往的经验或根据探索性因子分析的结果已经清楚哪些可 测变量可能被那一个潜在因子所影响,而只需进一步确定每一个潜 在因子对可测变量的影响程度,以及了解这些潜在因子之间的关联 程度,这时可用确定性因子分析。
③两种因子分析的假设条件
§ 探索性因子分析要求寻找出的这些潜在因子是相互独立的,有实际 意义的,而且这些独立的潜在因子尽可能多地概括了原可测变量的 信息。
何时使用探索性因子分析?
如果所进行的一项研究涉及到很多的可测变量,而且在研究之前, 并不清楚有哪些可能的潜在因子会影响这些可测变量,这时可作探 索性因子分析。
②确定性因子分析(confirmatory factor analysis)
确定性因子分析:是在探索性因子分析的基础上进一步确定每一个 潜在因子对可测变量的影响程度,以及了解这些潜在因子之间的关 联程度。
② 主成分Zi方差贡献率 计算式为:
λi表示主成分Zi的方差在全部方差中的比重。这 个值越大,表明主成分Zi综合原始变量信息的能 力越强。
③ 累计贡献率
前k个主成分的贡献率之和为前k个主成分的累积 贡献率,表示前k个主成分累计提取了原始变量 多少的信息 。
wenku.baidu.com
主成分的性质
(4)主成分分析的用途 主成分评价 主成分回归
(5)因子分析的相关概念
1.因子载荷aij:为第i个变量与第j个公共因子上的相关系数,反映了
第i个变量在第j个公共因子的相对重要性。
2.变量共同度:也称公共方差,反映全部公共因子对原有变量xi的
总方差的解释说明比例。原有变量xi的共同度为因子载荷矩阵A中第 i行因素的平方和。
3.公共因子Fj的方差贡献:因子载荷矩阵A中第j列各元素的平方
相关文档
最新文档