因素分析方法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中m<p,F1,F2,…,Fm称为所有变量的公共因子; i称为变量Xi的特殊因子。 模型假设:
1. 2.
公共因子是互相不相关的。 特殊因子和公共因子不相关。
1.3 因子载荷矩阵
1.矩阵A称为因子载荷矩阵(component matrix)系数aij 称为变量Xi在因子Fj上的载荷(loading)。即变量Xi在 公共因子Fj上的载荷aij就是Xi与Fj的相关系数。反映 公共因子对观察变量的影响程度。因子载荷越高, 表明该因子包含原有指标的信息量越多。 2.载荷矩阵的估计:主成分法。 主成分法是估计载荷矩阵的一种方法,由于其估计 结果和变量的主成分仅相差一个常数倍,因此就冠 以主成分法的名称。学习的时候,不要和主成分分 析混为一谈。主成分法是SPSS系统默认的方法,在 一般情况下,这是比较好的方法。以数据“应征人 员”为例,按特征值大于1提取公共因子。在用不同 方法获得因子载荷时,公共因子对总体方差的贡献 率以主成分法为最高:
因子分析的目的和任务
目的: 寻求变量的基本结构、简化观测系统,即减 少变量维数。用一个变量子集来解释整个问 题。主要目的是研究一种假设的结构,用 m(m<p)个假设的公共因子来解释和说明p个 变量之间的相互依赖结构及其复杂关系。 任务: 寻找共性因素,且能解释各主因子的意义
主成份分析

主成分分析只是一种中间手段,其背景是研 究中经常会遇到多指标的问题,这些指标间 往往存在一定的相关,直接纳入分析不仅复 杂,变量间难以取舍,而且可能因多元共线 性而无法得出正确结论。主成分分析的目的 就是通过线性变换,将原来的多个指标组合 成相互独立的少数几个能充分反映总体信息 的指标,便于进一步分析。
X i ai1F1 ai 2 F2 aim Fm i , i 1,2,..., p
1.2 正交因子模型
X 1 a11 F1 a12 F2 a1m Fm 1 X a F a F a F 2 21 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm p
第二节 变量的共同度与因子的方差贡献率
2.1 变量的共同度 定义 载荷矩阵A的第i行元素的平方和:
2 h j 1 aij , 2 i m
i 1,2,..., p
称为变量Xi的共同度(communality)。 共同度表示公共因子在多大的程度上解释变量Xi。 2.2 公共因子的方差贡献率 定义 载荷矩阵A第j列的平方和:
模型形式
1.1 公共因子与特殊因子 从总体中提取的综合变量:F1, F2, … , Fm(m<p)称为(总体 的)公共因子。一般来说,公共因子不可能包含总体的所有 信息,每个变量Xi除了可以由公共因子解释的那部分外,总 还有一些公共因子解Leabharlann Baidu不了的部分,称这部分为变量Xi的特 殊因子,记为:i。 故因子模型描述为: 变量Xi的信息=公共因子可以表达部分公共因子不可表达部分 目前,公共因子可以表达的部分由公共因子的线性组合表示。 即上面的因子模型可以写成以下的形式:
第三节 方差最大正交旋转
3.1 因子旋转的意义 1.正交因子模型只是一个数学模型,所得的因子在专 业上不一定能反映问题的实质,或者说:因子作为 一个综合变量,其专业意义在许多情况下不容易解 释。因子旋转就是针对这一问题,提出的一种改进 的方法。 2.因子旋转的依据:因子模型的不唯一性。 正是由于因子模型的不唯一性,如果模型不适合专 业解释,那么作一个正交变换T(即因子旋转),在新 模型中再去寻找因子的专业解释。经转换后的公共 因子具有最大的载荷离散总平方和D。由此确定的因 子载荷矩阵B,对每个公共因子来说,载荷最为分散, 因此比较容易对因子的专业意义作出解释。
称为因子Fj对总体 x 的贡献(initial eigenvalues)。
q
2 j
2 a i 1 ij , p
j 1,2,...,m
共性方差: 也称方差贡献率,是用某个公共因子占总方 差的百分比来说明共性因素的对观测变量总 体的作用大小。 公共因子个数的选择应考虑: 因子所能解释的方差比率或贡献率; 与利用有关专业知识所得结果的合理一致性 通过这几种途径和手段对研究结果给予合理 解释的可能性和可靠性。 一般,所选公共因子的个数应保证使其方 差累计贡献率大于85%,且主成份个数与变量 个数的比值越小越好。
因子分析
在许多实际问题中,涉及的变量众多,各 变量间还存在错综复杂的相关关系,这时最 好能从中提取少数综合变量,这些综合变量 彼此不相关,是不可测的潜在因素,但对观 测变量的变化起支配作用,且包含原变量提 供的大部分信息。因子分析就是为解决这一 问题提供的统计分析方法。 例如:P159 东西部地区各主成份的提取
因子分析
因子分析是通过变量或样本的相关系数矩 阵内部结构的研究,找出能控制所有变量的 少数几个随机变量去描述多个变量之间的相 关关系。即将观察变量分类,将相关性较高 的、联系较密切的、包含重复信息较多的变 量分在同一类中,使不同类的变量之间的相 关性较低,每类变量代表了一个本质因子或 基本结构。因子分析就是寻找系统中这种不 可观测的因子或结构的方法。
第四节 因子得分
4.1 因子得分函数 因子模型将总体中的原有变量分解为公共因子与特 殊因子的线性组合: X i ai 1F1 ai 2 F2 aim Fm i , i 1,2,..., p 按照这个思路,也可以把每个公共因子表示成原变 量的线性组合:
因素分析——Factor Analysis
系统分析与决策的四个进程:对系统进行 描述性分析 解析性分析 预测性研究 系统决策 因素分析法属于描述性分析,它能保证在数 据信息损失最小的前提下,从大规模的原始数据 群中,迅速将重要的信息提取出来,将高维的数 据进行降维处理,迅速的揭示出系统中的因子结 构,使人们对系统达到尽可能充分的认识,提高 决策者的洞察力和分析效率。又称作因子分析。
相关文档
最新文档