因子分析法详细步骤
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 迭代主因子法(iterated principal factor)
主因子的解很不稳定。因此, 主因子的解很不稳定。因此,常以估计 的共同度为初始值, 的共同度为初始值,构造新的约化矩 再计算其特征根及其特征向量, 阵,再计算其特征根及其特征向量, 并由此再估计因子负荷及其各变量的 共同度和特殊方差, 共同度和特殊方差,再由此新估计的 共同度为初始值继续迭代, 共同度为初始值继续迭代,直到解稳 定为止。 定为止。
(2)斜交旋转
rotation) (oblique rotation)
• 因子斜交旋转后,各因子负荷发生了 因子斜交旋转后, 较大变化,出现了两极分化。 较大变化,出现了两极分化。各因子 间不再相互独立,而彼此相关。 间不再相互独立,而彼此相关。各因 子对各变量的贡献的总和也发生了改 变。 • 适用于大数据集的因子分析。 适用于大数据集的因子分析。
设
h
2 i
= a
2 i1
+ a
2 i2
+ iii + a
2 im
(1)hi2是m个公共因子对第i个变量 个公共因子对第i 的贡献,称为第i 的贡献,称为第i个共同度 communality)或共性方差, (communality)或共性方差,公因 子方差( variance) 子方差(common variance) (2)δi称为特殊方差(specific 称为特殊方差( variance), ),是不能由公共因子解 variance),是不能由公共因子解 释的部分
• Heywood现象 现象 • 残差矩阵
五、因子旋转
• 目的:使因子负荷两极分化,要么 目的:使因子负荷两极分化, 接近于0,要么接近于1。 接近于 ,要么接近于 。 • 常用的旋转方法: 常用的旋转方法:
(1)方差最大正交旋转(varimax
orthogonal rotation)
• 基本思想:使公共因子的相对负荷 基本思想: 的方差之和最大, (lij/hi2)的方差之和最大,且保持 原公共因子的正交性和公共方差总和 不变。 不变。 • 可使每个因子上的具有最大载荷的变 量数最小, 量数最小,因此可以简化对因子的解 释。
• f=(f1,f2,…,fm)’为公共(共性)因子 为公共( 为公共 共性) ),简称因子 (common factor),简称因子 ), (factor) )
• e=(e1,e2,…,ep)’为特殊因子 ,e 为特殊因子 factor) (specific factor) f和e均为不可直接观测的随机变量 • μ=(μ1,μ2,…,μp)’为总体x的均 =(μ , 为总体x 为总体 值 • A=(aij)p*m为因子负荷(载荷) 为因子负荷(载荷) loading) (factor loading)矩阵
因子分析
一、前言
• 变量的相关性 公共因子? 公共因子? • 将多个实测变量转换成少数几 个不相关的综合指数
源自文库
二、因子分析模型
一般地, 一般地,设X=(x1, x2, …,xp)’为可观 为可观 测的随机变量, 测的随机变量,且有
Xi = µi + ai1 f1 + ai2 f2 +iii+aim fm + ei
谢谢! 谢谢!
factor) )
aij = λ j l ji i = 1, 2,..., p; j = 1, 2,..., m
每一个公共因子的载荷系数之平方和 等于对应的特征根, 等于对应的特征根,即该公共因子的 方差。 方差。
λj = ∑a = g
i=1 2 ij
p
2 j
• 极大似然法(maximum likelihood 极大似然法( factor) 假定原变量服从正态分布, 假定原变量服从正态分布,公共因 子和特殊因子也服从正态分布, 子和特殊因子也服从正态分布,构 造因子负荷和特殊方差的似然函数, 造因子负荷和特殊方差的似然函数, 求其极大,得到唯一解。 求其极大,得到唯一解。
如果再满足( 如果再满足(4)fi与fj相互独立 ≠j), ),则称该因子模型为正交因 (i≠j),则称该因子模型为正交因 子模型。 子模型。 正交因子模型具有如下特性: 正交因子模型具有如下特性: • x的方差可表示为
Var ( xi ) = 1 = a + a +iii+a + δ i
2 i1 2 i2 2 im
• 确定公共因子数; 确定公共因子数; • 计算公共因子的共性方差hi2; 计算公共因子的共性方差 • 对载荷矩阵进行旋转,以求能更好地 对载荷矩阵进行旋转, 解释公共因子; 解释公共因子; • 对公共因子作出专业性的解释。 对公共因子作出专业性的解释。
四、因子分析提取因子的方法
• 主成分法(principal component
通常先对x作标准化处理,使其均值为零, 通常先对 作标准化处理,使其均值为零, 作标准化处理 方差为1 方差为1.这样就有
xi = ai1 f1 + ai 2 f 2 + iii+ aim f m + ei
假定( 的均数为0 方差为1 假定(1)fi的均数为0,方差为1; 的均数为0 方差为δ (2)ei的均数为0,方差为δi; 相互独立. (3) fi与ei相互独立. 则称x为具有m 则称x为具有m个公共因子的因子模型
代替相关矩阵中的对角线上的元素, 以(hi’)2代替相关矩阵中的对角线上的元素, 得到约化相关矩阵。 得到约化相关矩阵。
(h1’)2 r12 r21 (h2’)2 R’= . . . . rp1 rp2 … r1p … r2p … . … . … (hp’)2
R’的前 个特征根及其对应的单位化特征向 的前m个特征根及其对应的单位化特征向 的前 量就是主因子解。 量就是主因子解。
六、因子得分
• Thomson法,即回归法 法
回归法得分是由Bayes思想导出的,得 思想导出的, 回归法得分是由 思想导出的 到的因子得分是有偏的, 到的因子得分是有偏的,但计算结果 误差较小。 误差较小。
• Bartlett法 法
Bartlett因子得分是极大似然估计,也是 因子得分是极大似然估计, 因子得分是极大似然估计 加权最小二乘回归, 加权最小二乘回归,得到的因子得分 是无偏的,但计算结果误差较大。 是无偏的,但计算结果误差较大。 • 因子得分可用于模型诊断,也可用作 因子得分可用于模型诊断, 进一步分析的原始资料。 进一步分析的原始资料。
七、因子分析应用实例
八、因子分析应用的注意事项
• 应用条件 (1)变量是计量的,能用线性相关 )变量是计量的, 系数( 积叉相关系数) 系数(Pearson积叉相关系数)表 积叉相关系数 示。 (2)总体的同质性 )
• 样本量 没有估计公式。 没有估计公式。至少要保证样本相 关系数稳定可靠。 关系数稳定可靠。 • 因子数目 一般认为,累积贡献要达到80%以 一般认为,累积贡献要达到 以 但要注意Heywood现象。 现象。 上。但要注意 现象
三、因子分析的步骤
• 输入原始数据xn*p,计算样本均值和方 输入原始数据 差,进行标准化计算(处理); 进行标准化计算(处理); • 求样本相关系数矩阵R=(rij)p*p; 求样本相关系数矩阵 • 求相关系数矩阵的特征根λi 求相关系数矩阵的特征根λ (λ1,λ2,…,λp>0)和相应的标准正交 , >0)和相应的标准正交 的特征向量l 的特征向量 i;
• 因子载荷(负荷)aij是随机变量xi与 因子载荷(负荷) 是随机变量x 公共因子f 的相关系数。 公共因子fj的相关系数。 •设
g = ∑a
2 j i =1 p 2 ij
j = 1, 2,..., m
为公共因子f 贡献” 称gj2为公共因子fj对x的“贡献”,是 衡量公共因子f 重要性的一个指标。 衡量公共因子fj重要性的一个指标。
• 主因子法(principal factor) 主因子法(
设原变量的相关矩阵为R=(rij),其逆 设原变量的相关矩阵为 , 矩阵为R 矩阵为 -1=(rij)。各变量特征方差 。 的初始值取为逆相关矩阵对角线元 素的倒数, 素的倒数,δi’=1/rii。则共同度 =1/r 的初始值为(h 的初始值为 i’)2=1- δi’=1-1/rii。