因子分析 数学模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 2 ΣU 0
当最后p-m个特征值较小时,协差阵可以近似的分解为
Σ
1 e1 ,
来自百度文库
, m e m
1 e '1 12 e ' m m
2 p
AA ' Σε 或 S AA ' D
b 1 b 1 V p i 1 h p i 1 h G V1 V2 max
用矩阵表示
X 1 a11 X a 2 21 X p a p1
a12 a22 ap2
a1m F1 1 F a2 m 2 2 a pm Fp p
因子旋转分为两种:正交旋转和斜交旋转 特点: 正交旋转:由因子载荷矩阵A左乘一正交阵而得到,经过 旋转后的新的公因子仍然保持彼此独立的性质。正交变化 主要包括方差最大旋转法、四次最大正交旋转、平均正交 旋转。 斜交旋转:放弃了因子之间彼此独立这个限制,可达到更 简洁的形式,实际意义也更容易解释。 不论是正交旋转还是斜交旋转,都应该在因子旋转后,使 每个因子上的载荷尽可能拉开距离,一部分趋近1,一部 分趋近0,使各个因子的实际意义能更清楚地表现出来。
数目的。
因子分析每个相应的系数不是唯一的,即因子载荷阵不是唯一的。
X (A)(Γ ' F) ε
为任一个m 阶的正交阵,上式仍满足约束条件
cov(Γ ' F, ε) 'cov(F, ε) 0
D(Γ ' F) ' D(F) m
正交因子模型中各统计量的意义
因子载荷的统计意义 因子载荷aij 的统计意义是第i 个变量与第j 个公共
因子的相关系数。用统计学术语叫权重,表示Xi 依赖Fj 的份量(比重)。
cov( X i , Fj ) aij
变量共同度的统计意义
因子载荷阵A中第i行元素的平方和,即
h a 2ij
2 i j 1 m
称为变量Xi 的共同度。 为了说明它的统计学意义,对Xi的表达式两边求方差,即
var( X i ) var( ait Ft )
a11 cos a12 sin B AC a p1 cos a p 2 sin b11 b 21 bp1 b12 b22 bp 2
目的:希望所得结果能使载荷矩阵的每一列元素的绝 对值尽可能向1和0两极分化,即原始变量中一部分主 要与第一因子有关,另一部分主要与第二因子有关, 也就是要求(b112,…,bp12),(b122,…,bp22)这两组 的方差尽量大。为此,正交旋转的角度必须满足使旋 转后得到因子载荷阵的总方差V1+V2=G达到最大。
方差最大化正交旋转
假设前提:公因子的解释能力能够以其因子载荷平方的方差来度量 先考虑两个因子的平面正交旋转:
对A按行计算共同度,考虑到各个变量的共同度之间的差异所造成的不平衡, 需对A中的元素进行规格化处理,即每行的元素用每行的共同度除之。规格 化后的矩阵,为方便仍记为A,施行方差最大正交旋转(C为正交阵):
简记为
X = AF + ε
且满足
m p
1 1 D (F ) 0 0 Im 1
cov(F, ε) 0
12 2 2 D(ε) 0 0 2 p
因子分析的目的
通过模型
X = AF + ε
以F 代替X ,由于m≤p,从而达到简化变量维
因子分析数学模型
因子旋转
因子得分 计算步骤及实例
因子分析的数学模型
R型因子分析 Q型因子分析
R型因子分析的数学模型
X 1 a11 F1 a12 F2 X a F a F 2 21 1 22 2 X p a p1 F1 a p 2 F2 a1m Fm 1 a2 m Fm 2 a pm Fm p
t 1
m
公共因子方差
a 2it var( Ft ) var( ) hi2 i2
t 1
m
剩余方差
公共因子Fj方差的统计意义
因子载荷阵A中各列元素的平方和记为
2 q2 a ij j i 1 p
j 1,
,m
表示第j 个公共因子对所有分量的总影响,称为第j 个公共因子对X 的贡献,它是衡量第j 个因子相对
重要性的指标
2 q12 q2 2 qm
因子载荷阵的估计方法
主成分法 主因子法 极大似然法
设样本的协差阵的特征值和对应的标准正交化特征向量分别为:
1 2
e1 , e2 ,
则协差阵可分解为
p 0 ep,
0 p U' e e ' i i i i 1 p
A即为因子协方差阵。 当X的协方差阵未知,可以用样本协方差阵S去代替。
因子旋转
• 不管用何种方法确定因子载荷矩阵A,它们都不 是唯一的,我们可以由任意一组初始公共因子做 线性组合,得到新的一组公共因子,使得新的公 共因子彼此之间相互独立,同时也能很好的解释 原始变量之间的相关关系。 • 这样的线性组合可以找到无数组,这样就引出了 因子旋转。 • 因子旋转的目的是为了找到意义更为明确,实际 意义更明显的公因子。 • 因子旋转不改变变量共同度,只改变公因子的方 差贡献。
a11 a 21 A a p1 a12 a22 ap2 cos C sin sin cos a11 sin a12 cos a p1 sin a p 2 cos