因子分析数学模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因子分析数学模型
1、因子分析看基本思想
因子分析是一种旨在寻找隐藏在多变量数据中,无法直接观察到却影响或支配可观测变量的潜在因子,并估计潜在因子对可观测变量的影响程度,以及潜在因子之间的相关性的一种多元统计分析方法。其基本思想是从分析多变量数据的相关关系入手,找到支配这种相关关系的少数几个相关独立的潜在因子,并通过建立起这些潜在因子与原变量之间的数量关系来预测潜在因子的状态,帮助发现隐藏在原变量之间的某种客观规律性。
因子分析和主成分分析都能起到清理多个原始变量内在结构关系的作用,但主成分分子重在综合原始变量信息,而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法。
因子分析法就是这些潜在因子的数学模型方法,它是在主成分的基础上构筑若干个意义较为明确的潜在因子,以它们为框架分析原变量,以考察原变量间的联系与区别。
2、因子分析的基本原理
3、因子分析的数学模型
假设对n例样品观测了p个指标,即X1,X2,…,X p,得到观测数据。我们的任务就是从一组观测数据出发,通过分析各指标X1,X2,…,X p之间的相关性,找出支配作用的潜在因子,使得这些因子可以解释各个指标之间的相关性。
因子分析模型描述如下:
(1)X=(X1,X2,…,X p)是可观测随机变量,均值向量E(X)=0,协方差Cov(X)与相关矩阵R相等,(只要将变量标准化即可实现)。
(2)F=(F1, F2,…,F m)(m<=p)是不可测的向量,其均值E(F)=0,协方差矩阵Cov(F)=1,即向量的各分量是独立的。
(3)e=(e1,e2,…,e p)与F相互独立,且E(e)=0,e的协方差矩阵是对角矩阵,即各分量e之间是相互独立的。
则因子分析的数学模型如下:
{X1=a11F1+a12F2+⋯+a1m F m+e1 X2=a21F1+a22F2+⋯+a2m F m+e2
⋮
X p=a p1F1+a p2F2+⋯+a pm F m+e p
由于该模型是针对变量进行的,各因子是正交的,所以也称为R型正交因子模型。其矩阵形式为:X=AF+e。
其中:
X={X1
X2
⋮
X p
A=[
a11a12
a21a22
…
…
a1m
a2m
⋮⋱⋮
a p1a p2⋯a
pm
]F= {
F1
F2
⋮
F m
,e= {
e1
e2
⋮
e p
对于因子分析,要求数据和模型满足以下假设条件:
●X i是均值为0、方差为1的随机变量;
●e i是均值为0 ,方差为常数的正太随机变量。
●e1,e2,…,e p不相关,且方差不同。
● Cov(F,e)=0,即F和e是相互独立的;
● D(F)=I,即F1, F2,…,F m不相关、均值为0方差为1.
我们把F称为X的公共因子或潜在因子,矩阵A称为因子载荷矩阵,e称为X的特殊因子,
它们是在各个变量中都出现的因子,我们可以把它们看做高维空间中所张起的相互垂直的m 个坐标轴。e i (i=1,2,…,p )表示影响X i 的独特因子。a ij 做因子载荷,它是第i 个变量在第j 个主因子上的负荷,或者叫做第i 个变量在第j 个主因子上的权,它反映了第i 个变量在第j 个主因子上的相对重要性。
(4)因子模型的性质
X 的协方差矩阵如下:
∑x =E (AF+e )(AF+e )'=AA'+∑e
为了得到因子分析结果的合理解释,因子载荷矩阵A 中有两个统计量十分重要,即变量公共度和潜在因子的方差贡献。我们现在看看矩阵A 的统计意义。
由因子分析数学模型的假设条件知:
{X i =∑a ik F k +e i m k=1I =VAR (X i )=∑a ik 2+σi
2m k=1 i=1,2,…,m 因子载荷矩阵A 中第i 行元素之间平方和记为ℎi 2,称为变量X i 的公共度。即
ℎi 2=∑a ik 2m k=1,则有ℎi 2+σi 2=I ,i=1,2,…,m
ℎi 2是全部潜在因子对原始指标X i 的方差所作出的贡献反映了全部潜在因子对变量X i 的影响。