第六讲 因子分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五讲 因子分析

在许多实际问题中,涉及的变量众多,各变量间还存在错综复杂的相关关系,这时最好能从中提取少数综合变量,这些综合变量彼此不相关,而且包含原变量提供的大部分信息。因子分析就是为解决这一问题提供的统计分析方法。

以后,如无特别说明,都假定总体是一个p 维变量:

),...,,(21'=p X X X x

它的均值向量μ

=)(x E ,协方差矩阵V =(σij )p ⨯p 都存在。

第一节 正交因子模型

1.1 公共因子与特殊因子

从总体中提取的综合变量:F 1, F 2, … , F m (m

变量X i 的信息=公共因子可以表达部分

+公共因子不可表达部分

这就是所谓因子模型。目前,公共因子可以表达的部分由公共因子的线性组合表示。即上面的因子模型可以写成以下的形式:

p i F a F a F a X i m im i i i i ,...,2,1,2211=++++=-εμ

1.2 正交因子模型

设总体),...,,(21'=p

X X X x ,均值向量μ

=)(x E ,协方差矩阵p p V x Va r

⨯=)(

。因子模型有形式:

其中m

X i 的特殊因子。

如果引入以下向量与矩阵:

),...,,(,),...,,(2121'='=p m F F F F εεεε

⎪⎪

⎪⎪⎪

⎭⎫

⎝⎛=pm p p m m a a a a a a a a a A

2

1

22221

11211

则因子模型的矩阵形式为:

εμ

+=-F A x 对于正交的因子模型,还要进一步要求:

z 1. m m I F Var F E ⨯==)(,0)(

。即有:

j i F F Cov F Var F E j i i i ≠===0

),(,1)(,0)(

公共因子是互相不相关的。

z 2. 0),(,],...,[)(,0)(221

===F Cov diag Var E p

εοσεε。即:

m

j p i F Cov Var E j i i i i ,...,2,1;

,...,2,10),(,)(,0)(2=====,εοεε

特殊因子和公共因子不相关。

1.3 因子载荷矩阵

1.矩阵A 称为因子载荷矩阵(component matrix),系数a ij 称为变量X i 在因子F j 上的载荷(loading)。由于

∑=+=m

k j i k ik j i F F a Cov F X Cov 1),(),(ε

⎪⎪

⎩⎪⎪⎨

⎧++++=-++++=-++++=-p

m pm p p p p m m m m F a F a F a X F a F a F a X F a F a F a X εμεμεμ 221122222121221121211111

ij m

k j i j k ik a F Cov F F Cov a =+=∑=1),(),(ε

特别,如果总体是标准化的,则有Var (X i )=1,从而有:

),()

()(),(),(j i j i j i j i F X Cov F Var X Var F X Cov F X ==

ρ

于是:

),(j i ij F X a ρ=

即变量X i 在公共因子F j 上的载荷a ij 就是X i 与F j 的相关系数。 2.载荷矩阵的估计:主成分法。

主成分法是估计载荷矩阵的一种方法,由于其估计结果和变量的主成分仅相差一个常数倍,因此就冠以主成分法的名称。在学到这里的时候,不要和主成分分析混为一谈。主成分法是SPSS 系统默认的方法,在一般情况下,这是比较好的方法。以数据“应征人员”为例,按特征值大于1提取公共因子。在用不同方法获得因子载荷时,公共因子对总体方差的贡献率以主成分法为最高:

关于主成分法的内容可参看任何一本多元统计分析书,例如:《应用多元统计分析》,高惠璇著,北京大学出版社,p301。

1.4 因子模型的不唯一性

设T 是一个正交矩阵,由I T T =',因子模型εμ

+=-F A x

与模型 εμ

+'=-))((F T AT x 等价。后者载荷矩阵为AT ,新

的公共因子为F T G

'=。

第二节 变量的共同度与因子的方差贡献率

3.1 变量的共同度

定义 载荷矩阵A 的第i 行元素的平方和:

p i a h m

j ij i

,...,2,1,122==∑=

称为变量X i 的共同度(communality)。

共同度表示公共因子F

能在多大的程度上解释变量X i 。关

于这一点,可从分析变量X i 的方差入手:

)()()()(12

1i m

k k ik m

k i k ik i Var F Var a F a Var X Var εε+=+=∑∑==

注意到正交因子模型的假设:Var (F k )=1,k =1,…,m ;另外,记

Var (εi )=σi 2。于是得:

22212

)(i i i m

k ik i h a X Var σσ+=+=∑=

这就是把变量X i 的方差分解为两部分:一部分是2i h ,它是由公共因子产生的;另一部分是2

i σ,是由特殊因子产生的。所以共同度被理解为公共因子能够解释原有变量的程度。对于标准化的变量,Var (X i )=1,因此有:

122=+i i h σ

2.2 公共因子的方差贡献率

定义 载荷矩阵A 第j 列的平方和:

相关文档
最新文档