第8章因子分析讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4、随机向量 X 的相关矩阵
R (rij ) p p , rij
Cov( X i , X j ) D(Xi ) D(X j )
上页 下页
性质:设 X、Y 是随机向量,A、B 是常数矩阵,则
(1)D ( X ) = Cov ( X, X ) (2)E (AX) = AE(X) (3)E(AXB)=AE(X)B (4)D(AX)=AD(X)AT (5)Cov (AX, BY) = ACov (X,Y)BT
p2
1m F1 1
2m
F2
2
pm
Fm
p
或X AF
上页 下页
称 F1, F2,, Fm为公共因子,是不可观测的变量,
他们的系数称为因子载荷。 是特i 殊因子,是不能
被前m个公共因子包含的部分。并且满足:
cov(F, ) 0 , F, 不相关;
1
D(F)
享这六个因子,但是每个变量又有自己的个性,不被包含的
部分i ,称为xi 的特殊因子。
因子分析(factor analysis)是一种数据简化技术。 它通过研究众多变量之间的内部依赖关系,探求观测数据中 的基本结构,并用少数几个假想变量来表示其基本的数据结 构。这几个假想变量能够反映原来众多变量的主要信息。原 始的变量是可观测的显在变量,而假想变量是不可观测的潜 在变量,称为因子。
我们将每个方面称为一个公共因子,每个学生的成绩 均由这六个因子确定,即第i个学生的考试分数Xi能用这
六个公共因子Y1、Y2、Y3、Y4、Y5、Y6的线性组合表示出
来,即可以表示为:
上页 下页
xi i i1F1 i2F2 i6F6 i i 1,, n
称 F1,F2,,F6 是不可观测的潜在因子。n个变量Xi共
Cov( X i ,Yj )
aij
上两式表明,aij 既是第i个变量Xi与第j个公共因子Yj的 协方差,又是Xi与Yj的相关系数,aij反映了第i个变量Xi与 第j个公共因子Yj的相关程度,即Xi在Yj上的相对重要性。
上页 下页
2、变量共同度的统计意义
定义:称因子载荷矩阵A中第i行元素的平方和(行方和)
1
I
1
即 F1, F2,, Fm 互不相关,方差为1。
上页 下页
2 1
D( )
2 2
2 p
即互不相关,方差不一定相等,i
~
N
(0,
2 i
)

上页 下页
二、随机向量的均值、协方差阵、相关阵
1、设随机向量 X (X1, X2,, X p )T, 则 X 的均值为
E(X ) E(X1, X 2,, X p )T (E(X1), E(X 2 ),, E(X p ))T
试利用因子分析法对全国31个地区的竞争力水平进行综 合评价。
上页 下页
第二节 因子分析的数学模型
一、因子分析数学模型(按列)
设 X i (i 1,2,, p) p 个随机变量,如果表示为
Xi ai1F1 aimFm i (m p)
X1 11 12

X
2
21
22
X
p
p1
上页 下页
三、因子分析中的几个统计特征
1、因子载荷矩阵A的统计意义。 由于
m
Cov( X i ,Yj ) Cov( aijYj i ,Yj )
j 1
m
Cov( aijYj ,Yj ) Cov(i ,Yj ) aij
j 1

ij
Cov( X i ,Yj ) D( X i ) D(Yj )
第八章 因子分析
第一节 什么是因子分析 第二节 因子分析的数学模型 第三节 因子载荷矩阵的估计方法 第四节 因子旋转(正交变换) 第五节 因子得分
上页 下页
第一节 什么是因子分析
因子分析是将具有复杂关系的一组变量综合为数学较 少的几个因子,并找出原变量和因子之间的相互关系。
例如,为了解学生的学习能力,对学生进行抽样命题 考试,考试题包括的面很广,但总的来讲可归结为学生 的数学推导、语文水平、记忆能力、逻辑推理能力、艺 术修养、历史知识六个方面
为变量 X i 的共同度 hi2 jm1ai2j。
统计意义:
X i ai1F1 aimFm i 两边求方差
D(
X
i
)
a
2i1D(F1
)
a
2 im
D(Fm
)
D(
i
)
1
a m
2 ij
2 i
j 1
所常靠有近的1公,共 i2因非子常和小特,殊则因因子子对分变析量的效X i果的好贡,献从为原1。变如量果空间jm到1a公i2j 共非
D( X p )
其中, Cov( Xi , X j ) E[( Xi E(Xi ))( X j ห้องสมุดไป่ตู้E(X j ))]
上页 下页
3、随机向量 X 与 Y 的协方差矩阵
Cov( X ,Y ) E[( X E( X ))(Y E(Y ))T ]
若Cov ( X, Y ) = 0, 则称 X 与 Y 不相关。
上页 下页
例:为了客观评价全国各地区的竞争能力水平,现选择了8 项竞争力评价指标。它们是 X1:城镇居民人均全年家庭可支配收入(元) X2:财政收入(万元) X3:地区生产总值(亿元) X4:城市用水普及率(%) X5:城市燃气普及率(%) X6:每万人拥有公共汽车车辆(标台) X7:人均城市道路面积(平方米) X8:人均公园绿地面积(平方米)。
算出来,使得
S1 S2 Sm
据此,可以找出最重要的公共因子,并依次递减,因此, 问题归结为因子载荷矩阵A的估计
上页 下页
四、因子分析模型的性质
1、原始变量X的协方差矩阵的分解
因子空间的转化性质好。
上页 下页
3、公共因子Fj 方差贡献的统计意义
因子载荷矩阵A中各列元素的平方和(列方和)
Sj
a p
i 1
2 ij
p
r
i 1
2
(
xi
,
Fj
)
称为 Fj ( j 1,, m) 对X的全部分量X1,X2,…,Xp的总贡
献。Sj是衡量第j个公共因子相对重要性的一个指标,Sj越大,
表明Yj对变量X的贡献也越大。若把矩阵A的各列平方和都计
2、随机向量X 的协方差矩阵为
D( X ) E[( X E( X ))( X E( X ))T ]
D( X1)
Cov(
X
2
,
X
1
)
Cov( X1, X 2 )
D(X 2)
Cov( X1, X p ) Cov( X 2, X p )
Cov( X p , X1) Cov( X p , X 2 )
相关文档
最新文档