应用多元统计分析习题解答 第七章讲解学习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用多元统计分析习题解答第七章
第七章 因子分析
7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面?
答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。 答:对于因子模型
1122i i i ij j im m i X a F a F a F a F ε=++
++
++ 1,2,
,i p =
因子载荷阵为11
12121
22212
1
2
(,,
,)m m m p p pm a a a a
a a A A A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦
A
i X 与j F 的协方差为:
1Cov(,)Cov(,)m
i j ik k i j k X F a F F ε==+∑
=1
Cov(,)Cov(,)m
ik k j i j k a F F F ε=+∑
=ij a
若对
i
X作标准化处理,=
ij
a,因此
ij
a一方面表示
i
X对
j
F的依赖程度;另一方面也反映了变量i X对公共因子j
F
的相对重要性。
变量共同度22
1
1,2,,
m
i ij
j
h a i p
=
==
∑
222
1122
()()()()()
i i i im m i
D X a D F a D F a D F Dε
=++++22
i i
hσ
=+说明变量
i
X的方差
由两部分组成:第一部分为共同度2
i
h,它描述了全部公共因子对变量
i
X的总方
差所作的贡献,反映了公共因子对变量
i
X的影响程度。第二部分为特殊因子
i
ε
对变量
i
X的方差的贡献,通常称为个性方差。
而公共因子
j
F对X的贡献22
1
1,2,,
p
j ij
i
g a j m
=
==
∑
表示同一公共因子
j
F对各变量所提供的方差贡献之总和,它是衡量每一个公共
因子相对重要性的一个尺度。
7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?
答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。
最大方差旋转法是一种正交旋转的方法,其基本思路为:
①A
其中令***
(),/
ij p m ij ij i
a d a h
⨯
===
A AΓ2
1
1p
j ij
i
d d
p=
=∑
*
A的第j列元素平方的相对方差可定义为22
1
1
()
p
j ij j
i
V d d
p=
=-
∑
②
12m
V V V V
=+++
最大方差旋转法就是选择正交矩阵Γ,使得矩阵*A所有m个列元素平方的相对
方差之和达到最大。
7.5 试分析因子分析模型与线性回归模型的区别与联系。
答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系, 用函数关系式表达出来。
因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即
1122
i i i im m i
X a F a F a Fε
=++++,(1,2,,
i p
=)该模型可用矩阵表示为:=+
X AFε而回归分析模型中多元线性回归方程模型为:
其中是常数项,是偏回归系数,是残差。
因子模型满足:
(1)m p
≤;(2)(,)0
Cov=
F ε,即公共因子与特殊因子是不相关的;
(3)
10
1
()
01
F m
D
⎡⎤
⎢⎥
⎢⎥
===
⎢⎥
⎢⎥
⎣⎦
D F I,即各个公共因子不相关且方差为1;
(4)
2
1
2
2
2
()
p
D
ε
σ
σ
σ
⎡⎤
⎢⎥
⎢⎥
==
⎢⎥
⎢⎥
⎢⎥
⎣⎦
Dε,即各个特殊因子不相关,方差不要求相
等。
而回归分析模型满足(1)正态性:随机误差(即残差)e服从均值为 0,方差为σ2的正态分布;(2)等方差:对于所有的自变量x,残差e的条件方差为σ2,且σ为常数;(3)独立性:在给定自变量x的条件下,残差e的条件期望值为0(本假设又称零均值假设);(4)无自相关性:各随机误差项e互不相关。
两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。