应用多元统计分析习题解答典型相关分析.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章 典型相关分析
9.1 什么是典型相关分析?简述其基本思想。
答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
用于揭示两组变量之间的内在联系。
典型相关分析的目的是识别并量化两组变量之间的联系。
将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。
基本思想:
(1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
即: 若设(1)
(1)(1)(1)12(,,,)p X X X =X
L 、(2)(2)(2)(2)
12(,,,)q X X X =X L 是两组相互关联的随机变量,
分别在两组变量中选取若干有代表性的综合变量Ui 、Vi ,使是原变量的线性组合。
在(1)(1)(1)(2)()()1D D ''==a X b X 的条件下,使得(1)(1)(1)(2)(,)ρ''a X b X 达到最大。
(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。
(3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。
9.2 什么是典型变量?它具有哪些性质?
答:在典型相关分析中,在一定条件下选取系列线性组合以反映两组变量之间的线性关系,这被选出的线性组合配对被称为典型变量。
具体来说,
()(1)()(1)()(1)
()(1)1122i i i i i P P U a X a X a X '=+++a X L @
()(2)()(2)()(2)()(2)1122i i i i i q q V b X b X b X '=+++b X L @
在(1)(1)(1)(2)()()1D D ''==a X b X 的条件下,使得(1)(1)(1)(2)(,)ρ''a X b X 达到最大,则称
(1)(1)'a X 、(1)(2)'b X 是(1)X 、(2)X 的第一对典型相关变量。
典型变量性质:
典型相关量化了两组变量之间的联系,反映了两组变量的相关程度。
1. ()1,()1
(1,2,,)k k D U D V k r ===L
(,)0,(,)0()i j i j Cov U U Cov V V i j ==≠
2. 0(,1,2,,)(,)0
()0()
i i j i j i r Cov U V i j j r λ≠==⎧⎪
=≠⎨⎪>⎩
L
9.3 试分析一组变量的典型变量与其主成分的联系与区别。
答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。
主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖关系之中,度量了这两组变量之间联系的强度。
()(1)()(1)()(1)()(1)
1122i i i i i P P U a X a X a X '=+++a X L @ ()(2)()(2)()(2)()(2)1122i i i i i
q q V b X b X b X '=+++b X L @ (1)(1)(1)(1)1
2
(,,,)p
X X X =L X 、(2)(2)(2)(2)1
2
(,,,)q
X X X =L X
9.4 简述典型相关分析中载荷分析的内容及作用。
答:作用:进行典型载荷分析有助于更好解释分析已提取的p 对典型变量。
分析原始变量与典型变量之间相关性。
内容:
令 (1)(2)*()p ⎡⎤
⎢⎥
⎢
⎥=⎢⎥
⎢⎥
⎣⎦a a A a M (1)(2)*()p ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦b b B b M 12p U U U ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦U M 12p V V V ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦
V M *(1)
*(2)==U A X V B X
其中*A ,*B 为p 对典型变量系数向量组成的矩阵,U 和V 为p 对典型变量组成的向
量。
则(1)*(1)(1)*
11(,)(,)Cov Cov ==U X A X X A Σ
(1)(1)(1)1/2
(1)(,)(,)
i k
i kk k Corr U X Cov U X σ-=
=
=
这里()1i D U =
,1/2
kk σ=。
记1/211V -为对角元素是1/2
kk σ-的对角阵,所以有
(1)(1)1/2(1)
11,*(1)1/2(1)*1/2
111111
(,)(,)
(,)U X Corr Cov Cov ---====R U X U V X A X V X A ΣV
类似可得:
(2)*1/22222
,V X -=R B ΣV (2)*1/21222,U X -=R A ΣV (1)*1/2
2111,V X -=R B ΣV 对于经过标准化处理后得到的典型变量有:
(1)*11,Z U Z =R A R ; (2)*22,Z V Z =R B R (2)*12,Z U Z =R A R ;(1)*
21,Z V Z =R B R
对于样本典型相关分析,上述结果中的数量关系同样成立。
9.5 简述典型相关分析中冗余分析的内容及作用。
答:典型冗余分析的作用即分析每组变量提取出的典型变量所能解释的该组样本总方差的比例,从而定量测度典型变量所包含的原始信息量。
第一组变量样本的总方差为11()tr p =R ,第二组变量样本的总方差为22()tr q =R 。
*ˆz A 和*ˆz
B 是样本典型相关系数矩阵,典型系数向量是矩阵的行向量,*(1)ˆˆz =U A Z ,*(2)ˆˆz
=V
B Z 。
前r 对典型变量对样本总方差的贡献为
(1)(1)(1)(2)(2)
()()
2ˆ,11
ˆˆˆˆˆˆ()i
k p
r r r z z
z z
z z
z U i k tr r =='''+++=∑∑a
a a a a a L (2)(1)(1)(2)(2)()()2ˆ,11
ˆˆˆˆˆˆ()i
K
q r
r r z z z z z z z V
i k tr r =='''+++=∑∑b b b b b b L 则第一组样本方差由前r 个典型变量解释的比例为(1)(1)2
ˆ,11
ˆ|i
k
p
r z U i k
z U
r
d
p
===
∑∑R
第二组样本方差由前r 个典型变量解释的比例为(2)(2)2ˆ,11
ˆ|i
k q
r
z V i k z V r
d q
===∑∑R
9.6 设X 和Y 分别是p 维和q 维随机向量,且存在二阶距,设p ≤q 。
它们的第i 对典型变
量分别为()i a X '、()i b Y ',典型相关系数为i λ,(1,,)i p =L 。
令*
X CX l =+,*Y DY m =+,其中C 、D 分别为,p p q q ⨯⨯阶非奇异阵,l 、m 分别为p 维、q 维随机向量,试证明
⑴ **
X Y 、的第i 对典型变量为1()*i C a X -'、1()*i D b Y -'。
⑵ 1()*i C a X -'与1()*
i D b Y -'的典型相关系数为i λ。
9.7 对140名学生进行了阅读速度1x 、阅读能力2x 、运算速度1y 和运算能力2y 的四种测验,所得成绩的相关系数阵为
1
0.030.240.590.0310.060.07R 0.240.0610.240.590.070.24
1⎡⎤⎢⎥⎢
⎥⎢⎥⎢⎥
⎣⎦= 试对阅读本领与运算本领之间进行典型相关分析。
解:根据已知可得
=
=
==
计算得的特征值为
提取第一典型变量为
其中
,
分别为原始变量
标准化后的结果。
按照常识,不应该有负数系数啊?不知道怎么回事。
9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。
44名学生的成闭卷 开卷 闭卷 开卷 力学 物理 代数
分析
统计
力学 物理 代数
分析
统计
1X 2X
3X
4X
5X
1X 2X
3X
4X
5X
77 82 67 67 81 63 78 80 70 81 75 73 71 66 81 55 72 63 70 68 63 63 65 70 63 53 61 72 64 73 51 67 65 65 68 59 70 68 62 56 62 60 58 62 70 64 72 60 62 45 52 64 60 63 54 55 67 59 62 44 50 50 64 55 63 65 63 58 56 37 31 55 60 57 76 60 64 56 54 40 44 69 53 53 53 42 69 61 55 45 62 46 61 57 45 31 49 62 63 62 44 61 52 62 45 49 41 61 49 64 12 58 61 63 67 49 53 49 62 47 54 49 56 47 53 54 53 46 59 44 44 56 55 61 36 18 44 50 57 81 46 52 65 50 35 32 45 49 57 64 30 69 50 52 45 46 49 53 59 37 40 27 54 61 61 31 42 48 54 68 36 59 51 45 51 56 40 56 54 5 46 56 57 49 32 45 42 55 56 40 42 60 54 49 33 40 63 53 54 25 23 55 59 53 44 48 48 49 51 37 41
63
49
46
34
46
52
53
41
40
试对闭卷(1X ,2X )和开卷(3X ,4X ,5X )两组变量进行典型相关分析。
9.9 邓讷姆(Dunham )在研究职业满意度与职业特性的相关程度时,对从一大型零售公司各分公司挑出的784位行政人员测量了5个职业特性变量:用户反馈、任务重要性、任务多样性、任务特性及自主性,7个职业满意度变量:主管满意度、事业前景满意度、财政满意度、工作强度满意度、公司地位满意度、工种满意度及总体满意度。
两组变量的样本相关矩阵为:
11 1.000.49 1.00ˆ0.53
0.57 1.00
0.490.460.48 1.000.51
0.530.570.57 1.00R ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥
⎢⎥⎢⎥⎣⎦
22 1.000.43 1.00
0.270.33 1.00ˆ0.240.260.25 1.000.340.540.460.28 1.00
0.370.320.290.300.35 1.000.400.580.45
0.27
0.590.31 1.00R ⎡⎤
⎢⎥⎢⎥⎢⎥⎢⎥=⎢
⎥⎢⎥⎢⎥
⎢⎥⎢⎥⎣
⎦
12210.33
0.320.200.190.300.370.210.300.210.160.080.270.350.20ˆˆ0.31
0.230.140.070.240.370.180.240.220.120.190.210.290.160.380.320.170.230.320.360.27R R ⎡⎤
⎢⎥⎢
⎥⎢⎥==⎢⎥
⎢⎥⎢⎥⎣⎦
试对职业满意度与职业特性进行典型相关分析。
9.10 试对一实际问题进行典型相关分析。