应用多元统计分析习题解答典型相关分析 (1)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
= 计算得
= 的特征值为
提取第一典型变量为
其中 , 分别为原始变量 标准化后的结果。
按照常识,不应该有负数系数啊?不知道怎么回事。
9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。44 名学生的成
绩如下表:
闭卷
开卷
闭卷
开卷
力学 物理 代数 分析 统计 力学 物理 代数 分析 统计
77 82 67 67 81 63 78 80 70 81
百度文库 - 让每个人平等地提升自我!
第九章 典型相关分析
9.1 什么是典型相关分析?简述其基本思想。 答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量 之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关 关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。
答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。 主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖 关系之中,度量了这两组变量之间联系的强度。 9.4 简述典型相关分析中载荷分析的内容及作用。
答:作用:进行典型载荷分析有助于更好解释分析已提取的 p 对典型变量。分析原始
在 D(a(1)X(1) ) D(b(1)X(2) ) 1 的条件下,使得 (a(1)X(1) ,b(1)X(2) ) 达到最大。(2)选取
和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。 (3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。 9.2 什么是典型变量?它具有哪些性质? 答:在典型相关分析中,在一定条件下选取系列线性组合以反映两组变量之间的线性关系, 这被选出的线性组合配对被称为典型变量。具体来说,
在 XD((1a) (1)(XX(11()1)) ,XD2(1)(,b(1),XX(p(21)) )) 、 1X的(2)条件(X下1(2,) , X使2(2得) , (,aX(1q()2X) )(1) ,b(1)X(2) ) 达 到 最 大 , 则 称
a(1)X(1) 、 b(1)X(2) 是 X(1) 、 X(2) 的第一对典型相关变量。
变量与典型变量之间相关性。
内容:
a(1)
b(1)
U1
V1
令
A*
a(2)
B*
b(2)
U
U
2
V
V2
a(
p
)
b(
p)
U
p
Vp
其中 A* , B* 为 p 对典型变量系数向量组成的矩阵, U 和 V 为 p 对典型变量组成的向
1
百度文库 - 让每个人平等地提升自我!
量。则 Cov(U, X(1) ) Cov(A*X(1) , X(1) ) A*Σ11
典型变量性质:
典型相关量化了两组变量之间的联系,反映了两组变量的相关程度。
1. D(Uk ) 1, D(Vk ) 1 (k 1, 2, , r)
i 0 (i j,i 1, 2, , r)
2. Cov(Ui ,Vj ) 0
(i j)
0
( j r)
9.3 试分析一组变量的典型变量与其主成分的联系与区别。
这里 D(Ui ) 1 ,
D(
X
(1) k
)
V 1/ kk
2
。记
1/ 2 11
为对角元素是
1/ kk
2
的对角阵,所以有
类似可得: 对于经过标准化处理后得到的典型变量有:
RU ,Z(1) A*Z R11 ;
RV ,Z(2)
B*Z R22
RU ,Z(2)
A*Z
R12
;
R V
,Z (1)
Байду номын сангаас
B*Z R21
量分别为 a(i) X 、b(i)Y ,典型相关系数为 i ,(i 1, , p) 。令 X * CX l ,Y * DY m ,
其中 C、D 分别为 p p, qq 阶非奇异阵, l 、 m 分别为 p 维、q 维随机向量,试证明
⑴ X *、Y * 的第 i 对典型变量为 C a 1 (i) X * 、 D b 1 (i)Y * 。
基本思想: (1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。 即:
若设 X(1)
(
X (1) 1
,
X
(1) 2
,
,
X
(1) p
)
、X(2)
(
X (2) 1
,
X
(2) 2
,
,
X
(2) q
)
是两组相互关联的随机变量,
分别在两组变量中选取若干有代表性的综合变量 Ui、Vi,使是原变量的线性组合。
对于样本典型相关分析,上述结果中的数量关系同样成立。
9.5 简述典型相关分析中冗余分析的内容及作用。
答:典型冗余分析的作用即分析每组变量提取出的典型变量所能解释的该组样本总方差的比
例,从而定量测度典型变量所包含的原始信息量。
第一组变量样本的总方差为 tr(R11) p ,第二组变量样本的总方差为 tr(R22 ) q 。 Aˆ *z 和 Bˆ *z 是 样 本 典 型 相 关 系数矩 阵 , 典 型 系 数 向 量是矩 阵 的 行 向 量 , Uˆ Aˆ *zZ(1) , Vˆ Bˆ *zZ(2) 。 前 r 对典型变量对样本总方差的贡献为
⑵ C a 1 (i) X * 与 D b 1 (i)Y * 的典型相关系数为 i 。
9.7 对 140 名学生进行了阅读速度 x1 、阅读能力 x2 、运算速度 y1 和运算能力 y2 的四种测验,
所得成绩的相关系数阵为 试对阅读本领与运算本领之间进行典型相关分析。 解:根据已知可得
=
=
2
百度文库 - 让每个人平等地提升自我!
rp
则第一组样本方差由前 r 个典型变量解释的比例为 Rdz(1)|Uˆ
i 1
r2
k 1 zk(1) ,Uˆi
p
rq
第二组样本方差由前 r 个典型变量解释的比例为 Rdz(2)|Vˆ
i 1
r2
k 1 zk( 2) ,Vˆi
q
9.6 设 X 和 Y 分别是 p 维和 q 维随机向量,且存在二阶距,设 p≤q。它们的第 i 对典型变
75 73 71 66 81 55 72 63 70 68
63 63 65 70 63 53 61 72 64 73
51 67 65 65 68 59 70 68 62 56
62 60 58 62 70 64 72 60 62 45
52 64 60 63 54 55 67 59 62 44