多元统计分析第七章主成分分析习题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.1 设随机变量12X
(X ,X )'=的协差阵为2
1,12⎡⎤∑=⎢
⎥⎣⎦
试求X的特征根和
特征向量,并写出主成分。
解:先求X的特征根λ,λ满足方程:
2101
2-λ=-λ
,即2
(2)10-λ-=,因此两个特征根分别为123, 1.λ=λ=
设13λ=对应的单位特征向量为()1121a ,a ',则()1121a ,a '满足:
1121a 110a 110-⎛⎫⎡⎤⎛⎫= ⎪ ⎪⎢⎥-⎣⎦⎝⎭⎝⎭
,故可以取1121a a ⎛⎛⎫ = ⎪ ⎝⎭ ⎝
,其对应主成分为:
112F X X 22
=
+
;
设21λ=对应的单位特征向量为()1222a ,a ',则()1222a ,a '满足:
1222a 110a 110⎛⎫⎡⎤⎛⎫
=
⎪ ⎪⎢⎥⎣⎦⎝⎭
⎝⎭
,故可以取1222a a ⎛⎫
⎛⎫ ⎪= ⎪ ⎝⎭- ⎝
,其对应的主成分为:
212F 2
2
=
-
.
7.2
设随机变量123X (X ,X ,X )'=的协差阵为120250,002-⎡⎤
⎢⎥
∑=-⎢⎥⎢⎥⎣⎦
试求X的主
成分及主成分对变量X的贡献率。
解:先求X的特征根λ,λ满足方程:
1202500
2-λ---λ=-λ
,即()2
(2)61
0-
λλ
-λ+=,因此三个特征根分别为
1235.8284,2,0.1716λ=λ=λ=
设1 5.8284λ=对应的单位特征向量为()112131a ,a ,a ',则它满足:
1121314.828420a 020.82840a 000 3.8284a 0--⎡⎤⎛⎫⎛⎫
⎪ ⎪⎢⎥--=
⎪ ⎪⎢⎥ ⎪ ⎪⎢⎥-⎣⎦⎝⎭⎝⎭
,故可以取 112131a 10.38271a 2.41420.92392.6131a 00⎛⎫⎛⎫⎛⎫
⎪ ⎪ ⎪
=-=- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭
,其对应主成分为: 112F 0.3827X 0.9239X =-,其贡献率为
5.8284
72.86%
5.828420.1716
=++;
设2
2
λ=对应的单位特征向量为()12
2232a
,a ,a ',则它满足:
1222
32120a 0230a 0000a 0--⎡⎤⎛⎫⎛⎫ ⎪ ⎪⎢⎥-= ⎪ ⎪⎢⎥ ⎪ ⎪⎢⎥⎣⎦⎝⎭⎝⎭,故可以取12
2232
a 0a 0a 1⎛⎫⎛⎫
⎪ ⎪= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭
,其对应主成分为: 23F X =,其贡献率为
2
25%
5.828420.1716
=++;
设30.1716λ=对应的单位特征向量为()132333a ,a ,a '
,则它满足:
1323330.828420a 02 4.82840a 000 1.8284a 0-⎡⎤⎛⎫⎛⎫
⎪ ⎪⎢⎥-=
⎪ ⎪⎢⎥ ⎪ ⎪⎢⎥⎣⎦⎝⎭⎝⎭
,故可以取
132333a 10.92391a 0.41420.38271.0824a 00⎛⎫⎛⎫⎛⎫
⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭
,其对应主成分为: 312F 0.9239X 0.3827X =+,其贡献率为
0.1716
2.14%
5.828420.1716
=++.
7.3 设随机变量12X (X ,X )'=的协差阵为14,4100⎡⎤∑=⎢⎥⎣⎦
试从∑
和相关阵
R出发求出总体主成分,并加以比较。
解:(1) 先从∑出发求总体主成分,先求特征根λ,λ满足方程:
140
4
100-λ=-λ
,即
2
101840λ
-λ+=,因此两个特征根分别为
12100.1614,0.8386.λ=λ=
设1100.1614λ=对应的单位特征向量为()1121a ,a ',则它满足:
1121a 99.161440a 40.16140-⎛⎫⎡⎤⎛⎫=
⎪ ⎪⎢⎥-⎣⎦⎝⎭⎝⎭,故可以取1121a 10.04031
a 24.79040.999224.8106⎛⎫⎛⎫⎛⎫== ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭
,
其对应主成分为:112F 0.0403X 0.9992X =+;
设2
0.8386λ=对应的单位向量特征向量为()1222a ,a ',则它满足:
1222a 0.161440a 499.16140⎛⎫⎡⎤⎛⎫= ⎪ ⎪⎢⎥⎣⎦⎝⎭⎝⎭,故可以取1222a 24.79040.99921
a 10.040324.8106⎛⎫⎛⎫⎛⎫== ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭
,
其对应的主成分为:212F 0.9992X 0.0403X =-.
(2) 先从R 出发求总体主成分,容易看出10.4R 0.41⎡⎤
=⎢⎥⎣⎦
.
先求特征根λ,λ满足方程:
10.400.4
1-λ=-λ
,即2
(1)0.160
-λ-=,因此两个特征根分别为
121.4,0.6.λ=λ=
设1 1.4λ=对应的单位特征向量为()1121a ,a ',则()1121a ,a '满足:
1121a 0.40.40a 0.40.40-⎛⎫⎡⎤⎛⎫= ⎪ ⎪⎢⎥-⎣⎦⎝⎭⎝⎭
,故可以取1121a a ⎛⎛⎫ = ⎪ ⎝⎭ ⎝
,其对应主成分为:
112F 22
=
+
;
设2
0.6
λ=对应的单位特征向量为()12
22a
,a ',则()1222a ,a '满足:
1222a 0.4
0.40a 0.4
0.40⎛⎫⎡⎤⎛⎫=
⎪ ⎪⎢⎥⎣⎦⎝⎭⎝⎭
,故可以取12
22
a a ⎛⎫
⎛⎫ ⎪
= ⎪ ⎝⎭- ⎝
,其对应的主成分为:
212F X X 2
2
=
-
由于12X ,X 的方差差距很大,所以如果从协方差阵出发,就导致两个
主成分贡献率相差非常大,而且主成分中两个变量的系数相差非常大;反之从相关阵出发时,两个主成分贡献率相差不大,主成分中两个变量的系数比较均衡。