多元统计分析试卷A答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
东 北 大 学 秦 皇 岛 分 校
课程名称: 多元统计分析 试卷类型: 答案 考试形式:开
授课专业: 数学与应用数学 考试日期: 2012年12月12日 试卷:共 3 页
一、填空题:(每空2分,共30分)
1、设(1)(2)(,)p N ⎡⎤=⎢⎥⎣⎦:X X μX ∑(2)p ≥,(1)(2)⎡⎤=⎢⎥⎣⎦μμμ,11122122⎡⎤=⎢⎥
⎣⎦∑∑∑∑∑,其中(1)X ,(1)
μ为1r ⨯,11∑为r r ⨯,则(1):X (1)11(,)r N μ∑,(2):X (2)22(,)p r N -μ∑
2、系统聚类分析的方法很多,其中的五种分别为最短距离法、最长距离法、重心法、类平均法、离差平方和法。
3、若p 维随机向量~(,)p X N μ∑,~(,)p W W n ∑,且X 与W 相互独立,则
1()()~n X W X μμ-'--2(,)T p n ,
2
1(,)~n p T p n pn
-+(,1)F p n p -+。 4、i X 与前个主成分的全相关系数的平方和21
(,)m
k i k Y X ρ=∑称为12,,,m Y Y Y L 对原始变量
i X 的方差贡献率,在因子分析中也称之为共同度。
5、Q 型因子分析研究样品之间的相关关系,R 型因子分析研究变量之间的相关关系。
6、Fisher 判别法的基本思想是投影,并利用方差分析的思想来导出判别函数。
二、判断题(每题2分,共10分)
1、( √ )随机向量12(,,,)p X X X 'L 的协方差阵()D X =∑是对称非负定阵。
2、( × )因子载荷矩阵A 是对称阵。
3、( × )聚类分析中快速聚类法指的就是模糊聚类法。
4、( √ )设(,)p N :X μ∑,(,)p W n :W ∑,且X 与W 相互独立,则
12()()(,)n T p n -':X μW X μ--。
5、( × )主成分分析中,从相关矩阵出发求解的主成分一定会比从协方差矩阵出发求解的主成分更可信。
装
订
线装 订 线 内 不 要 答 题
学 号
姓 名
班 级
三、计算题(共60分)
1、设12(,)X X 'X =
的协方差阵为2
9⎛∑=⎪⎭
,试分别从协方差∑和相关矩阵出发求解总体主成分1Y ,2Y 。(10分)
解:特征方程2||0E λλ--∑=
=,得特征根:110λ=,21
λ=
110λ=
的特征方程:128
01x x ⎛⎛⎫=
⎪ ⎪⎝⎭
⎝⎭
,得特征向量1
13u ⎛⎫
⎪
=
21λ=
的特征方程:12108x x ⎛-⎛⎫
= ⎪ ⎪-⎝⎭⎝⎭
,得特征向量213u ⎪= -⎪
⎪⎝⎭
112133Y x x =+
,1121
33
Y x x =-……………5分
由29⎛∑=⎪⎭,得:12321R ⎛⎫= ⎪⎝⎭
, 特征方程2
1
3
||021
3
E R λλλ--=
=-,得特征根:153λ*=,21
3λ*=
153λ*=的特征方程:122320232x x ⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭
,得特征向量1u *⎛⎫
⎪ ⎪=
⎝ 213λ*
=的特征方程:12232302323x x -⎛⎫⎛⎫= ⎪ ⎪-⎝⎭⎝⎭
,得特征向量2u *=
112Y x x ***=
-
,212Y x x ***
=…………10分 2、设5个样品两两之间的距离矩阵:04
06
90
1710063580⎛⎫
⎪
⎪
⎪ ⎪
⎪ ⎪⎝⎭
,试用最长距离法作系统聚类,并画出谱系聚类图。(15分)
解:样品与样品之间的明氏距离为:1234
512(0)
345
040690171006
3
5
8
0x x x x x x x D
x x x ⎛
⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭
样品最短距离是1,故把1X 与4X 合并为一类……………3分
学 号
班 级
计算类与类之间距离(最长距离法),得: 1423
514(1)
23
5{,}{,}0
701090
835
0x x x x x x x D x x x ⎛
⎫
⎪ ⎪ ⎪=
⎪ ⎪ ⎪⎝
⎭
类与类的最短距离是3,故把2X 与5X 合并为一类,……………6分
计算类与类之间距离(最长距离法),得:1425314(2)
253{,}{,}{,}0{,}801090x x x x x x x D x x x ⎛
⎫ ⎪
⎪= ⎪ ⎪
⎝⎭
类与类的最短距离是8,故把14{,}X X 与{}25,X X 合并为一类……………9分
计算类与类间距离(最长距离法),得:
12453(3)
12453{,,,}{}{,,,}0{}100x x x x x D x x x x x ⎛⎫ ⎪= ⎪ ⎪⎝⎭
…12分 谱系聚类图(略)……………15分
3、设三维随机向量1233(,,)~(,)X X X X N μ=∑,其中120250002-⎛⎫
⎪
∑=- ⎪ ⎪⎝⎭。试问
下列5对随机变量或随机向量中哪几对是相互独立的,为什么?(1)1X 与
22X ;(2)2X 与3X ;(3)12(,)X X 与3X ;(4)1X 与23(,)X X 。(10分)
解:由120250002-⎛⎫
⎪
∑=- ⎪ ⎪⎝⎭知,1X 与22X 不独立;2X 与3X 独立 ……………4分
12(,)X X 与3X 独立;1X 与23(,)X X 不独立……………10分
4、在1984年洛杉矶奥运会上,有55个国家和地区参与了男子径赛,其中有这样8
项比赛指标:x1:100米(秒),x2:200米(秒),x3:400米(秒),x4:800米(秒),
x5:1500米(分),x6:5000米(分),x7:10000米(分)和x8:马拉松(分)。
这8个变量的样本相关系数矩阵的个特征根和前三个标准正交特征向量分别为:
12
3
(0.318,0.337,0.356,0.369,0.373,0.364,0.367,0.342)
(0.567,0.462,0.248,0.012,0.140,0.312,0.307,0.439)(0.332,0.361,0.560,0.532,0.153,0.190,0.182,0.263)U U U '='=----'=--- (1)写出前三个主成分的表达式;(5分)
(2)计算每个主成分的方差贡献率,并按照一般性原则选取主成分的个数。(5分)
(1)********1123456780.3180.3370.3560.3690.3730.3640.3670.342Y x x x x x x x x =+++++++
********
212345678
0.5670.4620.2480.0120.1400.3120.3070.439Y x x x x x x x x =+++----********3123456780.3320.3610.5600.5320.1530.1900.1820.263Y x x x x x x x x =+---+++……5分
装订
线
装 订 线
学 号
姓 名 班 级
装
订
线
装 订 线
学 号
姓 名
班 级