多元统计分析期末试题及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
22121212121
~(,),(,),(,),,
1X N X x x x x x x ρμμμμσρ
⎛⎫
∑==∑=
⎪⎝⎭
+-1、设其中则Cov(,)=____.
10
31
2~(,),1,,10,()()_________i i i i X N i W X X μμμ='
∑=--∑、设则=服从。
()1
2
34
433,4
92,32
16___________________
X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝
⎭
=∑、设随机向量且协方差矩阵则它的相关矩阵
4、
__________, __________,
________________。
215,1,
,16(,),(,)
15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),
12
3设X=x x x 的相关系数矩阵通过因子分析分解为
211X h =
的共性方差111X σ=
的方差21X g =
1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.4473
0.8350.4470.1032013
R ⎛
⎫
- ⎪⎛⎫⎛⎫ ⎪
-⎛⎫ ⎪ ⎪
⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭
12332313116421(,,)~(,),(1,0,2),441,
2142X x x x N x x x x x μμ-⎛⎫
⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭
-⎛⎫
+ ⎪⎝⎭
、设其中试判断与是否独立?11262(90,58,16),82.0 4.3107
14.62108.946460.2,(5)( 115.6924)14.6210 3.172
37.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
其中0.010.010.0137608.946437.376035.5936(0.01,(3,2)99.2,(3,3)29.5,(3,4)16.7)
F F F α⎛⎫ ⎪
⎪
⎪-⎝
⎭
====
12124122411362190.5,(21),(12)35q q C e C e Bayes X μμ⎛⎫⎛⎫⎛⎫
==∑=∑=∑= ⎪ ⎪ ⎪
⎝⎭⎝⎭⎝⎭
====⎛⎫
= ⎪⎝⎭12、设已知有两正态总体G 与G ,且,,,而其先验概率分别为误判的代价;试用判别法确定样本属于哪一个总体?
1234411(,,,)~(0,),01
11T
X X X X X N ρρρρ
ρρρρρρρ
ρρ⎛⎫ ⎪
⎪=∑∑=<≤ ⎪ ⎪⎝⎭
4、设,协方差阵
(1) 试从Σ出发求X 的第一总体主成分;
(2) 试问当 取多大时才能使第一主成分的贡献率达95%以上。
ρ
1212111221225(,),(,),100
000010.950()00.95
10000100T T X X X X Y Y X Z Y Z ⎛⎫
=== ⎪⎝⎭
⎛⎫ ⎪
∑∑⎡⎤ ⎪=∑==⎢⎥ ⎪∑∑⎣⎦ ⎪⎝⎭
、设为标准化向量,令且其协方差阵
V ,求其第一对典型相关变量和它们的典型相关系数?
1,()X E XX μμμ∑''=∑+、设随机向量的均值向量、协方差矩阵分别为、试证:。
'2~(,),,~(,)P r X N N A b A A μμ⨯⨯∑+∑r p r 1、设随机向量又设Y=A X+b 试证:Y 。
1、0
2、W 3(10,∑)
3、21134211361114
6
R ⎛⎫- ⎪ ⎪ ⎪=-
- ⎪ ⎪ ⎪- ⎪⎝⎭
4、0.872 1 1.743
5、T 2(15,p )或(15p/(16-p))F (p ,n-p )
231213123111221
3312121,2,10021021210001102231642100102x x y y x x x x x x y x x y x x x y E y y V y -⎛⎫
==+ ⎪⎝⎭
-⎛⎫⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪
+⎝⎭⎝⎭⎝⎭⎛⎫⎛⎫⎛⎫⎛⎫
⎪⎪ ⎪
== ⎪ ⎪⎪ ⎪⎝⎭ ⎪⎪ ⎪
-⎝⎭⎝⎭⎝⎭
-⎛⎫⎛⎫
⎪=- ⎪ ⎪⎝⎭ ⎪⎝⎭、令则
01-101-101-11234411
002141
021061661620162040210
616(1,6
1620)
3162040y y N ⎛⎫⎛⎫ ⎪⎪
- ⎪⎪ ⎪⎪-⎝⎭⎝⎭
--⎛⎫ ⎪=- ⎪ ⎪-⎝⎭
--⎛⎫⎛⎫ ⎪ ⎪- ⎪ ⎪
⎪ ⎪--⎝⎭⎝
⎭
01-1故,的联合分布为故不独立。
010
01121000.02::8.02.2,
1.54.310714.62108.9464(23.13848)14.6210 3.17237.37608.946437.376035.5936()()
670.0741420.445
H H X S T n X S X F μμμμμμμ---=≠-⎛⎫
⎪-= ⎪ ⎪-⎝⎭
-⎛⎫
⎪
=-- ⎪ ⎪-⎝⎭'=--=⨯=0、假设检验问题:,经计算可得:构造检验统计量:由题目已知1001
0.01(3,3)29.535
(3,3)147.5
3
0.012T F H α=⨯===2.0
,由是
所以在显著性水平下,拒绝原设即认为农村和城市的周岁男婴上述三个指标的均值有显著性差异
11121221121233
21()
()exp[()()]exp(424)()
3912421
1ˆ(),,()411624283(1|2)
,()exp(2)5(2|1)35T Bayes f x W x x x x f x q C d e W x d e q C X μμμμμμμμ--=
=-∑-≈++--⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=+=∑=-=-= ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭
⎡⎤====<=⎢⎥⎣⎦⎡⎤
⇒=⎢⎣3、由判别知其中,2
G ∈⎥⎦
121341123114013,
11
11101111112222111222x x x x Z X X X λρρρρλρρ
λρρρλρρρρλλλλρ
λρ
ρρρλρρλρ
ρλρρρρλλ--------==+--------===-----⎛⎫⎛⎫ ⎪
⎪---- ⎪
⎪= ⎪---- ⎪ ⎪
⎪----⎝⎭⎝⎭'
⎛⎫ ⎪
⎝⎭
=++1234、(1)由得特征根为解所对应的方程得所对应的单位特征向量为故得第一主成分4
111
2
1395%
40.9541
0.9333
X λρ
λλλλρ++=≥+++⨯-≥
≈234(2)第一个主成分的贡献率为
得
112
2
11221112
2
111222
2111
22120.1010,0100.10.100
01000.950.1000010.95000.01000100.90250
00.902500.90250.9025,T
T TT TT λλλ
λλλ-⎛⎫⎛⎫∑∑ ⎪ ⎪
⎝⎭⎝⎭
=∑∑∑∑∑⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫= ⎪⎪⎪⎪⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭
-==--⇒=-
--
-
5、由题得===求的特征值,得211112111111
112221112111100.950
00.9025,00.90250.100001111000.9501100.100100.95,0.54,0.95T TT e e e V X W Y V W λαβλαρ---=⇒=⎛⎫= ⎪⎝⎭
⎛⎫⎛⎫⎛⎫=∑== ⎪⎪
⎪⎝⎭⎝⎭⎝⎭=∑∑⎛⎫⎛⎫⎛⎫⎛⎫
=
= ⎪⎪⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭
===的单位正交化特征向量为第一典型相关变量,且()为一对典型相关系数。
1()[()()]
()()()()()V X E X EX X EX E XX EX EX E XX E XX μμμμ'∑=--''=-''
=-''
=∑+、证明:=故
'
'2()()()()()()~(,)r Y E Y E AX b AE X b A b
V Y V AX b AV X A A A Y N A b A A μμ=+=+=+'=+==∑+∑、证明:由题可知服从正态分布,
故。
一、填空题:
1、多元统计分析是运用 数理统计 方法来研究解决 多指标 问题的理论和方法.
2、回归参数显著性检验是检验 解释变量 对 被解释变量 的影响是否著.
3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q 型 聚类和 R 型 聚类。
4、相应分析的主要目的是寻求列联表 行因素A 和 列因素B 的基本分析特
征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若
()
(,), P
x N αμα
∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为
_x~N(μ,Σ/n)_。
二、简答
1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。
对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。
要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
3、简述费希尔判别法的基本思想。
从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数
系数:
确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。
协差阵的检验 检验0=ΣΣ
0p H =ΣI : /2
/21exp 2np n e tr n λ⎧⎫⎛⎫
=-⎨⎬ ⎪
⎩⎭⎝⎭
S S
00p H =≠ΣΣI : /2
/2**1exp 2np n e tr n λ⎧⎫⎛⎫
=-⎨⎬ ⎪
⎩⎭⎝⎭
S S
检验12k ===ΣΣΣ012k H ===ΣΣΣ:
统计量/2/2
/2
/2
1
1
i i k
k
n n pn np k i
i
i i n
n
λ===∏∏S
S
6、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。
设d ij 表示样品X i 与X j 之间距离,用D ij 表示类G i 与G j 之间的距离。
(1). 最短距离法
ij G X G X ij d D j
j i i ∈∈=
,min
,min
i k j r
kr ij X G X G D d ∈∈=
min{,}kp kq D D =
(2)最长距离法
,max
i p j q
pq ij X G X G D d ∈∈=
,max
i k j r
kr ij X G X G D d ∈∈=
max{,}kp kq D D =
(3)中间距离法
其中错误!未找到引用源。
(4)重心法
2()()pq p q p q D X X X X '=--
)(1
q q p p r
r X n X n n X +=
222
22
p q p q
k r
k p
k q
p q
r
r
r
n n n n D D D D n n n =
+
- (5)类平均法
2
21
i p j j
pq ij X G X G p q
D d n n ∈∈=
∑∑
221
i k j r
kr
ij X G X G k r
D d n n ∈∈=∑∑
2
2
p q kp kq r
r
n n D D n n =
+
(6)可变类平均法
其中β是可变的且β <1 (7)可变法
22
221()2
kr kp kq pq D D D D ββ-=
++ 其中β是可变的且β <1 2
2222
121pq
kq kp kr D D D D β++= 2
222(1)()p q
kr kp kq pq r r
n n D D D D n n ββ=-++
(8)离差平方和法 1
()()t
n t it t it t t S X X X X ='=--∑
错误!未找到引用源。
2222
k p k q k kr
kp
kq pq r k
r k
r k
n n n n n D D D D n n n n n n ++=
+
-
+++
7、比较主成分分析与因子分析的异同点。
相同点:①两种分析方法都是一种降维、简化数
据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
9、进行相应分析时在对因素A 和因素B 进行相应分析之前没有必要进行独立性检验?为什么?有必要,如果因素A 和因素B 独立,则没有必要进行相应分析;如果因素A 和因素B 不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。
______________________________________________________________________________________________________________
Welcome To Download !!!
欢迎您的下载,资料仅供参考!
精品资料。