应用多元统计分析课后习题答案详解北大高惠璇(第三章部分习题解答)
多元统计分析课后练习答案
多元统计分析课后练习答案第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。
在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
其中最典型的就是0-1标准化和Z 标准化。
2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。
在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。
每个坐标对欧氏距离的贡献是同等的。
当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。
当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。
没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。
为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。
受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。
如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。
应用多元统计分析课后答案 .doc
2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。
应用多元统计分析课后习题答案高惠璇部分习题解答(00004)市公开课金奖市赛课一等奖课件
[(
y1
aˆ0
)2
]
0
可得
ˆ
2
1 3
( y1
aˆ0 )2
( y2
aˆ0 )2
( y3
3aˆ0 )2
drf
ˆ
2 0
似然比统计量分子为
L(aˆ0
, ˆ 0 2
)
(2
)
3 2
(ˆ 0 2
)
3 2
exp[
3 2
].
第5页
5
第四章 回归分析
似然比统计量为
L(aˆ0 ,ˆ02 ) L(aˆ,bˆ,ˆ 2 )
第18页 18
第四章 回归分析
第19页 19
第四章 回归分析
等号成立 C(ˆ ) 0 (CC)1C • C(ˆ ) 0 ˆ.
第20页 20
第四章 回归分析
第21页 21
第四章 回归分析
第22页 22
第四章 回归分析
见附录P394定理7.2(7.5)式
第23页 23
第四章 回归分析
证实:(1)预计向量为 Yˆ Cˆ C(CC)1CY HY
yˆ
1 n
n i 1
yˆi
1 n
1n
Yˆ
1 n
1n
HY
1 n
(H1n )Y
1 n
1n
Y
y.
(因1n C张成的空间,这里有H1n 1n )
(2) 因 n ( yi y)( yˆi yˆ ) n ( yi yˆi yˆi y)( yˆi y)
0
ln
L
2
n
2
2
1
2( 2 )2
(Y
应用多元统计分析课后题答案
c) c)2
2( x1
a)( x2
c)]
其中 a x1 b , c x2 d 。求 (1)随机变量 X1 和 X 2 的边缘密度函数、均值和方差; (2)随机变量 X1 和 X 2 的协方差和相关系数; (3)判断 X1 和 X 2 是否相互独立。
(1)解:随机变量 X1 和 X 2 的边缘密度函数、均值和方差;
12
2 2
1/
2
exp
1 2
(x
μ)
12 21
12
2 2
1
(x
μ)
。
2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )
2[(d
c)( x1
a)
(b a)(x2 (b a)2 (d
μ)
1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)
nE(X
μ)(X
μ)
Σ
。
故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本,试求 S
c) 2(x1 a)(x2 a)2(d c)2
c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2
应用多元统计分析_课后答案
图 2.1
Descriptives 对话框
2.
单击 Options 按钮,打开 Options 子对话框。在对话框中选择 Mean 复选框,即计 算样本均值向量,如图 2.2 所示。单击 Continue 按钮返回主对话框。
图 2.2 Options 子对话框 3. 单击 OK 按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表 2.1,即 样本均值向量为(35.3333,12.3333,17.1667,1.5250E2) 。
2.5 解: 依据题意,X= 57000 40200 21450 21900 45000 28350
′
15 16 12 8 15 8
27000 18750 12000 13200 21000 12000
144 36 381 190 138 26
′ E(X)= ∑6 α=1 x(α) = (35650,12.33,17325,152.5) n σ1 σ2 ρ2 (x1 −μ1 )2 σ2 1
+
σ2 1
(x2 −μ2 )2 σ2 2 )2
= = [
(x1 −μ1 )2 σ2 1 ρ(x1 −μ1 ) σ1
− −
2ρ(x1 −μ1 )(x2 −μ2 ) σ1 σ2 (x2 −μ2 ) 2 ] σ2
+
E( X ) μ
n→∞
lim E(
1 1 ������) = lim E( ������) = Σ n→∞ ������ n−1
2.7 试证多元正态总体 的样本均值向量 ̅) = E ( ΣX 证明: E(������ (α) ) = E (ΣX (α) ) =
n n 1 1 nμ n 1 n2
exp[−
最新应用多元统计分析课后习题答案高惠璇PPT课件
(2) 考虑随机变量Y= X1-X2 ,显然有
YX 1X2 0 X 1X 1,当 估计
P{Y0}P{X11或 X11} P{X11}P{X11} (X1~N(0,1)) 2(1)0.317 04
若(X1 , X2 ) 是二元正态分布,则由性质4可知,
31
第三章 多元正态总体参数的检验
证明 记rk(A)=r.
若r=n,由AB=O,知B= On×n,于是 X′AX与X′BX
若r=0时,则A=0,则两个二次型也是独 立的.
以下设0<r<n.因A为n阶对称阵,存在正 交阵Γ,使得
32
第三章 多元正态总体参数的检验
其中λi≠0为A的特征值(i=1,…,r).于是
P { X 2 x } P { X 1 x } ( x )
当x≥1时, P{X2x}
P{X2 1}P{1X2 1}P{1X2 x}
P{X11}P{1X11}P{1X1x}
P{X1x}(x) 17
第二章 多元正态分布及参数的估计
当-1≤x≤1时,
P{X2 x}P{X2 1}P{1X2 x} P{X1 1}P{xX1 1} P{X1 1}P{1X1 x} P{X1 x}(x)
它的任意线性组合必为一元正态. 但Y= X1-X2 不是正态分布,故(X1 , X2 ) 不是二元正态分布.
19
第二章 多元正态分布及参数的估计
2-17 设X~Np(μ,Σ),Σ>0,X的密度函数记为 f(x;μ,Σ).(1)任给a>0,试证明概率密度等高面
f(x;μ,Σ)= a
是一个椭球面. (2) 当p=2且
比较上下式相应的系数,可得:
1
2 2
2
1 2
应用多元统计分析课后习题答案高惠璇习题解答PPT学习教案
)
D(L1) pq
D(L)
(k p,q)
设第L+1步从类间距离矩阵D(L)
D(L) ij
出发,
第19页/共38页
20
第六章 聚类分析
因
D(L) rk
D ( L 1) pq
DL
(k p, q)
D(L) ij
D ( L 1) ij
DL
(i, j r, p, q)
故第L+1步的并类距离:
DL1 min(Di(jL) ) DL,
Dr2k
np nr
Dp2k
nq nr
Dq2k
npnq nr2
Dp2q
解一: 利用
X (r) 1 nr
np X ( p) nq X (q)
如果样品间的距离定义为欧氏距离,则有
Dr2k ( X (k ) X (r) )'( X (k ) X (r) )
n
p
nr
nq
X (k) np nr
②
di*j
cdij
cd ji
d
* ji
, 对一切i, j;Biblioteka 第2页/共38页3
第六章 聚类分析
③ di*j cdij c(dik dkj ) cdik cdkj
di*k
d
* kj
, 对一切i,
k,
j.
故d*=ad是一个距离.
(3) 设d为一个距离,c>0为常数,显然有
①
②
第3页/共38页
4
1)
p
q
1
2
1
2
11
故可变法具有单调性。
对于离差平方和法,因
0, p
(完整版)多元统计分析课后练习答案
第1章 多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。
在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
其中最典型的就是0-1标准化和Z 标准化。
2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。
在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。
每个坐标对欧氏距离的贡献是同等的。
当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。
当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。
没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。
为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。
受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。
如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。
应用多元统计分析课后习题答案详解北大高惠璇第三章部分习题解答
应用多元统计分析课后习题答案详解北大高惠璇(第三章部分习题解答).ppt
def
2 ln n( X 0 )01( X 0 )
因
X
H 0下
~
N
p (0,
1 n
0 ),
H 0下
n( X 0 ) ~ N p (0, 0 )
所以由§3“一﹑2.的结论1”可知
2 ln ~ 2 ( p).
20
第三章 多元正态总体参数的检验
3-6 (均值向量各分量间结构关系的检验) 设总体
若r=0时,则A=0,则两个二次型也是独 立的.
以下设0<r<n.因A为n阶对称阵,存在正 交阵Γ,使得
7
第三章 多元正态总体参数的检验
其中λi≠0为A的特征值(i=1,…,r).于是
令
r
由AB=O可得DrH11=O , DrH12=O . 因Dr为满秩阵,故有H11=Or×r,H12=Or×(n-r) .
由定义314可知15性质5在非退化的线性变换下t分别表示正态总体x的样本均值向量和离差阵则由性质1有1735对单个p维正态总体n均值向量的检验问题试用似然比原理导出检验h已知的似然比统计量及分布
第三章习题解答
第三章 多元正态总体参数的假设检验
3-1 设X~Nn(μ,σ2In), A为对称幂等 阵,且rk(A)=r(r≤n),证明
~
N pr
(0, 22 ),
记
X
n p
xij
X (1) | X (2) , nr n( pr)
则
W
X X
X (1)X (1) X (2)X (1)
X X
(1) X (2) X
(2) (2)
WW1211
W12 W22
,
即
W11 X (1)X (1), W22 X (2)X (2)
应用多元统计课后答案解析
2(d c)(x 1 a)x 2 (b a)2(d c)2 2[(b a )(X 2 c) 2(X 1 a )(X 2 c)] (b a)2(d c)2dx 22(d c)(x.| a)x 222~(b a) (d c) c2[(b a)t 2(X 1 a)t]2 2 (b a) (d c)dt 2(d c)(x-i a)x 22 2(b a) (d c)所以d c2 2(b a) (d c) o2 2[(b a)t 2(X 1 a)t ] 第二章2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X (X !,X 2^|X p )的联合分布密度函数是-个p 维的函数,而边际分布讨论是 X (X i ,X 2」||X p)的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量(X 1 X 2)服从二元正态分布,写出其联合分布。
其中 a X 1 b , c X 2 d 。
求(1 )随机变量X 1和X 2的边缘密度函数、均值和方差;(2) 随机变量X 1和X 2的协方差和相关系数; (3) 判断X 1和X 2是否相互独立。
(1)解:随机变量 X 1和X 2的边缘密度函数、均值和方差;2[(d c)(x-i a) (b a)(x 2 c) 2(x 1 a)(x 2c)]2 2(b a) (d c)id解:设(X 1 X 2)的均值向量为口 ,协方差矩阵为21;,则其联合分布密度函数为21/21f(X).2-2.3已知随机向量(X 1f(X 1,X 2)型21122 2exp口)2112 2 2(X口)。
X 2) c)(X 的联合密度函数为a) (b a)(X 2c) 2 2(b a) (d c)2(X 1 a)(x 2 c)] dx(C d)(b a)36COV(N,X2)X i X2(3)解:判断X i和X2是否相互独立。
X i 和X2 由于f(X!,X2) f x,X i) f x,(X2),所以不独立。
应用多元统计分析章节后习题答案详解北大高惠璇习题解答市公开课金奖市赛课一等奖课件
第10页 10
第八章 因子分析
8-3 验证下列矩阵关系式(A为p×m阵)
(1) (I AD1A)1 AD1A I (I AD1A)1;
(2) ( AA D)1 D1 D1A(I AD1A)1 A1D1;
(3) A( AA D)1 (Im AD1A)1 AD1.
解:利用分块矩阵求逆公式求下列分块矩阵逆:
(3) 主成份分析是将主成份表示为原变量线性 组合,而因子分析是将原始变量表示为公因子和 特殊因子线性组合,用假设公因子来“解释”相 关阵内部依赖关系.
这两种分析办法又有一定联系.当预计办法采 用主成份法,因子载荷阵A与主成份系数相差一 个倍数;因子得分与主成份得分也仅相差一个常 数.这种情况下可把因子分析当作主成份分析推 广和发展.
并计算误差平方和Q(2).
解 : m 2的因子模型的主成分解为:
0.8757 0.1802
A(
1l1,
2
l2
)
0.8312
0.4048,
0.7111 0.6950
第7页
7
第八章 因子分析
D
0.2007 0 0
0 0.1452
0
0.0100131
则m 2的正交因子模型为
X1 0.8757F1 0.1802F2 1 X 2 0.8312F1 0.4048F2 2 X 3 0.7111F1 0.6950F2 3
p
m
p
S ilili ilili ilili
i 1
i 1
i m 1
其中1 2 p 0 为S特性值,li为相应原则
特性向量。
第14页 14
第八章 因子分析
设A,D是因子模型主成份预计,即
应用多元统计分析课后习题答案详解北大高惠璇部分习题解答省名师优质课赛课获奖课件市赛课一等奖课件
4.7067
取a 1 A1( (1) (2) )
d
1 65 1381
3323 ,
则aAa
1,
且a满足 : Ba Aa ( d 2 ).
12
第五章 鉴别分析
判别效率(a) aBa 4.7067.
aAa
Fisher线性判别函数为u( X ) aX
1 89765
(32
X1
33X
2 判别准则为 判X G1 , 当W ( X ) 0,
判X G2 , 当W ( X ) 0, 试求错判概率P(2 |1)和P(1| 2).
解 : 记a 1 ( (1) (2) ),W ( X ) ( X )a是X的
线性函数,当X
G1时,W
(
X
)
~
N1
(1,
2 1
), 且
20
第五章 鉴别分析
20 20
时,
u
(
X
(1)
)
1 89765
(32,33)
20 20
4.3390
因u( X (1) ) 4.3390 u* , 判X (1) G2.
当X (1)
15 20
时,
u
(
X
(2)
)
1 89765
(32,33)1250
3.8050
因u( X (2) ) 3.8050 u* 判X (2) G1.
其中W ( X ) a( X *)
( X * )1( (1) (2) ) ,
* 1 ( (1) (2) ).
2 10
第五章 鉴别分析
5-4 设有两个正态总体G1和G2,已知(m=2)
(1)
1105, (2)
应用多元统计分析课后习题答案高惠璇
2 1 2 2 2 (1)第一次配方: 2 x12 2 x1 x2 x2 ( x1 x2 ) 2 x12
2 1 x1 2 1 1 1 1 1 因2 x 2 x1 x2 x ( x1 , x2 ) , 而 BB, 1 1 x2 1 1 1 0 1 0 y1 1 1 x1 x1 x2 2 2 2 2 令y , 则 2 x 2 x x x y y 1 1 2 2 1 2 y x x 1 0 2 1 2
类似地有
1 2 2 ( 2 x1 22 x1 65 x1 14 x1 49 ) 2
f 2 ( x2 )
X 2 ~ N (3,2).
f (x , x )dx
1 2 1
1 2 2
e
1 ( x2 3) 2 4
10
第二章
多元正态分布及参数的估计
1 e 2
1 2 ( 2 x1 22 x1 65) 2
e
1 2 ( x2 2 x2 ( x1 7 ) ( x1 7 ) 2 ) 2
dx2 e
1 ( x1 7 ) 2 2
9
第二章
多元正态分布及参数的估计
1 ( x2 x1 7 ) 2 2
1 e e dx2 2 1 2 1 ( x 8 x 16 ) ( x2 x1 7 ) 2 1 1 1 1 2 e 2 e dx2 2 2 1 ( x1 4 ) 2 1 e 2 X1 ~ N (4,1). 2
u1 x1 4 令 u2 x2 3
高惠璇多元统计分析习题答案
第四章4-1 设⎪⎩⎪⎨⎧++=+-=+=,2,2,332211εεεb a y b a y a y ).,0(~323321I N σεεεε⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=(1)试求参数b a ,的最小二乘估计;(2)试导出检验b a H =:0的似然比统计量,并指出当假设成立时,这个统计量是分布是什么?解:(1)由题意可知.,,,211201321321⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=εεεεβ b a y y y Y C 则⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎪⎪⎪⎪⎭⎫ ⎝⎛⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-==--321'1''1'211201************)(ˆy y y Y C C C β.ˆˆ)2(51)2(6132321⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+-++ba y y y y y(2)由题意知,检验b a H =:0的似然比统计量为2322ˆ⎪⎪⎭⎫ ⎝⎛=σσλ 其中,])ˆ2ˆ()ˆˆ2()ˆ[(31ˆ2322212b a y b a y a y --++-+-=σ。
当0H 成立时,设0a b a ==,则⎪⎩⎪⎨⎧+=+=+=,3,,303202101εεεa y a y a y ,311⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=C 可得,ˆ)3y (111311311311)(ˆ0321321'1''1'ay y y y y Y C C C =++=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎪⎪⎪⎪⎭⎫ ⎝⎛⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡==--β ],)ˆ3()ˆ()ˆ[(31ˆ20320220120a y a y ay -+-+-=σ因此,当假设0H 成立时,与似然比统计量λ等价的F 统计量及其分布为).1,1(~ˆˆˆ2202F F σσσ-=4-3 设Y 与321,,x x x 有相关关系,其8组观测数据见表4.5.表 4.5 观测数据序号 1x2x3xY1 38 47.5 23 66.02 41 21.3 17 43.0 3 34 36.5 21 36.0 4 35 18.0 14 23.0 5 31 29.5 11 27.06 34 14.2 9 14.07 29 21.0 4 12.0 83210.087.6(1)设εββββ++++=3322110x x x Y ,试求回归方程及决定系数2R 和均方误差2s 。
应用多元统计分析课后答案
第二章2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd cc d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布,则均值为2b a +,方差为()212b a -。
多元统计分析课后习题答案
多元统计分析课后习题答案多元统计分析课后习题答案在学习多元统计分析时,课后习题是巩固所学知识的重要环节。
通过解答习题,我们可以进一步理解和应用统计学的概念和方法。
下面将给出一些多元统计分析课后习题的答案,希望能对大家的学习有所帮助。
1. 在多元统计分析中,什么是协方差矩阵?如何计算协方差矩阵?答:协方差矩阵是用来衡量多个随机变量之间的线性关系的矩阵。
它是一个对称矩阵,对角线上的元素是各个变量的方差,非对角线上的元素是两个变量之间的协方差。
计算协方差矩阵的方法是,首先计算每个变量的平均值,然后计算每个变量与其他变量的协方差。
最后将这些协方差按照矩阵的形式排列,即得到协方差矩阵。
2. 什么是主成分分析?主成分分析的步骤是什么?答:主成分分析是一种用于降维的统计方法,它可以将多个相关变量转化为一组无关的主成分。
主成分分析的目标是找到能够解释原始变量大部分方差的少数几个主成分。
主成分分析的步骤如下:(1) 标准化数据:将原始数据进行标准化处理,使得每个变量的均值为0,标准差为1。
(2) 计算协方差矩阵:根据标准化后的数据计算协方差矩阵。
(3) 计算特征值和特征向量:求解协方差矩阵的特征值和特征向量。
(4) 选择主成分:根据特征值的大小选择主成分,通常选择特征值较大的前几个主成分。
(5) 构造主成分:将选择的主成分与原始数据进行线性组合,得到新的主成分。
3. 什么是判别分析?判别分析的步骤是什么?答:判别分析是一种用于分类的统计方法,它通过寻找最佳的分类边界,将样本分为不同的类别。
判别分析的目标是找到能够最大程度地区分不同类别的线性组合。
判别分析的步骤如下:(1) 收集样本数据:首先收集包含已知类别的样本数据。
(2) 计算类均值向量:根据样本数据计算每个类别的均值向量。
(3) 计算类内离散度矩阵:根据样本数据计算每个类别的类内离散度矩阵。
(4) 计算类间离散度矩阵:根据样本数据计算类间离散度矩阵。
(5) 计算投影向量:根据类内离散度矩阵和类间离散度矩阵计算投影向量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(记
1 2
1 2
)
10
1
第三章 多元正态总体参数的检验
由“1.结论6”知ξ与η相互独立
1 2 1 2 1 2 1 2
CD O A B O AB O
11
第三章 多元正态总体参数的检验
3-4 试证明Wishart分布的性质(4)和T2分布的性质(5).
C [CAx C ]1 C ( X ) n(n 1)( X )
n(n 1)( X ) Ax 1 ( X ) Ty
16
第三章 多元正态总体参数的检验
对单个p维正态总体Np(μ,Σ)均值向量的检验问题, 试用似然比原理导出检验H0:μ=μ0(Σ=Σ0已知)的似然比 统计量及分布. P66当Σ=Σ 已知μ的检验
第三章 多元正态总体参数的检验
Ay (Y( i ) Y )(Y(i ) Y )
i 1 n i 1
Y CX d , n
记y C d
C[ ( X ( i ) X )( X (i ) X )]C CAx C
Ay 1 (Y y ) T n(n 1)(Y y ) 2 y
3-7 设总体X~Np(μ,Σ) (Σ>0), X(α) (α=1,…,n)(n>p)为来自p
1 0 , 0 1( p 1) p 则上面的假设等价于H0:Cμ=0p-1,H1:Cμ≠ 0p-1 0 0
1 C 1
试求检验H0 的似然比统计量和分布.
Ax 1 ( X ) T n(n 1)( X ) 2 ~ T ( p, n 1). 2 x
令
其中C是pp非退化常数矩阵,d是p1常向量。 则 Y ~ N (C d , CC) (i 1,2,...,n)
(i ) p
15
Y(i ) CX (i ) d (i 1,..., n)
则
12
第三章 多元正态总体参数的检验
证明: 设 1 1 X (()) r X (()) ~ N r (0, 11 ), X ( ) ( 2 ) X p r , 则 X ( 2 ) ~ N (0, ), ( ) p r 22 ( )
记 X xij X (1) | X (2) , 则 n p nr n( p r )
(n 1)n(CX r )CAC (CX r ).
1
A ( X (i ) X )( X (i ) X ).
i 1
n
22
第三章 多元正态总体参数的检验
维正态总体X的样本,样本均值为X,样本离差阵为A.记μ= (μ1,…,μp)′.为检验H0:μ1=μ2=…=μp ,H1:μ1,μ2,…,μp至少有一对不 相等.令 1 1 0 0
1
当Σ12 =O 时,对α=1,2,…,n,
独立.故有W11与W22相互独立.
X 与X
(1) ( )
( 2) 相互 ( )
14
第三章 多元正态总体参数的检验
性质5 在非退化的线性变换下,T2统计量保持不 变. 证明:设X(α) (α=1,…,n) 是来自p元总体 Np(μ,Σ)的随机样本, X和Ax分别表示正态总体X 的样本均值向量和离差阵,则由性质1有
性质4 分块Wishart矩阵的分布:设X(α) ~ Np(0,Σ) (α =1,…,n)相互独立,其中
又已知随机矩阵
W11 W X ( ) X ( ) W21 1
n
11 12 r 21 22 p r W12 r p r ~ Wp (n, ) W22
3-5
(n>p)为来自p维正态总体X的样本.似然比统计量为
解:总体X~Np(μ ,Σ 0)(Σ 0>0),设X(α)(α =1,…,n)
0
max L( 0 , 0 ) max L( , 0 )
0
1 1 n 1 分子 exp ( X ( ) 0 )0 ( X ( ) 0 ) n/2 | 20 | 2 1
其中
T (n 1)n(CX )[CAC ] CX
2 1
~ T (n 1, p 1).(H 0下)
2
(注意:3-6中的k在这里为p-1)
24
第三章 多元正态总体参数的检验
3-8 假定人体尺寸有这样的一般规律:身高(X1),胸围
(X2)和上半臂围(X3)的平均尺寸比例是6∶4∶1.假设 X (α)(α=1,…,n)为来自总体X=(X1,X2,X3)′的随机样本.并 设X~N3(μ,Σ),试利用表3.5中男婴这一组数据检验三 个尺寸(变量)是否符合这一规律(写出假设H0,并导出检 验统计量). 解:检验三个尺寸(变量)是否符合这一规律的问题 可提成假设检验问题.因为
3
第三章 多元正态总体参数的检验
其中非中心参数为
4
第三章 多元正态总体参数的检验
3-2 设X~Nn(μ,σ2In), A,B为n阶对称阵. 若AB =0 ,证明X′AX与X′BX相互独立.
证明的思路:记rk(A)=r. 因A为n阶对称阵,存在正交阵Γ,使得 Γ ′AΓ=diag(λ1,…,λr 0,..,0) 令Y=Γ′X,则Y~Nn(Γ′μ,σ2In),
Yr 1 X BX Y Γ BΓΓ Y HY (Yr 1 ,, Yn ) H 22 Yn
i 1
r
由于Y1,…,Yr ,Yr+1 ,…,Yn相互独立,故 X′AX与X′BX相互独立.
9
第三章 多元正态总体参数的检验
设X~Np(μ,Σ),Σ>0,A和B为p阶对称阵, 试证明 (X-μ)′A(X-μ)与(X-μ)′B(X-μ)相互独立 ΣAΣBΣ=0p×p.
令
r
由AB=O可得DrH11=O , DrH12=O . 因Dr为满秩阵,故有H11=Or×r,H12=Or×(n-r) . 由于H为对称阵,所以H21=O(n-r)×r .于是
8
第三章 多元正态总体参数的检验
H Γ BΓ
令Y=Γ′X,则Y~ Nn(Γ′μ,σ2In), 且
AX ( ΓY ) AΓΓ Y Γ AΓΓ iYi 2 X
应用多元统计分析
第三章习题解答
第三章
多元正态总体参数的假设检验
3-1 设X~Nn(μ,σ2In), A为对称幂等 阵,且rk(A)=r(r≤n),证明
证明 因A为对称幂等阵,而对称幂等阵的
特征值非0即1,且只有r个非0特征值,即存在正 交阵Γ(其列向量ri为相应特征向量),使
2
第三章 多元正态总体参数的检验
1 1 1 exp tr[0 A ] n/2 | 20 | 2
18
第三章 多元正态总体参数的检验
max L( 0 , 0 ) max L( , 0 )
1 1 1 1 exptr[ 0 A] tr[ 0 ( A n( X 0 )( X 0 )] 2 2 n 1 exp tr[( X 0 )0 ( X 0 )] 2 n 1 exp ( X 0 )0 ( X 0 ) 2
因 X ~ N ( , 1 ), p 0 0 n
H 0下
n ( X 0 ) ~ N p (0, 0 )
H 0下
所以由§3“一﹑2.的结论1”可知
2 ln ~ ( p).
2
20
第三章 多元正态总体参数的检验
3-6 (均值向量各分量间结构关系的检验) 设总体
X~Np(μ ,Σ )(Σ >0),X(α)(α =1,…,n)(n>p)为 来自p维正态总体X的样本,记μ =(μ 1,…,μ p)′.C 为k×p常数(k<p),rank(C)=k,r为已知k维向量.试给出 检验H0:Cμ =r的检验统计量及分布.
解: H 0 : 1 2 p , H1 : 1 , 2 ,, p 至少有一对不相等.
23
第三章 多元正态总体参数的检验
H 0 : C 0, H1 : C 0,
利用3-6的结果知,检验H0的似然比统计量及分 布为: H 下
n ( p 1) 2 0 F T ~ F ( p 1, n p 1), (n 1)( p 1)
X (1) X (1) W X X X (2) X (1) X (1) X (2) W11 W12 W W , X (2) X (2) 21 22
即
W11 X (1) X (1), W22 X (2) X (2)
13
第三章 多元正态总体参数的检验
19
1 1 1 1 exptr[ 0 A] tr[ 0 A0 ] 2 2
0
第三章 多元正态总体参数的检验
n 01 ( X 0 ) ln ( X 0 ) 2
2 ln n( X 0 )01 ( X 0 ) def
X AX ( ΓY ) AΓΓ Y Γ AΓΓ iYi 2 且
i 1
5
r
第三章 多元正态总体参数的检验
又因为 X′BX=Y′Γ′BΓ Y= Y′HY 其中H=Γ′BΓ 。如果能够证明X′BX 可表示为Yr+1,…,Yn的函数,即H只是右 下子块为非0的矩阵。 则X′AX 与X′BX相互独立。
n 1 1 1 exp tr[0 ( X ( ) 0 )( X ( ) 0 )] n/2 | 20 | 1 2
17
第三章 多元正态总体参数的检验