应用多元统计分析课后习题答案详解北大高惠璇(第八章习题解答)
应用多元统计分析课后习题答案高惠璇共174页文档
(2)证明(X1 , X2 ) 不是二元正态分布.
证明(1):任给x,当x≤-1时
P { X 2 x } P { X 1 x } ( x )
当x≥1时, P{X2x}
P{X2 1}P{1X2 1}P{1X2 x}
P{X11}P{1X11}P{1X1x}
它的任意线性组合必为一元正态. 但Y= X1-X2 不是正态分布,故(X1 , X2 ) 不是二元正态分布.
19
第二章 多元正态分布及参数的估计
2-17 设X~Np(μ ,Σ ),Σ >0,X的密度函数记为 f(x;μ ,Σ ).(1)任给a>0,试证明概率密度等高面
5
第二章 多元正态分布及参数的估计
2-3 设X(1)和X(2) 均为p维随机向量,已知
XX X((1 2))~N2p ((1 2)), 1 2 1 2,
其中μ(i) (i=1,2)为p维向量,Σi (i=1,2)为p阶矩阵,
(1) 试证明X(1) +X(2)和X(1) -X(2) 相互独立. (2) 试求X(1) +X(2) 和X(1) -X(2) 的分布.
故X1 +X2 和X1 - X2相互独立.
3
第二章 多元正态分布及参数的估计
或者记
Y Y Y 1 2 X X 1 1 X X2 2 1 1 1 1 X X 1 2 CX
则 Y ~ N 2 (C ,C C )
e e dx 2
2
2 1e 2 1 e dx 1 2(x1 28x1 1)6
1 2(x2x17)2 2
1(
1 e2
x14)2
2
X1~N(4,1).
类似地有
应用多元统计分析答案详解汇总_高惠璇[1]
e
1 2 ( x2 2 x1 x2 14 x2 ) 2
dx2
1 e 2
1 2 ( 2 x1 22 x1 65 ) 2
e
1 2 ( x2 2 x2 ( x1 7 ) ( x1 7 ) 2 ) 2
比较上下式相应的系数,可得:
1 2 1 12 2 2 2 12 1 1 2 1 2 2 2 22 1 2 1 2 2 2 2 2 1 2 1 2 1 14 2 2 2 2 2 1 2 1 2 1 2 1 2
x1 y2 (2)第二次配方.由于 x2 y1 y2
14
第二章
2 1 2 2 2 1 2 1 2 2
多元正态分布及参数的估计
2 x x 2 x1 x2 22 x1 14 x2 65 y y 22 y2 14( y1 y2 ) 65 y 14 y1 49 y 8 y2 16 ( y1 7) ( y2 4)
由定理2.3.1可知X1 +X2 和X1 - X2相互独立.
4
第二章
(2) 因
多元正态分布及参数的估计
1 2 2 2(1 ) 0 X1 X 2 ~ N2 , Y 2(1 ) 0 X1 X 2 1 2
O 2(1 2 ) O 2(1 2 )
由定理2.3.1可知X(1) +X(2)和X(1) -X(2) 相 互独立.
7
第二章
(2) 因
(1) (2)
应用多元统计分析课后答案
第二章2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd cc d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布,则均值为2b a +,方差为()212b a -。
应用多元统计分析课后答案 .doc
2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。
北大多元统计分析答案
第二章 多元正态分布及参数的估计2-1 解:利用性质2, 得二维随机向量Y~N 2(μy ,∑y ),其中:3112121312211,().y y A d A I A AA μμ∑⎛⎫⎛⎫⎛⎫=+=+= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭-⎛⎫''=== ⎪-⎝⎭2-2 (1)证明:记Y 1= X 1 +X 2 =(1,1) X , Y 2= X 1-X 2= (1,﹣1) X ,利用性质2可知Y 1 , Y 2 为正态随机变量. 又()()212111111011Cov(,)Y Y ∑σρρ⎛⎫⎛⎫==++= ⎪ ⎪--⎝⎭⎝⎭故X 1 +X 2和X 1-X 2相互独立.另证:记112121221111Y X X X Y CX Y X X X +⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭⎝⎭,则2~(,),Y N C C C μ∑'因222111111111111112101111021()()Y ΣC C ρ∑σρρρρσσρρρ⎛⎫⎛⎫⎛⎫'== ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭+++⎛⎫⎛⎫⎛⎫== ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭故由定理2.3.1可得X 1 +X 2和X 1-X 2相互独立.(2)解:因为1212221212210021()~,()X X Y N X X μμρσμμρ⎛⎫+++⎛⎫⎛⎫⎛⎫= ⎪ ⎪ ⎪ ⎪---⎝⎭⎝⎭⎝⎭⎝⎭ 所以22121212122121~(,()),~(,()).X X N X X N μμσρμμσρ+++---2-3 (1)证明:令121122()()()()()()pp pp I I X X X Y CX I I X X X ⎛⎫⎛⎫⎛⎫+=== ⎪ ⎪ ⎪⎪--⎝⎭⎝⎭⎝⎭,则2~(,)p Y N C C C μ∑'. 因为1221121212211212D()22D()()()pp pp p p pp pp pp I I I I Y C X C I I I I I I I I O O ∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑⎛⎫⎛⎫⎛⎫'==⎪ ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭⎛⎫++⎛⎫= ⎪⎪ ⎪---⎝⎭⎝⎭+⎛⎫= ⎪-⎝⎭由定理2.3.1可知X (1) +X (2)和X (1) -X (2) 相互独立. (2)解:因为121212212121222()()()()()()()()()~,()p O X X Y N O X X ∑∑μμ∑∑μμ⎛⎫+⎛⎫⎛⎫⎛⎫++= ⎪ ⎪ ⎪ ⎪ ⎪---⎝⎭⎝⎭⎝⎭⎝⎭, 所以12121212121222()()()()()()()()~(,()),~(,()).p p X X N X X N μμ∑∑μμ∑∑+++---2-6 解:(1)记B =(3,-1,1), 由性质2得,~(,')Y BX N B B B μ=∑.123121113(3,2,1)313,'(3,2,1)132291122132(13,9).B B B Y X X X N μ⎛⎫⎛⎫⎛⎫⎪ ⎪⎪=--=∑=--= ⎪ ⎪⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭∴=-+ (2)令1132'X Y X a X ⎡⎤=-⎢⎥⎣⎦, 显然31,X Y 均服从正态分布, 故要使它们相互独立,只需()31,0COV X Y =即可. 又因()313311223313123212,(,)(,)(,)(,)22COV X Y COV X X a X a X COV X X a COV X X a COV X X a a =--=--=-- ∴1222a a +=,故当(1,0.5)a =时满足条件. 2-9 解:(1)1/1/1/1/1/1/1/1/1/21/2001/41/21/61/ '1/61/62/601/402/61/1/1/1/3/1/003/1000010000100001AA⎡⎤⎡⎤⎢⎥⎢⎥--⎢⎥⎢⎥=⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎢--⎣⎣⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦∴A是正交矩阵.(2)①由Y=AX知,11/1/1/1/2Y X X⎡==⎣,且()442211'()'()'''i ii iY Y Y AX AX X AA X X X X=======∑∑,所以()444222221211444222221114214842()4.i i ii i ii i ii i iiiY X Y X XX X X X X X XX X========-=-=-+=-+=-∑∑∑∑∑∑∑②由2444(,)X N Iμσ1,Y=AX知:2444(,')Y N A AI Aμσ1.而22244''AI A AA Iσσσ==,故由定理2.3.1的推论2知1234,,,Y Y Y Y相互独立.③由②知1234,,,Y Y Y Y均服从正态分布,且方差均为2σ,又41/1/1/1/121/1/0010101/1/2/0101/1/1/3/Aμμμ⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎣⎦⎣⎦-⎣1所以221~(2,),~(0,)(2,3,4).iY N Y N iμσσ=2-11解:设221212121211(,)exp(22221465)22f x x x x x x x xπ⎧⎫=-++--+⎨⎬⎩⎭2222211121122122222121[()2()()()]2(1)x x x xσμσσρμμσμσσρ⎧⎫=-----+-⎨⎬-⎩⎭比较上下式相应的系数,可得:1222112212122221121222212211212121122222214265σσσσρσσμσρσσμμσρσσμμσμσρσσμμ⎧=⎪=⎪⎪=⎪-=⎨⎪-+=-⎪⎪-+=-⎪+-=⎩解得:121211/43σσρμμ=⎧⎪=⎪⎪⎨=-⎪=⎪⎪=⎩,所以2111222122411,312μσρσσμμρσσσ-⎛⎫⎛⎫⎛⎫⎛⎫==∑==⎪⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭. 2-13解:(1)[]()()'(')'(')'ΣE X EX X EX E XX EXEX E XXμμ=--=-=-(')'.E XXΣμμ∴=+(2)()()()(')tr'tr'tr'E X AX E X AX E AXX E AXX===⎡⎤⎡⎤⎣⎦⎣⎦()()tr'tr'tr()tr(')tr()tr(')tr()'.AE XX AΣAΣAΣA AΣA Aμμμμμμμμ==+=+⎡⎤⎡⎤⎣⎦⎣⎦=+=+(3)∵22'2'1tr()=tr()()=trp p p p p p pΣA I I Ip pσσσ⎛⎫⎡⎤--⎪⎢⎥⎣⎦⎝⎭1111()()()2222'2'22 tr tr tr tr(1) p p p p p pI I p p pp p pσσσσσσσ⎛⎫=-=-=-=-⎪⎝⎭1111,又'2'''11'()'()()()p p p p p p p p p p pA a I a ap pμμ=-=-11111111112''=()=0p p p ppap-1111,∴2(')()'(1)E X AX tr ΣA A p μμσ=+=-.2-18解:(1)()()1111()()().n n n ni i i i i i i i i i E Z E c X c EX c c μμμ=========∑∑∑∑(2)∵Z 为p 维正态随机向量的线性组合,故Z 也为正态随机向量,又 22()()111()()()'nnni i i i i i i i D Z D c X c DX c Σc c Σ=======∑∑∑, 结合(1)知 ~(,')p Z N c c Σμ(3)∵22221212()1n nc c c c c c nn++++++≥=,且Σ为非负定矩阵 ∴对任意p 维向量0x ≠,有2111111''()'()'''''0,n n n i i x c c Σ-Σx x c c Σ-Σx c c -x Σx c -x Σx n n n n n =⎛⎫⎛⎫⎛⎫⎛⎫===≥ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭∑11即1n c n=1 时,Z 的协方差阵在非负定意义下达到极小.第三章 多元正态总体参数的假设检验3-1解:因为A 对称幂等阵,而对称幂等阵的特征值非0即1,且只有r 个非0特征值,即存在正交阵Γ(其列向量i r 为相应特征向量),使⎥⎦⎤⎢⎣⎡=ΓΓ'000t I A ,记),,(1n r r =Γ,令X Y Y Y n Γ'=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡= 1(即Y X Γ=), 则),(),(~22n nn n I N I N Y σμσμΓ'=ΓΓ'Γ', ∑==⎥⎦⎤⎢⎣⎡'=ΓΓ'''ti it YY I Y Y A Y AX X 122222100011~1σσσσ,因为),,2,1)(,(~2r i r N Y i i ='σμ,且相互独立,所以∑=='=ti ir X YAX X 12222),(~11δσσξ,其中非中心参数为121112221111()[)][,,]tt i t t t i t r r rr rr r r r δμμμμμσσσ='⎡⎤⎢⎥''''==++=⎢⎥'⎢⎥⎣⎦∑(μμσμμσA I t '=Γ'⎥⎦⎤⎢⎣⎡Γ'=22100013-2解:记()rank A r =.① 若n r =,由O AB =,知n n O B ⨯=,于是AX X '与BX X '相互独立; ② 若0=r 时,则0=A ,则两个二次型也是独立的. ③以下设0r n <<.因A 为n 阶对称阵,存在正交阵Γ,使得100',000rr r D ΓA Γ=D λλ⎡⎤⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦其中0λ≠为A 的特征值1(,,)i r =.于是,r r D D A=ΓΓ'AB ΓΓ'B ΓΓ'⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦000000, 令11122122,nnH H H =Γ'B ΓH H ⨯⎡⎤⎢⎥⎣⎦其中11H 为r 阶方阵, 由于111211122122rr r H H D D H D H AB =ΓΓ'ΓΓ'H H ⎡⎤⎡⎤⎡⎤==⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦000000, 故11120,0r r D H D H ==. 又因r D 为满秩阵,故有1112()0,0r r r n r H H ⨯⨯-==. 由于H 为对称阵,所以21()0n r r H -⨯=.于是 2200,0H =Γ'B ΓH ⎡⎤=⎢⎥⎣⎦ 令H X Γ'=,则2~(,)n n Y N I μσΓ',且21'()rr i i i D X AX Y A Y Y A Y Y Y Y ξλ=⎡⎤'''''==ΓΓ=ΓΓ==⎢⎥⎣⎦∑000, 112222000ηΓΓΓ(,,)r r n n Y X BX Y B Y Y Y Y H H Y ++⎡⎤⎡⎤⎢⎥''''====⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦,由于11,,,,,r r n Y Y Y Y +相互独立,故AX X '与BX X '相互独立..3-11解:这是两总体均值向量的检验问题. 检验统计量取为(p =3,n =6,m =9):021~(,1)(2)H n m p F T F p n m p n m p+--=+--+-下其中2112(2)()()()nmT n m X Y A A X Y n m-'=+--+-+故检验统计量为1121()()()n m p nmF X Y A A X Y p n m-+--'=⨯-+-+用观测数据代入计算可得: 25.3117,1.4982,T F == 显著性概率值 0.26930.05p α=>= 故H 0相容.第五章 判别分析5-1 解:由题意,其错判概率为1111211P μμμμΦΦσσ()*()*(|)[()]()--=-+ 12121121212112111μσμσμσμσμμσσσσΦΦσσ()()[()]()()()()()-+---+=-+(1)(2)(2)(1)2112[1()]()μμμμσσσσ--=-Φ+Φ-+),()(21)1()2(12)1()2(σσμμσσμμ+-Φ+--Φ= )]()(1[1)2|1(1)1(*1)1(*σμμσμμ-Φ+-Φ--=P)()(2)2(2112212)2(121221σμσσσμσμσμσσσμσμ-++Φ----Φ=)()()()( )()(21)2()1(12)2()1(σσμμσσμμ+-Φ---Φ= )](1[)(121)1()2(12)1()2(\σσμμσσμμ+-Φ----Φ-= ).()(12)1()2(21)1()2(σσμμσσμμ--Φ-+-Φ= 5-2 解:由题意(1)样品x 与三个总体21,G G 和3G 的马氏距离分别为 ,15.0)25.2()()(22212121=-=-=σμx x d ,5625.12)05.2()()(22222222=-=-=σμx x d,25.01)35.2()()(22232323=-=-=σμx x d 显然,{})()(),(),(min 23232221x d x d x d x d =,则3G x ∈,即样品5.2=x 应判归总体3G .(2)样品x 与三个总体21,G G 和3G 的贝叶斯距离分别为 ,3863.0)3863.1(1)ln()()(212121-=-+=+=σx d x D ,9488.24ln 5625.1)ln()()(222222=+=+=σx d x D ,25.01ln 25.0)ln()()(232323=+=+=σx d x D显然,{})()(),(),(min 21232221x D x D x D x D =,则1G x ∈,即样品5.2=x 应判归总体1G .5-4解:(1)可取121812207385123275537A -⎛⎫⎛⎫⎛⎫=∑+∑=+= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭(组内)()(1)(2)(1)(2)1020100100()()10,101525100100B μμμμ-⎛⎫⎛⎫'=--=--= ⎪ ⎪-⎝⎭⎝⎭(组间) 类似于例5.3.1的解法, A -1B 的特征根就等于2(1)(2)1(1)(2)3751016500()()(10,10) 4.70675381013811381d A μμμμ---⎛⎫⎛⎫'=--=--== ⎪⎪--⎝⎭⎝⎭取1(1)(2)321()33a A d μμ-⎛⎫=-= ⎪⎝⎭,则1a Aa '=, 且a 满足:2().Ba Aa d λλ==判别效率:() 4.7067a Baa a Aaλ'∆===', Fisher 线性判别函数为:12()33)u X a X X X '==+ 判别准则为*1*2()()X G u X u X G u X u⎧∈>⎨∈≤⎩判当判当, 阈值为(1)(2)*21124.2964u u u σσσσ+==-+,其中 ()21118123217862432,330.87591232338976589765a a σ⎛⎫⎛⎫'=∑=== ⎪⎪⎝⎭⎝⎭ ()2222073211114132,330.124175338976589765a a σ-⎛⎫⎛⎫'=∑=== ⎪⎪-⎝⎭⎝⎭(1)(1)10 2.720215ua μ⎛⎫'====- ⎪⎝⎭(2)(2)20 4.889725ua μ⎛⎫'====- ⎪⎝⎭故(1)(2)uu >.当(1)2020X ⎛⎫= ⎪⎝⎭时,(1)20() 4.339020u X ⎛⎫==- ⎪⎝⎭ 因*(1)() 4.3390u X u =-<,∴判(1)2X G ∈. 当(1)1520X ⎛⎫= ⎪⎝⎭时,(2)15() 3.805020u X ⎛⎫==- ⎪⎝⎭因*(2)() 3.8050u X u =->,∴判(2)1.X G ∈ (2) )(10)(75)1|2()()2|1()()()()()1(1)1(2)1(11)1(22)1(2)1(1)1(X f X f L X f q L X f q X h X h X W ===(2)'1(2)(1)'1(1)(1)2(1)(1)2(1)1511exp{()()()()}222X X X X μμμμ--=--∑-+-∑- )25202020(32121218)25202020(21exp{5.71'⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡-=- ,19229.75)}15102020(32121218)15102020(211'>=⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡+- )(10)(75)1|2()()2|1()()()()()2(1)2(2)2(11)2(22)2(2)2(1)2(X f X f L X f q L X f q X h X h X W ===(2)'1(2)(1)'1(1)(2)2(2)(2)2(2)1511e x p {()()()()}222X X X X μμμμ--=--∑-+-∑- )25202015(32121218)25202015(21exp{5.71'⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡-=- ,15.7)}15102015(32121218)15102015(211'>=⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡+- 故,2)1(G X ∈ )2()2(G X ∈.(3)122'1112010181220101812()()ln ||()()ln 2015123220151232D x d x Σ-⎡⎤⎡⎤⎡⎤⎡⎤⎡⎤=+=--+⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦⎣⎦122'22220202072020207()()ln ||()()ln 202575202575D x d x Σ---⎡⎤⎡⎤⎡⎤⎡⎤⎡⎤=+=--+⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦⎣⎦⎣⎦212212exp(0.5())(1|)0.7306exp(0.5())exp(0.5())D x P x D x D x -==-+-, 222212exp(0.5())(2|)0.2694exp(0.5())exp(0.5())D x P x D x D x -==-+-. 5-5 解:2()()()()a d a d a d a a Sa a Sa ''''∆==''(1)(2)(1)(2)def 1()()a X X X X a a Baa Sa a Saλ'''--==≤''111,S B a λλ-=其中为的最大特征值且仅当对应的特征向量时等号成立. 又1(1)(2)(1)(2)12(1)(2)1(1)(2)()()()()S B X X X X S D X X S X X ---''=--=--,与有相同的特征值. 故21D λ=;以下验证a 就是D 2对应的一个特征向量:11(1)(2)(1)(2)1(1)(2)1(1)(2)22()()()().S Ba S X X X X S X X S X X D D a ----'=---=-∙=1(1)(2)2(),().a S X X a D -=-∆=故当取时比值达最大值5-6 解:记(1)(2)(),()()W X X a μμμ'-=-是X 的线性函数,21111,()~(,),X G W X N νσ∈当时且(1)(1)(2)1(1)(2)122(1)(2)1(1)(2)1(())()()()21[()()]2E W X a d d νμμμμμμμμμμ--''==-=-∑-'==-∑-其中21(1)(2)11(1)(2)2(())[()]()()()D W X D a X a D X a a ad σμμμμμμ--'''==-=-=∑'=-∑∑∑-=11111()0(2|1){()0|}{}W X P P W X X G P ννσσ--∴=≤∈=≤2111{/}()1().222P U d d d d =≤-=Φ-=-Φ其中11()~(0,1).W X U N νσ-=2(2)2222122221,()~(,),(),2X G W X N a d d νσνμμσ'∈=-=-=当时且222222()0(1|2){()0|}{}11{/}1().22W X P P W X X G P P U d d d ννσσ--∴=>∈=>=>=-Φ其中22()~(0,1).W X U N νσ-=第六章 聚类分析6-2证明:设变量X i 和X j 是二值变量,它们的n 次观测值记为x ti , x tj (t =1,…,n ). x ti , x tj 的值为0 or 1.由二值变量的列联表(表6.5)可知:变量X i 取值1的观测次数为a +b,取值0的观测次数为c +d ;变量X i 和X j 取值均为1的观测次数为a,取值均为0的观测次数为d .利用两定量变量相关系数的公式:()()ntii tj j ij xx x x r --=∑又11()()11[()()][()()()]n nti i tj j ti tj i j t t a b a cx x x x x x nx x a n n n an a b a c a a b c d a b a c n nad bc n==++--=-=-=-++=+++-++-=∑∑222211()()1[()]()()n nti i ti i t t a b x x x nx a b n n a b n a b a b c d n n==+⎛⎫-=-=+- ⎪⎝⎭+=-+=++∑∑222211()()1[()]()()nntj j tj j t t a c x x x nx a c n n a c n a c a c b d n n==+⎛⎫-=-=+- ⎪⎝⎭+=-+=++∑∑故二值变量的相关系数为:()()(7)ntii tj j ij xx x x C --==∑利用两定量变量夹角余弦的公式:cos nti tjij x xα=∑其中1,nti tj t x x a ==∑2211,n ntitj t t x a b x a c ===+=+∑∑故有(9)c o s )i j i jc α==. 6-3解:用最长距离法:① 合并{X (1),X (4)}=CL4,并类距离 D 1=1.(2)(3)(2)(5)0903********X XD X CL ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭② 合并{X (2),X (5)}=CL3,并类距离 D 2=3.③ 合并{CL3,CL4}=CL2,并类距离 D 3=8. ④ 所有样品合并为一类CL1,并类距离 D 4=10. 最长距离法的谱系聚类图如下:用类平均聚类法:① 合并{X (1),X (4)}=CL4,并类距离 D 1=1.② 合并{X (2),X (5)}=CL3,并类距离 D 2=3.③ 合并{CL3,CL4}=CL2,并类距离 D 3=(165/4)1/2. ④ 所有样品合并为一类CL1,并类距离 D 4=(121/2)1/2. 类平均法的谱系聚类图如下:(3)(3)010049803X D CL CL ⎛⎫ ⎪= ⎪⎪⎝⎭(3)(4)01002X DCL ⎛⎫= ⎪⎝⎭(2)2(3)(2)22(5)0903506513610004222X X D X CL ⎛⎫ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭(3)(3)01362041062165403X D CL CL ⎛⎫ ⎪= ⎪⎪⎝⎭(3)(4)0121202X D CL ⎛⎫= ⎪⎝⎭6-6解:按中间距离法, 取β=-1/4,将B 和C 合并为一类后,并类距离D 1=1,而A 与新类G r ={B,C}的类间平方距离为222211()0.5(1.1 1.1)0.251 1.10.250.8524Ar AB AC BC D D D D =+-=⨯+-⨯=-=当把A 与{B ,C}并为一类时,并类距离210.9221D D ==<= 故中间距离法不具有单调性。
多元应用统计第八章答案
多元应用统计第八章答案1、对某高中一年级男生38人进行体力测试(共7项指标)及运动能力测试(共5项指标),试对两组指标做典型相关分析。
体力测试指标:x1-反复横向跳(次),x 2-纵跳(cm),x 3-臂力(kg),x 4-握力(kg),x 5-台阶试验(指数),x 6-立定体前屈(cm),x 7-俯卧上体后仰(cm)。
运动能力测试指标: x8-50米跑(秒),x 9-跳远(cm),x 10-投球(m),x11-引体向上(次),x12-耐力跑(秒)。
矩阵Run MATRIX procedure:一、两组变量间的相关系数Correlations for Set-1X1 X2 X3 X4 X5 X6 X7X1 1.0000 .2701 .1643 -.0286 .2463 .0722 -.1664X2 .2701 1.0000 .2694 .0406 -.0670 .3463 .2709X3 .1643 .2694 1.0000 .3190 -.2427 .1931 -.0176X4 -.0286 .0406 .3190 1.0000 -.0370 .0524 .2035X5 .2463 -.0670 -.2427 -.0370 1.0000 .0517 .3231X6 .0722 .3463 .1931 .0524 .0517 1.0000 .2813X7 -.1664 .2709 -.0176 .2035 .3231 .2813 1.0000Correlations for Set-2X8 X9 X10 X11 X12X8 1.0000 -.4429 -.2647 -.4629 .0777X9 -.4429 1.0000 .4989 .6067 -.4744X10 -.2647 .4989 1.0000 .3562 -.5285X11 -.4629 .6067 .3562 1.0000 -.4369X12 .0777 -.4744 -.5285 -.4369 1.0000Correlations Between Set-1 and Set-2X8 X9 X10 X11 X12X1 -.4005 .3609 .4116 .2797 -.4709X2 -.3900 .5584 .3977 .4511 -.0488X3 -.3026 .5590 .5538 .3215 -.4802X4 -.2834 .2711 -.0414 .2470 -.1007X5 -.4295 -.1843 -.0116 .1415 -.0132X6 -.0800 .2596 .3310 .2359 -.2939X7 -.2568 .1501 .0388 .0841 .1923首先给出的是Correlations for Set-1、Correlations for Set-2为两组变量的内部各自相关矩阵。
应用多元统计分析课后题答案
c) c)2
2( x1
a)( x2
c)]
其中 a x1 b , c x2 d 。求 (1)随机变量 X1 和 X 2 的边缘密度函数、均值和方差; (2)随机变量 X1 和 X 2 的协方差和相关系数; (3)判断 X1 和 X 2 是否相互独立。
(1)解:随机变量 X1 和 X 2 的边缘密度函数、均值和方差;
12
2 2
1/
2
exp
1 2
(x
μ)
12 21
12
2 2
1
(x
μ)
。
2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )
2[(d
c)( x1
a)
(b a)(x2 (b a)2 (d
μ)
1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)
nE(X
μ)(X
μ)
Σ
。
故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本,试求 S
c) 2(x1 a)(x2 a)2(d c)2
c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2
应用多元统计分析课后答案
应用多元统计分析课后答案第二章2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布,则均值为2b a +,方差为()212b a -。
应用多元统计分析_课后答案
图 2.1
Descriptives 对话框
2.
单击 Options 按钮,打开 Options 子对话框。在对话框中选择 Mean 复选框,即计 算样本均值向量,如图 2.2 所示。单击 Continue 按钮返回主对话框。
图 2.2 Options 子对话框 3. 单击 OK 按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表 2.1,即 样本均值向量为(35.3333,12.3333,17.1667,1.5250E2) 。
2.5 解: 依据题意,X= 57000 40200 21450 21900 45000 28350
′
15 16 12 8 15 8
27000 18750 12000 13200 21000 12000
144 36 381 190 138 26
′ E(X)= ∑6 α=1 x(α) = (35650,12.33,17325,152.5) n σ1 σ2 ρ2 (x1 −μ1 )2 σ2 1
+
σ2 1
(x2 −μ2 )2 σ2 2 )2
= = [
(x1 −μ1 )2 σ2 1 ρ(x1 −μ1 ) σ1
− −
2ρ(x1 −μ1 )(x2 −μ2 ) σ1 σ2 (x2 −μ2 ) 2 ] σ2
+
E( X ) μ
n→∞
lim E(
1 1 ������) = lim E( ������) = Σ n→∞ ������ n−1
2.7 试证多元正态总体 的样本均值向量 ̅) = E ( ΣX 证明: E(������ (α) ) = E (ΣX (α) ) =
n n 1 1 nμ n 1 n2
exp[−
最新应用多元统计分析课后习题答案高惠璇PPT课件
(2) 考虑随机变量Y= X1-X2 ,显然有
YX 1X2 0 X 1X 1,当 估计
P{Y0}P{X11或 X11} P{X11}P{X11} (X1~N(0,1)) 2(1)0.317 04
若(X1 , X2 ) 是二元正态分布,则由性质4可知,
31
第三章 多元正态总体参数的检验
证明 记rk(A)=r.
若r=n,由AB=O,知B= On×n,于是 X′AX与X′BX
若r=0时,则A=0,则两个二次型也是独 立的.
以下设0<r<n.因A为n阶对称阵,存在正 交阵Γ,使得
32
第三章 多元正态总体参数的检验
其中λi≠0为A的特征值(i=1,…,r).于是
P { X 2 x } P { X 1 x } ( x )
当x≥1时, P{X2x}
P{X2 1}P{1X2 1}P{1X2 x}
P{X11}P{1X11}P{1X1x}
P{X1x}(x) 17
第二章 多元正态分布及参数的估计
当-1≤x≤1时,
P{X2 x}P{X2 1}P{1X2 x} P{X1 1}P{xX1 1} P{X1 1}P{1X1 x} P{X1 x}(x)
它的任意线性组合必为一元正态. 但Y= X1-X2 不是正态分布,故(X1 , X2 ) 不是二元正态分布.
19
第二章 多元正态分布及参数的估计
2-17 设X~Np(μ,Σ),Σ>0,X的密度函数记为 f(x;μ,Σ).(1)任给a>0,试证明概率密度等高面
f(x;μ,Σ)= a
是一个椭球面. (2) 当p=2且
比较上下式相应的系数,可得:
1
2 2
2
1 2
应用多元统计分析课后习题答案详解北大高惠璇(第二章部分习题解答)
则2
x12
2x1x2
x22
y12
y22
(2)第二次配方.由于
xx12
y2 y1
y2
14
第二章 多元正态分布及参数的估计
2x12 x22 2x1x2 22x1 14x2 65
y12 y22 22y2 14( y1 y2 ) 65
y12 14y1 49 y22 8y2 16
15
第二章 多元正态分布及参数的估计
(3) 随机向量
Y
YY12
~
N2
7 4
,
I2
(4) 由于
X
X X
1 2
0 1
11
Y1 Y2
CY
0 1
11 74
34
比较上下式相应的系数,可得:
1 2
2 2
1 2
2
1
2 1
1
1 2 1
2 1
1
2
1/
21
2 2
2
2
2 1
21 22 21 21
22 14
12
2 2
22
2 1
21 212
注意:由D(X)≥0,可知 (Σ1-Σ2) ≥0.
8
第二章 多元正态分布及参数的估计
2-11 已知X=(X1,X2)′的密度函数为
f
应用多元统计分析课后习题答案详解北大高惠璇第八章习题解答
所以
Q(m)
i 1 j 1 2 ij
p
p
j m1
(
2 j i 1
p
2 2 i
)
j m 1
,
2 j
16
p
第八章 因子分析
8-5 试比较主成分分析和因子分析的 (1) 主成分分析不能作为一个模型来描述,它只 是通常的变量变换,而因子分析需要构造因子模型; (2) 主成分分析中主成分的个数和变量个数p相 同,它是将一组具有相关关系的变量变换为一组互 不相关的变量(注意应用主成分分析解决实际问题 时,一般只选取前m(m<p)个主成分),而因子分析的 目的是要用尽可能少的公共因子,以便构造一个结 构简单的因子模型;
(2) ( AA D) 1 D 1 D 1 A( I AD 1 A) 1 A1 D 1 ; (3) A( AA D) 1 ( I m AD 1 A) 1 AD 1. 解:利用分块矩阵求逆公式求以下分块矩阵的逆:
记B221 I m AD A,
17
第八章 因子分析
(3) 主成分分析是将主成分表示为原变量的线 性组合,而因子分析是将原始变量表示为公因子 和特殊因子的线性组合,用假设的公因子来“解 释”相关阵的内部依赖关系. 这两种分析方法又有一定的联系.当估计方法 采用主成分法,因子载荷阵A与主成分的系数相 差一个倍数;因子得分与主成分得分也仅相差一 个常数.这种情况下可把因子分析看成主成分分 析的推广和发展. 这两种方法都是降维的统计方法,它们都可用 来对样品或变量进行分类.
18
2 11 2 21 2 3 2 31
a 1
2 31 2 3
a11a21 0.63 a11a31 0.45 a31a21 0.35
应用多元统计分析章节后习题答案详解北大高惠璇习题解答市公开课金奖市赛课一等奖课件
第10页 10
第八章 因子分析
8-3 验证下列矩阵关系式(A为p×m阵)
(1) (I AD1A)1 AD1A I (I AD1A)1;
(2) ( AA D)1 D1 D1A(I AD1A)1 A1D1;
(3) A( AA D)1 (Im AD1A)1 AD1.
解:利用分块矩阵求逆公式求下列分块矩阵逆:
(3) 主成份分析是将主成份表示为原变量线性 组合,而因子分析是将原始变量表示为公因子和 特殊因子线性组合,用假设公因子来“解释”相 关阵内部依赖关系.
这两种分析办法又有一定联系.当预计办法采 用主成份法,因子载荷阵A与主成份系数相差一 个倍数;因子得分与主成份得分也仅相差一个常 数.这种情况下可把因子分析当作主成份分析推 广和发展.
并计算误差平方和Q(2).
解 : m 2的因子模型的主成分解为:
0.8757 0.1802
A(
1l1,
2
l2
)
0.8312
0.4048,
0.7111 0.6950
第7页
7
第八章 因子分析
D
0.2007 0 0
0 0.1452
0
0.0100131
则m 2的正交因子模型为
X1 0.8757F1 0.1802F2 1 X 2 0.8312F1 0.4048F2 2 X 3 0.7111F1 0.6950F2 3
p
m
p
S ilili ilili ilili
i 1
i 1
i m 1
其中1 2 p 0 为S特性值,li为相应原则
特性向量。
第14页 14
第八章 因子分析
设A,D是因子模型主成份预计,即
应用多元统计分析课后习题答案详解北大高惠璇部分习题解答
可提成假设检验问题.因为
1 : 2 : 3 6 : 4 :1 C 0
其中
C
1 0
0 1
6 4
23
,
注意:
第24页/共46页
1 3
6 , 且 2 4
1
3 1
12
63 43
00.
24
第三章 多元正态总体参数的检验
或
C
2 1
3 0
0 6
~
Nr (0, 11),
X (2) ( )
~
N pr (0, 22 ),
记
X
n p
xij
X (1) | X (2) , nr n( pr)
则
W
X
X
X (1)X (1) X (2)X (1)
X X
(1) X (2) X
(2) (2)
WW1211
W12 W22
,
即 W11 X (1)X (1), W22 X (2)X (2)
样本,样本均值为X,样本离差阵为A.记μ=(μ1,…,μp)′.为检验
H0:μ1=μ2=…=μp ,H1:μ1,μ2,…,μp至少有一对不相等.令
C 11
1 0
0 1
0 0
,
1 0 0 1( p1)p
则上面的假设等价于H0:Cμ=0p-1,H1:Cμ≠ 0p-1
试求检验H0 的似然比统计量和分布.
Tx2 n(n 1)(X ) Ax1( X )
~ T 2 ( p, n 1).
令 Y(i) CX (i) d (i 1,..., n)
其中C是pp非退化常数矩阵,d是p1常向量。
高惠璇多元统计分析习题答案
第四章4-1 设⎪⎩⎪⎨⎧++=+-=+=,2,2,332211εεεb a y b a y a y ).,0(~323321I N σεεεε⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=(1)试求参数b a ,的最小二乘估计;(2)试导出检验b a H =:0的似然比统计量,并指出当假设成立时,这个统计量是分布是什么?解:(1)由题意可知.,,,211201321321⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=εεεεβ b a y y y Y C 则⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎪⎪⎪⎪⎭⎫ ⎝⎛⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-==--321'1''1'211201************)(ˆy y y Y C C C β.ˆˆ)2(51)2(6132321⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+-++ba y y y y y(2)由题意知,检验b a H =:0的似然比统计量为2322ˆ⎪⎪⎭⎫ ⎝⎛=σσλ 其中,])ˆ2ˆ()ˆˆ2()ˆ[(31ˆ2322212b a y b a y a y --++-+-=σ。
当0H 成立时,设0a b a ==,则⎪⎩⎪⎨⎧+=+=+=,3,,303202101εεεa y a y a y ,311⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=C 可得,ˆ)3y (111311311311)(ˆ0321321'1''1'ay y y y y Y C C C =++=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎪⎪⎪⎪⎭⎫ ⎝⎛⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡==--β ],)ˆ3()ˆ()ˆ[(31ˆ20320220120a y a y ay -+-+-=σ因此,当假设0H 成立时,与似然比统计量λ等价的F 统计量及其分布为).1,1(~ˆˆˆ2202F F σσσ-=4-3 设Y 与321,,x x x 有相关关系,其8组观测数据见表4.5.表 4.5 观测数据序号 1x2x3xY1 38 47.5 23 66.02 41 21.3 17 43.0 3 34 36.5 21 36.0 4 35 18.0 14 23.0 5 31 29.5 11 27.06 34 14.2 9 14.07 29 21.0 4 12.0 83210.087.6(1)设εββββ++++=3322110x x x Y ,试求回归方程及决定系数2R 和均方误差2s 。