应用多元统计分析试题及答案.doc
多元统计分析期末试题及答案
![多元统计分析期末试题及答案](https://img.taocdn.com/s3/m/47d4644f5727a5e9846a610d.png)
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
应用多元统计分析课后答案_暴强整理
![应用多元统计分析课后答案_暴强整理](https://img.taocdn.com/s3/m/54e5723ded630b1c59eeb51a.png)
第二章2.1 试述多元联合分布和边缘分布之间的关系。
设X =(X 1,X 2,⋯X p )′是p 维随机向量,称由它的q (<p )个分量组成的子向量X(i)=(X i1,X i2,⋯X iq )′的分布为X 的边缘分布,相对地把X 的分布称为联合分布。
当X 的分布函数为F (x 1,x 2,⋯x p )时,X (1)的分布函数即边缘分布函数为F (x 1,x 2,⋯x p )=P(X 1≤x 1,⋯X q ≤x q ,X q+1≤∞,⋯X p ≤∞) = F (x 1,x 2,⋯x q ,∞,⋯∞)当X 有分布密度f (x 1,x 2,⋯x p )则X (1)也有分布密度,即边缘密度函数为:f (x 1,x 2,⋯x q )=∫⋯+∞−∞∫f (x 1,x 2,⋯x p )dx q+1⋯d +∞−∞x p 2.2 设随机向量X =(X 1,X 2)′服从二元正态分布,写出其联合分布密度函数和X 1,X 2各自的边缘密度函数。
联合分布密度函数12πσ1σ2(1−ρ2)1/2exp{−12(1−ρ2)[(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+f (x 1,x 2)=(x 2−μ2)2σ22]} , x 1>0,x 2>00 , 其他(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+(x 2−μ2)2σ22=(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+(x 2−μ2)2σ22+ρ2(x 1−μ1)2σ12−ρ2(x 1−μ1)2σ12=[ρ(x 1−μ1)σ1−(x 2−μ2)σ2]2+(1−ρ2)(x 1−μ1)2σ12所以指数部分变为−12{[11√1−ρ2σ1−22√1−ρ2σ2]2+(x 1−μ1)2σ12}令t=22√1−ρ2σ2−11√1−ρ2σ1 ∴dt =√1−ρ2σ22∴f (x 1)=∫f (x 1,x 2)+∞−∞dx 2=12πσ1σ2(1−ρ2)1/2exp{−(x 1−μ1)22σ12∫exp(+∞−∞−12t 2√1−ρ22dt =√2πσexp[−(x 1−μ1)22σ12] √2πσexp[−(x 1−μ1)22σ12] , x 1>0f (x 1)=0 ,其他 同理, √2πσ2exp[−(x 2−μ2)22σ22] , x 2>0f (x 2)=0 ,其他2.3 已知随机向量X =(X 1,X 2)′的联合分布密度函数为f (x 1,x 2)=2[(d−c )(x 1−a )+(b−a )(x 2−c )−2(x 1−a)(x 2−c)(b−a)2(d−c)2,其中,a ≤x 1≤b,c ≤x 2≤d 。
厦门大学《应用多元统计分析》试题A答案
![厦门大学《应用多元统计分析》试题A答案](https://img.taocdn.com/s3/m/96bf9368a98271fe910ef9b3.png)
一、判断题 1. 正确
( ) 证明: ∀c = c1, c2 ,"cp ,
∑∑ c′∑c =
cic jσ ij
ji
= ∑∑cic j [E(Xi − E(Xi ))(Xj − E(Xj ))]
ji
= E⎢⎡∑c j (Xi − E(Xi ))∑ci (Xj − (E Xj ))⎥⎤
=
(n
−1)[
(n −1) p
n(X − μ0 )′S−1
n(X − μ0 )]
八、
( ) ( ) 在典型相关分析中 X (1) =
X
(1)
1
,
X
(1)
2
"
X
(1)
p
′
,
X
(2)
=
X 1(2 ) ,
X
(2
2
)
"
X
(2
q
)
′
是
两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量 Ui、Vi,使
计算共因子的方差贡献得:
g12
=
λ1
= 1.9633;
g
2 2
=
0.6795;
g 32
=
0.3572 ,分别为公共因子
F1, F2 ,
F
对X
的贡
献,是衡量每个公共因子的相对重要性的尺度。
三、解:先求三元总体 X 的协方差阵 ∑ 的特征根,
σ2 −λ ∑ −λE = ρσ 2
0
ρσ 2 σ2 −λ
ρσ 2
−00.7.6439749⎟⎟⎞⎜⎜⎜⎛ 1.9633 − 0.1772⎟⎠⎜⎜⎝ 0.4479 ⎟⎞ − 0.3812⎟ − 0.1059⎟⎠
多元统计分析期末试题及答案
![多元统计分析期末试题及答案](https://img.taocdn.com/s3/m/a502064167ec102de2bd89d7.png)
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
应用多元统计分析(B卷)
![应用多元统计分析(B卷)](https://img.taocdn.com/s3/m/33bfccd6172ded630b1cb6b3.png)
⎪⎪⎪⎭⎫ ⎝⎛=1623294344Σ---应用多元统计分析(B )卷一、判断题(10道小题,共计10分)1.对任意的随机向量Tp X X X X ),,,(21 =来说,其协方差矩阵∑是对称矩阵,并且总是半正定的。
2.对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。
3.量纲的变化对欧几里得距离的计算结果有影响,而马氏距离则克服了这种影响。
欧氏距离是马氏距离的一种特例。
4.贝叶斯判别法是一种考虑了总体出现的先验概率和误判损失的判别方法。
5.快速(动态)聚类分析中,分类的个数是确定的,不可改变。
6.因子分析模型中公共因子i F 是互不相关、不可测的变量,并且()1i Var F =。
7.因子载荷矩阵经过旋转后,变量i X 的共同度2i h 不变。
8.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。
9.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。
10.典型相关分析中,分别求出两组变量的第一主成分,两个第一主成分即构成第一对典型相关变量。
二、填空题(5道小题,共计12分)1.(2分)主成分分析时选取____________________表示原始变量信息的多少,并且主要基于____________________矩阵进行主成分分析。
2.(2分)因子分析把每个原始变量分解为两部分因素:一部分为,另一部分为__________________。
3.(2分)相应分析的主要目的是寻求列联表____________________和____________________的基本分析特征和它们的最优联立表示。
4.(3分)设随机向量),,(321'=X X X X ,且协差阵则其相关阵为。
5.(3分)设有两个正态总体21,G G ,已知:,4223,32)2(,52)1(21⎪⎪⎭⎫⎝⎛=∑=∑⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=μμ求出G 1G 2间的马氏距离。
多元统计分析期末试题及答案
![多元统计分析期末试题及答案](https://img.taocdn.com/s3/m/a502064167ec102de2bd89d7.png)
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
应用多元统计分析课后题答案
![应用多元统计分析课后题答案](https://img.taocdn.com/s3/m/c943825b10a6f524ccbf85e8.png)
c) c)2
2( x1
a)( x2
c)]
其中 a x1 b , c x2 d 。求 (1)随机变量 X1 和 X 2 的边缘密度函数、均值和方差; (2)随机变量 X1 和 X 2 的协方差和相关系数; (3)判断 X1 和 X 2 是否相互独立。
(1)解:随机变量 X1 和 X 2 的边缘密度函数、均值和方差;
12
2 2
1/
2
exp
1 2
(x
μ)
12 21
12
2 2
1
(x
μ)
。
2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )
2[(d
c)( x1
a)
(b a)(x2 (b a)2 (d
μ)
1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)
nE(X
μ)(X
μ)
Σ
。
故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本,试求 S
c) 2(x1 a)(x2 a)2(d c)2
c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2
多元统计复习题_附答案.docx
![多元统计复习题_附答案.docx](https://img.taocdn.com/s3/m/bfa3d57402d276a201292e80.png)
复习题原文:, 复习题I4.2试述判别分析的实质............................ 8-4.3简述距离判别法的基本思想和方法• ............... &4.4简述贝叶斯判别法的基本思想和方法.............. %4.5简述费希尔判别法的基本思想和方法..............10.4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同 ............................................. 11“4.8某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销.下表是这十种品牌饮料的销售价格〈元)和顾客对各种饮料的口味评分、信任度评分的平均数.12。
5.1判别分析和聚类分析有何区别?................ 18.答案:4.2试述判别分析的实质。
4.3简述距离判别法的基本思想和方法。
4.4简述贝叶斯判别法的基本思想和方法。
4.5简述费希尔判别法的基本思想和方法。
4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同。
4. 2试述判别分析的实质。
答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。
设Rl, R2,…,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为RP,则称Ri,R2-R P^R P的一个划分。
判别分析问题实质上就是在某种意义上,以最优的性质对P维空间Rp构造一个“划分”,这个“划分”就构成了一个判别规则。
4. 3简述距离判别法的基本思想和方法。
答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。
其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一•类。
①两个总体的距离判别问题设有协方差矩阵E相等的两个总体G和Q,其均值分别是卬和#2,对于一个新的样品X,要判断它来自哪个总体。
多元统计分析试题及答案
![多元统计分析试题及答案](https://img.taocdn.com/s3/m/969167e8524de518964b7d50.png)
X 1的共性方差h12 =
X 1的方差σ
11
= ___1 注(0.128+0.872)___,
公因子f1对X的贡献g12 = 1.743
备注(0.934^2+(-0.417)^2+0.835^2)__。
5、 设 X i , i = 1,⋯ ,16是 来 自 多 元 正 态 总 体 N p ( µ , Σ ), X 和 A分 别 为 正 态 总 体 N p ( µ , Σ ) 的 样 本 均 值 和 样 本 离 差 矩 阵 ,则 T 2 = 15[4( X − µ )]′ A − 1[4( X − µ )] ~ ___________ 。
2、假设检验问题:H 0 : µ = µ0,H1 : µ ≠ µ0 ⎛ −8.0 ⎞ 经计算可得:X − µ0 = ⎜ 2.2 ⎟ , ⎜ ⎟ ⎜ −1.5 ⎟ ⎝ ⎠ ⎛ 4.3107 −14.6210 8.9464 ⎞ −1 −1 ⎜ S = (23.13848) −14.6210 3.172 −37.3760 ⎟ ⎜ ⎟ ⎜ 8.9464 −37.3760 35.5936 ⎟ ⎝ ⎠ 构造检验统计量:T 2 = n( X − µ0 )′S −1 ( X − µ0 ) = 6 × 70.0741 = 420.445 由题目已知F0.01 (3,3) = 29.5,由是 3× 5 F0.01 (3,3) = 147.5 3 所以在显著性水平α = 0.01下,拒绝原设 H 0
⎛ 16 −4 2 ⎞ 1、设X = ( x1 , x2 , x3 ) ~ N 3 ( µ , Σ), 其中µ = (1,0, − 2)′, Σ = ⎜ −4 4 −1⎟ , ⎜ ⎟ ⎜ 2 −1 4 ⎟ ⎝ ⎠ ⎛x −x ⎞ 试判断x1 + 2 x3与 ⎜ 2 3 ⎟ 是否独立? ⎝ x1 ⎠
多元统计分析期末试题及答案
![多元统计分析期末试题及答案](https://img.taocdn.com/s3/m/47d4644f5727a5e9846a610d.png)
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计分析期末试题及答案.doc
![多元统计分析期末试题及答案.doc](https://img.taocdn.com/s3/m/106a8691f90f76c660371a24.png)
4、设 X=(X|X 2xj 的相关系数矩阵通过因子分析分解为_13 2<3(0.934 0、 ‘0.934 -0.417 0.835、<0.128 、 -0.417 0.89+ 0.027、0 0.894 0.447、0.835 0.44 Z、0.103X 的共性方差叶0.872(0.934八2) 的方差o H = 1_ (0.128+0.934*0.934)1、设X =(兀[宀心)~弘(“上),其中〃 =(1,0厂2)'工'16 -42、-44 -1 ,<2 -1 4丿试判断禹+2无3与是否独立?1、设X ~ “2(“◎),其中X =(“ 宀)=(“1,“2),工=, VP 1丿 贝l 」CoV (尢]+ x 2,x ( - x 2)二 •102、设 X j 〜N 、mn= 1,…,10,则 w 二工(X, -J = 1服从 。
‘4-4 3、 3、设随机向量X =(x, x 2兀3)‘,且协方差矩阵-49 -2U-2 16丿则它的相关矩阵R=_公W J'lj 对X 的贝献篦=_ (0.934人2+0.417人2+0.835人) ______ °5、设XJ = 1,…,16是来自多元正态总体竹(“上),乂和A 分别为正态总体Np (“Q )的样木均值和样木离差矩阵,则厂=15[4(乂-“)"“[4(乂-“)]〜 ________ o〔4]而其先验概率分别为彳=% =0.5,误判的代价C(2|l) = /33、设已知有两正态总体5与11“试用Bd)疚判别法确定样本X属于哪一个总体?4、W=(X,,X 2,X 3,X 4)r ((),£),协方差阵工二(1P P¥<1 1)J 9丿,C(1|2) yp p p 1丿2、对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量, 得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的 均值他= (90,58,1 6)',现欲在多元正态性的假定下检验该地区农村男婴是 否与城市男婴有相同的均值。
应用多元统计分析试题及答案.doc
![应用多元统计分析试题及答案.doc](https://img.taocdn.com/s3/m/acd57af50740be1e640e9ac9.png)
一、填空题:1、多元统计剖析是运用数理统计方法来研究解决多指标问题的理论和方法 .2、回归参数明显性查验是查验解说变量对被解说变量的影响能否著.3、聚类剖析就是剖析怎样对样品(或变量)进行量化分类的问题。
往常聚类分析分为Q型聚类和R型聚类。
4、相应剖析的主要目的是追求列联表行要素A和列要素B的基本剖析特点和它们的最优联立表示。
5、因子剖析把每个原始变量分解为两部分要素:一部分为公共因子,另一部分为特别因子。
6、若x( ): N P( ,),=1,2,3 .n且互相独立,则样本均值向量x 听从的散布为 _ x ~N(μ,Σ /n)_。
二、简答1、简述典型变量与典型有关系数的观点,并说明典型有关剖析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间拥有最大的有关系数。
选用和最先精选的这对线性组合不有关的线性组合,使其配对,并选用有关系数最大的一对,这样下去直到两组之间的有关性被提取完成为止。
被选出的线性组合配对称为典型变量,它们的有关系数称为典型有关系数。
2、简述相应剖析的基本思想。
相应剖析,是指对两个定性变量的多种水平进行剖析。
设有两组要素A和B,此中要素 A 包括 r 个水平,要素 B 包括 c 个水平。
对这两组要素作随机抽样检查,获得一个 rc 的二维列联表,记为。
要追求列联表列要素 A 和行要素 B 的基本剖析特点和最优列联表示。
相应剖析即是经过列联表的变换,使得要素 A和要素 B 拥有平等性,进而用同样的因子轴同时描绘两个要素各个水平的情况。
把两个要素的各个水平的情况同时反应到拥有同样坐标轴的因子平面上,进而获得要素 A 、 B 的联系。
3、简述费希尔鉴别法的基本思想。
从 k 个整体中抽取拥有 p 个指标的样品观察数据,借助方差剖析的思想结构一个线性鉴别函数系数:确立的原则是使得整体之间差别最大,而使每个整体内部的离差最小。
将新样 品的 p 个指标值代入线性鉴别函数式中求出 值,而后依据鉴别必定的规则,就能够鉴别新的样品属于哪个整体。
多元统计分析期末试题及标准答案
![多元统计分析期末试题及标准答案](https://img.taocdn.com/s3/m/b2f6fa2b0242a8956aece4ab.png)
多元统计分析期末试题及答案作者: 日期:的样本均值和样本离差矩阵,则T 21、设 X(Xi,X2,X 』〜2(,),其中试判断人2X3与X"3是否独立?Xi15[4(X)]A 1[4( X)〕〜°16 4 2(1,0, 2),4 4 1 ,2 1 410,),i1 丄,10,则 W = (Xi)(Xi)i 1则它的相矢矩阵R八设X= Xi X2X3,的相尖系数矩阵通过因子分析分解为公因子匚对X 的贡献gj5、设Xi,i 1丄,16是来自多元正态总体Np( ,), X 和A 分别为正态总体 Np(,)N2(),其中 X(Xi,X 2), (1,2),则 Cov( Xi \2, xiX2)=服从3、设随机向量XX1 X2 X3,且协方差矩阵44 3 49 232 162、设 Xi - Na(R 11 0 32n 130.9340 417 0.8350 0 894 0.4470.934 00.417 0 8940.835 0 4470.1280 0270.103X1的共性方差hl.......... 方差2、对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得相尖数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值。
(90,58,16), 现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
82.0 4.310714.62108.9464其中X60.2 ,(5 s)1( 115.6924)114.6210 3.17237. 376014.58.946437.376035.5936 ( 0.01,F0.01 (3, 2) 99.2, F0.01 (3,3)29.5, F0.01 (3, 4)16.7)3、设已知有两正态总体G与G,且I而其先验概率分别为q q2 0.5,误判的代价C(2|1) e4,C(112) e;3试用Bayes判别法确定样本X 属于哪一个总体?14、设X (Xi,X2,X3,X4)丁 ~ N4(0,),协方差阵I 畀1(1)试从工出发求X的第一总体主成分;(2)试问当取多大时才能使第一主成分的贡献率达95%以上5、设X (Xi ,X2)T3Y(Y,X2)丁为标准化向量,令Z1、设随机向量X的均值向量、协方差矩阵分别为试证:E(XX) ,且其协方差阵V(Z)100000 1112010.950 212200.9510000100求其第一对典型相尖变量和它们的典型相尖系数?2、设随机向量X~N P(J,又设丫=A P X+bn,试证:丫~ N r(A b,A A)。
(完整)多元统计分析期末试题及答案,推荐文档.docx
![(完整)多元统计分析期末试题及答案,推荐文档.docx](https://img.taocdn.com/s3/m/69d8c4a2866fb84ae55c8d67.png)
1 、设 X ~ N2 ( ,), 其中 X( x1 , x 2 ),( 1 ,212 ),,1则 Cov( x1x 2 , x1x 2 )=____.102、设X i ~N 3 (,), i 1, L,10,则 W =( X i)( X i)i 1服从_________。
4433、设随机向量X x1x2x3, 且协方差矩阵 4 9 2 ,3 2 16则它的相关矩阵R___________________4、设 X= x1x2x3,的相关系数矩阵通过因子分析分解为112330.93400.1280.4171R100.4170.9340.83530.8940.8940.027 0.83500.4472010.4470.10332__________,__________,X1的共性方差 h1X1的方差11公因子 f 1对 X的贡献 g12________________。
5、设 X i , i 1,L ,16 是来自多元正态总体N p (, ), X 和 A分别为正态总体N p ( ,)的样本均值和样本离差矩阵 , 则T 215[4( X)] A 1[4( X)] ~ ___________。
1642、设( x1 , x2 , x3) ~ N3(, ),其中(1,0, 2) ,44 1 ,1X214试判断 x12 x3与x2x3是否独立?x12、对某地区农村的 6 名 2 周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下 , 根据以往资料 , 该地区城市 2周岁男婴的这三个指标的均值0(90,58,16), 现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
82.0 4.310714.62108.9464其中 X60.2 ,(5 S ) 1( 115.6924)114.6210 3.17237. 376014.58.946437.376035.5936 (0.01,F 0.01 (3, 2)99.2, F 0.01 (3,3)29.5,F0.01 (3, 4)16.7)、设已知有两正态总体G与 G,且12,24,1211,3126219而其先验概率分别为q1q20.5,误判的代价C (2 1)4;e ,C(1 2)e试用判别法确定样本X 3属于哪一个总体?Bayes514、设X( X1 , X2 , X3 , X4 )T,协方差阵1~ N (0, ),0111(1)试从Σ出发求 X 的第一总体主成分;(2)试问当取多大时才能使第一主成分的贡献率达95%以上。
《应用多元统计分析》各章作业题及部分参考答案
![《应用多元统计分析》各章作业题及部分参考答案](https://img.taocdn.com/s3/m/cddcb5ecaeaad1f346933f14.png)
60.6
16.5
2 76
58.1
12.5
3 92
63.2
14.5
4 81
59.0
14.0
5 81
60.8
15.5
6 84
59.5
14.0
解:作如下假设 H0 : μ = μ0 , H1 : μ ≠ μ0
经计算,求的样本均值向量 x = (82.0, 60.2,14.5) ' ,x − μ0 = (−8, 2.2, −1.5) ' ,样本协差阵
x2
+
1 2
x3
+
1 2
x4 。
(2)第一主成分的贡献率为
λ1
+
λ2
λ1 +
λ3
+ λ4
= 1+ 3ρ 4
≥ 95% ,得 ρ
≥ 0.933 。
第 7 章 因子分析
1、设 x = (x1, x2 , x3 )′ 的相关系数矩阵通过因子分析分解为
⎛ ⎜
1
⎜
R
=
⎜ ⎜
−1 3
⎜ ⎜⎜⎝
2 3
−1 3 1
54.58
11.67
产品净值率 10.7
6.2
21.41
11.67
7.90
2、 设 G1, G2 , G3 三个组,欲判别某样品 x0 属于何组,已知 p1 = 0.05, p2 = 0.65, p3 = 0.3,
应用多元统计分析
pofeel@
3
f1 (x0 ) = 0.10, f2 (x0 ) = 0.63, f3 (x0 ) = 2.4 ,假定误判代价矩阵为:
⎢⎣ 4.5 ⎥⎦
(完整版)多元统计分析试题及答案
![(完整版)多元统计分析试题及答案](https://img.taocdn.com/s3/m/10a69930eef9aef8941ea76e58fafab069dc4496.png)
(完整版)多元统计分析试题及答案试题:1. 试解释多元统计分析的含义及其与单变量和双变量统计分析的区别。
2. 简述卡方检验方法及适用场景。
3. 请解释回归分析中的回归系数及其p值的含义及作用,简单说明如何进行回归模型的选择和评估。
4. 试解释主成分分析的原理及目的,如何进行主成分分析及如何解释因子载荷矩阵。
5. 请列举和简要解释聚类分析和判别分析的适用场景,并说明两种方法的区别。
答案:1. 多元统计分析是一种将多个变量进行综合分析的方法。
与单变量和双变量统计分析不同的是,多元统计分析可以处理多个自变量和因变量的组合关系,从而探究它们之间的综合关系。
该方法通常适用于探究多种变量在某个问题中的关系、探究影响某一结果变量的因素、探究各个变量相互作用的影响等。
2. 卡方检验是根据样本数据与期望值的差异来判断观察值与理论预期是否相符,以此来验证假设是否成立的方法。
它通常用于对某个现象进行分类的相关度检验。
适用场景包括:样本的数量大于等于40,且至少有一个期望值小于5;变量为分类变量,且分类类别数不超过10个。
卡方检验的原理是将观察值和期望值进行比较,并计算卡方值,然后根据卡方值与自由度的乘积查找p值,从而得出结论。
3. 回归系数是回归方程中自变量与因变量之间的关系,在线性回归中,回归系数表示每一个自变量单位变化与因变量单位变化的关系。
p值是评估回归系数是否具有显著性的指标。
回归模型的选择有两种方法:一种是逐步回归分析,根据不同的准则进行多个回归模型的比较,选择最优的模型;另一种是正则化回归,通过加入惩罚项来保证回归模型具有良好的泛化性能。
回归模型的评估有多种方法,包括:残差分析、R方值、方差齐性检验、变量的共线性检验等。
4. 主成分分析是一种将多维数据降维处理的方法,它的目的是通过数据的变换,将多个变量转化为一些综合指标,这些指标是原始变量的线性组合。
主成分分析的步骤包括:数据标准化、计算协方差矩阵或相关系数矩阵、计算特征值和特征向量、选取主成分。
(完整word版)多元统计分析习题
![(完整word版)多元统计分析习题](https://img.taocdn.com/s3/m/e4eadd13561252d380eb6e79.png)
1.已知n=4,p=3的一个样本数据阵143X =626,X S 833534ρ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦计算,,v,2.已知23514241130010322X ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦,用最短、最长、中间距离法聚类,并画出聚类树形图3.已知52=22⎡⎤∑⎢⎥⎣⎦,要求: ①求特征根12λλ, ②求特征向量12μμ,③构造主成分12,F F④计算1F 的方差Var(F 1)和2F 的方差Var(F 2)⑤计算()()()()11122122,,,,;;;F X F X F X F X ρρρρ4.设有12,G G 两个总体,从中分别抽取容量为3的样品如下:要求:(1)样本的均值向量()()12,XX 及离差阵12,S S(2)假定()()12==∑∑∑,用12,S S 联合估计∑(3)已知待判样品(27)X T=,分别用距离判别法、Fisher 判别法、Bayes 判别法判定X 的归属。
5.设111=n 个和122=n 个的观测值分别取自两个随机变量1X 和2X 。
假定这两个变量服从二元正态分布,且有相同的协方差阵。
样本均值向量和联合协方差阵为:⎥⎦⎤⎢⎣⎡--=111X ,⎥⎦⎤⎢⎣⎡=122X ,⎥⎦⎤⎢⎣⎡--=∑8.41.11.13.7。
新样品⎥⎦⎤⎢⎣⎡=21X ,要求用Bayes 法和Fisher 进行判别分析。
6.已知2变量协方差阵⎥⎦⎤⎢⎣⎡=∑3224,要求:(1)求∑的特征根及其对应的单位特征向量;(2)组建主成分1F 、2F ;(3)验证j j F Var λ=)(;(4)计算11x F ρ、21x F ρ。
7、试分析某海运学院100名新生的性别与来自的区域有无相关关系。
(20.05(1) 3.84χ=)8、已知4个样品3个数据的数据如下:44068644363X ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦,试求均值向量X 、协方差阵∑、相关阵R 。
9、已知随机向量X=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡321x x x ,具有均值向量826X ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦和协方差阵,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=∑411161113。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空题:
1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.
2、回归参数显着性检验是检验解释变量对被解释变量的影响是否着.
3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分
析分为Q型聚类和R型聚类。
4、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和
它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若x( ): N P( ,),=1,2,3 .n且相互独立,则样本均值向量x 服从的分布
为 _ x ~N(μ,Σ /n)_ 。
二、简答
1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关
系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取
相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选
出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素 A 包含 r 个水平,因素 B 包含 c 个水平。
对这两组因素作随机抽样调
查,得到一个 rc 的二维列联表,记为。
要寻求列联表列因素 A 和行因素 B 的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素 A 和因素 B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情
况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,
从而得到因素 A、 B 的联系。
3、简述费希尔判别法的基本思想。
从 k 个总体中抽取具有 p 个指标的样品观测数据,借助方差分析的思想构造一个
线性判别函数
系数:
确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样
品的 p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和 H1;
第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定
域;
第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受) 。
协差阵的检验
检验
Σ Σ0
np / 2
H 0:Σ I p
exp
1
tr S S n / 2
e
2
n
1
* n / 2
np/ 2
H 0: Σ Σ0 I p
* e
exp
tr S
S
n
2
检验 Σ1 Σ2 L Σk H 0: Σ1
Σ2
L Σk
k
n i /2
n /2
k
k n np /2
S i n i
pn i
/ 2
统计量
S
i 1
i 1
6、在进行系统聚类分析时,不同的类间距离计算方法有何区别请举例说明。
设 d ij 表示样品 X i 与 X j 之间距离,用 D ij 表示类 G i 与 G j 之间的距离。
(1) . 最短距离法
D
ij
X i min
d
ij
G i , X j G j
D kr
X i min
d ij
min{ D kp , D kq }
G k , X j G r
(2)最长距离法
D
pq
max
d
ij
X i G p , X j G q
D
kr
X i max
G r d
ij
max{ D kp , D kq }
G k , X j
(3)中间距离法
D kr 2
1
D kp
2
1
D kq 2 D pq 2
2
2
其中
(4)重心法
D pq2 ( X p X q ) ( X p X q ) X r 1
(n p X p n q X q ) n r
D kr2 n p n q n p n q
D pq2
D kp2 D kq2 2
n r n r n r
(5)类平均法
2 1 2 2 1 2n
p 2 n q 2
D
pq
n p n q X i
d
ij
D
kr n
k
n
r
X
i
G
k
X
j
G
r
d
ij
D
kp
n r
D
kq G p X j G j n r
(6)可变类平均法
D kr2 (1 )( n
p D kp2
n
q D kq2 ) D
pq
2 n r n r
其中是可变的且<1 (7)可变法
D kr21
(D kp2 D kq2 ) D pq2 其中是可变的且 <1 2
(8)离差平方和法
n t
S t ( X it X t ) ( X it X t ) t 1
D kr2 n k n p
D kp2
n k n q
n k D pq2 n r n k n r
D kq2
n k n r n k
7、比较主成分分析与因子分析的异同点。
相同点:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
9、进行相应分析时在对因素 A和因素 B进行相应分析之前没有必要进行独立性检验为什么
有必要,如果因素 A和因素 B独立,则没有必要进行相应分析;如果因素 A和因素B不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。