厦门大学《应用多元统计分析》试题B
厦门大学《应用多元统计分析》习题第02章 多元正态分布的参数估计
思考与练习2.1 试述多元联合分布和边缘分布之间的关系。
2.2 设随机向量12(,)X X ′=X 服从二元正态分布,写出其联合分布密度函数和1X 、2X 各自的边缘密度函数。
2.3 已知随机向量12(,)X X ′=X 的联合分布密度函数为:()()()()()()()()()121122222,d c x a b a x c x a x c f x x b a d c −−+−−−−−2⎡⎤⎣⎦=−−其中,。
求:12,a x b c x d ≤≤≤≤⑴ 随机变量1X 和2X 各自的边缘密度函数、均值与方差。
⑵ 随机变量1X 和2X 的协方差和相关系数。
⑶ 判断1X 和2X 是否相互独立。
2.4 设随机向量12(,,,)p X X X ′=X L 服从正态分布,已知其协差阵为对角阵,证明ΣX 的分量是相互独立的随机变量。
2.5 从某企业全部职工中随机抽取一个容量为6的样本,该样本中各职工的目前工资、受教育年限、初始工资和工作经验资料如下表所示: 职工编号目前工资 (美元)受教育年限(年)初始工资 (美元)工作经验(月)11 2 3 4 5 6 57,000 40,200 21,450 21,900 45,000 28,350 15 16 12 8 15 8 27,000 18,750 12,000 13,200 21,000 12,000 144 36 381 190 138 26设职工总体的以上变量服从多元正态分布,根据样本资料求出均值向量和协差阵的最大似然估计。
2.6 均值向量和协差阵的最大似然估计量具有哪些优良性质? 2.7 试证多元正态总体的样本均值向量(,)p N μΣ1~(,p N nX μΣ)。
2.8 试证多元正态总体的样本协差阵S 为(,)p N μΣΣ的无偏估计。
2.9 设()1x 、()2x 、…、()n x 是从多元正态总体中独立抽取的一个随机样本,试求样本协差阵的分布。
厦门大学统计学试卷B(含答案及评分标准)
统计学试卷B (含答案及评分标准)10分。
(将唯一正确答案的序号写在括号内)1.产品质量的检查应该采用( )。
A.重点调查的方法;B.典型调查的方法;C.普查的方法;D.抽样检验的方法;2.我国的统计调查方法体系中,作为“主体”的是( )A.经常性抽样调查;B.必要的统计报表;C.重点调查及估计推算等;D.周期性普查;3.某商场销售额2004年与2003年相比为120%,同期价格水平下降2%,则该商场销售量指数为( )A.133%; B.122.4%; C.122%; D.118%;4.在具有报告期实际商品流转额和几种商品价格的个体指数资料的条件下,要确定价格的平均变动,应该使用( )指数。
A.综合;B.加权算术平均;C.加权调和平均;D.可变构成;5.复相关系数的取值区间为:( )A. 11≤≤-R ;B. 1≤≤∞-R ;C.10≤≤R ;D.∞≤≤-R 1;6.在其它条件不变的情况下,如果允许抽样平均误差比原来扩大2倍,则样本容量( )。
A.扩大为原来的4倍B. 扩大为原来的2倍C.缩小为原来的二分之一D. 缩小为原来的四分之一7.在长期趋势分析中,如果被研究现象的各年逐期增长量大致相同,则该现象可拟合( )模型。
A.直线; B.二次曲线; C.指数曲线; D.双曲线;8.随着收入水平的提高,下列指标中呈下降趋势的有:( )A.恩格尔系数;B.基尼系数;C.全员劳动生产率;D.投资率9.下列指标中,反映分布离散程度的指标有:( )A.几何平均数;B.决定系数;C.变异系数;D.回归系数;10.在其他条件相同的前提下:不重复抽样误差( )A. 大于重复抽样误差;B. 小于重复抽样误差C. 等于重复抽样误差;D. 与重复抽样误差何者更大无法判定二、多项选择题每小题2分共10分(正确答案包含1至5项,请将正确答案的序号写在1. 常见的离散型分布有:()A.正态分布B.二项分布C.t分布D.F 分布E.卡方分布2.下列定理中,哪两个属于统计推断的数理基础()。
多元统计分析期末试题及答案
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
应用多元统计分析课后答案 .doc
2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。
厦门大学 应用多元统计分析 试题B
厦门大学应用多元统计分析试题B厦门大学[应用多元统计分析]试题B厦门大学《多元统计分析》试卷B经济学院计统系级本科生一、判断并改错(每题3分)1. 距离判别是Bayes判别的一种特例。
()2. 系统聚类法中的“离差平方和法”的基本思想来源于同类样品的离差平方和应该较小,不同类样品之间的离差平方和应该较大。
()3. 在对因素A和因素B进行相应分析之前没有必要进行独立性检验。
()4. 相应分析反应的是列变量和行变量的交叉关系。
()5. 典型相关分析是研究多组变量之间相关关系的一种多元统计方法。
()二、(12%)设X(1),K,X(n)是来自Np(μ,Σ)的随机样本,ci≥0(i=1,L,n),∑ci=1,令Z=∑ciX(i)。
试证明:1)Z是μ的无偏估计量;2)Z~Np(μ,c'cΣ),其中c=(c1,L,cn)'。
三、简述题(第1题6分,第2题8分,第3题6分,第4题6分) 1. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。
2. 比较主成分分析与因子分析的异同点。
3. 简述相应分析的基本思想。
4. 简述典型相关分析的基本思想。
四、计算题(第1题10分,第2题15分,第3题10分,第4题10分) 1. 设有两个正态总体G1和G2,已知:⎡10⎡⎡20⎡⎡1812⎡⎡20−7⎡,μ(1)=⎡⎡,μ(2)=⎡⎡,Σ1=⎡Σ=⎡2⎡⎡, 1525123275−⎡⎡⎡⎡⎡⎡⎡⎡⎡20⎡试用距离判别法判断:样品:X=⎡⎡,应归属于哪一类?⎡20⎡2.下面是5个样品两两间的距离矩阵⎡⎡0⎡(0)⎡ D90⎡7100⎡试用最长距离法作系统聚类,并画出谱系聚类图。
⎡0⎡4⎡=⎡6⎡⎡1⎡⎡6⎡3. 设三元总体X的协方差阵为Σ=⎡ρσ2⎡0⎡ρσ2σ2ρσ20⎡⎡ρσ2⎡,试求总体主成4. 设标准化变量X1,X2,X3的协差阵(即相关阵)为⎡1.000.630.45⎡⎡, R=⎡0.631.000.35⎡⎡⎡⎡0.450.351.00⎡⎡R的特征值和相应的正则化特征向量分别为:λ1=1.9633,λ2=0.6795,λ3=0.3572,l1=(0.6250,0.5932,0.5075)'l2=(−0.2186,−0.4911,0.8432)'l3=(0.7494,−0.6379,−0.1772)'1)计算因子载荷矩阵A,并建立因子模型; 2)计算公因子Fj的方差贡献g2 j(j=1,2,3),并说明其统计意义。
研究生多元统计分析试题(A卷)(答案)
内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。
厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验
≠
μ0 ; (α
=
0.05) 。
3.5 测量 30 名初生到 3 周岁婴幼儿的身高( x1 )和体重( x2 )数据如
下表所示,其中男女各 15 名。假定这两组都服从正态总体且协方差阵相等,
试在显著性水平α = 0.05 下检验男女婴幼儿的这两项指标是否有差异。
编号 1
男
x1
x2
54
3
女
x1
x2
54
1 LF HF 3.71 1.76 3.63 3.17 4.49 4.08 5.70 4.78 4.96 3.39 5.83 4.02 5.22 5.08 4.15 2.39
2 LF HF 3.96 2.47 3.64 3.19 4.86 4.12 5.72 5.44 5.14 3.88 5.64 4.06 5.03 4.99 4.15 2.08
2 LF HF 4.29 3.03 4.69 4.77 5.28 4.41 5.05 3.28 4.94 3.56 4.54 3.28 4.26 3.11 5.56 5.36
3 LF HF 4.77 3.57 4.58 3.04 5.37 4.79 4.65 2.86 4.68 3.97 4.61 4.40 5.27 3.88 5.55 5.00
时各小时的低频心电频谱值(LF)、高频心电频谱值(HF),资料见下表。试
分析这两个指标的各次重复测定均值向量是否有显著差异(α = 0.05 )。
3
1 LF HF 4.66 2.89 4.54 4.65 5.91 4.53 4.95 3.31 5.51 3.78 4.22 2.61 4.61 3.10 5.08 4.38
1
4
4
1
2
厦门大学《应用多元统计分析》习题第09章 典型相关分析
思考与练习9.1 什么是典型相关分析?简述其基本思想。
9.2 什么是典型变量?它具有哪些性质?9.3 试析一组变量的典型变量与其主成分的联系与区别。
9.4 简述典型相关分析中载荷分析的内容及作用。
9.5 简述典型相关分析中冗余分析的内容及作用。
9.6 设X 和Y 分别是p 维和q 维随机向量,且存在二阶距,设p ≤q 。
它们的第i 对典型变量分别为()i a X ′、()i b Y ′,典型相关系数为i λ,(1,,)i p =L 。
令*X CX l =+,*Y DY m =+,其中C 、D 分别为,p p q q ××阶非奇异阵,、分别为p 维、q 维随机向量,试证明l m1⑴ **X Y 、的第i 对典型变量为1()i C a X −*′、1()i D b Y −*′。
⑵ 1()*i C a X −′与1()*i D b Y −′的典型相关系数为i λ。
9.7 对140名学生进行了阅读速度1x 、阅读能力2x 、运算速度1y 和运算能力2y 的四种测验,所得成绩的相关系数阵为10.030.240.590.0310.060.07R 0.240.0610.240.590.070.241⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦= 试对阅读本领与运算本领之间进行典型相关分析。
9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。
44名学生的成绩如下表:闭卷 开卷 闭卷 开卷力学 物理 代数分析统计力学物理代数分析 统计 1X 2X 3X 4X5X1X 2X3X 4X5X77 82 676781637880708175 73 7166815572637068 63 63 6570635361726473 51 67 6565685970686256 62 60 5862706472606245 52 64 6063545567596244 50 50 6455636563585637 31 55 6057766064565440 44 69 5353534269615545 62 46 6157453149626362 44 61 5262454941614964 12 58 6163674953496247 54 49 5647535453465944 44 56 5561361844505781 46 52 6550353245495764 30 69 5052454649535937 40 27 5461613142485468 36 59 51455156405654 5 46 56 5749324542555640 42 60 5449334063535425 23 55 5953444848495137 41 63 4946344652534140试对闭卷( 21X ,2X )和开卷(3X ,4X ,5X )两组变量进行典型相关分析。
厦门大学应用多元统计分析第多元正态分布的参数估计
则称 X 为连续型随机变量,称 f (x1, x2 ,, x p ) 为分布密度函
数,简称为密度函数或分布密度。
一个 p 元函数 f (x1, x2 ,, x p ) 能作为 R p 中某个随机向量的
密度函数的主要条件是:
(1) f (x1, x2 ,, x p ) 0 , (x1, x2 ,, xp ) R p ;
当 X 有分布密度 f (x1, x2 ,, x p ) 时(亦称联合分布密度函 数),则 X (1) 也有分布密度,即边缘密度函数为:
f1(x1, x2 ,, xq ) f (x1,, x p )dxq1,, dxp
【例 2.2】对例 2.1 中的 X ( X1, X 2 ) 求边缘密度函数。
然而在实际问题中,多元正态分布中均值向量和协差阵通 常是未知的,一般的做法是由样本来估计。这是本章讨论的 重要内容之一,在此我们介绍最常见的最大似然估计法对参 数进行估计,并讨论其有关的性质。
第二节 基本概念
一 随机向量 二 多元分布 三 随机向量的数字特征
一、随机向量
我们所讨论的是多个变量的总体,所研究的数据是同时p个 指标(变量),又进行了n次观测得到的,我们把这个p指标 表示为X1 ,X2,…,Xp,常用向量X = (X1 , X2 , … , XP)'
阵为
Cov( X ,Y )E( X E( X ))(Y E(Y ))
Cov( X1,Y1)
Cov(
X
2
,
Y1
)
Cov( X1,Y2 ) Cov( X 2,Y2 )
Cov( X p ,Y1) Cov( X p ,Y2 )
当 X = Y 时,即为 D( X ) 。
Cov( X1,Yp )
厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验
3
2
50.5
2.25
53
2.25
3
51
2.5
51.5
2.5
4
56.5
3.5
51
3
5
52
3
51
3
6
76
9.5
77
7.5
7
80
9
77
10
8
74
9.5
77
9.5
9
80
9
74
9
10
76
8
73
7.5
11
96
13.5
91
12
12
97
14
91
13
13
99
16
94
15
14
92
11
92
12
15
94
15
91
12.5
3.6 1992 年美国总统选举的三位候选人为布什、佩罗特和克林顿。从支
持三位候选人的选民中分别抽取了 20 人,登记他们的年龄段( x1 )、受教育
程度( x2 )和性别( x3 )资料如下表所示:
投票人
x1
x2
x3
投票人
x1
x2
x3
布什
2
1
2
1
1
11
1
1
2
2
1
3
2
12
4
1
2
3
3
3
1
13
4
0
2
4
1
3
2
14
3
4
2
5
3
1
应用多元统计分析试题及答案
一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q型聚类和 R型聚类。
4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。
二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。
对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。
要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
3、简述费希尔判别法的基本思想。
从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
厦门大学《应用多元统计分析》习题第04章 判别分析
思考与练习4.1 简述欧氏距离与马氏距离的区别和联系。
4.2 试述判别分析的实质。
4.3 简述距离判别法的基本思想和方法。
4.4 简述Bayes 判别法的基本思想和方法。
4.5 简述Fisher 判别法的基本思想和方法。
4.6 试析距离判别法、Bayes 判别法和Fisher 判别法的异同。
4.7 设有两个二元总体和,从中分别抽取样本计算得到1G 2G (1)(2)53 5.8 2.1,,12 2.17.6p x x S ⎛⎞⎛⎞⎛⎞===⎜⎟⎜⎟⎜⎟−⎝⎠⎝⎠⎝⎠假设,试用距离判别法建立判别函数和判别规则。
样品1=ΣΣ2(6,0)x ′=应属于哪个总体?4.8 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。
下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。
销售情况 产品序号 销售价格 口味评分 信任度评分畅销1 2.2 5 8 2 2.5 6 73 3.0 3 94 3.2 8 6 平销5 2.8 76 6 3.5 87 7 4.89 8 滞销8 1.7 3 4 9 2.2 4 2 10 2.7 4 3⑴ 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。
1⑵ 现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。
4.9 银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。
可以根据贷款申请人的年龄(1X )、受教育程度(2X )、现在所从事工作的年数(3X )、未变更住址的年数(4X )、收入(5X )、负债收入比例(6X )、信用卡债务(7X )、其它债务(8X )等来判断其信用情况。
下表是从某银行的客户资料中抽取的部分数据,⑴根据样本资料分别用距离判别法、Bayes 判别法和Fisher 判别法建立判别函数和判别规则。
⑵某客户的如上情况资料为(53,1,9,18,50,11.20,2.02,3.58),对其进行信用好坏的判别。
厦门大学《应用多元统计分析》习题第08章 相应分析
8.10 试用相应分析法对一实际问题进行分析。
E 891114.6 23847.5 42375.3 40488.0 30560.0 50449.6 60591.8 39255.5 80755.3 4747.8 49999.8
781.9 12797.5
3
术处理为
A:引流和迷走神经切除 C:50%的切除和迷走神经切除
手术处理 综合症 1
B:25%的切除和迷走神经切除 D:75%的切除
医院
2
3
4
1
无
23
18
8
12
A
有
9
7
9
10
无
23
18
12
15
B
有
15
8
8
5
无
20
13
11
14
C
有
18
15
8
11
无
24
9
7
13
D
有
16
17
11
10
对上面的数据进行相应分析,研究医院和手术处理类型的关系。
丹佛
1212 920 0
休斯顿 701 940 879 0
洛杉矶 1936 1745 831 1374 0
迈阿密 604 1188 1726 968 2339 0
纽约
748 713 1631 1420 2451 1092 0
旧金山 2139 1858 949 1645 347 2594 2571 0
湖北
1415.6
23.5
619
60716.8
广东
2546.9 84.2 1779 123771.5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∑ 二、(12%)设 X(1) ,K, X(n) 是来自 N p (μ, Σ) 的随机样本,ci ≥ 0(i = 1,L, n), ci = 1, i=0
n
∑ 令 Z = ciX(i) 。试证明: i=0
1) Z 是 μ 的无偏估计量;
2) Z ~ N p (μ,c'cΣ) ,其中 c = (c1,L, cn )' 。
1. 设有两个正态总体 G1 和 G2 ,已知:
μ(1)
=
⎡10 ⎢⎣15
⎤ ⎥⎦
,
μ
(
2)
=
⎡20⎤ ⎢⎣25⎥⎦ ,
Σ1
=
⎛18 ⎜⎝12
12 ⎞
32
⎟, ⎠
Σ2
=
⎛ 20
⎜ ⎝
−7
−7 ⎞
5
⎟, ⎠
试用距离判别法判断:样品:
X
=
⎡20⎤ ⎢⎣20⎥⎦
,应归属于哪一类?
1
2.下面是 5 个样品两两间的距离矩阵
厦门大学《多元统计分析》试卷 B
经济学院计统系
级 专业
本科生
一、判断并改错(每题 3 分) 1. 距离判别是 Bayes 判别的一种特例。( ) 2. 系统聚类法中的“离差平方和法”的基本思想来源于同类样品的离差平方和
应该较小,不同类样品之间的离差平方和应该较大。( ) 3. 在对因素 A 和因素 B 进行相应分析之前没有必要进行独立性检验。( ) 4. 相应分析反应的是列变量和行变量的交叉关系。( ) 5. 典型相关分析是研究多组变量之间相关关系的一种多元统计方法。( )
(0 < ρ ≤ ห้องสมุดไป่ตู้ 2) 。
4. 设标准化变量 X1, X 2 , X3 的协差阵(即相关阵)为
⎡1.00 0.63 0.45⎤ R = ⎢⎢0.63 1.00 0.35⎥⎥ ,
⎢⎣0.45 0.35 1.00⎥⎦
R 的特征值和相应的正则化特征向量分别为:
λ1 = 1.9633, λ2 = 0.6795, λ3 = 0.3572, 要求:
三、简述题(第 1 题 6 分,第 2 题 8 分,第 3 题 6 分,第 4 题 6 分)
1. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。
2. 比较主成分分析与因子分析的异同点。
3. 简述相应分析的基本思想。
4. 简述典型相关分析的基本思想。
四、计算题(第 1 题 10 分,第 2 题 15 分,第 3 题 10 分,第 4 题 10 分)
⎡0
⎤
⎢⎢4 0
⎥ ⎥
D(0) = ⎢6 9 0
⎥
⎢⎢1 7 10 0
⎥ ⎥
⎢⎣6 3 5 8 0⎥⎦
试用最长距离法作系统聚类,并画出谱系聚类图。
⎡ σ 2 ρσ 2 0 ⎤
3. 设 三 元 总 体 X 的 协 方 差 阵 为 Σ = ⎢⎢ρσ 2
σ2
ρσ
2⎥ ⎥
,试求总体主成分
⎢⎣ 0 ρσ 2 σ 2 ⎥⎦
l1 = (0.6250, 0.5932, 0.5075)' l2 = (−0.2186, −0.4911, 0.8432)' l3 = (0.7494, −0.6379, −0.1772)'
1)计算因子载荷矩阵 A ,并建立因子模型;
2)计算公因子
Fj
的方差贡献
g
2 j
(
j
=
1,
2,
3)
,并说明其统计意义。
2