厦门大学《应用多元统计分析》试题B答案

合集下载

厦门大学统计学试卷B(含答案及评分标准)

厦门大学统计学试卷B(含答案及评分标准)

统计学试卷B (含答案及评分标准)10分。

(将唯一正确答案的序号写在括号内)1.产品质量的检查应该采用( )。

A.重点调查的方法;B.典型调查的方法;C.普查的方法;D.抽样检验的方法;2.我国的统计调查方法体系中,作为“主体”的是( )A.经常性抽样调查;B.必要的统计报表;C.重点调查及估计推算等;D.周期性普查;3.某商场销售额2004年与2003年相比为120%,同期价格水平下降2%,则该商场销售量指数为( )A.133%; B.122.4%; C.122%; D.118%;4.在具有报告期实际商品流转额和几种商品价格的个体指数资料的条件下,要确定价格的平均变动,应该使用( )指数。

A.综合;B.加权算术平均;C.加权调和平均;D.可变构成;5.复相关系数的取值区间为:( )A. 11≤≤-R ;B. 1≤≤∞-R ;C.10≤≤R ;D.∞≤≤-R 1;6.在其它条件不变的情况下,如果允许抽样平均误差比原来扩大2倍,则样本容量( )。

A.扩大为原来的4倍B. 扩大为原来的2倍C.缩小为原来的二分之一D. 缩小为原来的四分之一7.在长期趋势分析中,如果被研究现象的各年逐期增长量大致相同,则该现象可拟合( )模型。

A.直线; B.二次曲线; C.指数曲线; D.双曲线;8.随着收入水平的提高,下列指标中呈下降趋势的有:( )A.恩格尔系数;B.基尼系数;C.全员劳动生产率;D.投资率9.下列指标中,反映分布离散程度的指标有:( )A.几何平均数;B.决定系数;C.变异系数;D.回归系数;10.在其他条件相同的前提下:不重复抽样误差( )A. 大于重复抽样误差;B. 小于重复抽样误差C. 等于重复抽样误差;D. 与重复抽样误差何者更大无法判定二、多项选择题每小题2分共10分(正确答案包含1至5项,请将正确答案的序号写在1. 常见的离散型分布有:()A.正态分布B.二项分布C.t分布D.F 分布E.卡方分布2.下列定理中,哪两个属于统计推断的数理基础()。

应用多元统计分析课后答案

应用多元统计分析课后答案

应用多元统计分析课后答案第二章2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。

解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。

求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。

(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布,则均值为2b a +,方差为()212b a -。

应用多元统计分析_课后答案

应用多元统计分析_课后答案

图 2.1
Descriptives 对话框
2.
单击 Options 按钮,打开 Options 子对话框。在对话框中选择 Mean 复选框,即计 算样本均值向量,如图 2.2 所示。单击 Continue 按钮返回主对话框。
图 2.2 Options 子对话框 3. 单击 OK 按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表 2.1,即 样本均值向量为(35.3333,12.3333,17.1667,1.5250E2) 。
2.5 解: 依据题意,X= 57000 40200 21450 21900 45000 28350

15 16 12 8 15 8
27000 18750 12000 13200 21000 12000
144 36 381 190 138 26
′ E(X)= ∑6 α=1 x(α) = (35650,12.33,17325,152.5) n σ1 σ2 ρ2 (x1 −μ1 )2 σ2 1
+
σ2 1
(x2 −μ2 )2 σ2 2 )2
= = [
(x1 −μ1 )2 σ2 1 ρ(x1 −μ1 ) σ1
− −
2ρ(x1 −μ1 )(x2 −μ2 ) σ1 σ2 (x2 −μ2 ) 2 ] σ2
+
E( X ) μ
n→∞
lim E(
1 1 ������) = lim E( ������) = Σ n→∞ ������ n−1
2.7 试证多元正态总体 的样本均值向量 ̅) = E ( ΣX 证明: E(������ (α) ) = E (ΣX (α) ) =
n n 1 1 nμ n 1 n2
exp[−

厦门大学 应用多元统计分析 试题B

厦门大学 应用多元统计分析 试题B

厦门大学应用多元统计分析试题B厦门大学[应用多元统计分析]试题B厦门大学《多元统计分析》试卷B经济学院计统系级本科生一、判断并改错(每题3分)1. 距离判别是Bayes判别的一种特例。

()2. 系统聚类法中的“离差平方和法”的基本思想来源于同类样品的离差平方和应该较小,不同类样品之间的离差平方和应该较大。

()3. 在对因素A和因素B进行相应分析之前没有必要进行独立性检验。

()4. 相应分析反应的是列变量和行变量的交叉关系。

()5. 典型相关分析是研究多组变量之间相关关系的一种多元统计方法。

()二、(12%)设X(1),K,X(n)是来自Np(μ,Σ)的随机样本,ci≥0(i=1,L,n),∑ci=1,令Z=∑ciX(i)。

试证明:1)Z是μ的无偏估计量;2)Z~Np(μ,c'cΣ),其中c=(c1,L,cn)'。

三、简述题(第1题6分,第2题8分,第3题6分,第4题6分) 1. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。

2. 比较主成分分析与因子分析的异同点。

3. 简述相应分析的基本思想。

4. 简述典型相关分析的基本思想。

四、计算题(第1题10分,第2题15分,第3题10分,第4题10分) 1. 设有两个正态总体G1和G2,已知:⎡10⎡⎡20⎡⎡1812⎡⎡20−7⎡,μ(1)=⎡⎡,μ(2)=⎡⎡,Σ1=⎡Σ=⎡2⎡⎡, 1525123275−⎡⎡⎡⎡⎡⎡⎡⎡⎡20⎡试用距离判别法判断:样品:X=⎡⎡,应归属于哪一类?⎡20⎡2.下面是5个样品两两间的距离矩阵⎡⎡0⎡(0)⎡ D90⎡7100⎡试用最长距离法作系统聚类,并画出谱系聚类图。

⎡0⎡4⎡=⎡6⎡⎡1⎡⎡6⎡3. 设三元总体X的协方差阵为Σ=⎡ρσ2⎡0⎡ρσ2σ2ρσ20⎡⎡ρσ2⎡,试求总体主成4. 设标准化变量X1,X2,X3的协差阵(即相关阵)为⎡1.000.630.45⎡⎡, R=⎡0.631.000.35⎡⎡⎡⎡0.450.351.00⎡⎡R的特征值和相应的正则化特征向量分别为:λ1=1.9633,λ2=0.6795,λ3=0.3572,l1=(0.6250,0.5932,0.5075)'l2=(−0.2186,−0.4911,0.8432)'l3=(0.7494,−0.6379,−0.1772)'1)计算因子载荷矩阵A,并建立因子模型; 2)计算公因子Fj的方差贡献g2 j(j=1,2,3),并说明其统计意义。

多元统计分析课后练习答案

多元统计分析课后练习答案

多元统计分析课后练习答案第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。

在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

其中最典型的就是0-1标准化和Z 标准化。

2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。

在二维和三维空间中的欧氏距离的就是两点之间的距离。

缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。

每个坐标对欧氏距离的贡献是同等的。

当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。

当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。

它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。

没有考虑到总体变异对距离远近的影响。

马氏距离表示数据的协方差距离。

为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。

优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。

由标准化数据和中心化数据计算出的二点之间的马氏距离相同。

马氏距离还可以排除变量之间的相关性的干扰。

缺点:夸大了变化微小的变量的作用。

受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。

3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。

如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验


μ0 ; (α
=
0.05) 。
3.5 测量 30 名初生到 3 周岁婴幼儿的身高( x1 )和体重( x2 )数据如
下表所示,其中男女各 15 名。假定这两组都服从正态总体且协方差阵相等,
试在显著性水平α = 0.05 下检验男女婴幼儿的这两项指标是否有差异。
编号 1

x1
x2
54
3

x1
x2
54
1 LF HF 3.71 1.76 3.63 3.17 4.49 4.08 5.70 4.78 4.96 3.39 5.83 4.02 5.22 5.08 4.15 2.39
2 LF HF 3.96 2.47 3.64 3.19 4.86 4.12 5.72 5.44 5.14 3.88 5.64 4.06 5.03 4.99 4.15 2.08
2 LF HF 4.29 3.03 4.69 4.77 5.28 4.41 5.05 3.28 4.94 3.56 4.54 3.28 4.26 3.11 5.56 5.36
3 LF HF 4.77 3.57 4.58 3.04 5.37 4.79 4.65 2.86 4.68 3.97 4.61 4.40 5.27 3.88 5.55 5.00
时各小时的低频心电频谱值(LF)、高频心电频谱值(HF),资料见下表。试
分析这两个指标的各次重复测定均值向量是否有显著差异(α = 0.05 )。
3
1 LF HF 4.66 2.89 4.54 4.65 5.91 4.53 4.95 3.31 5.51 3.78 4.22 2.61 4.61 3.10 5.08 4.38
1
4
4
1
2

厦门大学《应用多元统计分析》习题第09章 典型相关分析

厦门大学《应用多元统计分析》习题第09章 典型相关分析

思考与练习9.1 什么是典型相关分析?简述其基本思想。

9.2 什么是典型变量?它具有哪些性质?9.3 试析一组变量的典型变量与其主成分的联系与区别。

9.4 简述典型相关分析中载荷分析的内容及作用。

9.5 简述典型相关分析中冗余分析的内容及作用。

9.6 设X 和Y 分别是p 维和q 维随机向量,且存在二阶距,设p ≤q 。

它们的第i 对典型变量分别为()i a X ′、()i b Y ′,典型相关系数为i λ,(1,,)i p =L 。

令*X CX l =+,*Y DY m =+,其中C 、D 分别为,p p q q ××阶非奇异阵,、分别为p 维、q 维随机向量,试证明l m1⑴ **X Y 、的第i 对典型变量为1()i C a X −*′、1()i D b Y −*′。

⑵ 1()*i C a X −′与1()*i D b Y −′的典型相关系数为i λ。

9.7 对140名学生进行了阅读速度1x 、阅读能力2x 、运算速度1y 和运算能力2y 的四种测验,所得成绩的相关系数阵为10.030.240.590.0310.060.07R 0.240.0610.240.590.070.241⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦= 试对阅读本领与运算本领之间进行典型相关分析。

9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。

44名学生的成绩如下表:闭卷 开卷 闭卷 开卷力学 物理 代数分析统计力学物理代数分析 统计 1X 2X 3X 4X5X1X 2X3X 4X5X77 82 676781637880708175 73 7166815572637068 63 63 6570635361726473 51 67 6565685970686256 62 60 5862706472606245 52 64 6063545567596244 50 50 6455636563585637 31 55 6057766064565440 44 69 5353534269615545 62 46 6157453149626362 44 61 5262454941614964 12 58 6163674953496247 54 49 5647535453465944 44 56 5561361844505781 46 52 6550353245495764 30 69 5052454649535937 40 27 5461613142485468 36 59 51455156405654 5 46 56 5749324542555640 42 60 5449334063535425 23 55 5953444848495137 41 63 4946344652534140试对闭卷( 21X ,2X )和开卷(3X ,4X ,5X )两组变量进行典型相关分析。

应用多元统计分析试题及答案.doc

应用多元统计分析试题及答案.doc

一、填空题:1、多元统计剖析是运用数理统计方法来研究解决多指标问题的理论和方法 .2、回归参数明显性查验是查验解说变量对被解说变量的影响能否著.3、聚类剖析就是剖析怎样对样品(或变量)进行量化分类的问题。

往常聚类分析分为Q型聚类和R型聚类。

4、相应剖析的主要目的是追求列联表行要素A和列要素B的基本剖析特点和它们的最优联立表示。

5、因子剖析把每个原始变量分解为两部分要素:一部分为公共因子,另一部分为特别因子。

6、若x( ): N P( ,),=1,2,3 .n且互相独立,则样本均值向量x 听从的散布为 _ x ~N(μ,Σ /n)_。

二、简答1、简述典型变量与典型有关系数的观点,并说明典型有关剖析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间拥有最大的有关系数。

选用和最先精选的这对线性组合不有关的线性组合,使其配对,并选用有关系数最大的一对,这样下去直到两组之间的有关性被提取完成为止。

被选出的线性组合配对称为典型变量,它们的有关系数称为典型有关系数。

2、简述相应剖析的基本思想。

相应剖析,是指对两个定性变量的多种水平进行剖析。

设有两组要素A和B,此中要素 A 包括 r 个水平,要素 B 包括 c 个水平。

对这两组要素作随机抽样检查,获得一个 rc 的二维列联表,记为。

要追求列联表列要素 A 和行要素 B 的基本剖析特点和最优列联表示。

相应剖析即是经过列联表的变换,使得要素 A和要素 B 拥有平等性,进而用同样的因子轴同时描绘两个要素各个水平的情况。

把两个要素的各个水平的情况同时反应到拥有同样坐标轴的因子平面上,进而获得要素 A 、 B 的联系。

3、简述费希尔鉴别法的基本思想。

从 k 个整体中抽取拥有 p 个指标的样品观察数据,借助方差剖析的思想结构一个线性鉴别函数系数:确立的原则是使得整体之间差别最大,而使每个整体内部的离差最小。

将新样 品的 p 个指标值代入线性鉴别函数式中求出 值,而后依据鉴别必定的规则,就能够鉴别新的样品属于哪个整体。

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

3
2
50.5
2.25
53
2.25
3
51
2.5
51.5
2.5
4
56.5
3.5
51
3
5
52
3
51
3
6
76
9.5
77
7.5
7
80
9
77
10
8
74
9.5
77
9.5
9
80
9
74
9
10
76
8
73
7.5
11
96
13.5
91
12
12
97
14
91
13
13
99
16
94
15
14
92
11
92
12
15
94
15
91
12.5
3.6 1992 年美国总统选举的三位候选人为布什、佩罗特和克林顿。从支
持三位候选人的选民中分别抽取了 20 人,登记他们的年龄段( x1 )、受教育
程度( x2 )和性别( x3 )资料如下表所示:
投票人
x1
x2
x3
投票人
x1
x2
x3
布什
2
1
2
1
1
11
1
1
2
2
1
3
2
12
4
1
2
3
3
3
1
13
4
0
2
4
1
3
2
14
3
4
2
5
3
1

应用多元统计分析课后答案_暴强整理40页

应用多元统计分析课后答案_暴强整理40页

第二章2.1 试述多元联合分布和边缘分布之间的关系。

设,是p维随机向量,称由它的q(<p)个分量组成的子向量,的分布为的边缘分布,相对地把的分布称为联合分布。

当的分布函数为F,时,的分布函数即边缘分布函数为F,=P()= F,当X有分布密度f(,)则也有分布密度,即边缘密度函数为:f(,)=(,)2.2 设随机向量服从二元正态分布,写出其联合分布密度函数和各自的边缘密度函数。

联合分布密度函数,0 , 其他==()所以指数部分变为令t== exp[] exp[] ,=0 ,其他 同理,exp[] ,=0 ,其他2.3 已知随机向量 的联合分布密度函数为,其中, 。

求:(1) 随机变量各自的边缘密度函数、均值与方差。

解:==同理,==同理可得()22dc x E +=同理可得()()1222d c x D -=(2)随机变量的协方差和相关系数。

E(==E(==E(==E(=D(E(D(E(Cov E(E(=.===(3)判断是否独立。

不相互独立。

2.4设随机向量,服从正态分布,已知其协差阵为对角阵,证明的分量是相互独立的随机变量。

Σ= ΣΣΣΣ与不相关又 ,服从正态分布与 相互独立。

( , , , , , ) 2.5解: 依据题意,X=E(X)=D(X)=注:利用 11p n n ⨯'=1X X , S 1()n n n n''=-11X I X 其中 1001n ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦I 在SPSS 中求样本均值向量的操作步骤如下:1. 选择菜单项Analyze →Descriptive Statistics →Descriptives ,打开Descriptives 对话框。

将待估计的四个变量移入右边的Variables 列表框中,如图2.1。

图2.1 Descriptives 对话框2. 单击Options 按钮,打开Options 子对话框。

在对话框中选择Mean 复选框,即计算样本均值向量,如图2.2所示。

厦门大学《应用多元统计分析》习题第04章 判别分析

厦门大学《应用多元统计分析》习题第04章 判别分析

思考与练习4.1 简述欧氏距离与马氏距离的区别和联系。

4.2 试述判别分析的实质。

4.3 简述距离判别法的基本思想和方法。

4.4 简述Bayes 判别法的基本思想和方法。

4.5 简述Fisher 判别法的基本思想和方法。

4.6 试析距离判别法、Bayes 判别法和Fisher 判别法的异同。

4.7 设有两个二元总体和,从中分别抽取样本计算得到1G 2G (1)(2)53 5.8 2.1,,12 2.17.6p x x S ⎛⎞⎛⎞⎛⎞===⎜⎟⎜⎟⎜⎟−⎝⎠⎝⎠⎝⎠假设,试用距离判别法建立判别函数和判别规则。

样品1=ΣΣ2(6,0)x ′=应属于哪个总体?4.8 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。

下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。

销售情况 产品序号 销售价格 口味评分 信任度评分畅销1 2.2 5 8 2 2.5 6 73 3.0 3 94 3.2 8 6 平销5 2.8 76 6 3.5 87 7 4.89 8 滞销8 1.7 3 4 9 2.2 4 2 10 2.7 4 3⑴ 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。

1⑵ 现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。

4.9 银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。

可以根据贷款申请人的年龄(1X )、受教育程度(2X )、现在所从事工作的年数(3X )、未变更住址的年数(4X )、收入(5X )、负债收入比例(6X )、信用卡债务(7X )、其它债务(8X )等来判断其信用情况。

下表是从某银行的客户资料中抽取的部分数据,⑴根据样本资料分别用距离判别法、Bayes 判别法和Fisher 判别法建立判别函数和判别规则。

⑵某客户的如上情况资料为(53,1,9,18,50,11.20,2.02,3.58),对其进行信用好坏的判别。

厦门大学《应用多元统计分析》习题第08章 相应分析

厦门大学《应用多元统计分析》习题第08章 相应分析

8.10 试用相应分析法对一实际问题进行分析。
E 891114.6 23847.5 42375.3 40488.0 30560.0 50449.6 60591.8 39255.5 80755.3 4747.8 49999.8
781.9 12797.5
3
术处理为
A:引流和迷走神经切除 C:50%的切除和迷走神经切除
手术处理 综合症 1
B:25%的切除和迷走神经切除 D:75%的切除
医院
2
3
4
1

23
18
8
12
A

9
7
9
10

23
18
12
15
B

15
8
8
5

20
13
11
14
C

18
15
8
11

24
9
7
13
D

16
17
11
10
对上面的数据进行相应分析,研究医院和手术处理类型的关系。
丹佛
1212 920 0
休斯顿 701 940 879 0
洛杉矶 1936 1745 831 1374 0
迈阿密 604 1188 1726 968 2339 0
纽约
748 713 1631 1420 2451 1092 0
旧金山 2139 1858 949 1645 347 2594 2571 0
湖北
1415.6
23.5
619
60716.8
广东
2546.9 84.2 1779 123771.5

厦门大学《应用多元统计分析》试题A

厦门大学《应用多元统计分析》试题A

厦门大学《多元统计分析》试卷A经济学院计统系 级 专业 本科生一、(20%)判断题1、“p 维随机向量1(,...,)p X X X ′=的协差阵及相关阵一定是非负定阵”是否正确,并说明理由。

2、“距离判别是Bayes 判别的一种特例”是否正确,为什么? 二、(15%)设标准化变量12,,3X X X 的协差阵(即相关阵)为1.000.630.450.63 1.000.350.450.35 1.00⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦R , R 的特征值和相应的正则化特征向量分别为:'11'22'331.9633,(0.6250,0.5932,0.5075)0.6795,(0.2186,0.4911,0.8432)0.3572,(0.7494,0.6379,0.1772)l l l λλλ====−−==−− 要求:1)计算因子载荷矩阵A ,并建立因子模型;2)计算公因子的方差贡献,并说明其统计意义。

j F 2(1,2,3j g j =)三、(10%)设三元总体的协方差阵为X 222222200σρσρσσρσρσσ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦Σ,试求总体主成分(0ρ<≤。

四、(15%)金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布),今测得两个总体的若干数据,并由这些数据得到⎟⎟⎠⎞⎜⎜⎝⎛=62ˆ1μ⎟⎟⎠⎞⎜⎜⎝⎛=24ˆ2μ⎟⎟⎠⎞⎜⎜⎝⎛=∑4111ˆ 对某一金融分析员进行判别是否能满足这项工作。

进行测量得到两个指标为,且当两组先验概率分别为)4,5(′=X 269.01=q 与731.02=q ,损失相同。

问该金融分析员满足要求吗?为什么?五、(6%)设是来自的随机样本,,令。

试证明:(1)(),,n X X K ()i i c X (,)p N μΣ00(1,,),1ni ii c i n c=≥==∑L 0ni ==∑Z 1)是Z μ的无偏估计量;2)~,其中。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3. 相应分析指受制于某个载体总体的两个因素为 A 和 B ,其中因素 A 包含 r 个水平,
即 A1, A2 ," Ar ;因素 B 包含 c 个水平,即 B1, B2 ," Bc 。对这两组因素作随机抽样
调查,得到一个 r × c 的二维列联表,记为 K = (kij )r×c ,主要目的是寻求列联表行
432
51
所以 X 属于正态总体 G1 。
2. 解:由题意得:
G1
G2
G3
G4
G5
G1
0
G2
4
0
G3
6
9
0
G4
1
7
Hale Waihona Puke 100G5
6
3
5
8
0
D(0)中最小的元素是 D14=1,将 G1 和 G4 合并成 G6,用最长距离法计算新类与其他类之间的距 离,得到新的距离矩阵 D(1):
G6
G2
G3
G5
G6
0
G2
义类间距离平方为这两类元素两两之间距离平方的平均数;可变类平均法将 G p 和
Gq 合并为新类 Gr ,反映出 G p 和 Gq 之间的距离 Dpq 的影响;如果中间法的前两
项的系数也依赖于 β ,那么用可变法如果将 G p 和 Gq 合并为新类 Gr ;离差平方和
法则是先将 n 个样品各自成一类,然后每次缩小一类,每缩小一类,离差平方和就 要增大,选择使方差增加最小的两类合并,直到所有的样品归为一类为止 2. 主成分分析与因子分析的相同点:两者都是一种降维,简化数据的技术;两种方法 的求解过程是类似的,都是从协方差出发,利用特征值、特征向量求解。 不同点:主成分分析的数学模型本质上是一种线形变换,将原始坐标变换到变异程 度最大的方向上,突出数据变异的方向,归纳重要信息。而因子分析是从现在变量 去提取潜在因子的过程。
Y1
=
1 2
X1
+
2 2
X2
+
1 2
X3
, Y2 =
2 2
X1

2 2 X3
, Y3
=
1 2
X1

2 2
X2
+
1 2
X3

4. 解:
⎜⎛ λ1
⎟⎞
A
=
(l1
,
l
2
,
l
3
)⎜
⎜⎜⎝
λ2
⎟ λ3 ⎟⎟⎠
⎜⎛ 0.6250 = ⎜ 0.5932
⎜⎝ 0.5075
− 0.2186 − 0.4911 − 0.8432
计算共因子的方差贡献得:
0.6795
⎟⎞

0.3572
⎟ ⎟
⎟⎠
g12
=
λ1
= 1.9633;
g
2 2
=
0.6795; g32
=
0.3572 ,分别为公共因子
F1,
F2 ,
F
对X
的贡
献,是衡量每个公共因子的相对重要性的尺度。
0.7494 − 0.6379
⎟⎞⎜⎜⎛ ⎟⎜
1.9633
− 0.1772⎟⎠⎜⎜⎝
⎜⎛ 0.8757 − 0.1802 0.4479 ⎟⎞ = ⎜ 0.8312 − 0.4048 − 0.3812⎟
⎜⎝ 0.7111 − 0.6951 − 0.1059⎟⎠
建立因子模型:
X1 = 0.8757F1 − 0.1802F2 + 0.4479F3 X 2 = 0.8312F1 − 0.4048F2 − 0.3812F3 X 3 = 0.7111F1 − 0.6951F2 − 0.1059F3
⎟⎟⎠⎞⎜⎜⎝⎛150
⎟⎟⎠⎞

(0
,- 5)
1 51
⎜⎜⎝⎛
5 7
7 20
⎟⎟⎠⎞⎜⎜⎝⎛
-05⎟⎟⎠⎞
=
25 432
(2 ,1)⎜⎜⎝⎛
32 - 12
- 12 18
⎟⎟⎠⎞⎜⎜⎝⎛
2 1
⎟⎟⎠⎞

1 51
(0
,- 5)⎜⎜⎝⎛
5 7
7 20
⎟⎟⎠⎞⎜⎜⎝⎛
-05⎟⎟⎠⎞
= 25 × 98 − 500 〈0
i=0
i=0
Z 是 μ 的无偏估计量得证;
2) X1 "Xn 独立同分布于 N p (μ, Σ) ,
∑ ∑ ( ) ∑ ( ) ∑ ( ) D Z
=
D⎜⎛ ⎝
n i=0
ci
X(i
)
⎟⎞ ⎠
=
n i=0
D
ci X(i)
n
= ci2D X(i)
i=0
n
= ci2 ∑ = c′c ∑ ,
i=0
且由(1)中结论可知 E(Z) = μ
关系。
4. 典型相关分析是研究两组变量之间相关关系的一种多元统计方法,目的为识别并量
化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合
与另一组变量线性组合之间的相关关系分析。基本思想为:设
( ) ( ) X (1) =
X
(1)
1
,
X
(1)
2
"
X
(1)
p


X
(2)
=
X
(2)
1
,
谱系聚类图:
G1
G6
G4
G8
G2
G7
G9
G5
G3
3. 解:先求三元总体 X 的协方差阵 ∑ 的特征根,
σ2 −λ ∑ −λE = ρσ 2
0
ρσ 2 σ2 −λ
ρσ 2
0
( )( ) ρσ 2 = σ 2 − λ σ 4 − 2λσ 2 + λ2 − 2ρ 2σ 4 = 0
σ2 −λ
( ) ( ) 解得: λ1 = 1+ 2ρ σ 2, λ2 = σ 2, λ3 = 1− 2ρ σ 2
( ) λ1 = 1+

σ
2
对应的单位特征根为 T1
=
⎜⎜⎝⎛
1 2
,
2 2
,
1 2
⎟⎟⎠⎞

λ2 = σ 2 对应的单位特征根为 T2 = ⎜⎜⎝⎛
2 ,0,− 2
2 2
⎟⎟⎠⎞

( ) λ3 = 1−

σ
2 对应的单位特征根为 T3
=
⎜⎜⎝⎛
1 2
,−
2 2
,
1 2
⎟⎟⎠⎞

因此,总体的主成分为:
7
0
G3
10
9
0
G5
8
3
5
0
D(1)中最小的元素是 D25=3,将 G2 和 G5 合并成 G7,用最长距离法计算新类与其他类之间的距 离,得到新的距离矩阵 D(2):
G6
G7
G3
G6
0
G7
8
0
G3
10
9
0
然后将 G6 和 G7 合并成 G8,最后将 G8 和 G3 合并成 G9,五个样品聚为一类。
所以, Z ~ N p (μ,c'cΣ) ,其中 c = (c1,", cn )' 成立。
三、简答题
1. 最短距离法为类 Gi 与 G j 之间的距离为两类最近样品的距离;最长距离法为类 Gi
与 G j 之间的距离为两类最远样品的距离;中间距离法用介于最长与最短两者之间
的距离;重心法定义类间距离为两类重心(各类样品的均值)的距离;类平均法定
X
(2
2
)
"
X
(2
q
)

是两个相互关联的随机向
量,分别在两组变量中选取若干有代表性的综合变量 Ui、Vi,使得每一个综合变量
是原变量的线性组合,即
Ui
=
a1(i ) x1(i )
+ a2(i)x2(i)
+
"
+
a
(i
p
)
x
(i
p
)

Vi = b1(i)x1(i) + b2(i)x2(i) + " + bp(i)x(pi) 。在 D(a(1)′ X (1) ) = D(b(1)′ X (2) ) = 1 的条件下,
多元统计分析 试卷 B(答案)
一、判断并改错 对;对;对;对;错(典型相关分析是研究两组变量之间相关关系的一种多元统计方法。)
二、解: 1)
∑ ∑ ( ) ∑ ( ) ∑ ∑ ( ) E Z =
E⎜⎛ n ⎝ i=0
ci
X
(i
)
⎟⎞ ⎠
=
n i=0
E
ci X(i)
n
= ci E X(i)
i=0
n
n
= ci μ = μ ci = μ
因素 A 和列因素 B 的基本分析特征和它们的最优联立表示。基本思想为通过列联
表的转换,使得因素 A 和列因素 B 具有对等性,这样就可以用相同的因子轴同时
描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同
坐标轴的因子平面上,直观地描述两个因素 A 和因素 B 以及各个水平之间的相关
使得 ρ (a(1)′ X (1) , b(1)′ X (2) ) 达到最大, a(1)′ X (1) 、 b(1)′ X (2) 是 X (1) 、 X (2) 的第一对
典型相关变量。可以类似的求出各对之间互不相关的第二对、第三对等典型相关变
相关文档
最新文档