期末试卷应用多元统计分析A卷

合集下载

多元统计学多元统计分析试题(A卷)(答案)

多元统计学多元统计分析试题(A卷)(答案)

《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。

3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。

4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。

5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L =6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。

7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。

8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

一、填空题(每空2分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。

把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。

多元统计考题A卷

多元统计考题A卷
4
1.6
5.2
800
5
0.9
4.2
813
6
1.7
3.8
812
7
2.1
1.1
862
8
2.5
4.5
765
9
2.0
2.7
820
五、(15分)
设有5个产品,每个只测量了一个指标,得数据如下:1,2,4.5,6,8试用欧式距离和最短距离法将它们进行分类,并画出系统聚类图。
六、(15分)
设 与 有相关关系,其8组观测数据见下表。
4.设 来自于A1,A2,…Ag总体,按贝叶斯准则建立多总体判别模型即是要求,其 k=1,2,…,g。
5.聚类分析分Q型和R型聚类,当需要研究变量与变量之间关系时,一般使用,常用统计量作为分类依据。
二、(10分)
设 是 维随机向量, , ,其中 为非零向量,
证明:
三、(10分)
设有 组样本观测值数据
其中, 表示第 次试验或第 个样本关于变量 的观测值,证明:
四、(15分)
某钻探区钻了9口探井,下表列出了这9口井的横坐标 、纵坐标 以及某含油层顶面的海拔高程 。含油层海拔高度的单位是米。试求其一次趋势面方程。
序号
横坐标,
纵坐标,
海拔高程,
1
0.6
1.7
873
2
1.4
6.2
793
3
0.3
6.1
870
序号
1
38
47.5
23
66.0
2
41
21.3
17
43.0
3
34
36.5
21
36.0
4

期末试卷应用多元统计分析A卷

期末试卷应用多元统计分析A卷

浙江农林大学 2015 - 2016 学年第 二 学期考试卷(A 卷)课程名称: 多元统计分析 课程类别: 专业必修课 考试方式闭卷注意事项:1、本试卷满分100分.2、考试时间 120分钟.一、填空题(每空3分,共30分)1. 因子分析的内容非常丰富,常用的因子分析类型是 和Q 因 子分析.2. 是将R 型因子分析Q 型因子分析结合起来进行的统计分析方法.3. 总体方差未知的情况下,采用总体方差用 来进行估计.4. 设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫⎝⎛=∑200031014,则1X 与2X (是否独立).5. 因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 .6. 设随机向量123(,,)X X X X '=,均值向量(125)μ'=,协方差矩阵4202920216⎛⎫⎪∑=- ⎪ ⎪-⎝⎭,则1X 的期望1()E X = ,12(,)Cov X X = ,13(,)X X ρ= .7. 因子分析中因子载荷系数ij a 的统计意义是: .学院: 专业班级: 姓名: 学号:装 订 线 内 不 要 答 题二、简答题(每小题9分,共18分)2.什么是相应分析?它与因子分析有何关系?三、实验题(每空4分,共32分)1.某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销.根据这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数进行判别分析,所得分析结果如下:根据分析结果给出三个分类各自贝叶斯判别函数:(1) ; (2);(3) ;(4 )现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,判别该饮料属于 销售情况.2. 根据我国2003年各地区农村居民家庭平均每人主要食品消费量,利用主成分方法对数据进行分析结果如下:根据分析结果,(1)根据特征值大于1的标准,需要提取 个主成分; (2)前两个主成分的累计贡献率为 ;(3)写出第一主成分表达式 ; (4)第一主成分和2X 的因子载荷为 .特征根和方差贡献率表表6.5 因子载荷阵3.四、操作题(共18分)为研究两类地理环境问题,选定4个指标X1、X2、X3、X4,序号1-10的样品的地理情况已分成2类,13-15的待定(下表前6列为原始数据)。

多元统计分析期末试题及标准答案

多元统计分析期末试题及标准答案

多元统计分析期末试题及答案————————————————————————————————作者:————————————————————————————————日期:22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑L 、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

应用多元统计分析A卷试题

应用多元统计分析A卷试题
3.因子分析把每个原始变量分解为两部分因素:一部分为_____________,另一部分为_______________。
4.R型因子分析是指对_____________进行分析,Q型因子分析是指对_____________进行分析。
得分
二、简述(10分×2)
1.比较主成分分析与因子分析的异同点。
2.简述聚类分析的基本思想
3)写出因子得分函数
4)解释因子的含义,并进行适当分析
3.250
54.159
54.159
2
1.255
20.910
75.069
1.255
20.910
75.069
3
.732
12.204
87.272
4
.465
7.748
95.021
5
.235
3.916
98.937
6
.064
1.063
100.000
提取方法:主成份分析。
成份得分系数矩阵
成份
1
2
体重
-.242
.342
得分
一、填空(2分×15)
1.常见的统计图有___________,___________,___________,___________以及___________。
2.系统聚类分析方法有___________,___________,___________,___________,___________和___________。
腰围
-.265
.285
脉搏
.127
-.461
单杠
.239
.244
仰卧起坐
.270
.238
跳高

华东师范大学期中期末试卷多元统计分析标准答案A2013

华东师范大学期中期末试卷多元统计分析标准答案A2013

华东师范大学期末试卷(A)标准答案2012----2013学年第二学期课程名称: 多元统计分析学生姓名: ______________________ 学 号: ________________ 专 业: ______________________ 年级/班级: _______________ 课程性质:专业必修一、选择题(每题2分,共20分). 1. D2. D3. A.4. C.5. C.6. B.7. C8. B.9. D.10. C二、填空题(每空2分,共20分)1. 1/211/()(,)()(,)()V a r X C O V X Y V a r Y C O V Y X V a r X --- 1/211()(,)()(,)()V a r Y C O V Y X V a r XC O V X Y V a r Y --- 2. 1211,,T T n n X X Y Y n nττ∑=∑= 1(,),T n C o v X Y X Y n τ=3. 1(),T j j j u h X EX λ=-(),T j j v h X EX =-4. 11((),,),T T p n W rk A M AM A J μμ--∑ΩΩ=∑=∑ 11((),,),()()T T p n n n W n rk A M I A M I A J μμ---∑ΩΩ=∑-=∑-5. 设A 和B 是两个互不相交的集合,集合{(,):,}A B x y x A y B ⨯=∈∈称为笛卡尔积,非空集合{(,):,}R A B x y x A y B ⊂⨯=∈∈称为一种关系,如果存在(,)x y A B ∈⨯使得(,)x y R ∈,那么称A 和B 有关联。

设A 和B 是两个互不相交的集合,集合()R A 和()R B 分别由A 和B 唯一确定,如果()()R A R B ⊂ 那么称A 和B 相干。

三、改错题(每题2分,共20分)1. 12.10 0.00 5.68 0.00 B;→12.10 0.00 5.68 0.00 B;2.set ds511-d511test;→set ds511-d511test;3.class x1-x&m;→Var x1-x&m;4. proc means out=bbb000 noprint;→proc means data=bbb000 noprint;5. AAA=c*ginv(c`*c)*c`-j(nrow(c),ncol(c),1)/nrow(c);→AAA=c*ginv(c`*c)*c`-j(nrow(c),ncol(c),1)/nrow(c);6.print www1 mvvvvvv1 mvvvvv1, mu1 www2 mvvvvvv2 mvvvvv2 mu2; →print www1 mvvvvvv1 mvvvvv1 mu1 www2 mvvvvvv2 mvvvvv2 mu2;7. if test=&jjj then call symput('&ttt',ttt);→if test=&jjj then call symput('&ttt',ttt);8. data zzz set zzz ccc;→data zzz set zzz ccc;9. gua=&col3;→gua=col3;10. proc sort; var rf;→proc sort; var rf;四、编程题(每题10分,共40分)1. proc cancorr data=a out=b;var y1-y5;with x1-x5;proc print; run;2. proc anova data=a outstat=b;Class x1-x5;Model y1-y3= x1-x5;Proc print;Run;3. proc corresp data=a out=b;var x1-x5;id y;proc print;run;4.proc cluster data=a out=x;var x1-x5;id name;proc tree n=3 data=x out=b;proc print;run;。

(完整word版)多元统计分析期末试卷

(完整word版)多元统计分析期末试卷

一、(本大题共2小题,每题5分,共10分)1、设),(~3∑μN X ,其中⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑-==221231111,)'1,3,2(,)',,(321μX X X X ,试求32123X X X +-的分布。

2、设三个总体321,G G G 和的分布分别为:)1,3()2,0(),5.0,2(222N N N 和。

试按马氏距离判别准则判别x =2.5应判归哪一类?二、(本题10分)设'1233(,,)~(,)X X X X N μ=∑,其中)10(111,)',,(321<<⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑=ρρρρρρρμμμμ,1342A ⎛⎫= ⎪⎝⎭,14d ⎛⎫= ⎪⎝⎭ (1) 试求(1)AX d +的分布,(1)12()'X X X =(2) 试求3X 的分布。

三、(本题10分)已知5个样品的观测值为:1,4,5,7,11.试用按类平均法对5个样品进行分类。

四、(本题10分)设有两个正态总体21G G 和,已知(m=2)⎥⎦⎤⎢⎣⎡=∑=∑⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=32121218,2520,151021)1()1(μμ ,先验概率21q q =,而,10)12(=L 75)21(=L 。

试问按贝叶斯判别准则样品⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=2015,2020)2()1(X X 各应判归哪一类?五、(本题10分)假定人体尺寸有这样的一般规律:身高(1X ),胸围(2X )和上半臂围(3X )的平均尺寸比例是6:4:1。

假定),,1()(n X =αα为来自总体)',,(321X X X X =的随机样本,并设),(~3∑μN X 。

试利用下表中数据来检验其身高、胸围和上半臂围这三个尺寸是否符合这一规律。

(94.6)4,2(,05.005.0==F α)六、(本题10分)设随机变量)',,(321X X X X =的协方差阵为⎪⎪⎪⎭⎫⎝⎛--=∑200052021,试求X 的主成分及主成分对变量i X 的贡献率)3,2,1(=i i ν。

多元统计分析试题(A卷)(答案)

多元统计分析试题(A卷)(答案)

多元统计分析试题(A卷)(答案)《多元统计分析》试卷一、填空题(每空2分,共40分)1、若且相互独立,则样本均值向量X服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。

3、判别分析是判别样品的一种统计方法,常用的判别方法有___、、、。

4、Q型聚类是指对_进行聚类,R型聚类是指对进行聚类。

'5、设样品,总体X~Np(,对样品进行分类常用的距离有:明氏距离,马氏距离,兰氏距离6、因子分析中因子载荷系数aij的统计意义是_第i个变量与第j个公因子的相关系数。

7、一元回归的数学模型是:,多元回归的数学模型是:。

8、对应分析是将和结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

二、计算题(每小题10分,共40分)1、设三维随机向量,其中130,问X1与X2是否独立?和X3是否独立?为什么?解:因为,所以X1与X2不独立。

把协差矩阵写成分块矩阵,的协差矩阵为因为,而,所以和X3是不相关的,而正态分布不相关与相互独立是等价的,所以和X3是独立的。

2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。

若样本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。

x1013.55702.54601.53.502x2x3解:样品与样品之间的明氏距离为:D(0)样品最短距离是1,故把X1与X2合并为一类,计算类与类之间距离(最长距离法){x1,x2}03.55701.53.502x3x4得距离阵 D(1)类与类的最短距离是1.5,故把X3与X4合并为一类,计算类与类之间距离(最长距离法)得距离阵D(2){x1,x2}057{x3,x4}x5类与类的最短距离是3.5,故把{X3,X4}与X5合并为一类,计算类与类之间距离(最{x1,x2}07长距离法)得距离阵D(3)分类与聚类图(略)(请你们自己做)3、设变量X1,X2,X3的相关阵为0.631.000.350.35,R的特征值和单位化特征向量分别为TTT(1)取公共因子个数为2,求因子载荷阵A。

厦门大学《应用多元统计分析》试题A

厦门大学《应用多元统计分析》试题A

厦门大学《多元统计分析》试卷A经济学院计统系 级 专业 本科生一、(20%)判断题1、“p 维随机向量1(,...,)p X X X ′=的协差阵及相关阵一定是非负定阵”是否正确,并说明理由。

2、“距离判别是Bayes 判别的一种特例”是否正确,为什么? 二、(15%)设标准化变量12,,3X X X 的协差阵(即相关阵)为1.000.630.450.63 1.000.350.450.35 1.00⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦R , R 的特征值和相应的正则化特征向量分别为:'11'22'331.9633,(0.6250,0.5932,0.5075)0.6795,(0.2186,0.4911,0.8432)0.3572,(0.7494,0.6379,0.1772)l l l λλλ====−−==−− 要求:1)计算因子载荷矩阵A ,并建立因子模型;2)计算公因子的方差贡献,并说明其统计意义。

j F 2(1,2,3j g j =)三、(10%)设三元总体的协方差阵为X 222222200σρσρσσρσρσσ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦Σ,试求总体主成分(0ρ<≤。

四、(15%)金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布),今测得两个总体的若干数据,并由这些数据得到⎟⎟⎠⎞⎜⎜⎝⎛=62ˆ1μ⎟⎟⎠⎞⎜⎜⎝⎛=24ˆ2μ⎟⎟⎠⎞⎜⎜⎝⎛=∑4111ˆ 对某一金融分析员进行判别是否能满足这项工作。

进行测量得到两个指标为,且当两组先验概率分别为)4,5(′=X 269.01=q 与731.02=q ,损失相同。

问该金融分析员满足要求吗?为什么?五、(6%)设是来自的随机样本,,令。

试证明:(1)(),,n X X K ()i i c X (,)p N μΣ00(1,,),1ni ii c i n c=≥==∑L 0ni ==∑Z 1)是Z μ的无偏估计量;2)~,其中。

应用多元统计分析试题及答案

应用多元统计分析试题及答案

一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。

二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。

选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。

被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。

设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。

对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。

要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

3、简述费希尔判别法的基本思想。

从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

多元统计分析期末试题及答案

多元统计分析期末试题及答案

多元统计分析期末试题与答案22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、, ,。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

应用多元统计分析期末试卷

应用多元统计分析期末试卷

应用多元统计分析期末试卷重庆文理学院试卷2011,2012学年第一学期期末考试承担单位: 数学与统计学院课程名称: 《应用多元统计分析》试卷类别: 考试形式:开卷考试时间:14教学周至16教学周适用层次: 本科适用专业: 数学与应用数学(金融方向)2009级1,2班题号一二三四五六七八九十总分得分阅卷须知:阅卷用红色墨水笔书写,小题得分写在相应小题题号前,用正分表示;大题得分登录在对应的分数框内;考试课程应集体阅卷,流水作业.考试说明及要求:《应用多元统计分析》课程采用课程论文的形式对学生进行考试。

要求学生利用所学的多元统计分析的基本方法和参考其它文献资料撰写一篇3000字以上的课程论文。

具体要求如下:一、学生可以选择以下七个方向中的一个或者多种进行写作,学生可以结合实际问题,进行数据的收集(包括自己制作问卷调查表,网上下载数据等),利用以下的七个方向进行写作。

学生亦可自己拟定选题,选题要与所学课程的理论与方法联系紧密,能利用所学的知识研究某一实际问题(10分)。

(1)均值向量的检验;(2)聚类分析;(3)判别分析;(4)主成分分析;(5)因子分析;密封线 (6)对应分析和频数分析;(7)典型相关分析。

二、只写中文摘要。

摘要能简明扼要地阐明研究的内容、方法和主要结论等(5分)。

三、论文结构要合理,层次分明,逻辑性强,重点突出,前后连贯,能形成有机整体(5分)。

四、论文的观点要与论证统一,论据充分严密,数据处理分析方法恰当,模型能通过各种理论检验(25分)。

系(院): 专业: 年级及班级: 姓名: 学号: .错误~未定义“自动图文集”词条。

《应用多元统计分析》考试形式:开卷五、论文的观点和材料要统一,数据要真实可靠(表明出处),数据与所研究的问题要一致,数据要能满足建模的要求,模型的结果能够支撑所论述的观点(25分)。

六、论文能充分体现对所学课程知识的综合运用能力。

理论方法上不能有知识性错误(25分)。

应用多元统计分析试题及答案.doc

应用多元统计分析试题及答案.doc

一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若()(,), Px N αμα∑:=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。

二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。

选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。

被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。

设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。

对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。

要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

3、简述费希尔判别法的基本思想。

从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浙江农林大学 2015 - 2016 学年第 二 学期考试卷(A 卷)
课程名称: 多元统计分析 课程类别: 专业必修课 考试方式闭卷
注意事项:1、本试卷满分100分.
2、考试时间 120分钟.
一、填空题(每空3分,共30分)
1. 因子分析的内容非常丰富,常用的因子分析类型是 和Q 因 子分析.
2. 是将R 型因子分析Q 型因子分析结合起来进行的统计分析方法.
3. 总体方差未知的情况下,采用总体方差用 来进行估计.
4. 设三维随机向量),(~3∑μN X ,其中⎪⎪⎪


⎝⎛=∑200031014,则1X 与2X (是否独立).
5. 因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 .
6. 设随机向量123(,,)X X X X '=,均值向量(125)μ'=,协方差矩阵4202920216⎛⎫

∑=- ⎪ ⎪-⎝⎭

则1X 的期望1()E X = ,12(,)Cov X X = ,
13(,)X X ρ= .
7. 因子分析中因子载荷系数ij a 的统计意义是: .
学院: 专业班级: 姓名: 学号:
装 订 线 内 不 要 答 题
二、简答题(每小题9分,共18分)
2.什么是相应分析?它与因子分析有何关系?
三、实验题(每空4分,共32分)
1.某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平
销.根据这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数进行判别分析,所得分析结果如下:
根据分析结果给出三个分类各自贝叶斯判别函数:
(1) ; (2)

(3) ;
(4 )现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,判别该饮料属于 销售情况.
2. 根据我国2003年各地区农村居民家庭平均每人主要食品消费量,利用主成分方法对
数据进行分析结果如下:
根据分析结果,(1)根据特征值大于1的标准,需要提取 个主成分; (2)前两个主成分的累计贡献率为 ;
(3)写出第一主成分表达式 ; (4)第一主成分和2X 的因子载荷为 .
特征根和方差贡献率表
表6.5 因子载荷阵
3.四、操作题(共18分)
为研究两类地理环境问题,选定4个指标X1、X2、X3、X4,序号1-10的样品的地理情况已分成2类,13-15的待定(下表前6列为原始数据)。

(1)写出判别分析的基本思想(5分)
2)在刚进入判别分析界面时,请完成以下操作(填空)(8分):
将选入Grouping Variable框中,并点击Define Range,在跳出的界面中Minimum框中填写,在Maximum框中填写;将选入Independents框中。

(每空2分,共4×2=8分)
(3)最后输出的Descriminant Scores列在上表的第7列,请在表的最后1列的最后2行空格处填上序号11-12样品的预测分类号,并说明其中的原因(5分)。

答:
1.检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,
11. 试用最短距离法或重心法进行聚类分析.
2.设有两个二元总体1G 和2G ,从中分别抽取样本计算得到 (1)
51X
⎛⎫
= ⎪⎝⎭
,(2)32X ⎛⎫= ⎪-⎝⎭,
5.8 2.1ˆ 2.17.6p ⎛⎫∑= ⎪
⎝⎭
,假设12∑=∑,试用距离判别法建立判别函数和判别规则. 样品X =(6,0)’应属于哪个总体?
1.系统聚类分析的方法很多,其中的五种分别为最长距离法、最短距离法、重心法、类平均法、离差平方和法。

2. 因子分析可以分为确定因子载荷、因子旋转、计算因子得分三个步骤。

3. 变量的类型按尺度划分有
1. 为了研究7种植物A 、B 、C 、D 、E 、F 、G 的分布规律,根据资料做类型划分。

已知各植物两两间距离矩阵如下:
D = ⎥⎥⎥
⎥⎥
⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢
⎢⎢⎢⎣⎡04381721
14
0311********
652310
01924130
2212
110G F E D C B A G F
E D C
B A
试用系统聚类法(类与类采用最短距离法)进行聚类分析:(1)写出从7类最后聚成1类的详细
过程(10分);(2)画出系统聚类图(5分)。

2
2121212121~(,),(,),(,),,
1X N X x x x x x x ρμμμμσρ
⎛⎫
∑==∑=
⎪⎝⎭
+-1、设其中则Cov(,)=____.
10
31
2~(,),1,,10,()()_________i i i i X N i W X X μμμ='
∑=--∑、设则=服从。

()1
2
34
433,4
92,
3216___________________
X x x x R -⎛⎫ ⎪'==-- ⎪
⎪-⎝⎭
=∑、设随机向量且协方差矩阵则它的相关矩阵
4、
_,
12332313116421(,,)~(,),(1,0,2),441,
2142X x x x N x x x x x μμ-⎛⎫
⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭
-⎛⎫
+ ⎪⎝⎭、设其中试判断与是否独立?
12124122411362190.5,(21),(12)35q q C e C e Bayes X μμ⎛⎫⎛⎫⎛⎫==∑=∑=∑= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭====⎛⎫
= ⎪⎝⎭12、设已知有两正态总体G 与G ,且,,,而其先验概率分别为误判的代价;试用判别法确定样本属于哪一个总体?
(),
123设X=x x x 的相关系数矩阵通过因子分析分解为
211X h =
的共性方差111
X σ
=
的方差21X g =1公因子f 对的贡献
1212111221225(,),(,),100
000010.950()00.95
100
00100T T X X X X Y Y X Z Y Z ⎛⎫
=== ⎪⎝⎭
⎛⎫ ⎪
∑∑⎡⎤ ⎪=∑==⎢⎥ ⎪∑∑⎣⎦ ⎪
⎝⎭、设为标准化向量,令且其协方差阵
V ,求其第一对典型相关变量和它们的典型相关系数?。

相关文档
最新文档