多元统计学多元统计分析试题(A卷)(答案)

合集下载

期末试卷应用多元统计分析A卷

期末试卷应用多元统计分析A卷

浙江农林大学 2015 - 2016 学年第 二 学期考试卷(A 卷)课程名称: 多元统计分析 课程类别: 专业必修课 考试方式闭卷注意事项:1、本试卷满分100分.2、考试时间 120分钟.一、填空题(每空3分,共30分)1. 因子分析的内容非常丰富,常用的因子分析类型是 和Q 因 子分析.2. 是将R 型因子分析Q 型因子分析结合起来进行的统计分析方法.3. 总体方差未知的情况下,采用总体方差用 来进行估计.4. 设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫⎝⎛=∑200031014,则1X 与2X (是否独立).5. 因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 .6. 设随机向量123(,,)X X X X '=,均值向量(125)μ'=,协方差矩阵4202920216⎛⎫⎪∑=- ⎪ ⎪-⎝⎭,则1X 的期望1()E X = ,12(,)Cov X X = ,13(,)X X ρ= .7. 因子分析中因子载荷系数ij a 的统计意义是: .学院: 专业班级: 姓名: 学号:装 订 线 内 不 要 答 题二、简答题(每小题9分,共18分)2.什么是相应分析?它与因子分析有何关系?三、实验题(每空4分,共32分)1.某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销.根据这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数进行判别分析,所得分析结果如下:根据分析结果给出三个分类各自贝叶斯判别函数:(1) ; (2);(3) ;(4 )现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,判别该饮料属于 销售情况.2. 根据我国2003年各地区农村居民家庭平均每人主要食品消费量,利用主成分方法对数据进行分析结果如下:根据分析结果,(1)根据特征值大于1的标准,需要提取 个主成分; (2)前两个主成分的累计贡献率为 ;(3)写出第一主成分表达式 ; (4)第一主成分和2X 的因子载荷为 .特征根和方差贡献率表表6.5 因子载荷阵3.四、操作题(共18分)为研究两类地理环境问题,选定4个指标X1、X2、X3、X4,序号1-10的样品的地理情况已分成2类,13-15的待定(下表前6列为原始数据)。

厦门大学《应用多元统计分析》试题A答案

厦门大学《应用多元统计分析》试题A答案
多元统计分析 试卷A(答案)
一、判断题 1. 正确
( ) 证明: ∀c = c1, c2 ,"cp ,
∑∑ c′∑c =
cic jσ ij
ji
= ∑∑cic j [E(Xi − E(Xi ))(Xj − E(Xj ))]
ji
= E⎢⎡∑c j (Xi − E(Xi ))∑ci (Xj − (E Xj ))⎥⎤
=
(n
−1)[
(n −1) p
n(X − μ0 )′S−1
n(X − μ0 )]
八、
( ) ( ) 在典型相关分析中 X (1) =
X
(1)
1
,
X
(1)
2
"
X
(1)
p


X
(2)
=
X 1(2 ) ,
X
(2
2
)
"
X
(2
q
)


两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量 Ui、Vi,使
计算共因子的方差贡献得:
g12
=
λ1
= 1.9633;
g
2 2
=
0.6795;
g 32
=
0.3572 ,分别为公共因子
F1, F2 ,
F
对X
的贡
献,是衡量每个公共因子的相对重要性的尺度。
三、解:先求三元总体 X 的协方差阵 ∑ 的特征根,
σ2 −λ ∑ −λE = ρσ 2
0
ρσ 2 σ2 −λ
ρσ 2
−00.7.6439749⎟⎟⎞⎜⎜⎜⎛ 1.9633 − 0.1772⎟⎠⎜⎜⎝ 0.4479 ⎟⎞ − 0.3812⎟ − 0.1059⎟⎠

多元统计分析题

多元统计分析题

多元统计分析题多元统计分析模拟试题(两套:每套含填空、判断各⼆⼗道)A卷1)判别分析常⽤的判别⽅法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法。

2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。

3)主成分分析中可以利⽤协⽅差矩阵和相关矩阵求解主成分。

4)因⼦分析中对于因⼦载荷的求解最常⽤的⽅法是主成分法、主轴因⼦法、极⼤似然法5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析6)分组数据的Logistic回归存在异⽅差性,需要采⽤加权最⼩⼆乘估计7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为=8)最短距离法适⽤于条形的类,最长距离法适⽤于椭圆形的类。

9)主成分分析是利⽤降维的思想,在损失很少的信息前提下,把多个指标转化为⼏个综合指标的多元统计⽅法。

10)在进⾏主成分分析时,我们认为所取的m(m分的累积贡献率达到85%以上⽐较合适。

11)聚类分析的⽬的在于使类内对象的同质性最⼤化和类间对象的异质性最⼤化12)是随机变量,并且有,那么服从(卡⽅)分布。

13)在对数线性模型中,要先将概率取对数,再分解处理,公式:14)将每个原始变量分解为两部分因素,⼀部分是由所有变量共同具有的少数⼏个公共因⼦组成的,另⼀部分是每个变量独⾃具有的因素,即特殊因⼦15)判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须⾄少⼀个以上,解释变量必须是可测量的16)当被解释变量是属性变量⽽解释变量是度量变量时判别分析是合适的统计分析⽅法17)多元正态分布是⼀元正态分布的推⼴18)多元分析的主要理论都是建⽴在多元正态总体基础上的,多元正态分布是多元分析的基础19)因⼦分析中,把变量表⽰成各因⼦的线性组合,⽽主成分分析中,把主成分表⽰成各变量的线性组合。

20)统计距离包括欧⽒距离和马⽒距离两类1)因⼦负荷量是指因⼦结构中原始变量与因⼦分析时抽取出的公共因⼦的相关程度。

(√)(p147)2)主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计⽅法。

多元统计考题A卷

多元统计考题A卷
4
1.6
5.2
800
5
0.9
4.2
813
6
1.7
3.8
812
7
2.1
1.1
862
8
2.5
4.5
765
9
2.0
2.7
820
五、(15分)
设有5个产品,每个只测量了一个指标,得数据如下:1,2,4.5,6,8试用欧式距离和最短距离法将它们进行分类,并画出系统聚类图。
六、(15分)
设 与 有相关关系,其8组观测数据见下表。
4.设 来自于A1,A2,…Ag总体,按贝叶斯准则建立多总体判别模型即是要求,其 k=1,2,…,g。
5.聚类分析分Q型和R型聚类,当需要研究变量与变量之间关系时,一般使用,常用统计量作为分类依据。
二、(10分)
设 是 维随机向量, , ,其中 为非零向量,
证明:
三、(10分)
设有 组样本观测值数据
其中, 表示第 次试验或第 个样本关于变量 的观测值,证明:
四、(15分)
某钻探区钻了9口探井,下表列出了这9口井的横坐标 、纵坐标 以及某含油层顶面的海拔高程 。含油层海拔高度的单位是米。试求其一次趋势面方程。
序号
横坐标,
纵坐标,
海拔高程,
1
0.6
1.7
873
2
1.4
6.2
793
3
0.3
6.1
870
序号
1
38
47.5
23
66.0
2
41
21.3
17
43.0
3
34
36.5
21
36.0
4

多元统计学多元统计分析试题(A卷)(答案)

多元统计学多元统计分析试题(A卷)(答案)

《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。

3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。

4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。

5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L =6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。

7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。

8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

一、填空题(每空2分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。

把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。

应用多元统计分析A卷答案

应用多元统计分析A卷答案

1.常见的统计图有直方图,轮廓图,雷达图,调和曲线图以及散点图。

2.系统聚类分析方法有最短距离法,最长距离法,中间距离法,重心法,类平均法和可变类平均法。

3.因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

4.R 型因子分析是指对变量进行分析,Q 型因子分析是指对样品进行分析。

二、简述( 10 分×2) 1.比较主成分分析与因子分析的异同点。

主成分分析与因子分析的相同点:两者都是一种降维,简化数据的技术;两种方法的求解过程是类似的,都是从协方差出发,利用特征值、特征向量求解。

不同点:主成分分析的数学模型本质上是一种线形变换,将原始坐标变换到变异程度最大的方向上,突出数据变异的方向,归纳重要信息。

而因子分析是从现在变量去提取潜在因子的过程。

2.简述聚类分析中系统聚类法的基本思想设有n个样品,每个样品测得m 项指标,系统聚类法的基本思想是:首先定义样品间的距离和类与类之间的距离,初始将样品看n个成n 类,这时类间的距离与样品间的距离是等价的;然后将距离最近的两类合并成为新类,并计算新类与其它类的类间距离,在按最小距离原则并类。

这样每次缩小一类,直到所有的样品都并成一类为止。

三、证明(10 分× 1)设随机向量X 的均值向量、协方差矩阵分别为、试证:E(XX )证明:=V(X) E[( X EX)(X EX)]E(XX ) (EX)(EX)E(XX )四、数据分析( 20分× 2)1.测量20 名学生的生理指标和运动指标共计6 个变量,对这六个变量进行主成分分析输出结果如下:提取方法:主成份。

1)当贡献率超过85% 时应该选取几个主成分。

应该选取 3 个主成分2)写出第一、第二主成分表达式Z1 0.242 X1 0.265X2 0.127X 3 0.239X4 0.27X 5 0.182X6Z2 0.342X1 0.285X 2 0.461X3 0.244X 4 0.238X 5 0.519X63)第一到第三主成分的方差分别是多少3.25,1.255,0.7324)进行适当的主成分分析通过分析可以看出,第一主成分代表的是先天的身体素质,第二主成分代表的是运动指标2.在某年级44 名学生的期末考试中,有的课程采用闭卷,有的课程采用开卷,对数据进行了因子分析,输出结果如下:Eigenvalues of the Correlation Matrix: Total = 5 Average = 1Eigenvalue Difference Proportion Cumulative1 2.61195302 1.539887240.52240.52242 1.072065780.502619810.21440.736830.569445970.133506180.11390.850740.435939800.125344370.08720.937950.310595420.0621 1.0000Factor PatternFactor1 Factor2 Factor3x1 力学(闭)0.62491 0.58706 0.46831x2物理(闭)0.670150.44046-0.58552x3代数(开)0.84837-0.021560.07721x4几何(开)0.80568-0.261710.03545x5统计(开)0.63520-0.681520.00893 Rotated Factor PatternFactor1Factor2x1力学(闭)0.054880.85565x2物理(闭)0.188110.77957x3代数(开)0.633990.56414x4几何(开)0.766980.35967x5统计(开)0.92948-0.06329Standardized Scoring CoefficientsFactor1Factor2x1力学(闭)0.239250.54760x2物理(闭)0.256570.41085x3代数(开)0.32480-0.02011x4几何(开)0.30846-0.24411x5统计(开)0.24319-0.635701)初次进行因子分析时,贡献率不超过85% ,应该选取几个因子?选取 2 个因子2)试结合输出结果解释为何进行因子旋转,并说明因子旋转的效果。

多元统计分析试题(A卷)(答案)

多元统计分析试题(A卷)(答案)

多元统计分析试题(A卷)(答案)《多元统计分析》试卷一、填空题(每空2分,共40分)1、若且相互独立,则样本均值向量X服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。

3、判别分析是判别样品的一种统计方法,常用的判别方法有___、、、。

4、Q型聚类是指对_进行聚类,R型聚类是指对进行聚类。

'5、设样品,总体X~Np(,对样品进行分类常用的距离有:明氏距离,马氏距离,兰氏距离6、因子分析中因子载荷系数aij的统计意义是_第i个变量与第j个公因子的相关系数。

7、一元回归的数学模型是:,多元回归的数学模型是:。

8、对应分析是将和结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

二、计算题(每小题10分,共40分)1、设三维随机向量,其中130,问X1与X2是否独立?和X3是否独立?为什么?解:因为,所以X1与X2不独立。

把协差矩阵写成分块矩阵,的协差矩阵为因为,而,所以和X3是不相关的,而正态分布不相关与相互独立是等价的,所以和X3是独立的。

2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。

若样本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。

x1013.55702.54601.53.502x2x3解:样品与样品之间的明氏距离为:D(0)样品最短距离是1,故把X1与X2合并为一类,计算类与类之间距离(最长距离法){x1,x2}03.55701.53.502x3x4得距离阵 D(1)类与类的最短距离是1.5,故把X3与X4合并为一类,计算类与类之间距离(最长距离法)得距离阵D(2){x1,x2}057{x3,x4}x5类与类的最短距离是3.5,故把{X3,X4}与X5合并为一类,计算类与类之间距离(最{x1,x2}07长距离法)得距离阵D(3)分类与聚类图(略)(请你们自己做)3、设变量X1,X2,X3的相关阵为0.631.000.350.35,R的特征值和单位化特征向量分别为TTT(1)取公共因子个数为2,求因子载荷阵A。

多元统计分析(A)

多元统计分析(A)

2010-2011学年第一学期信息与计算专业《多元统计分析》(课程)试卷一、计算(每小题8+10+6分,共24分)1、(共2+6=8分)设X ~),(3∑μN ,其中),,(321'=X X X X ,)2,0,1('=μ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑221241111试求:1)计算1X 和2X 的相关系数2) ⎪⎪⎭⎫⎝⎛++=⎪⎪⎭⎫ ⎝⎛=322121X X X X Y Y Y 的分布。

2、(共5+5=10分)、设一个容量为n=4的随机样本取自二维正态总体),(2∑μN ,其数据矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=4031-2231-X , 1)计算样本均值x ,样本自方差2S2). 对]2,2[='μ计算统计量2T 的值,并将其变为F 统计量,同时在显著水平为0.05下检验0μμ=。

(19)05.0(,5.199)05.0(2,21,2==F F )3、(共6分)已知五个样品的之间的距离矩阵如下:D=⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡082101109360730605432154321 类间距采用最长距离法,将五个对象分为3类。

二、简答(每小题5分,共20分)1、马氏距离相对欧式距离有什么优点。

2、快速聚类分析的步骤。

3、主成分分析和因子分析的区别。

4、简述典型相关分析模型(用数学形式表示,并解释每个符号的意义)。

三、(每小题6+4+4分,共14分) 为了为了考虑鸡的头(X)和腿(Y)的关系,头观察了两个指标颅骨宽(X1)和颅骨长(X2),腿观察了股骨长(Y1)和胫骨长(Y2),利用spss得到以下结果:Canonical Correlations(表一)1 .6312 .057Raw Canonical Coefficients for Set-1(表二)V1 V2X1 0.781 -.856X2 0.345 1.106Raw Canonical Coefficients for Set-2(表三)W1 W2Y1 0.060 -2.648Y2 0.944 2.475Canonical StructureCorrelations Between the set-1 Variables and Their Canonical Variables(表四)V1 V2X1 0.9548 -0.2974X2 0.7388 0.6739Correlations Between the set-2 Variables and Their Canonical Variables(表五)W1 W2Y1 0.9343 -0.3564Y2 0.9997 0.0227Correlations Between the set-1 Variables and the Canonical Variables of the set-2 Variables(表六)W1 W2X1 0.6025 -0.0169X2 0.4663 0.0383Correlations Between the set-2 Variables and the Canonical Variables of the VAR Variables(表七)V1 V2Y1 0.5897 -0.0202Y4 0.6309 0.0013根据上面结果,试回答以下问题:1、这两组经济变量间的典型相关系数分别是多少,并写出相应的典型相关变量。

多元统计分析试卷(a)答案

多元统计分析试卷(a)答案

1. 设随机向量 X = ( X , X , X )' ,且其协方差阵为 ∑ = -49 -2 ⎪ ,则它的相关 3 -2 16⎪⎭ 1 - 2 矩阵 R = - 1 - 1 ⎪ 。

1 ⎪  3(α) ~ N ( μ, ∑),( α = 1,2, n) 且相互独立,样本均值向量为 X ,样本离差阵为n - 1 B ⎢11 0⎥ 22 0⎥ D = C D ⎢13 24 19 0⎥- X )' , 则 X ~N (μ , 1 ∑) , L ~ W (n - 1,∑) 。

L =∑( X- X )( X5. 设三维随机向量 X ~ N (μ , ∑) ,其中 ∑ = 1 3 0 ⎪ ,则 X 与 X 不独立 ; 0 0 2 ⎪⎢ A 0⎥ 11 0⎥ 12 22 0 ⎥C (0) =⎢解:样品与样品之间的明氏距离为: D ⎢ E 10 23 5 6 0 ⎥ ⎭n⎣ ⎦学 号精品文档东 北 大 学 秦 皇 岛 分 校课程名称: 多元统计分析 试卷类型: A 答案 考试形式:闭卷授课专业: 信科、应数、统计 考试日期: 2013 年 7 月 9 日 试卷:共 3 页( X , X )' 和 X 独立(填独立或不独立)。

1 2 36. 变量的类型按尺度划分有间隔尺度 、有序尺度 、名义尺度 。

二、判断题(每小题 3 分,共 15 分) 1. [×] 因子载荷矩阵 A 是对称阵。

2. [×] 方差分析是检验多个正态总体的方差或协方差阵是否相等的统计分析方法。

班 级题号得分阅卷人一 二 三 四 总分3. [√] 聚类分析中快速聚类法指的就是 k -均值法。

4. [√] 判别分析中,“留一个观测在外”的原则是指在交叉验证时,某个观测不参与估计判别函数,但要根据除这个观测以外的其他观测估计的判别函数来预测该观测的所属类,从而使这个 观测得到验证。

姓 名装订线内不要答题装订线一、填空题:(每空 2 分,共 32 分)⎛ 4 -4 3 ⎫ ⎪ 1 2 3 ⎝⎛ 3 ⎫3 8 ⎪2 3 6 ⎪⎝ 8 - 61 ⎪⎪2. 系统聚类分析的方法很多,其中的五种分别为最长距离法、最短距离法、重心法、类 平均法、离差平方和法。

多元统计分析试题及答案

多元统计分析试题及答案

多元统计分析试题及答案华南农业⼤学期末试卷(A 卷)2006学年第2学期考试科⽬:多元统计分析考试类型:(闭卷)考试时间:120 分钟⼀、填空题(5×6=30)22121212121~(,),(,),(,),,1X N X x x x x x x ρµµµµσρ∑==∑=+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________iiii XN i W XXµµµ='∑=--∑ 、设则=服从。

()1234433,492,3216___________________X x x x R -?? ?'==-- ? ?-?=∑、设随机向量且协⽅差矩阵则它的相关矩阵________________。

(),123设X=xx x 的相关系数矩阵通过因⼦分析分解为211X h =的共性⽅差111X σ=的⽅差21X g =1公因⼦f 对的贡献121330.9340.1280.9340.4170.8351100.4170.8940.027 0.8940.44730.8350.4470.1032013R ?-?-=-=-+5,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N TX A X µµµµ-=∑∑'=-- 、设是来⾃多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

⼆、计算题(5×11=50)12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x µµ-??'=∑=-∑=-- --??+、设其中试判断与是否独⽴?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.62103.17237.14.5X S µ--'=-?? ?==-- ? 0、对某地区农村的名周岁男婴的⾝⾼、胸围、上半臂围进⾏测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

(完整)多元统计分析期末试题及答案,推荐文档.docx

(完整)多元统计分析期末试题及答案,推荐文档.docx

1 、设 X ~ N2 ( ,), 其中 X( x1 , x 2 ),( 1 ,212 ),,1则 Cov( x1x 2 , x1x 2 )=____.102、设X i ~N 3 (,), i 1, L,10,则 W =( X i)( X i)i 1服从_________。

4433、设随机向量X x1x2x3, 且协方差矩阵 4 9 2 ,3 2 16则它的相关矩阵R___________________4、设 X= x1x2x3,的相关系数矩阵通过因子分析分解为112330.93400.1280.4171R100.4170.9340.83530.8940.8940.027 0.83500.4472010.4470.10332__________,__________,X1的共性方差 h1X1的方差11公因子 f 1对 X的贡献 g12________________。

5、设 X i , i 1,L ,16 是来自多元正态总体N p (, ), X 和 A分别为正态总体N p ( ,)的样本均值和样本离差矩阵 , 则T 215[4( X)] A 1[4( X)] ~ ___________。

1642、设( x1 , x2 , x3) ~ N3(, ),其中(1,0, 2) ,44 1 ,1X214试判断 x12 x3与x2x3是否独立?x12、对某地区农村的 6 名 2 周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下 , 根据以往资料 , 该地区城市 2周岁男婴的这三个指标的均值0(90,58,16), 现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

82.0 4.310714.62108.9464其中 X60.2 ,(5 S ) 1( 115.6924)114.6210 3.17237. 376014.58.946437.376035.5936 (0.01,F 0.01 (3, 2)99.2, F 0.01 (3,3)29.5,F0.01 (3, 4)16.7)、设已知有两正态总体G与 G,且12,24,1211,3126219而其先验概率分别为q1q20.5,误判的代价C (2 1)4;e ,C(1 2)e试用判别法确定样本X 3属于哪一个总体?Bayes514、设X( X1 , X2 , X3 , X4 )T,协方差阵1~ N (0, ),0111(1)试从Σ出发求 X 的第一总体主成分;(2)试问当取多大时才能使第一主成分的贡献率达95%以上。

多元统计分析试题

多元统计分析试题

多元统计分析试题及答案一、选择题1. 以下哪一项不是多元统计分析的基本方法?A. 主成分分析B. 聚类分析C. 方差分析D. 因子分析答案:C2. 在多元统计分析中,协方差阵和相关阵的关系是:A. 相关系数是协方差阵的标准化形式B. 协方差阵是相关阵的平方C. 相关系数是协方差阵的平方根D. 协方差阵和相关阵是等价的答案:A3. 在因子分析中,以下哪个指标用于衡量变量间的共同性?A. 提取载荷B. 特征值C. 累计贡献率D. 共同度答案:D4. 聚类分析中,以下哪种方法属于层次聚类法?A. K-means 聚类B. 动态聚类C. 系统聚类D. 密度聚类答案:C二、填空题1. 多元统计分析中的“多元”指的是______。

答案:多个变量2. 主成分分析的目的是将多个变量______,以减少数据的维度。

答案:线性组合3. 在多元正态分布中,若随机变量X和Y独立,则它们的协方差______。

答案:为04. 聚类分析中,类内平方和与类间平方和的比值越大,说明聚类效果______。

答案:越好三、简答题1. 简述主成分分析的基本思想。

答案:主成分分析的基本思想是通过线性变换,将原始变量组合成一组新的变量,这组新变量能够尽可能多地反映原始变量中的信息。

具体步骤如下:(1)计算原始变量的协方差阵;(2)求出协方差阵的特征值和特征向量;(3)根据特征值的大小,选取前几个特征值对应的特征向量,作为主成分;(4)将原始变量表示为新变量的线性组合。

2. 简述因子分析的基本步骤。

答案:因子分析的基本步骤如下:(1)计算变量间的相关阵或协方差阵;(2)求出相关阵的特征值和特征向量;(3)根据特征值的大小,选取前几个特征值对应的特征向量,作为因子;(4)计算因子载荷矩阵;(5)对因子进行命名和解释;(6)计算因子得分,用于进一步的分析。

3. 简述聚类分析中的层次聚类法。

答案:层次聚类法是一种自底向上的聚类方法,其基本思想是将每个样本作为一个初始类,然后根据样本之间的相似度,逐步合并相似度较高的类,直到满足特定的终止条件。

研究生多元统计分析试题(A卷)(答案)

研究生多元统计分析试题(A卷)(答案)

内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。

多元统计复习题答案

多元统计复习题答案

多元统计复习题答案一、单项选择题1. 多元统计分析中,用于描述多个变量之间关系的统计方法是()。

A. 相关分析B. 聚类分析C. 因子分析D. 主成分分析答案:C2. 以下哪个不是多元统计分析中常用的降维方法?()A. 主成分分析B. 因子分析C. 聚类分析D. 典型相关分析答案:C3. 在多元统计分析中,用于识别数据集中的异常值或离群点的统计方法是()。

A. 马氏距离B. 箱线图C. 相关系数D. 卡方检验答案:B二、多项选择题1. 多元统计分析中,以下哪些方法可以用来进行变量选择?()A. 逐步回归B. 岭回归C. 偏最小二乘回归D. 主成分分析答案:A|B|C2. 多元统计分析中,以下哪些方法可以用来进行数据的分类?()A. 判别分析B. 聚类分析C. 因子分析D. 典型相关分析答案:A|B三、判断题1. 多元统计分析中的因子分析可以用于变量的降维。

(对)2. 多元统计分析中的主成分分析和因子分析是完全相同的方法。

(错)3. 多元统计分析中的聚类分析可以用于识别数据集中的异常值。

(错)四、简答题1. 简述多元统计分析中主成分分析(PCA)的主要步骤。

答:主成分分析的主要步骤包括:数据标准化、计算协方差矩阵、求解特征值和特征向量、选择主成分、构造主成分得分。

2. 描述多元统计分析中判别分析的应用场景。

答:判别分析在多元统计分析中主要应用于根据已有的分类变量来预测新样本的分类,例如在医学诊断、市场细分、信用评分等领域。

五、计算题1. 给定一组数据,计算其主成分得分。

答:首先需要对数据进行标准化处理,然后计算协方差矩阵,接着求解特征值和特征向量,最后根据特征值的大小选择前几个主成分,并计算对应的得分。

2. 利用判别分析对一组数据进行分类,并给出分类结果。

答:首先需要确定分类的依据,然后计算各类别的判别函数,接着对新样本进行判别分析,最后根据判别得分将样本分类到相应的类别中。

多元统计分析期末试题(卷)与答案解析

多元统计分析期末试题(卷)与答案解析

22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

(),123设X=x xx 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

(完整版)多元统计分析试题及答案

(完整版)多元统计分析试题及答案

(完整版)多元统计分析试题及答案试题:1. 试解释多元统计分析的含义及其与单变量和双变量统计分析的区别。

2. 简述卡方检验方法及适用场景。

3. 请解释回归分析中的回归系数及其p值的含义及作用,简单说明如何进行回归模型的选择和评估。

4. 试解释主成分分析的原理及目的,如何进行主成分分析及如何解释因子载荷矩阵。

5. 请列举和简要解释聚类分析和判别分析的适用场景,并说明两种方法的区别。

答案:1. 多元统计分析是一种将多个变量进行综合分析的方法。

与单变量和双变量统计分析不同的是,多元统计分析可以处理多个自变量和因变量的组合关系,从而探究它们之间的综合关系。

该方法通常适用于探究多种变量在某个问题中的关系、探究影响某一结果变量的因素、探究各个变量相互作用的影响等。

2. 卡方检验是根据样本数据与期望值的差异来判断观察值与理论预期是否相符,以此来验证假设是否成立的方法。

它通常用于对某个现象进行分类的相关度检验。

适用场景包括:样本的数量大于等于40,且至少有一个期望值小于5;变量为分类变量,且分类类别数不超过10个。

卡方检验的原理是将观察值和期望值进行比较,并计算卡方值,然后根据卡方值与自由度的乘积查找p值,从而得出结论。

3. 回归系数是回归方程中自变量与因变量之间的关系,在线性回归中,回归系数表示每一个自变量单位变化与因变量单位变化的关系。

p值是评估回归系数是否具有显著性的指标。

回归模型的选择有两种方法:一种是逐步回归分析,根据不同的准则进行多个回归模型的比较,选择最优的模型;另一种是正则化回归,通过加入惩罚项来保证回归模型具有良好的泛化性能。

回归模型的评估有多种方法,包括:残差分析、R方值、方差齐性检验、变量的共线性检验等。

4. 主成分分析是一种将多维数据降维处理的方法,它的目的是通过数据的变换,将多个变量转化为一些综合指标,这些指标是原始变量的线性组合。

主成分分析的步骤包括:数据标准化、计算协方差矩阵或相关系数矩阵、计算特征值和特征向量、选取主成分。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《多元统计分析》试卷
一:1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布

2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。

3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。

4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。

5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距
离,马氏距离2
()ij
d M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L
6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。

7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:
εββββ++++=p p x x x y 22110。

8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

二:1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪

⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3
X 是否独立?为什么?
解: 因为1),cov(21=X X ,所以1X 与2X 不独立。

把协差矩阵写成分块矩阵⎪⎪⎭

⎝⎛∑∑∑∑=∑22211211
,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独
立是等价的,所以),(21'X X 和3X 是独立的。

2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。

若样本间采用明氏
距离,试用最长距离法对其进行分类,要求给出聚类图。

解:样品与样品之间的明氏距离为:⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛=02
5
.36
7
05.14505.25.3010
5
432154
321)
0(x x x x x x x x x x D 样品最短距离是1,故把21X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵
⎪⎪⎪⎪⎪⎪⎭



=025.3705.1505.30}
,{},{54
32154321)
1(x x x x x x x x x x D 类与类的最短距离是1.5,故把43X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵
⎪⎪⎪⎪⎪⎪⎭



=05.3705),{0}
,{},{},{5
432154321)
2(x x x x x x x x x x D 类与类的最短距离是3.5,故把543},{X X X 与合并为一类,计算类与类之间距离(最长距离法)得
距离阵⎪⎪⎪⎭
⎫ ⎝⎛
=07},,{0},{},,{},{5432154321)
3(x x x x x x x x x x D 分类与聚类图(略)(请你们自己做)
3、设变量123,,X X X 的相关阵为 1.000.630.450.63 1.000.35,0.450.35 1.00R R ⎛⎫

= ⎪ ⎪⎝⎭
的特征值和单位化特征向量分别为
()111.96,0.63,0.59,0.51;T l λ==20.68,λ=()20.22,0.49,0.84;T
l =--
30.37,λ=()30.75,0.64,0.18T
l =--
(1) 取公共因子个数为2,求因子载荷阵A 。

(2) 计算变量共同度2i h 及公共因子j F 的方差贡献,并说明其统计意义。

解:因子载荷阵⎪⎪⎪⎪⎭


⎛--=68.084.096.151.068
.049.096.159.068
.022.096.163.0A
变量共同度:2221)68.022.0()96.163.0(-+=h =
2222)68.049.0()96.159.0(-+=h =
2223)68.084.0()96.151.0(+=h =
公共因子j F 的方差贡献:
2221)96.151.0()96.159.0()96.163.0(++=S 2222)68.084.0()68.049.0()68.022.0(+-+-=S
统计意义(省略)(学生自己做)
4、设三元总体X 的协方差阵为⎪⎪⎪


⎝⎛=∑600030001,从∑出发,求总体主成分123,,F F F ,并求前两个主成
分的累积贡献率。

解:
特征方程0||=∑-E λ,得特征根:1,3,6321===λλλ
61=λ的特征方程:0000030005321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛x x x ,得特征向量⎪⎪⎪
⎭⎫ ⎝⎛=1001u
31=λ的特征方程:0300000002321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛-x x x ,得特征向量⎪⎪⎪
⎭⎫ ⎝⎛=0102u
11=λ的特征方程:0500020000321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛--x x x ,得特征向量⎪⎪⎪

⎫ ⎝⎛=0013u
31x F = 22x F = 13x F =
前两个主成分的累积贡献率
9.010
9
= 三、简述题:简述多元统计的主要内容,结合你本专业谈谈能用到那些统计方法。

(省略)(学生自己做)。

相关文档
最新文档