多元统计学多元统计分析试题A卷答案
多元统计分析期末试题及答案
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计分析题
多元统计分析题多元统计分析模拟试题(两套:每套含填空、判断各⼆⼗道)A卷1)判别分析常⽤的判别⽅法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法。
2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。
3)主成分分析中可以利⽤协⽅差矩阵和相关矩阵求解主成分。
4)因⼦分析中对于因⼦载荷的求解最常⽤的⽅法是主成分法、主轴因⼦法、极⼤似然法5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析6)分组数据的Logistic回归存在异⽅差性,需要采⽤加权最⼩⼆乘估计7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为=8)最短距离法适⽤于条形的类,最长距离法适⽤于椭圆形的类。
9)主成分分析是利⽤降维的思想,在损失很少的信息前提下,把多个指标转化为⼏个综合指标的多元统计⽅法。
10)在进⾏主成分分析时,我们认为所取的m(m分的累积贡献率达到85%以上⽐较合适。
11)聚类分析的⽬的在于使类内对象的同质性最⼤化和类间对象的异质性最⼤化12)是随机变量,并且有,那么服从(卡⽅)分布。
13)在对数线性模型中,要先将概率取对数,再分解处理,公式:14)将每个原始变量分解为两部分因素,⼀部分是由所有变量共同具有的少数⼏个公共因⼦组成的,另⼀部分是每个变量独⾃具有的因素,即特殊因⼦15)判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须⾄少⼀个以上,解释变量必须是可测量的16)当被解释变量是属性变量⽽解释变量是度量变量时判别分析是合适的统计分析⽅法17)多元正态分布是⼀元正态分布的推⼴18)多元分析的主要理论都是建⽴在多元正态总体基础上的,多元正态分布是多元分析的基础19)因⼦分析中,把变量表⽰成各因⼦的线性组合,⽽主成分分析中,把主成分表⽰成各变量的线性组合。
20)统计距离包括欧⽒距离和马⽒距离两类1)因⼦负荷量是指因⼦结构中原始变量与因⼦分析时抽取出的公共因⼦的相关程度。
(√)(p147)2)主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计⽅法。
多元统计分析期末试题及答案
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计分析期末试题及答案
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计分析期末试题及答案
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计期末考试题及答案
多元统计期末考试题及答案一、选择题(每题2分,共20分)1. 在多元线性回归中,如果一个变量的系数为0,这意味着什么?A. 该变量对因变量没有影响B. 该变量与因变量完全相关C. 该变量与因变量无关D. 该变量是多余的2. 主成分分析(PCA)的主要目的是什么?A. 减少数据的维度B. 增加数据的维度C. 找到数据的均值D. 找到数据的中位数3. 以下哪个不是聚类分析的优点?A. 可以揭示数据的内在结构B. 可以用于分类C. 可以减少数据的维度D. 可以找到数据的异常值4. 在因子分析中,如果一个因子的方差贡献率很低,这通常意味着什么?A. 该因子对数据的解释能力很强B. 该因子对数据的解释能力很弱C. 该因子是多余的D. 该因子是重要的5. 以下哪个是多元统计分析中常用的距离度量?A. 欧氏距离B. 曼哈顿距离C. 切比雪夫距离D. 所有以上选项二、简答题(每题10分,共30分)6. 解释什么是多元线性回归,并简述其在实际问题中的应用。
7. 描述主成分分析(PCA)的基本原理,并举例说明其在数据分析中的作用。
8. 简述聚类分析的过程,并讨论其在商业数据分析中的应用。
三、计算题(每题25分,共50分)9. 假设有以下数据集,包含两个变量X和Y,以及它们的观测值:| 观测 | X | Y |||||| 1 | 2 | 3 || 2 | 3 | 4 || 3 | 4 | 5 || 4 | 5 | 6 |请计算X和Y的协方差,并解释其意义。
10. 给定以下数据集,进行聚类分析,并解释聚类结果:| 观测 | 变量1 | 变量2 |||-|-|| 1 | 1.5 | 2.5 || 2 | 2.0 | 3.0 || 3 | 3.5 | 4.5 || 4 | 4.0 | 5.0 |多元统计期末考试题答案一、选择题1. A2. A3. C4. B5. D二、简答题6. 多元线性回归是一种统计方法,用于分析两个或两个以上的自变量(解释变量)与一个因变量之间的关系。
多元统计分析试卷(a)答案
1. 设随机向量 X = ( X , X , X )' ,且其协方差阵为 ∑ = -49 -2 ⎪ ,则它的相关 3 -2 16⎪⎭ 1 - 2 矩阵 R = - 1 - 1 ⎪ 。
1 ⎪ 3(α) ~ N ( μ, ∑),( α = 1,2, n) 且相互独立,样本均值向量为 X ,样本离差阵为n - 1 B ⎢11 0⎥ 22 0⎥ D = C D ⎢13 24 19 0⎥- X )' , 则 X ~N (μ , 1 ∑) , L ~ W (n - 1,∑) 。
L =∑( X- X )( X5. 设三维随机向量 X ~ N (μ , ∑) ,其中 ∑ = 1 3 0 ⎪ ,则 X 与 X 不独立 ; 0 0 2 ⎪⎢ A 0⎥ 11 0⎥ 12 22 0 ⎥C (0) =⎢解:样品与样品之间的明氏距离为: D ⎢ E 10 23 5 6 0 ⎥ ⎭n⎣ ⎦学 号精品文档东 北 大 学 秦 皇 岛 分 校课程名称: 多元统计分析 试卷类型: A 答案 考试形式:闭卷授课专业: 信科、应数、统计 考试日期: 2013 年 7 月 9 日 试卷:共 3 页( X , X )' 和 X 独立(填独立或不独立)。
1 2 36. 变量的类型按尺度划分有间隔尺度 、有序尺度 、名义尺度 。
二、判断题(每小题 3 分,共 15 分) 1. [×] 因子载荷矩阵 A 是对称阵。
2. [×] 方差分析是检验多个正态总体的方差或协方差阵是否相等的统计分析方法。
班 级题号得分阅卷人一 二 三 四 总分3. [√] 聚类分析中快速聚类法指的就是 k -均值法。
4. [√] 判别分析中,“留一个观测在外”的原则是指在交叉验证时,某个观测不参与估计判别函数,但要根据除这个观测以外的其他观测估计的判别函数来预测该观测的所属类,从而使这个 观测得到验证。
姓 名装订线内不要答题装订线一、填空题:(每空 2 分,共 32 分)⎛ 4 -4 3 ⎫ ⎪ 1 2 3 ⎝⎛ 3 ⎫3 8 ⎪2 3 6 ⎪⎝ 8 - 61 ⎪⎪2. 系统聚类分析的方法很多,其中的五种分别为最长距离法、最短距离法、重心法、类 平均法、离差平方和法。
多元统计分析试题及答案
多元统计分析试题及答案华南农业⼤学期末试卷(A 卷)2006学年第2学期考试科⽬:多元统计分析考试类型:(闭卷)考试时间:120 分钟⼀、填空题(5×6=30)22121212121~(,),(,),(,),,1X N X x x x x x x ρµµµµσρ∑==∑=+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________iiii XN i W XXµµµ='∑=--∑ 、设则=服从。
()1234433,492,3216___________________X x x x R -?? ?'==-- ? ?-?=∑、设随机向量且协⽅差矩阵则它的相关矩阵________________。
(),123设X=xx x 的相关系数矩阵通过因⼦分析分解为211X h =的共性⽅差111X σ=的⽅差21X g =1公因⼦f 对的贡献121330.9340.1280.9340.4170.8351100.4170.8940.027 0.8940.44730.8350.4470.1032013R ?-?-=-=-+5,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N TX A X µµµµ-=∑∑'=-- 、设是来⾃多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
⼆、计算题(5×11=50)12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x µµ-??'=∑=-∑=-- --??+、设其中试判断与是否独⽴?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.62103.17237.14.5X S µ--'=-?? ?==-- ? 0、对某地区农村的名周岁男婴的⾝⾼、胸围、上半臂围进⾏测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
厦门大学《应用多元统计分析》试题A
厦门大学《多元统计分析》试卷A经济学院计统系 级 专业 本科生一、(20%)判断题1、“p 维随机向量1(,...,)p X X X ′=的协差阵及相关阵一定是非负定阵”是否正确,并说明理由。
2、“距离判别是Bayes 判别的一种特例”是否正确,为什么? 二、(15%)设标准化变量12,,3X X X 的协差阵(即相关阵)为1.000.630.450.63 1.000.350.450.35 1.00⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦R , R 的特征值和相应的正则化特征向量分别为:'11'22'331.9633,(0.6250,0.5932,0.5075)0.6795,(0.2186,0.4911,0.8432)0.3572,(0.7494,0.6379,0.1772)l l l λλλ====−−==−− 要求:1)计算因子载荷矩阵A ,并建立因子模型;2)计算公因子的方差贡献,并说明其统计意义。
j F 2(1,2,3j g j =)三、(10%)设三元总体的协方差阵为X 222222200σρσρσσρσρσσ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦Σ,试求总体主成分(0ρ<≤。
四、(15%)金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布),今测得两个总体的若干数据,并由这些数据得到⎟⎟⎠⎞⎜⎜⎝⎛=62ˆ1μ⎟⎟⎠⎞⎜⎜⎝⎛=24ˆ2μ⎟⎟⎠⎞⎜⎜⎝⎛=∑4111ˆ 对某一金融分析员进行判别是否能满足这项工作。
进行测量得到两个指标为,且当两组先验概率分别为)4,5(′=X 269.01=q 与731.02=q ,损失相同。
问该金融分析员满足要求吗?为什么?五、(6%)设是来自的随机样本,,令。
试证明:(1)(),,n X X K ()i i c X (,)p N μΣ00(1,,),1ni ii c i n c=≥==∑L 0ni ==∑Z 1)是Z μ的无偏估计量;2)~,其中。
应用多元统计分析试题及答案
一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q型聚类和 R型聚类。
4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。
二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。
对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。
要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
3、简述费希尔判别法的基本思想。
从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
多元统计分析试卷答案
课程名称: 多元统计分析 试卷类型: 答案 考试形式:开 授课专业: 数学与应用数学题号 一二三总分得分 阅卷人一、 填空题:(每空2分,共30分)1、设(1)(2)(,)p N ⎡⎤=⎢⎥⎣⎦:X X μX ∑(2)p ≥,(1)(2)⎡⎤=⎢⎥⎣⎦μμμ,11122122⎡⎤=⎢⎥⎣⎦∑∑∑∑∑,其中(1)X ,(1)μ为1r ⨯,11∑为r r ⨯,则(1):X (1)11(,)r N μ∑,(2):X (2)22(,)p r N -μ∑2、系统聚类分析的方法很多,其中的五种分别为最短距离法、最长距离法、重心法、类平均法、离差平方和法。
3、若p 维随机向量~(,)p X N μ∑,~(,)p W W n ∑,且X 与W 相互独立,则1()()~n X W X μμ-'--2(,)T p n ,21(,)~n p T p n pn-+(,1)F p n p -+。
4、i X 与前个主成分的全相关系数的平方和21(,)mk i k Y X ρ=∑称为12,,,m Y Y Y L 对原始变量i X 的方差贡献率,在因子分析中也称之为共同度。
5、Q 型因子分析研究样品之间的相关关系,R 型因子分析研究变量之间的相关关系。
6、Fisher 判别法的基本思想是投影,并利用方差分析的思想来导出判别函数。
二、 判断题(每题2分,共10分)1、( √ )随机向量12(,,,)p X X X 'L 的协方差阵()D X =∑是对称非负定阵。
2、( × )因子载荷矩阵A 是对称阵。
3、( × )聚类分析中快速聚类法指的就是模糊聚类法。
4、( √ )设(,)p N :X μ∑,(,)p W n :W ∑,且X 与W 相互独立,则12()()(,)n T p n -':X μW X μ--。
5、( × )主成分分析中,从相关矩阵出发求解的主成分一定会比从协方差矩阵出发求解的主成分更可信。
多元统计试题及答案
从这个矩阵可以看出,G5,G6的相关性最大,因此将G5,G6在水平0.89上合成一个新类G8={5,6},计算G8与G7,G3,G4,之间的最长距离,得到:
在第二个相关距离作为新的一行一列,得到:
③在第二步的基础上,再将其余的 个自变量分别加入到此模型中,拟合各个模型并计算偏F统计量值,与 比较决定是否又新变量引入,如果有新的变量引入,还需要检验原模型中的老变量是否因为这个新变量的引入而不再显著,那样就应该被删除。
重复以上的步骤,直到没有新的变量能进入模型,同时在模型中的老变量都不能被剔除,则结束选择过程,最后,一个模型即为所求的最优回归模型。
六、在作判别分析时,如何检验判别效果的优良性?(8分)
解答:
当一个判别准则提出以后,还要研究其优良性,即要考察误判概率.一般使用以训练样本为基础的回代估计法与交叉确认估计法
八、因子模型 中,因子载荷 、变量共同度以及公共因子 的方差贡献的统计意义是什么?在实际应用中,一般怎样选择公共因子?(10分)
试用最长距离法对这六个样品进行聚类,并画出谱系图。(10分)
解答:首先将6个样品的各自看成一类,即:
Gi=(i),i=1,2,3,4,5,6
将相关系数矩阵记为R0,则:
从这个矩阵可以看出,G1,G2的相关性最大,因此将G1,G2在水平0.92上合成一个新类G7={1,2},计算G7与G3,G4,G5,G6之间的最长距离,得到:
利用P值法作显著性检验十分方便,这里的P值是 ,定显著性水平α.,若 ,则拒绝 ,反之接受 .
⑷回归分析和相关分析的区别和联系?
相关分析和回归分析都是对客观事物数量依存关系的分析,均有一元和多元,线性与非线性之分,在应用中相互结合与渗透,但仍有差别,主要是:
研究生多元统计分析试题(A卷)(答案)
内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。
多元统计分析期末试题(卷)与答案解析
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x xx 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
应用多元统计分析试题及答案.doc
一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q型聚类和 R型聚类。
4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若()(,), Px N αμα∑:=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。
二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。
对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。
要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
3、简述费希尔判别法的基本思想。
从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
(完整版)多元统计分析试题及答案
(完整版)多元统计分析试题及答案试题:1. 试解释多元统计分析的含义及其与单变量和双变量统计分析的区别。
2. 简述卡方检验方法及适用场景。
3. 请解释回归分析中的回归系数及其p值的含义及作用,简单说明如何进行回归模型的选择和评估。
4. 试解释主成分分析的原理及目的,如何进行主成分分析及如何解释因子载荷矩阵。
5. 请列举和简要解释聚类分析和判别分析的适用场景,并说明两种方法的区别。
答案:1. 多元统计分析是一种将多个变量进行综合分析的方法。
与单变量和双变量统计分析不同的是,多元统计分析可以处理多个自变量和因变量的组合关系,从而探究它们之间的综合关系。
该方法通常适用于探究多种变量在某个问题中的关系、探究影响某一结果变量的因素、探究各个变量相互作用的影响等。
2. 卡方检验是根据样本数据与期望值的差异来判断观察值与理论预期是否相符,以此来验证假设是否成立的方法。
它通常用于对某个现象进行分类的相关度检验。
适用场景包括:样本的数量大于等于40,且至少有一个期望值小于5;变量为分类变量,且分类类别数不超过10个。
卡方检验的原理是将观察值和期望值进行比较,并计算卡方值,然后根据卡方值与自由度的乘积查找p值,从而得出结论。
3. 回归系数是回归方程中自变量与因变量之间的关系,在线性回归中,回归系数表示每一个自变量单位变化与因变量单位变化的关系。
p值是评估回归系数是否具有显著性的指标。
回归模型的选择有两种方法:一种是逐步回归分析,根据不同的准则进行多个回归模型的比较,选择最优的模型;另一种是正则化回归,通过加入惩罚项来保证回归模型具有良好的泛化性能。
回归模型的评估有多种方法,包括:残差分析、R方值、方差齐性检验、变量的共线性检验等。
4. 主成分分析是一种将多维数据降维处理的方法,它的目的是通过数据的变换,将多个变量转化为一些综合指标,这些指标是原始变量的线性组合。
主成分分析的步骤包括:数据标准化、计算协方差矩阵或相关系数矩阵、计算特征值和特征向量、选取主成分。
多元统计学多元统计分析试题(A卷)(答案)
《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_.3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
一、填空题(每空2分,共40分)二、计算题(每小题10分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。
多元统计分析A卷(12-13-2)
广西工学院 2012 — 2013 学年第 2 学期课程考核试题考核课程 多元统计分析 ( A 卷)考核班级 统计101,102 学生数 73 印数 85 考核方式 闭卷 考核时间 120 分钟一、填空题(每题3分,共18分)1.设随机向量~(,)p X N μ∑,则X 的特征函数为()X t ϕ= .2.设随机向量~(0,)p U N I ,Y AU μ=+,其中A 为r p ⨯常数矩阵,μ为r 维向量,则随机向量Y 的分布为 .3.设随机向量12X X X ⎛⎫= ⎪⎝⎭,~(,)p X N μ∑,1X 为k 维随机向量,2X 为p k -维随机向量,11122122∑∑⎛⎫∑= ⎪∑∑⎝⎭,其中11∑为k 阶方阵,22∑为p k -阶方阵,则1X 与2X 独立的充要条件为 .4.设3~(,)X N μ∑,123(,,)X x x x '=,其中300051011⎛⎫ ⎪∑=- ⎪ ⎪-⎝⎭,随机变量(向量)对1x 与2x ,1x 与3x ,2x 与3x ,1x 与23(,)x x '中不独立的是 .5.设随机向量121222(,,,)(,),(,,)p p X x x x x X X x x ''''=== ,~(,)p X N μ∑,其中111212122212p p p p pp σσσσσσσσσ⎛⎫ ⎪ ⎪∑= ⎪ ⎪ ⎪⎝⎭11122122σ∑⎛⎫= ⎪∑∑⎝⎭, 则,1x 关于2X 的复相关系数为 .6.对于多元正态总体(,)p N μ∑欲检验0010:;:H H μμμμ=≠,若已知方差协方差矩阵∑,采用的统计量为20T = .二、(10分)已知p 维随机向量X 的均值向量()E X μ=,协方差矩阵()V X =∑,证明()E XX μμ''=∑+.三、(18分)设3~(,)X N μ∑,其中(10,4,7)μ'=,933351315--⎛⎫ ⎪∑=- ⎪ ⎪-⎝⎭试求(1) 关于12(,)x x 的边缘分布;(2)条件分布123(,)|x x x .四、(15分)设3~(,)X N μ∑,110011A -⎛⎫= ⎪⎝⎭,()231μ=-,211121114⎛⎫⎪∑=- ⎪⎪-⎝⎭,试求Y AX =的分布.五、(17分)设有123,,πππ三个组,欲判别样品0x 属于何组,已知122()0.1,()0.55,()0.35P P P πππ===,102030()0.1,()0.7,() 2.4f x f x f x ===,假设误判代价矩阵(2) 根据这一判别准则,给出0x 所属的组.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《多
元
统计
分
析》
试卷
题号 一 二 三 总分 分值 40
40
20 100
得分
1、若
),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为)1
,(~∑n
N X p μ。
2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离q
p
q
j i ij x x q d 1
1
)||(
)(∑=-=ααα,马氏距离2()ij d M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L =
∑=+-p
j i j i x x x x 1
||α
α
ααα。
6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:
εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
得分
评卷
人
一、填空题(每空2
分,共40分)
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
1、设三维随机向量
),(~3∑μN X ,
其中
⎪⎪⎪
⎭
⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?
解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭
⎫
⎝⎛∑∑∑∑=∑22211211
,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相
互独立是等价的,所以),(21'X X 和3X 是独立的。
2、设抽了五个样品,每个样品只测了一个指标,它们分别是
1 ,
2 ,4.5 ,6 ,8。
若样本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。
解:样品与样品之间的明氏距离为:⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛
=02
5
.367
05.14505
.25.30
105
432154
3
2
1)
0(x x x x x x x x x x D 样品最短距离是1,故把21X X 与合并为一类,计算类与类之间距离(最长距离法)
得距离阵 ⎪⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛
=025.3705.1505.30}
,{},{54
32154321)
1(x x x x x x x x x x D 得分
评卷
人
二、计算题(每小题10分,共40分)
类与类的最短距离是1.5,故把43X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵⎪⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛
=05.3705),{0}
,{},{},{5
432154321)
2(x x x x x x x x x x D 类与类的最短距离是3.5,故把543},{X X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵⎪⎪⎪⎭
⎫ ⎝⎛
=07},,{0},{},,{},{5432154321)
3(x x x x x x x x x x D 分类与聚类图(略)(请你们自己做)
3、设变量123,,X X X 的相关阵为 1.000.630.450.63 1.000.35,0.450.35 1.00R R ⎛⎫
⎪
= ⎪ ⎪⎝⎭
的特征值和单位化特征向量分别为
(1) 取公共因子个数为2,求因子载荷阵A 。
(2) 计算变量共同度2i h 及公共因子j F 的方差贡献,并说明其统计意义。
解:因子载荷阵⎪⎪⎪⎪⎭
⎫
⎝⎛--=68.084.096.151.068
.049.096.159.068
.022.096.163.0A 变量共同度:2221)68.022.0()96.163.0(-+=h =
2222)68.049.0()96.159.0(-+=h =
2223)68.084.0()96.151.0(+=h =
公共因子j F 的方差贡献: 统计意义(省略)(学生自己做)
4、设三元总体X 的协方差阵为⎪⎪⎪
⎭
⎫
⎝⎛=∑600030001,从∑出发,求总体主成分123,,F F F ,并求前两个
主成分的累积贡献率。
解:
特征方程0||=∑-E λ,得特征根:1,3,6321===λλλ
61=λ的特征方程:0000030005321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛x x x ,得特征向量⎪⎪⎪
⎭⎫ ⎝⎛=1001u
31=λ的特征方程:0300000002321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛-x x x ,得特征向量⎪⎪⎪
⎭⎫ ⎝⎛=0102u
11=λ的特征方程:0500020000321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛--x x x ,得特征向量⎪⎪⎪
⎭
⎫ ⎝⎛=0013u
前两个主成分的累积贡献率
9.010
9
= 简述多元统计的主要内容,结合你本专业谈谈能用到那些统计方法。
(省略)(学生自己做)
得分
评卷
人
三、简述题(20分)。