多元统计分析试题(A卷)

合集下载

多元统计分析及R语言建模考试试卷

多元统计分析及R语言建模考试试卷

多元统计分析及R 语言建模考试试卷一、简答题(共5小题,每小题6分,共30分)(1)多元正态分布检验(2)多元方差-协方差分析(3)聚类分析(4)判别分析(5)主成分分析(6)因子分析(7)对应分析(8)典型相关性分析( 9)定性数据建模分析(10)路径分析(又称多重回归、联立方程)(11)结构方程模型(12)联合分析(13)多变量图表示法(14)多维标度法2. 简单相关分析、复相关分析和典型相关分析有何不同?并举例说明之。

简单相关分析:简单相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。

例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。

复相关分析;研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。

例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。

复相关系数R0.12…n的测定,可先求出 x0对一组变量x1,x2,…,xn的回归直线,再计算x0与用回归直线估计值悯之间的简单直线回归。

复相关系数为R0.12…n的取值范围为0≤R0.12…n≤1。

复相关系数值愈大,变量间的关系愈密切。

典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。

它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

3. 试说明主成分分析和因子分析不同点和相同之处。

主成分分析和因子分析的相同之处1.都可以降维、分析多个变量的基本结构2.因子分析是主成分分析的进一步推广。

主成分分析可被视为一种固定效应的因子分析,是因子分析的特列3.都是利用变量之间的相关性将它们进行分类4.主成分分析中,各个主成分之间互不相关;因子分析中,公因子之间不相关、特殊因子之间不相关、公因子与特殊因子之间不相关主成分分析和因子分析的区别1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2006年研究生《多元统计期末试题》(A卷)

2006年研究生《多元统计期末试题》(A卷)

(10 分)


二、下面是 4 个变量 X 1 , X 2 , X 3 , X 4 两两之间的相关系数矩阵,试用模糊聚类法


作聚类并画出谱系图。
1 0.92 1 R 0.09 0.87 1 0.58 0.75 0.67 1
(8 分)
使用学期
三、 设三个总体 G1 , G2 , G3 的分布分别为: N (2, 0.52 ), N (0, 22 ), N (3,12 ) 。试问
中国地质大学(武汉)研究生课程考试出题专用纸
考试课程名称:多元统计分析 学时: 60
简述动态聚类法的基本思想和步骤,在实际应用中如何确定合理的聚类 数目? (8 分) 六、试比较主成分分析、因子分析、对应分析这三种方法的异同之处并简要介 绍它们的应用。 (14 分) 综合题: (30 分) 七、如果你作为研究人员参加定量研究“和谐社会”这样的课题,对于以下两 个问题,请提出你的设想: (1) 你觉得应该选取涉及哪些方面的指标,构成指标体系?如果有些指标没 有现存的统计数据,兼顾考虑研究的经济成本和样本数据量的话,你该 怎么办? (2) 你觉得在这个课题的研究过程中,可以应用哪些多元统计方法?请指出 每种方法的应用具体设想。 (14 分) 八、某教学研究小组试图利用统计方法研究以下几个问题: (1) 对某专业 100 名学生,进行了多门课程(包含各种基础课程和专业课程) 考试,有的课程是闭卷考试,有的则是开卷考试。为了充分利用这些课 程成绩所提供的信息,你觉得可以采用哪些统计方法做分析?简要说明 你的分析思路。 (2) 如何对这些学生作出合理的综合评价?要做到因材施教,如何确定每个 学生的特点和发展潜力? (3) 研究小组对该专业近几年毕业生(部分继续攻读硕士和博士学位,部分参 加工作)做了问卷和座谈方式的调查,你觉得可以利用怎样的统计方法 进行分析,获得对今后的教学和管理具有指导意义的信息? (16 分)

多元统计分析题

多元统计分析题

多元统计分析模拟试题(两套:每套含填空、判断各二十道)A卷1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法。

2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。

3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。

4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极大似然法5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为=8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。

9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化为几个综合指标的多元统计方法。

10)在进行主成分分析时,我们认为所取的m(m<p,p为所有的主成分)个主成分的累积贡献率达到85%以上比较合适。

11)聚类分析的目的在于使类内对象的同质性最大化和类间对象的异质性最大化12)是随机变量,并且有,那么服从(卡方)分布。

13)在对数线性模型中,要先将概率取对数,再分解处理,公式:14)将每个原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子15)判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须至少一个以上,解释变量必须是可测量的16)当被解释变量是属性变量而解释变量是度量变量时判别分析是合适的统计分析方法17)多元正态分布是一元正态分布的推广18)多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多元分析的基础19)因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分表示成各变量的线性组合。

20)统计距离包括欧氏距离和马氏距离两类1)因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度。

多元统计试题及答案

多元统计试题及答案
1从拟合角度考虑,可以采用修正的复相关系数达到最大的准则。
准则1:修正的复相关系数 达到最大。因为:
从这个关系式容易看出, 达到最大时, 达到最小。
2从预测的角度考虑,可以采用预测平方和达到最小的准则以及 准则
准则2:预测平方和 达到最小
准则3:( 准则):定义 统计量为 要求选择 小,且 小的回归方程。
检验假设
根据 分布的定义,有 ,这里 ,对于给定的显著性水平,当 时,我们拒绝 ,反之就接受 ,在SPSS软件的输出结果中,可以直接从P值看出检验结果,那么我们拒绝的P值区间是多少呢?
⑶统计性的依据是什么?给出一个回归分析方程如何作显著性检验?
统计性的依据方差分析
对于多元线性回归作显著性检验就是要看自变量 从整体上对随机变量y是否有明显的影响,即检验假设
如果 被接受,则表明y与 之间不存在线性关系,为了说明如何进行检验,我们要首先建立方差分析表.
在进行显著性的检验中,我们可以用F统计量来检验回归方程的显著性,也可以用P值法做检验.F统计量是:
当 为真时, ,给定显著性水平α,查F分布表得临界值 ,计算F的观测值,若 ,则接受 ,即认为在显著性水平α之下,认为y与 之间线性关系不显著.
试用最长距离法对这六个样品进行聚类,并画出谱系图。(10分)
解答:首先将6个样品的各自看成一类,即:
Gi=(i),i=1,2,3,4,5,6
将相关系数矩阵记为R0,则:
从这个矩阵可以看出,G1,G2的相关性最大,因此将G1,G2在水平0.92上合成一个新类G7={1,2},计算G7与G3,G4,G5,G6之间的最长距离,得到:
2.3聚类分析
⑴系统聚类的基本思想:
先将待聚类的n个样品(或者变量)各自看成一类,公有n类,然后按照事先选定的方法计算每两类之间的聚类统计,即某种距离(或者相似系数),将关系最密切的两类并为一类,其余不变,既得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离(或者相似系数),再将关系最密切的两类并为一类,其余不变,即得到n-2类;如此继续下去,每次重复都减少一类,直到最后所有的样品(或者变量)归为一类为止.

《多元统计分析》课程考试试题

《多元统计分析》课程考试试题

《多元统计分析》课程考试试题学年第 学期 班级 时量:100分钟 总分100分考试形式 开卷一、(本大题共2小题,每题n 分,共22分)-i 1 r1 .设 X 〜N"Z ),其中 X = (X],X2,X3)% = (2,—3,1)',,= 1 32 ,试求1 2 2 3X1 —2Xz + X3的分布。

2 .设三个总体QG 和G3的分布分别为:A^(2A52),m22)W (3J 2)o 试按马氏距离判 别准那么判别产2. 5应判归哪一类?二、(此题 12 分)设 X=(X],X2,X3)其中1 P 4 二(从,42,〃3)',2= P 1 P P (1)试求AX ⑴+ d 的分布,x ⑴=(X1 x 2y (2)试求X3的分布。

三、(此题12分)5个样品的观测值为:1, 4, 5, 7, 11 ,试用按类平均法对5个样品 进行分类。

四、(此题12分)设有两个正态总体G1和G2,(m=2)小 F1O1 小「20]「18 12].〃⑴=]5'〃 = 25 2=1= 12 32 ,先验概率4 =%,而〃2|1) = 10,「201「⑸ 〃12) = 75。

试问按贝叶斯判别准那么样品X (1)=,X0)= 各应判归哪一类?(1)20⑵20五、(此题12分)设随机变量X=(X],X2,X3)'的协方差阵为,1-2 0、£= -2 5 0〔。

2)试求X 的主成分及主成分对变量X,的贡献率匕.(,= 1,2,3)。

六、(此题30分)设标准化变量X1,X2,X3的协方差阵为1.00 0.63 0.45(\ A = 14 (\ A = 14 3、2)R= 0.63 1.00 0.350.45 0.35 1.00协方差阵的特征值和特征向量分别为4 = 1.9633,4 = (0.6250,0.5932,0.5075)'4=0.6795,。

=(一°・2186「0.4911,0.8432)'4 = 0.3672 4 = (0.7494 -0.6379 -0.1772)'(1)取公共因子个数m=l时,求因子模型的主成分解,并计算误差平方和。

多元统计分析试题及答案

多元统计分析试题及答案

多元统计分析试题及答案华南农业⼤学期末试卷(A 卷)2006学年第2学期考试科⽬:多元统计分析考试类型:(闭卷)考试时间:120 分钟⼀、填空题(5×6=30)22121212121~(,),(,),(,),,1X N X x x x x x x ρµµµµσρ∑==∑=+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________iiii XN i W XXµµµ='∑=--∑ 、设则=服从。

()1234433,492,3216___________________X x x x R -?? ?'==-- ? ?-?=∑、设随机向量且协⽅差矩阵则它的相关矩阵________________。

(),123设X=xx x 的相关系数矩阵通过因⼦分析分解为211X h =的共性⽅差111X σ=的⽅差21X g =1公因⼦f 对的贡献121330.9340.1280.9340.4170.8351100.4170.8940.027 0.8940.44730.8350.4470.1032013R ?-?-=-=-+5,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N TX A X µµµµ-=∑∑'=-- 、设是来⾃多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

⼆、计算题(5×11=50)12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x µµ-??'=∑=-∑=-- --??+、设其中试判断与是否独⽴?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.62103.17237.14.5X S µ--'=-?? ?==-- ? 0、对某地区农村的名周岁男婴的⾝⾼、胸围、上半臂围进⾏测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

研究生多元统计分析试题(A卷)(答案)

研究生多元统计分析试题(A卷)(答案)

内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。

多元统计分析

多元统计分析

多元统计分析多元统计分析习题集(⼀)⼀、填空题1.若()(,),(1,2,,)p X N n αµα∑= 且相互独⽴,则样本均值向量X 服从的分布是____________________。

2.变量的类型按尺度划分为___________、____________、_____________。

3.判别分析是判别样品_____________的⼀种⽅法,常⽤的判别⽅法有_____________、_____________、_____________、_____________。

4.Q 型聚类是指对_____________进⾏聚类,R 型聚类指对_____________进⾏聚类。

5.设样品12(,,,),(1,2,,)i i i ip X X X X i n '== ,总体(,)p X N µ∑ ,对样品进⾏分类常⽤的距离有____________________、____________________、____________________。

6.因⼦分析中因⼦载荷系数ij a 的统计意义是_________________________________。

7.主成分分析中的因⼦负荷ij a 的统计意义是________________________________。

8.对应分析是将__________________和__________________结合起来进⾏的统计分析⽅法。

9.典型相关分析是研究__________________________的⼀种多元统计分析⽅法。

⼆、计算题 1.设3(,)X N µ∑ ,其中410130002?? ?∑= ? ??,问1X 与2X 是否独⽴?12(,)X X '与3X 是否独⽴?为什么?2.设抽了5个样品,每个样品只测了⼀个指标,它们分别是1,2,4.5,6,8。

若样品间采⽤绝对值距离,试⽤最长距离法对其进⾏分类,要求给出聚类图。

应用多元统计分析试题及答案

应用多元统计分析试题及答案

一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。

二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。

选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。

被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。

设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。

对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。

要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

3、简述费希尔判别法的基本思想。

从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

多元统计分析试卷

多元统计分析试卷

一.填空题(每空2分,共30分)1.若--------(看不清)且相互独立,则样本均值向量X 2服从的分布为_______2.聚类分析是判别样品所属类型的一种统计方法,常用的聚类分析方法有距离判别法、Fisher 判别法、Bavers 判别法、逐步判别法。

3.主成份同因子分析之间的差异在于方差,_____。

4.设样本-------,总体-----,对样本进行分类常用的工具有:马氏距离--=_______,相关系数_______,它们之间的关系如何_______。

5.因子分析中的因子载荷系数共性方差的统计意义是_______。

6.典型相关分析是研究两组变量之间_______的一种多元统计方法。

7.刻画两个变量之间相关程度的通过统计指标是_______。

8.数据标准化对因子分析的结构分解有什么影响_______。

二.计算题(每小题12分,共60分)1.设三维随机变量-----,其中⎪⎪⎪⎭⎫ ⎝⎛=∑210140005,问1X 与2X 是否独立?---和1X 是否独立?为什么?2.设抽了五个样品,每个样品只测了一个指标,它们分别是1 1 2 3 5 4 5,若样本间采用欧式,试用平均距离法对其进行分类,要求给出聚类图。

3.设变量321,,X X X 的相关阵为⎪⎪⎪⎭⎫ ⎝⎛=00.135.045.035.000.163.045.063.000.1R ,R 的特征值和单位化特征向量分别为T T T l l l 18.0,64.0,75.0,37.03,84.0,49.0,22.0,68.0,51.0,59.0,63.0,96.122211--==--====λλλ(1)取公共因子个数为2,求因子载荷矩阵A 。

(2)计算变量共同度—及公共因子2F 的方差贡献,并说明其统计意义。

4.设三元总体X 的协方差阵为⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑841,从∑出发,求总体主成份321,,F F F ,求前两个主成份的累计贡献率。

研究生多元统计分析试题(A卷)(答案)

研究生多元统计分析试题(A卷)(答案)

内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。

应用多元统计分析试题及答案

应用多元统计分析试题及答案

一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分析分为 Q型聚类和R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。

二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。

选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。

被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。

设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。

对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。

要寻求列联表列因素A和行因素B 的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换,使得因素A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。

3、简述费希尔判别法的基本思想。

从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

(完整版)多元统计分析试题及答案

(完整版)多元统计分析试题及答案

(完整版)多元统计分析试题及答案试题:1. 试解释多元统计分析的含义及其与单变量和双变量统计分析的区别。

2. 简述卡方检验方法及适用场景。

3. 请解释回归分析中的回归系数及其p值的含义及作用,简单说明如何进行回归模型的选择和评估。

4. 试解释主成分分析的原理及目的,如何进行主成分分析及如何解释因子载荷矩阵。

5. 请列举和简要解释聚类分析和判别分析的适用场景,并说明两种方法的区别。

答案:1. 多元统计分析是一种将多个变量进行综合分析的方法。

与单变量和双变量统计分析不同的是,多元统计分析可以处理多个自变量和因变量的组合关系,从而探究它们之间的综合关系。

该方法通常适用于探究多种变量在某个问题中的关系、探究影响某一结果变量的因素、探究各个变量相互作用的影响等。

2. 卡方检验是根据样本数据与期望值的差异来判断观察值与理论预期是否相符,以此来验证假设是否成立的方法。

它通常用于对某个现象进行分类的相关度检验。

适用场景包括:样本的数量大于等于40,且至少有一个期望值小于5;变量为分类变量,且分类类别数不超过10个。

卡方检验的原理是将观察值和期望值进行比较,并计算卡方值,然后根据卡方值与自由度的乘积查找p值,从而得出结论。

3. 回归系数是回归方程中自变量与因变量之间的关系,在线性回归中,回归系数表示每一个自变量单位变化与因变量单位变化的关系。

p值是评估回归系数是否具有显著性的指标。

回归模型的选择有两种方法:一种是逐步回归分析,根据不同的准则进行多个回归模型的比较,选择最优的模型;另一种是正则化回归,通过加入惩罚项来保证回归模型具有良好的泛化性能。

回归模型的评估有多种方法,包括:残差分析、R方值、方差齐性检验、变量的共线性检验等。

4. 主成分分析是一种将多维数据降维处理的方法,它的目的是通过数据的变换,将多个变量转化为一些综合指标,这些指标是原始变量的线性组合。

主成分分析的步骤包括:数据标准化、计算协方差矩阵或相关系数矩阵、计算特征值和特征向量、选取主成分。

多元统计学多元统计分析试题(A卷)(答案)

多元统计学多元统计分析试题(A卷)(答案)

《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_.3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。

4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。

5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。

7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。

8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

一、填空题(每空2分,共40分)二、计算题(每小题10分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。

把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

广西科技大学 2013 — 2014 学年第 2 学期课程考核试题
考核课程 多元统计分析 ( A 卷)考核班级 统计101、102班 学生数 114 印数 120 考核方式 闭卷 考核时间 120 分钟
一、填空题(每空3分,共15分)
1、设2~(,)X N μ∑,其中12(,)X x x '=,12(,)μμμ'=,211ρσρ
⎛⎫
∑= ⎪⎝⎭
,则1212ov(,)C x x x x +-= 。

2、设A 和B 为常数矩阵,ov(,)C x y =∑,则ov(,)C Ax By = 。

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

根据分类对象的不同,聚类分析分为 聚类和 聚类。

4、因子分析中,因子载荷矩阵A 中元素ij a 的统计意义是 。

5、为研究两组变量12,,,p x x x 和12,,,q y y y 之间的相关关系,一般采用 方法。

二、简述题(每小题10分,共20分) 1、简述系统聚类法的基本思想。

2、简述主成分分析和因子分析的基本思想,并比较二者的异同点。

三、(10分)设随机向量X 的协方差矩阵为
1643()442329V X -⎛⎫

=-- ⎪ ⎪-⎝⎭
求其相关系数矩阵R 。

四、(15分)设3121~(,),110X N A μ-⎛⎫
∑= ⎪-⎝⎭
,其中
()1642111,441214μ-⎛⎫

=-∑=-- ⎪ ⎪-⎝⎭

求Y AX =的分布.
五、(15分)已知两个总体1π,2π的概率密度分别为1()f x 和2()f x ,且总体的先验概率分布为120.6,0.4p p ==,误判损失为(1|2)12c =个单位, (2|1)4c =个单位。

(1) 建立最小平均误判代价(ECM )判别规则;
(2) 设有一新样品0x 满足1020()0.36,()0.24f x f x ==,判定0x 的归属问题。

六、(10分)设三元总体123(,,)X x x x '= 的协方差矩阵为
41
21932325⎛⎫ ⎪
∑=- ⎪ ⎪-⎝⎭
试求总体的主成分以及各主成分的贡献率。

七、(15分)某学校体检中获得的30位学生身体的四项指标,数据见下表。

对数据做主成分分析,利用SAS 软件运行,得到如下输出结果:
试根据输出结果,完成以下问题:
(1)写出前两个主成分,并说明前两个主成分的累计贡献率; (2)对所取的前两个主成分给出合理的解释。

相关文档
最新文档