多元统计分析期末试卷
山东财经大学多元统计分析期末试题
山东财经大学2019-2020学年第二学期期末试题课程代码: 17300371 试卷 (A) 课程名称: 多元统计分析注意事项:所有的答案都必须写在答题纸(答题卡)上,答在试卷上一律无效。
一、单项选择题(共6小题,每题2分,共12分)1.对数据能够进行缩减或简化的方法是( )。
A. 聚类分析B. 回归分析C. 主成分分析D. 判别分析 2.X 是P 维随机向量,()E AX BY +=( )。
A. ()()T A E X BE Y +B. ()()T AE X B E Y +C. ()()AE X BE Y +D. ()()T T A E X B E Y +3..大夫通过病人肺部阴影的指标(阴影的大小、阴影部位、边缘是否光滑、6.R 型因子分析模型为1121,1,2,,i i i ij j im m i X a F a F a F a F i p ε=++++++=,i X 为标准化的随机变量,下面对系数ij a 描述正确的是( )。
A.是i X 与公因子j F 的相关系数B.表示j F 依赖i X 的程度C.判断i X 与j F 是否独立D.以上选项都不对 二、填空题(每空2分,共18分)1.已知样本数据阵为⎪⎪⎪⎪⎪⎭⎫⎝⎛=358448552442X ,则变量个数p=_________,观测的次数n=_________,样本均值为_________.2.设,X A 分别是正态总体(,)p N μ∑的样本均值向量和离差阵,则X ~_______,~A __________。
3.在费希尔(Fisher )准则下,设A 为合并的组内离差阵,B 为组间离差阵,则线性判别函数()u X a X '=的解a ,即为1A B -的________所对应的满足111l Al '=的________。
4.设随机向量12(,)'X X X =的协方差阵4449-⎛⎫∑= ⎪-⎝⎭,则它的相关阵R =__________。
(完整版)多元统计分析试题及答案
2009学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:100 分钟学号 姓名 年级专业一、填空题(5×6=30)22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
二、计算题(5×11=50)(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元统计分析期末复习试题
第一章:多元统计分析研究的内容(5点)1、简化数据结构(主成分分析)2、分类与判别(聚类分析、判别分析)3、变量间的相互关系(典型相关分析、多元回归分析)4、多维数据的统计推断5、多元统计分析的理论基础第二三章:二、多维随机变量的数字特征1、随机向量的数字特征随机向量X 均值向量:随机向量X 与Y 的协方差矩阵:当X=Y 时Cov (X ,Y )=D (X );当Cov (X ,Y )=0 ,称X ,Y 不相关。
随机向量X 与Y 的相关系数矩阵:2、均值向量协方差矩阵的性质(1).设X ,Y 为随机向量,A ,B 为常数矩阵E (AX )=AE (X );E (AXB )=AE (X )B;D(AX)=AD(X)A ’;Cov(AX,BY)=ACov(X,Y)B ’;(2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。
例2.见黑板三、多元正态分布的参数估计2、多元正态分布的性质(1).若 ,则E(X)= ,D(X)= . )',...,,(),,,(2121P p EX EX EX EX μμμ='= )')((),cov(EY Y EX X E Y X --=qp ij r Y X ⨯=)(),(ρ),(~∑μP N X μ∑p X X X ,,,21特别地,当 为对角阵时, 相互独立。
(2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量,AX+d ~ . 即正态分布的线性函数仍是正态分布.(3).多元正态分布的边缘分布是正态分布,反之不成立.(4).多元正态分布的不相关与独立等价.例3.见黑板.三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面.(2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R(3) ,V分别是 和 的最大似然估计;(4)估计的性质是 的无偏估计; ,V分别是 和 的有效和一致估计; ;S~ , 与S相互独立;第五章 聚类分析:一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。
多元统计分析期末考试
北方工业大学《多元统计分析》课程试卷A 卷2014年春季学期开课学院:理考试方式:√闭卷、开卷、一纸开卷、其它 考试时间:120 分钟班级 姓名 学号一、(12分)令),(~221∑⎪⎪⎭⎫ ⎝⎛=μN x x X ,⎪⎪⎭⎫ ⎝⎛=21μ,⎪⎪⎭⎫⎝⎛⋅=∑15.05.01, 1、试求21x x +和21x x -的分布; 2、试判断1x 与21x x -是否相互独立。
订线装二、(10分) 为评估某职业培训中心的教学效果,随机地抽取4名受训者,进行甲和乙两项目的测试,数据列入下表。
假设()∑⎪⎪⎭⎫⎝⎛=,~221μN X X X ,试求μ和∑的无偏估计。
三、(25分)在某年级44名学生的期末考试中,有的课程采用闭卷,有的课程采用开卷。
考试成绩见表3.1。
表3.1 44名学生闭卷与开卷考试的成绩表基于相关矩阵对上述数据进行因子分析,运算结果如下。
表3.2 Descriptive Statistics表3.3 KMO and Bartlett's Test表3.4 Rotated Component Matrix3.5 Component Score Coefficient Matrix求:1、请写出正交因子模型;2、请说明表3.3的作用,并对结果做出评价;3、根据上述运算结果,试填写下表并解释共同度及累积贡献率的含义;4. 说明为什么要进行因子旋转并对两个旋转因子的含义做出解释;5. 写出两个旋转因子的因子得分表达式。
四、(15分)在一项关于某种谷物产量的研究中,从10个试验田得到的数据列于表4.1中。
表4.1 某种谷物产量研究的10个试验田数据利用SPSS进行多元线性回归分析,结果如下。
求:1、请写出多元线性回归模型的一般形式;2、请写出最小二乘法的思想及线性回归方程,并说明其拟合10对观测的效果如何?3、给定检验的显著性水平05.0=α,多元线性回归方程的F 检验及回归系数t 检验是否显著,解释原因;4、解释表4.4 中Beta 系数的作用。
多元统计学多元统计分析试题(A卷)(答案)
《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L =6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
一、填空题(每空2分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。
多元统计分析期末试题汇编
一、填空题(20分)1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L=6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
二、计算题(60分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。
2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。
多元统计分析期末复习试题
第一章:多元统计分析研究的容(5点)1、简化数据结构(主成分分析)2、分类与判别(聚类分析、判别分析)3、变量间的相互关系(典型相关分析、多元回归分析)4、多维数据的统计推断5、多元统计分析的理论基础第二三章:二、多维随机变量的数字特征1、随机向量的数字特征随机向量X 均值向量:随机向量X 与Y 的协方差矩阵: 当X=Y 时Cov (X ,Y )=D (X );当Cov (X ,Y )=0 ,称X ,Y 不相关。
随机向量X 与Y 的相关系数矩阵:2、均值向量协方差矩阵的性质(1).设X ,Y 为随机向量,A ,B 为常数矩阵E (AX )=AE (X );E (AXB )=AE (X )B;D(AX)=AD(X)A ’;Cov(AX,BY)=ACov(X,Y)B ’;)',...,,(),,,(2121P p EX EX EX EX μμμ='= )')((),cov(EY Y EX X E Y X --=q p ij r Y X ⨯=)(),(ρ(2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立.(3).X 的协方差阵D(X)是对称非负定矩阵。
例2.见黑板三、多元正态分布的参数估计2、多元正态分布的性质(1).若 ,则E(X)= ,D(X)= .特别地,当 为对角阵时, 相互独立。
(2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量,AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立.(4).多元正态分布的不相关与独立等价.例3.见黑板.三、多元正态分布的参数估计(1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量样本均值向量 =样本离差阵S= 样本协方差阵V= S ;样本相关阵R(3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析:一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。
多元统计期末考试试题
多元统计期末考试试题一、选择题(每题2分,共20分)1. 以下哪项不是多元统计分析中常用的数据预处理方法?- A. 标准化- B. 归一化- C. 特征选择- D. 数据清洗2. 多元回归分析中,当自变量之间存在高度相关性时,我们通常称之为:- A. 多重共线性- B. 正态性- C. 同方差性- D. 独立性3. 以下哪项不是主成分分析(PCA)的目的?- A. 降维- B. 特征选择- C. 变量解释- D. 增加数据的维度4. 聚类分析中,若要衡量聚类效果,常用的指标不包括:- A. 轮廓系数- B. 熵- C. 戴维斯-库尔丁指数- D. 距离方差5. 因子分析中,因子载荷矩阵的元素表示:- A. 观测变量的均值- B. 因子的方差- C. 观测变量与因子之间的关系- D. 因子之间的相关性二、简答题(每题10分,共30分)1. 请简述多元线性回归分析的基本假设,并说明违反这些假设可能带来的问题。
2. 描述主成分分析(PCA)的基本步骤,并说明其在数据降维中的应用。
3. 聚类分析与分类分析有何不同?请举例说明。
三、计算题(每题25分,共50分)1. 假设有一组数据,包含三个变量X1、X2和Y,数据如下:| X1 | X2 | Y ||-|-|-|| 1 | 2 | 3 || 2 | 4 | 6 || 3 | 6 | 9 || 4 | 8 | 12 |请计算多元线性回归模型的参数,并检验模型的显著性。
2. 给定以下数据集,进行K-means聚类分析,选择K=3,并计算聚类中心。
| 变量1 | 变量2 | 变量3 ||--|-|-|| 1.2 | 2.3 | 3.4 || 1.5 | 2.5 | 3.6 || 4.1 | 5.2 | 6.3 || 4.4 | 5.6 | 6.8 || 7.1 | 8.2 | 9.3 || 7.4 | 8.6 | 9.9 |四、论述题(每题30分,共30分)1. 论述因子分析与主成分分析的异同,并讨论它们在实际应用中可能遇到的问题及解决方案。
多元统计分析期末试题及答案.doc
4、设 X=(X|X 2xj 的相关系数矩阵通过因子分析分解为_13 2<3(0.934 0、 ‘0.934 -0.417 0.835、<0.128 、 -0.417 0.89+ 0.027、0 0.894 0.447、0.835 0.44 Z、0.103X 的共性方差叶0.872(0.934八2) 的方差o H = 1_ (0.128+0.934*0.934)1、设X =(兀[宀心)~弘(“上),其中〃 =(1,0厂2)'工'16 -42、-44 -1 ,<2 -1 4丿试判断禹+2无3与是否独立?1、设X ~ “2(“◎),其中X =(“ 宀)=(“1,“2),工=, VP 1丿 贝l 」CoV (尢]+ x 2,x ( - x 2)二 •102、设 X j 〜N 、mn= 1,…,10,则 w 二工(X, -J = 1服从 。
‘4-4 3、 3、设随机向量X =(x, x 2兀3)‘,且协方差矩阵-49 -2U-2 16丿则它的相关矩阵R=_公W J'lj 对X 的贝献篦=_ (0.934人2+0.417人2+0.835人) ______ °5、设XJ = 1,…,16是来自多元正态总体竹(“上),乂和A 分别为正态总体Np (“Q )的样木均值和样木离差矩阵,则厂=15[4(乂-“)"“[4(乂-“)]〜 ________ o〔4]而其先验概率分别为彳=% =0.5,误判的代价C(2|l) = /33、设已知有两正态总体5与11“试用Bd)疚判别法确定样本X属于哪一个总体?4、W=(X,,X 2,X 3,X 4)r ((),£),协方差阵工二(1P P¥<1 1)J 9丿,C(1|2) yp p p 1丿2、对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量, 得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的 均值他= (90,58,1 6)',现欲在多元正态性的假定下检验该地区农村男婴是 否与城市男婴有相同的均值。
(完整)多元统计分析期末试题及答案,推荐文档.docx
1 、设 X ~ N2 ( ,), 其中 X( x1 , x 2 ),( 1 ,212 ),,1则 Cov( x1x 2 , x1x 2 )=____.102、设X i ~N 3 (,), i 1, L,10,则 W =( X i)( X i)i 1服从_________。
4433、设随机向量X x1x2x3, 且协方差矩阵 4 9 2 ,3 2 16则它的相关矩阵R___________________4、设 X= x1x2x3,的相关系数矩阵通过因子分析分解为112330.93400.1280.4171R100.4170.9340.83530.8940.8940.027 0.83500.4472010.4470.10332__________,__________,X1的共性方差 h1X1的方差11公因子 f 1对 X的贡献 g12________________。
5、设 X i , i 1,L ,16 是来自多元正态总体N p (, ), X 和 A分别为正态总体N p ( ,)的样本均值和样本离差矩阵 , 则T 215[4( X)] A 1[4( X)] ~ ___________。
1642、设( x1 , x2 , x3) ~ N3(, ),其中(1,0, 2) ,44 1 ,1X214试判断 x12 x3与x2x3是否独立?x12、对某地区农村的 6 名 2 周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下 , 根据以往资料 , 该地区城市 2周岁男婴的这三个指标的均值0(90,58,16), 现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
82.0 4.310714.62108.9464其中 X60.2 ,(5 S ) 1( 115.6924)114.6210 3.17237. 376014.58.946437.376035.5936 (0.01,F 0.01 (3, 2)99.2, F 0.01 (3,3)29.5,F0.01 (3, 4)16.7)、设已知有两正态总体G与 G,且12,24,1211,3126219而其先验概率分别为q1q20.5,误判的代价C (2 1)4;e ,C(1 2)e试用判别法确定样本X 3属于哪一个总体?Bayes514、设X( X1 , X2 , X3 , X4 )T,协方差阵1~ N (0, ),0111(1)试从Σ出发求 X 的第一总体主成分;(2)试问当取多大时才能使第一主成分的贡献率达95%以上。
多元统计分析期末试题(卷)与答案解析
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x xx 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
(完整版)多元统计分析试题及答案
(完整版)多元统计分析试题及答案试题:1. 试解释多元统计分析的含义及其与单变量和双变量统计分析的区别。
2. 简述卡方检验方法及适用场景。
3. 请解释回归分析中的回归系数及其p值的含义及作用,简单说明如何进行回归模型的选择和评估。
4. 试解释主成分分析的原理及目的,如何进行主成分分析及如何解释因子载荷矩阵。
5. 请列举和简要解释聚类分析和判别分析的适用场景,并说明两种方法的区别。
答案:1. 多元统计分析是一种将多个变量进行综合分析的方法。
与单变量和双变量统计分析不同的是,多元统计分析可以处理多个自变量和因变量的组合关系,从而探究它们之间的综合关系。
该方法通常适用于探究多种变量在某个问题中的关系、探究影响某一结果变量的因素、探究各个变量相互作用的影响等。
2. 卡方检验是根据样本数据与期望值的差异来判断观察值与理论预期是否相符,以此来验证假设是否成立的方法。
它通常用于对某个现象进行分类的相关度检验。
适用场景包括:样本的数量大于等于40,且至少有一个期望值小于5;变量为分类变量,且分类类别数不超过10个。
卡方检验的原理是将观察值和期望值进行比较,并计算卡方值,然后根据卡方值与自由度的乘积查找p值,从而得出结论。
3. 回归系数是回归方程中自变量与因变量之间的关系,在线性回归中,回归系数表示每一个自变量单位变化与因变量单位变化的关系。
p值是评估回归系数是否具有显著性的指标。
回归模型的选择有两种方法:一种是逐步回归分析,根据不同的准则进行多个回归模型的比较,选择最优的模型;另一种是正则化回归,通过加入惩罚项来保证回归模型具有良好的泛化性能。
回归模型的评估有多种方法,包括:残差分析、R方值、方差齐性检验、变量的共线性检验等。
4. 主成分分析是一种将多维数据降维处理的方法,它的目的是通过数据的变换,将多个变量转化为一些综合指标,这些指标是原始变量的线性组合。
主成分分析的步骤包括:数据标准化、计算协方差矩阵或相关系数矩阵、计算特征值和特征向量、选取主成分。
多元统计学多元统计分析试题(A卷)(答案)
《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_.3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
一、填空题(每空2分,共40分)二、计算题(每小题10分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。
山东财经大学《多元统计分析》期末复习题参考
多元统计分析期末复习题参考1、设其中,设,求 3(,)X N μ∑:2 1 1 13, 1 3 21 1 2 2μ⎛⎫⎛⎫ ⎪ ⎪=-∑= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭(-1 2 3)a =1);(')(')E a X D a X 及2) 求。
123123(|,)(|,)E X X X D X X X 及2、已知,为来自X 的两个样品观测得其观21 1 0.9,10.9 1X N ⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭:12,X X 测值为:,求12,x x 的马氏距离。
1221,12x x ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭3、设抽了5个样品,每个样品只测了一个指标,它们分别是1, 2, 4.5, 6, 8, 若样品间距离用欧氏距离来度量,试用最短距离法对其进行聚类,要求画出聚类图。
4、设抽了5个有序样品,每个样品只测了一个指标,它们分别是1, 2, 3.5, 6, 8, 试用最优分割法对该5个样品分为3类。
5、设有两个总体的分布分别为:12, G G 221018 122020 -7,, ,,1512 3225-7 5N N ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭试问样品分别按以下两种准则各应判归哪一类? (1)(2)2015,2020X X ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭1)按距离判别准则;2)按贝叶斯判别准则(取)。
121=,(2|1)10,(1|2)752q q C C ===先验概率误判损失为6、在某中学随机抽取某年级30名学生,测量其身高(X1),体重(X2),胸围(X3)和坐高(X4)四个指标,这四个变量的相关系数矩阵的特征根及单位特征向量分别为:113.541, (0.497, 0.5146, 0.4809, 0.5069)u λ'==220.3133, (0.5432, 0.2102, 0.7246, 0.3683)u λ'==--330.0794, (0.4496, 0.4623, 0.1752, 0.7439)u λ'==--440.0661, (0.5057, 0.6908, 0.4615, 0.2323)u λ'==--1) 写出四个主成分的表达式;2) 计算每个主成分的方差贡献率,并结合碎石图适当选取主成分个数;3) 主成分分析有哪些应用?7、对纽约股票市场上的五种股票的周回升率X1,X2,X3,X4,X5进行了因子分析,其中X1,X2,X3分别表示三个化学工业公司的股票回升率,X4,X5表示两个石油公司的股票回升率,试这5个变量的相关系数矩阵的前两个特征根和对应的单位特征向量为112.857, (0.464,0.457,0.47,0.421,0.421)u λ'==221.024, (0.24,0.509,0.26,0.526,0.582)u λ'==--1) 取公共因子个数为2,求因子载荷阵A ;2) 用F1,F2表示选取的公共因子,表示特殊因子,写出因子模型;12,εε3) 说明因子载荷矩阵中元素的统计意义。