应用多元统计分析A卷试题
应用多元统计分析试题及答案(1)
应用多元统计分析试题及答案(1)多元统计分析是现代统计学中不可或缺的一部分,它是用于对不同数据进行相关分析的高级统计方法。
对于需要进行多因素分析的问题,多元统计分析是必须掌握的技能。
以下是一些应用多元统计分析的试题及答案。
试题1:假设你要进行一项研究,以评估学生在学期末考试成绩与他们的就业情况之间是否存在关联。
你将分析什么类型的多元统计分析?答案:此问题需要进行一种二元多元回归分析。
此方法可以用于探索学期末考试成绩和就业情况之间的相关性。
通过回归分析,我们可以计算出两个变量之间的相关系数以及建立一个数学模型来预测就业成功与否的可能性。
试题2:你是一家旅游公司的行销经理,你想了解你们的财务状况、品牌信誉和市场定位之间的关系。
采用哪种多元统计分析来解决这个问题?答案:这个问题需要进行一种因子分析。
因子分析是一种常用的多元统计技术,可用于探索大量变量之间的共性或相似性。
因此,行销经理可以使用因子分析来探究这三个因素之间的关系,以帮助公司更好地了解市场需求、推广策略和产品定位。
试题3:你是一名医学研究员,你需要研究新型药物的效果以及它是否与特定人群的特征相关。
哪种多元统计分析可用于研究?答案:这个问题需要使用一种路径分析方法。
路径分析是一种分层回归分析技术,可用于探索变量间的直接和间接影响关系。
因此,研究人员可以使用路径分析来研究新型药物的效果以及与特定人群特征的相关性,以便更好地理解治疗效果的影响因素。
试题4:你是一名市场分析师,你需要研究不同年龄、性别和教育水平的人群之间的消费习惯。
采用哪种多元统计分析来解决这个问题?答案:这个问题需要使用一种聚类分析方法。
聚类分析是一种将成为节点的相似对象分组的过程。
因此,市场分析师可以使用聚类分析来将相似的人群以及他们的共同消费习惯分成几个类别,以便更好地了解不同年龄、性别和教育水平背景下的人群之间的消费习惯和偏好。
结论:多元统计分析是一种有用的技术,可以用于探索大量不同变量之间的关系,对于需要分析多个变量之间关系的问题,多元统计分析是必须学习的基本技能。
2006年研究生《多元统计期末试题》(A卷)
(10 分)
姓
名
二、下面是 4 个变量 X 1 , X 2 , X 3 , X 4 两两之间的相关系数矩阵,试用模糊聚类法
院
系
作聚类并画出谱系图。
1 0.92 1 R 0.09 0.87 1 0.58 0.75 0.67 1
(8 分)
使用学期
三、 设三个总体 G1 , G2 , G3 的分布分别为: N (2, 0.52 ), N (0, 22 ), N (3,12 ) 。试问
中国地质大学(武汉)研究生课程考试出题专用纸
考试课程名称:多元统计分析 学时: 60
简述动态聚类法的基本思想和步骤,在实际应用中如何确定合理的聚类 数目? (8 分) 六、试比较主成分分析、因子分析、对应分析这三种方法的异同之处并简要介 绍它们的应用。 (14 分) 综合题: (30 分) 七、如果你作为研究人员参加定量研究“和谐社会”这样的课题,对于以下两 个问题,请提出你的设想: (1) 你觉得应该选取涉及哪些方面的指标,构成指标体系?如果有些指标没 有现存的统计数据,兼顾考虑研究的经济成本和样本数据量的话,你该 怎么办? (2) 你觉得在这个课题的研究过程中,可以应用哪些多元统计方法?请指出 每种方法的应用具体设想。 (14 分) 八、某教学研究小组试图利用统计方法研究以下几个问题: (1) 对某专业 100 名学生,进行了多门课程(包含各种基础课程和专业课程) 考试,有的课程是闭卷考试,有的则是开卷考试。为了充分利用这些课 程成绩所提供的信息,你觉得可以采用哪些统计方法做分析?简要说明 你的分析思路。 (2) 如何对这些学生作出合理的综合评价?要做到因材施教,如何确定每个 学生的特点和发展潜力? (3) 研究小组对该专业近几年毕业生(部分继续攻读硕士和博士学位,部分参 加工作)做了问卷和座谈方式的调查,你觉得可以利用怎样的统计方法 进行分析,获得对今后的教学和管理具有指导意义的信息? (16 分)
(完整版)多元统计分析试题及答案
2009学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:100 分钟学号 姓名 年级专业一、填空题(5×6=30)22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
二、计算题(5×11=50)(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
厦门大学《应用多元统计分析》试题A答案
一、判断题 1. 正确
( ) 证明: ∀c = c1, c2 ,"cp ,
∑∑ c′∑c =
cic jσ ij
ji
= ∑∑cic j [E(Xi − E(Xi ))(Xj − E(Xj ))]
ji
= E⎢⎡∑c j (Xi − E(Xi ))∑ci (Xj − (E Xj ))⎥⎤
=
(n
−1)[
(n −1) p
n(X − μ0 )′S−1
n(X − μ0 )]
八、
( ) ( ) 在典型相关分析中 X (1) =
X
(1)
1
,
X
(1)
2
"
X
(1)
p
′
,
X
(2)
=
X 1(2 ) ,
X
(2
2
)
"
X
(2
q
)
′
是
两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量 Ui、Vi,使
计算共因子的方差贡献得:
g12
=
λ1
= 1.9633;
g
2 2
=
0.6795;
g 32
=
0.3572 ,分别为公共因子
F1, F2 ,
F
对X
的贡
献,是衡量每个公共因子的相对重要性的尺度。
三、解:先求三元总体 X 的协方差阵 ∑ 的特征根,
σ2 −λ ∑ −λE = ρσ 2
0
ρσ 2 σ2 −λ
ρσ 2
−00.7.6439749⎟⎟⎞⎜⎜⎜⎛ 1.9633 − 0.1772⎟⎠⎜⎜⎝ 0.4479 ⎟⎞ − 0.3812⎟ − 0.1059⎟⎠
应用多元统计分析试题及答案
一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q型聚类和 R型聚类。
4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。
二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。
对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。
要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
3、简述费希尔判别法的基本思想。
从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
多元统计考题A卷
1.6
5.2
800
5
0.9
4.2
813
6
1.7
3.8
812
7
2.1
1.1
862
8
2.5
4.5
765
9
2.0
2.7
820
五、(15分)
设有5个产品,每个只测量了一个指标,得数据如下:1,2,4.5,6,8试用欧式距离和最短距离法将它们进行分类,并画出系统聚类图。
六、(15分)
设 与 有相关关系,其8组观测数据见下表。
4.设 来自于A1,A2,…Ag总体,按贝叶斯准则建立多总体判别模型即是要求,其 k=1,2,…,g。
5.聚类分析分Q型和R型聚类,当需要研究变量与变量之间关系时,一般使用,常用统计量作为分类依据。
二、(10分)
设 是 维随机向量, , ,其中 为非零向量,
证明:
三、(10分)
设有 组样本观测值数据
其中, 表示第 次试验或第 个样本关于变量 的观测值,证明:
四、(15分)
某钻探区钻了9口探井,下表列出了这9口井的横坐标 、纵坐标 以及某含油层顶面的海拔高程 。含油层海拔高度的单位是米。试求其一次趋势面方程。
序号
横坐标,
纵坐标,
海拔高程,
1
0.6
1.7
873
2
1.4
6.2
793
3
0.3
6.1
870
序号
1
38
47.5
23
66.0
2
41
21.3
17
43.0
3
34
36.5
21
36.0
4
多元统计学多元统计分析试题(A卷)(答案)
《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离,马氏距离2()ijd M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L =6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
一、填空题(每空2分,共40分)1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。
华东师范大学期中期末试卷多元统计分析标准答案A2013
华东师范大学期末试卷(A)标准答案2012----2013学年第二学期课程名称: 多元统计分析学生姓名: ______________________ 学 号: ________________ 专 业: ______________________ 年级/班级: _______________ 课程性质:专业必修一、选择题(每题2分,共20分). 1. D2. D3. A.4. C.5. C.6. B.7. C8. B.9. D.10. C二、填空题(每空2分,共20分)1. 1/211/()(,)()(,)()V a r X C O V X Y V a r Y C O V Y X V a r X --- 1/211()(,)()(,)()V a r Y C O V Y X V a r XC O V X Y V a r Y --- 2. 1211,,T T n n X X Y Y n nττ∑=∑= 1(,),T n C o v X Y X Y n τ=3. 1(),T j j j u h X EX λ=-(),T j j v h X EX =-4. 11((),,),T T p n W rk A M AM A J μμ--∑ΩΩ=∑=∑ 11((),,),()()T T p n n n W n rk A M I A M I A J μμ---∑ΩΩ=∑-=∑-5. 设A 和B 是两个互不相交的集合,集合{(,):,}A B x y x A y B ⨯=∈∈称为笛卡尔积,非空集合{(,):,}R A B x y x A y B ⊂⨯=∈∈称为一种关系,如果存在(,)x y A B ∈⨯使得(,)x y R ∈,那么称A 和B 有关联。
设A 和B 是两个互不相交的集合,集合()R A 和()R B 分别由A 和B 唯一确定,如果()()R A R B ⊂ 那么称A 和B 相干。
三、改错题(每题2分,共20分)1. 12.10 0.00 5.68 0.00 B;→12.10 0.00 5.68 0.00 B;2.set ds511-d511test;→set ds511-d511test;3.class x1-x&m;→Var x1-x&m;4. proc means out=bbb000 noprint;→proc means data=bbb000 noprint;5. AAA=c*ginv(c`*c)*c`-j(nrow(c),ncol(c),1)/nrow(c);→AAA=c*ginv(c`*c)*c`-j(nrow(c),ncol(c),1)/nrow(c);6.print www1 mvvvvvv1 mvvvvv1, mu1 www2 mvvvvvv2 mvvvvv2 mu2; →print www1 mvvvvvv1 mvvvvv1 mu1 www2 mvvvvvv2 mvvvvv2 mu2;7. if test=&jjj then call symput('&ttt',ttt);→if test=&jjj then call symput('&ttt',ttt);8. data zzz set zzz ccc;→data zzz set zzz ccc;9. gua=&col3;→gua=col3;10. proc sort; var rf;→proc sort; var rf;四、编程题(每题10分,共40分)1. proc cancorr data=a out=b;var y1-y5;with x1-x5;proc print; run;2. proc anova data=a outstat=b;Class x1-x5;Model y1-y3= x1-x5;Proc print;Run;3. proc corresp data=a out=b;var x1-x5;id y;proc print;run;4.proc cluster data=a out=x;var x1-x5;id name;proc tree n=3 data=x out=b;proc print;run;。
多元统计期末考试试题
多元统计期末考试试题一、选择题(每题2分,共20分)1. 以下哪项不是多元统计分析中常用的数据预处理方法?- A. 标准化- B. 归一化- C. 特征选择- D. 数据清洗2. 多元回归分析中,当自变量之间存在高度相关性时,我们通常称之为:- A. 多重共线性- B. 正态性- C. 同方差性- D. 独立性3. 以下哪项不是主成分分析(PCA)的目的?- A. 降维- B. 特征选择- C. 变量解释- D. 增加数据的维度4. 聚类分析中,若要衡量聚类效果,常用的指标不包括:- A. 轮廓系数- B. 熵- C. 戴维斯-库尔丁指数- D. 距离方差5. 因子分析中,因子载荷矩阵的元素表示:- A. 观测变量的均值- B. 因子的方差- C. 观测变量与因子之间的关系- D. 因子之间的相关性二、简答题(每题10分,共30分)1. 请简述多元线性回归分析的基本假设,并说明违反这些假设可能带来的问题。
2. 描述主成分分析(PCA)的基本步骤,并说明其在数据降维中的应用。
3. 聚类分析与分类分析有何不同?请举例说明。
三、计算题(每题25分,共50分)1. 假设有一组数据,包含三个变量X1、X2和Y,数据如下:| X1 | X2 | Y ||-|-|-|| 1 | 2 | 3 || 2 | 4 | 6 || 3 | 6 | 9 || 4 | 8 | 12 |请计算多元线性回归模型的参数,并检验模型的显著性。
2. 给定以下数据集,进行K-means聚类分析,选择K=3,并计算聚类中心。
| 变量1 | 变量2 | 变量3 ||--|-|-|| 1.2 | 2.3 | 3.4 || 1.5 | 2.5 | 3.6 || 4.1 | 5.2 | 6.3 || 4.4 | 5.6 | 6.8 || 7.1 | 8.2 | 9.3 || 7.4 | 8.6 | 9.9 |四、论述题(每题30分,共30分)1. 论述因子分析与主成分分析的异同,并讨论它们在实际应用中可能遇到的问题及解决方案。
多元统计分析题
多元统计分析模拟试题(两套:每套含填空、判断各二十道)A卷1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法。
2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。
3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。
4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极大似然法5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为=8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。
9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化为几个综合指标的多元统计方法。
10)在进行主成分分析时,我们认为所取的m(m<p,p为所有的主成分)个主成分的累积贡献率达到85%以上比较合适。
11)聚类分析的目的在于使类内对象的同质性最大化和类间对象的异质性最大化12)是随机变量,并且有,那么服从(卡方)分布。
13)在对数线性模型中,要先将概率取对数,再分解处理,公式:14)将每个原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子15)判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须至少一个以上,解释变量必须是可测量的16)当被解释变量是属性变量而解释变量是度量变量时判别分析是合适的统计分析方法17)多元正态分布是一元正态分布的推广18)多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多元分析的基础19)因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分表示成各变量的线性组合。
20)统计距离包括欧氏距离和马氏距离两类1)因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度。
期末试卷应用多元统计分析A卷
浙江农林大学 2015 - 2016 学年第 二 学期考试卷(A 卷)课程名称: 多元统计分析 课程类别: 专业必修课 考试方式闭卷注意事项:1、本试卷满分100分.2、考试时间 120分钟.一、填空题(每空3分,共30分)1. 因子分析的内容非常丰富,常用的因子分析类型是 和Q 因 子分析.2. 是将R 型因子分析Q 型因子分析结合起来进行的统计分析方法.3. 总体方差未知的情况下,采用总体方差用 来进行估计.4. 设三维随机向量),(~3∑μN X ,其中⎪⎪⎪⎭⎫⎝⎛=∑200031014,则1X 与2X (是否独立).5. 因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 .6. 设随机向量123(,,)X X X X '=,均值向量(125)μ'=,协方差矩阵4202920216⎛⎫⎪∑=- ⎪ ⎪-⎝⎭,则1X 的期望1()E X = ,12(,)Cov X X = ,13(,)X X ρ= .7. 因子分析中因子载荷系数ij a 的统计意义是: .学院: 专业班级: 姓名: 学号:装 订 线 内 不 要 答 题二、简答题(每小题9分,共18分)2.什么是相应分析?它与因子分析有何关系?三、实验题(每空4分,共32分)1.某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销.根据这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数进行判别分析,所得分析结果如下:根据分析结果给出三个分类各自贝叶斯判别函数:(1) ; (2);(3) ;(4 )现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,判别该饮料属于 销售情况.2. 根据我国2003年各地区农村居民家庭平均每人主要食品消费量,利用主成分方法对数据进行分析结果如下:根据分析结果,(1)根据特征值大于1的标准,需要提取 个主成分; (2)前两个主成分的累计贡献率为 ;(3)写出第一主成分表达式 ; (4)第一主成分和2X 的因子载荷为 .特征根和方差贡献率表表6.5 因子载荷阵3.四、操作题(共18分)为研究两类地理环境问题,选定4个指标X1、X2、X3、X4,序号1-10的样品的地理情况已分成2类,13-15的待定(下表前6列为原始数据)。
多元统计分析(A)
2010-2011学年第一学期信息与计算专业《多元统计分析》(课程)试卷一、计算(每小题8+10+6分,共24分)1、(共2+6=8分)设X ~),(3∑μN ,其中),,(321'=X X X X ,)2,0,1('=μ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑221241111试求:1)计算1X 和2X 的相关系数2) ⎪⎪⎭⎫⎝⎛++=⎪⎪⎭⎫ ⎝⎛=322121X X X X Y Y Y 的分布。
2、(共5+5=10分)、设一个容量为n=4的随机样本取自二维正态总体),(2∑μN ,其数据矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=4031-2231-X , 1)计算样本均值x ,样本自方差2S2). 对]2,2[='μ计算统计量2T 的值,并将其变为F 统计量,同时在显著水平为0.05下检验0μμ=。
(19)05.0(,5.199)05.0(2,21,2==F F )3、(共6分)已知五个样品的之间的距离矩阵如下:D=⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡082101109360730605432154321 类间距采用最长距离法,将五个对象分为3类。
二、简答(每小题5分,共20分)1、马氏距离相对欧式距离有什么优点。
2、快速聚类分析的步骤。
3、主成分分析和因子分析的区别。
4、简述典型相关分析模型(用数学形式表示,并解释每个符号的意义)。
三、(每小题6+4+4分,共14分) 为了为了考虑鸡的头(X)和腿(Y)的关系,头观察了两个指标颅骨宽(X1)和颅骨长(X2),腿观察了股骨长(Y1)和胫骨长(Y2),利用spss得到以下结果:Canonical Correlations(表一)1 .6312 .057Raw Canonical Coefficients for Set-1(表二)V1 V2X1 0.781 -.856X2 0.345 1.106Raw Canonical Coefficients for Set-2(表三)W1 W2Y1 0.060 -2.648Y2 0.944 2.475Canonical StructureCorrelations Between the set-1 Variables and Their Canonical Variables(表四)V1 V2X1 0.9548 -0.2974X2 0.7388 0.6739Correlations Between the set-2 Variables and Their Canonical Variables(表五)W1 W2Y1 0.9343 -0.3564Y2 0.9997 0.0227Correlations Between the set-1 Variables and the Canonical Variables of the set-2 Variables(表六)W1 W2X1 0.6025 -0.0169X2 0.4663 0.0383Correlations Between the set-2 Variables and the Canonical Variables of the VAR Variables(表七)V1 V2Y1 0.5897 -0.0202Y4 0.6309 0.0013根据上面结果,试回答以下问题:1、这两组经济变量间的典型相关系数分别是多少,并写出相应的典型相关变量。
研究生多元统计分析试题(A卷)(答案)
内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。
多元统计分析试卷A(12-13-2)
东 南 大 学 考 试 卷(A 卷)课程名称 应用多元统计分析 考试学期12-13-2得分适用专业 数学系信息专业 考试形式闭卷考试时间长度 120分钟可以使用计算器1、对8个学生调查其智商IQ 和课后复习某门课时间t ,该门课考试成绩g ,如下表。
试建立由智商和复习时间预测该课程考试成绩的公式。
若某人智商130,复习15h ,预测其得分。
请写出以上问题的SAS 程序。
(15分)自觉 遵 守 考 场 纪 律 如 考 试 作 弊 此 答 卷 无 效2、设甲、乙、丙三个车间都生产某种型号的电池,为了评比它们的质量,今从各车间产品中随机的抽取5只,测得他们的寿命(h ),如下表所示。
问这三个车间的电池寿命有无显著差异?若有,哪个车间电池最好?请写出以上问题的SAS 程序,并根据结果做出判断。
(15分)若运行结果如下:Source DF Type III SS F Value Pr > FA 2 520.93333333 7.73 0.00703、12个社区总人口数1x ,受教育年限中位数2x ,就业人数3x ,专业服务业人数4x ,家庭收入中位数5x ,如下表所示。
试用SAS 分析其主成分,写出程序,并根据结果选择主成分个数,写出具体主成分表达式及各主成分含义。
(15分)若运行结果如下:Eigenvalues of the Correlation MatrixEigenvalue Difference Proportion CumulativePRIN1 2.87331 1.07665 0.574663 0.57466PRIN2 1.79666 1.58182 0.359332 0.93399PRIN3 0.21484 0.11490 0.042967 0.97696PRIN4 0.09993 0.08468 0.019987 0.99695PRIN5 0.01526 . 0.003051 1.00000EigenvectorsPRIN1 PRIN2 PRIN3 PRIN4 PRIN5X1 0.342730 0.601629 0.059517 0.204033 0.689497X2 0.452507 -.406414 0.688822 -.353571 0.174861X3 0.396695 0.541665 0.247958 0.022937 -.698014X4 0.550057 -.077817 -.664076 -.500386 -.000124X5 0.466738 -.416429 -.139649 0.763182 -.0824254、已知某因子分析结果如下,试写出因子负荷矩阵,解释公共因子1和2,并说明因子1,2谁更重要,并写出所有共性方差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.R型因子分析是指对_____________进行分析,Q型因子分析是指对_____________进行分析。
得分
二、简述(10分×2)
1.比较主成分分析与因子分析的异同点。
2.简述聚类分析的基本思想
3)写出因子得分函数
4)解释因子的含义,并进行适当分析
3.250
54.159
54.159
2
1.255
20.910
75.069
1.255
20.910
75.069
3
.732
12.204
87.272
4
.465
7.748
95.021
5
.235
3.916
98.937
6
.064
1.063
100.000
提取方法:主成份分析。
成份得分系数矩阵
成份
1
2
体重
-.242
.342
得分
一、填空(2分×15)
1.常见的统计图有___________,___________,___________,___________以及___________。
2.系统聚类分析方法有___________,___________,___________,___________,___________和___________。
腰围
-.265
.285
脉搏
.127
-.461
单杠
.239
.244
仰卧起坐
.270
.238
跳高
.182
.519
提取方法:主成份。
1)当贡献率超过85%时应该选取几个主成分。
2)写出第一、第二主成分表达式
3)第一到第三主成分的方差分别是多少
4)进行适当的主成分分析
2.在某年级44名学生的期末考试中,有的课程采用闭卷,有的课程采用开卷,对数据进行了因子分析,输出结果如下:
x2物理(闭)0.67015 0.44046 -0.58552
x3代数(开)0.84837 -0.02156 0.07721
x4几何(开)0.80568 -0.26171 0.03545
x5统计(开)0.63520 -0.68152 0.00893
Rotated Factor Pattern
Factor1 Factor2
x1力学(闭)0.05488 0.85565
x2物理(闭)0.18811 0.77957
x3代数(开)0.63399 0.56414
x4几何(开)0.76698 0.35967
x5统计(开)0.92948-0.06329
Standardized Scoring Coefficients
Factor1 Factor2
3 0.56944597 0.13350618 0.1139 0.8507
4 0.43593980 0.12534437 0.0872 0.9379
5 0.31059542 0.0621 1.0000
Factor Pattern
Factor1 Factor2 Factor3
x1力学(闭)0.62491 0.58706 0.46831
得分
三、证明(10分×1)
1.设随机向量 的均值向量、协方差矩阵分别为
试证:
得理指标和运动指标共计6个变量,对这六个变量进行主成分分析输出结果如下:
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
3.250
54.159
54.159
Eigenvalues of the Correlation Matrix: Total = 5 Average = 1
Eigenvalue Difference Proportion Cumulative
1 2.61195302 1.53988724 0.5224 0.5224
2 1.07206578 0.50261981 0.2144 0.7368
x1力学(闭0.23925 0.54760
x2物理(闭)0.25657 0.41085
x3代数(开)0.32480 -0.02011
x4几何(开)0.30846 -0.24411
x5统计(开)0.24319 -0.63570
1)初次进行因子分析时,贡献率不超过85%,应该选取几个因子?
2)试结合输出结果解释为何进行因子旋转,并说明因子旋转的效果。