应用多元统计分析试题及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空题:
1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.
2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.
3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。
4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若
()
(,), P
x N αμα
∑=1,2,3….n且相互独立,则样本均值向量x服从的分布
为_x~N(μ,Σ/n)_。
二、简答
1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A
和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。
从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数:
确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1;
第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;
第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。
协差阵的检验
检验0=ΣΣ
0p H =ΣI : /2
/21exp 2np n e tr n λ⎧⎫⎛⎫
=-⎨⎬ ⎪
⎩⎭⎝⎭
S S
00p H =≠ΣΣI : /2
/2**1exp 2np n e tr n λ⎧⎫⎛⎫
=-⎨⎬ ⎪
⎩⎭⎝⎭
S S
检验12k ===ΣΣΣ012k H ===ΣΣΣ:
统计量/2/2
/2
/2
1
1
i i k
k
n n pn np k i
i
i i n
n
λ===∏∏S
S
6、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。 设d ij 表示样品X i 与X j 之间距离,用D ij 表示类G i 与G j 之间的距离。
(1). 最短距离法
,min
i k j r
kr ij X G X G D d ∈∈=
min{,}kp kq D D =
(2)最长距离法
,max
i p j q
pq ij X G X G D d ∈∈=
,max
i k j r
kr ij X G X G D d ∈∈=
max{,}kp kq D D =
(3)中间距离法
其中
(4)重心法
2
()()pq p q p q D X X X X '=-- )(1
q q p p r
r
X n X n n X +=
22222
p q p q kr
kp
kq
pq r
r
r n n n n D D D D n n n =
+
-
(5)类平均法
221
i p j j
pq ij
X G X G p q
D d n n ∈∈=
∑∑ 221
i k j r
kr
ij
X G X G k r D d
n n ∈∈=∑∑22p q kp
kq r
r
n n D D n n =
+
(6)可变类平均法
其中b 是可变的且b <1 (7)可变法
ij G X G X ij d D j
j i i ∈∈=
,min
2
2222
121pq
kq kp kr D D D D β++= 222
2
(1)()p q kr kp kq pq
r r
n n D D D D n n ββ=-++
2222
1()2
kr kp kq pq D D D D ββ-=
++ 其中b 是可变的且b <1 (8)离差平方和法
1
()()t
n t it t it t t S X X X X ='=--∑
2222
k p k q k kr
kp
kq pq r k
r k
r k
n n n n n D D D D n n n n n n ++=
+
-
+++
7、比较主成分分析与因子分析的异同点。
相同点:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
9、进行相应分析时在对因素A 和因素B 进行相应分析之前没有必要进行独立性检验?为什么?
有必要,如果因素A 和因素B 独立,则没有必要进行相应分析;如果因素A 和因素B 不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。