多元统计分析期末试题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空题
1、多元统计分析研究的内容是多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。
2、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为)1
,
(~∑n
N X p μ。 3、Fisher 判别法中系数P C C C ,,,21 确定的原则是使两组间的区别最大,而使每个组内部离差最小。 4、对一个样本来说,他的轮廓图是多角折线。
5、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、=),(21F F Cov 0。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
二、判断题
1、多元统计分析的含义。
2、协差阵是非负定矩阵,是一个对称矩阵(对角阵)。
3、均值检验时采用的检验统计量是不唯一的。
4、一个多元数据画出来的图形不是唯一的(包括轮廓图、雷达图和调和曲线图)。
5、系统聚类的原则是把距离短的样品归在相同类,距离长的样品归在不同类。
6、Bayes 判别法的基本思想是假定对研究的对象有一定的认识,常用先验概率来描述这种认识。
7、主成分的协差阵是对角阵。
8、因子分析是主成分分析两种方法的出发点都是变量的相关系数矩阵,在损失较少信息的前提下,把多个变量(这些变量之间要求存在较强的相关性,以保证能从原始变量中提取主成分)综合成少数几个综合变量来研究总体各方面信息的多元统计方法,且这少数几个综合变量所代表的信息不能重叠,即变量间不相关。
9、对应分析可分析的三个方面Q 型因子分析、R 型因子分析和样本和变量之间的分析。 三、计算题
1、设随机向量()'
=21,X X X 的联合密度函数为:
⎩
⎨⎧≤≤≤≤=其他,01
0,0,8),(1212121x x x x x x x f
求X 的均值向量。
解:
2
121222
12111),()(),()(dx dx x x f x X E dx dx x x f x X E D
D
⋅⎰⎰=⋅⎰⎰=
2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。若样本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。
解:样品与样品之间的明氏距离为:⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫
⎝⎛=02
5
.36
7
05.14505.25.30
1
05
432154
321)
0(x x x x x x x x x x D 样品最短距离是1,故把21X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵
⎪⎪⎪⎪⎪⎪⎭
⎫
⎝⎛
=025.3705.1505.30}
,{},{54
32154321)
1(x x x x x x x x x x D 类与类的最短距离是 1.5,故把43X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵
⎪⎪⎪⎪⎪⎪⎭
⎫
⎝⎛
=05.3705),{0}
,{},{},{5
432154321)
2(x x x x x x x x x x D 类与类的最短距离是 3.5,故把543},{X X X 与合并为一类,计算类与类之间距离(最长距离法)得距离
阵⎪⎪⎪⎭
⎫ ⎝⎛
=07},,{0},{},,{},{5432154321)
3(x x x x x x x x x x D 分类与聚类图(略)
3、设变量123,,X X X 的相关阵为 1.000.630.450.63 1.000.35,0.450.35 1.00R R ⎛⎫
⎪
= ⎪ ⎪⎝⎭
的特征值和单位化特征向量分别为
()111.96,0.63,0.59,0.51;T
l λ==
20.68,λ=()20.22,0.49,0.84;T
l =-- 30.37,λ=()30.75,0.64,0.18T
l =--
(1) 取公共因子个数为2,求因子载荷阵A 。
(2) 计算变量共同度2
i h 及公共因子j F 的方差贡献,并说明其统计意义。
解:因子载荷阵⎪⎪⎪⎪⎭
⎫
⎝⎛--=68.084.096.151.068
.049.096.159.068
.022.096.163.0A 变量共同度:2
221)68.022.0()96.163.0(-+=h =
2222)68.049.0()96.159.0(-+=h =
2223)68.084.0()96.151.0(+=h =
公共因子j F 的方差贡献:
2221)96.151.0()96.159.0()96.163.0(++=S 2222)68.084.0()68.049.0()68.022.0(+-+-=S
统计意义(略)
4、设三元总体X 的协方差阵为⎪⎪⎪
⎭
⎫ ⎝⎛=∑600030001,从∑出发,求总体主成分123,,F F F ,并求前两个主成
分的累积贡献率。
解:特征方程0||=∑-E λ,得特征根:1,3,6321===λλλ
61=λ的特征方程:0000030005321=⎪
⎪⎪
⎭⎫
⎝⎛⎪⎪⎪⎭⎫ ⎝⎛x x x ,得特征向量⎪⎪⎪⎭⎫ ⎝⎛=1001u
31=λ的特征方程:0300000002321=⎪
⎪⎪
⎭⎫
⎝⎛⎪⎪⎪⎭⎫ ⎝⎛-x x x ,得特征向量⎪⎪⎪⎭⎫ ⎝⎛=0102u
11=λ的特征方程:0500020000321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛--x x x ,得特征向量⎪⎪⎪
⎭⎫
⎝⎛=0013u
31x F = 22x F = 13x F =
前两个主成分的累积贡献率9.010
9
= 四、证明题
1、设三维随机向量),(~3∑μN X ,其中⎪⎪⎪
⎭
⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否
独立?为什么?
解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭
⎫
⎝⎛∑∑∑∑=∑22211211,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独