《多元统计分析》期末复习题(201412)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
(1) 试从 Σ 出发求 X 的第一主成分; (2) 试问当 取多大时才能使第一主成分的贡献率达 95%以上。
19. 设标准化变量 X 1 , X 2 , X 3 的协方差阵(即相关系数阵)为
1.00 0.63 0.45 R 0.63 1.00 0.35 0.45 0.35 1.00
c
i 1
n
i
1 令
n n Z ci Xi 。试证明: 1)Z 是 μ 的无偏估计量; 2) Z ~ N p μ, ci2 Σ i 1 i 1
16 -4 2 4. 设 X =(X 1 , X 2 , X 3 ) ~ N 3 (μ, Σ) , 其 中 μ = 1, 0, -2 ,Σ = -4 4 -1 , 试 判 断 2 -1 4 X X3 X1 2 X 2 与 2 是否相互独立。 X1
13. 设有两个正态总体 G1 和 G2 ,已知:
10 20 18 12 20 7 μ (1) , μ (2) , Σ1 , Σ2 15 25 12 32 7 5
试用距离判别法判断:样品: x
《多元统计分析》期末复习题
一、 简述题
1. 针对一个多元正态总体 N p (μ, Σ) 均值向量 μ 的检验 H 0 : μ μ 0 H1 : μ μ 0 而言,其 中 μ 0 是已知的向量。在协方差阵 Σ 已知和未知的两种情形下,如何分别构造的统计量? 2. 简述欧几里得距离与马氏距离的区别和联系。 3. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。 4. 试述 K 均值法与系统聚类法的异同。 5. 试述有序聚类法的基本思想。 6. 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。 7. 简述费希尔判别法的基本思想。 8. 试述主成分分析的基本思想 9. 主成分分析的作用体现在何处? 10. 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。
5. 设总体 X ~ N p (μ, Σ) ( Σ 未知) , X1 , X 2 , , X n 是来自总体 X 的样本, C 是秩为 k 的
k p 阶矩阵,试检验 H 0 : Cμ Cμ 0 H1 : Cμ Cμ 0 ,其中 μ 0 是已知的向量。
6. 对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根 据以往资料, 该地区城市2周岁男婴的这三项指标的均值 μ 0 = 90,58,16 。 现欲在多元正态 性的假设下检验该地区农村男婴是否与城市男婴有相同的均值。其中
11. 简述因子模型
中载荷矩阵 A 的统计意义。
12. 在进行因子分析时,为什么要进行因子旋转? 13. 比较主成分分析与因子分析的异同点 14. 简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 15. 试分析一组变量的典型变量与其主成分的联系与区别 16. 简述典型相关分析中载荷分析的作用。
同度 hi (i 1, 2,3) ; (3)计算第一公因子对 X 的“贡献”。
2
21. 已知标准化变量 X ( X 1 , X 2 ) 和 Y (Y1 , Y2 ) 的相关矩阵为:
R R = 11 R 21
其中 R11 =
R12 R 22
1 1 , R 22 = , R12 R 21 = 1 1
4
2 6
4 2
1 1 ,而其先验 1 9
概率分别为 q1 q2 0.5 ,误判的损失为 L(2 |1) e , L (1| 2) e ,试用 Bayes 判别法确定 样品 x 属于哪一个总体?
3 5
2 2 17.设三元总体 X 的协方差阵为 Σ 0
0 1 0 3 4 0 2 7 9 0
写出聚类的步骤(即写出每一次类合并以后新的个样品,每个只测量了一个指标,分别是 1,2,6,8,11,使用最短距离法将它们分 类。(样品间采用绝对值距离)
10. 设三个总体 G1 , G2 和 G3 的分布分别为: N (2, 0.5 ) , N (0, 2 ) 和 N (3,1 ) ,试问样 品 x 2.5 应 判 归 哪 一 类 ? 1 ) 按 距 离 判 别 准 则 ; 2 ) 按 贝 叶 斯 判 别 准 则 ( 取
R 的特征值和相应的正则化特征向量分别为:
1 =1.9633,
u1 0.6250, 0.5932, 0.5075
2 =0.6795, u 2 0.2186, 0.4911, 0.8432 3 =0.3572, u3 0.7494, 0.6379, 0.1772
二、证明与计算题 1. 设 X ~ N n ( 1, I ) , 其 中 1 (1 1 1) , 考 虑 统 计 量 aX
n
a X
i 1 i
n
i
,其中
a (a1 , , an ) 满足 ai 0 ,试证明 X
i 1
1 n X i 与 aX 相互独立。 n i 1
(0 1),
X 22. 设X ( X 1 , X 2 ), Y (Y1 , Y2 )为两个随机向量,令Z , 且其协方差阵 Y 0 0 0 100 Σ12 0 1 0.95 0 Σ Var(Z) Σ= 11 = , 1 0 Σ 21 Σ 22 0 0.95 0 0 100 0 试求其第一对典型相关变量和它们的典型相关系数?
1
2. 设 Y ~ N n ( Xβ, I ) ,其中 X 为 n p 阶矩阵且 rank( X ) p ,记 H X( XX) X 和
2
M Ι X( XX) 1 X I H ,证明 MY 与 HY 相互独立。
3. 设 X1 , X 2 , , X n 是 来 自 N p μ, Σ 的 随 机 样 本 , ci 0 i 1, 2,..., 4 ,
试对阅读本领与运算本领之间进行典型相关分析。
试求:1)计算因子载荷矩阵 A,并建立因子模型; 2)计算公因子 F j 的方差贡献 gi (i 1, 2,3) ,并说明其统计意义。
2
20. 设某客观现象可用 X ( X 1 , X 2 , X 3 ) 来描述, 在因子分析时,从约相关阵出发计算出
,3 =0.255,由于 1 +2 / 1 +2 3 85% ,所以找前两个 特征值为 1 =1.754,,2 =1
20 ,应归属于哪一类? 20
14. 金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2 为“金融分析员不满足要求”(两个总体均服从正态分布,且协方差阵相等),今测得两个总 体的若干数据,并由这些数据得到
2 4 ˆ 1 1 ˆ 2 , Σ ˆ1 ,μ μ 6 2 1 4
7. 下面是5个样品两两间的距离矩阵
0 4 D(0) 6 1 6
0 9 0 7 10 0 3 5 8 0
试用最长距离法作系统聚类,并画出聚类图。 8. 考虑采用系统聚类法中的最短距离法对下面的数据做聚类分析,样品的距离已经如下面 的矩阵定义:
( 0.01, F0.01 (3, 2) 99.2, F0.01 (3,3) 29.5, F0.01 (3,4) 16.7)
82.0 4.3107 14.6210 8.9464 1 1 3.172 X 60.2 ,(5S) ( 115.6924) 14.6210 37.3760 14.5 8.9464 37.3760 35.5936
2
2
2
1 i j ) q1 q2 q3 1/ 3; L( j | i ) 0 i j 5 1 3 , 2
11. 设有两个二元总体 G1 和 G2 ,从中分别抽取样本计算得到 X1 , X 2
5.8 2.1 Sp 。假设 Σ1 = Σ 2 ,试用距离判别法建立判别函数和判别规则。 样品 2.1 7.6 6 X 应属于哪个总体? 0
12. 设有三个总体 G1 ,G2 , G3 , 先验概率分布分别为 q1 0.05 ,q2 0.65 ,q3 0.30 。
x0 是一个等待判别的样品。 f1 ( x0 ) 0.10 , f 2 ( x0 ) 0.63 , f3 ( x0 ) 2.4 。试依据最大
后验概率准则,判别 x0 的归属。
特征值所对应的公共因子即可,又知
1,2 对 应 的 正 则 化 特 征 向 量 分 别 为
0.707 0 (2)计算共 u1 0.316 , u 2 0.899 ,试求(1)因子载荷矩阵 A,并建立因子模型; 0.632 0.447
分。
2 2 2
0 2 0 1/ 2 ,试求总体主成 2
1 18. 设X ( X 1 , X 2 , X 3 , X 4 ) ~ N 4 (0, Σ),协方差阵Σ
1 1
,0 1
对某一金融分析员进行判别是否能满足这项工作。进行测量得到两个指标为 x 5, 4 ,且 当两组先验概率分别为 q1 0.269, q2 0.731 ,损失相同。 问该金融分析员满足要求吗? 为什么?
16. 设已知有两个正态总体 G1 , G2 ,且 μ1 = ,μ ,2 = ,Σ1 =Σ 2 =Σ =
阅读能力 x2 、 运算速度 y1 和运算能力 y2 的四种测验, 23. 对 140 名学生进行了阅读速度 x1 、 所得成绩的相关系数阵为
0.03 0.24 0.59 1 0.03 1 0.06 0.07 R= 0.24 0.06 1 0.24 1 0.59 0.07 0.24
(1) 试从 Σ 出发求 X 的第一主成分; (2) 试问当 取多大时才能使第一主成分的贡献率达 95%以上。
19. 设标准化变量 X 1 , X 2 , X 3 的协方差阵(即相关系数阵)为
1.00 0.63 0.45 R 0.63 1.00 0.35 0.45 0.35 1.00
c
i 1
n
i
1 令
n n Z ci Xi 。试证明: 1)Z 是 μ 的无偏估计量; 2) Z ~ N p μ, ci2 Σ i 1 i 1
16 -4 2 4. 设 X =(X 1 , X 2 , X 3 ) ~ N 3 (μ, Σ) , 其 中 μ = 1, 0, -2 ,Σ = -4 4 -1 , 试 判 断 2 -1 4 X X3 X1 2 X 2 与 2 是否相互独立。 X1
13. 设有两个正态总体 G1 和 G2 ,已知:
10 20 18 12 20 7 μ (1) , μ (2) , Σ1 , Σ2 15 25 12 32 7 5
试用距离判别法判断:样品: x
《多元统计分析》期末复习题
一、 简述题
1. 针对一个多元正态总体 N p (μ, Σ) 均值向量 μ 的检验 H 0 : μ μ 0 H1 : μ μ 0 而言,其 中 μ 0 是已知的向量。在协方差阵 Σ 已知和未知的两种情形下,如何分别构造的统计量? 2. 简述欧几里得距离与马氏距离的区别和联系。 3. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。 4. 试述 K 均值法与系统聚类法的异同。 5. 试述有序聚类法的基本思想。 6. 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。 7. 简述费希尔判别法的基本思想。 8. 试述主成分分析的基本思想 9. 主成分分析的作用体现在何处? 10. 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。
5. 设总体 X ~ N p (μ, Σ) ( Σ 未知) , X1 , X 2 , , X n 是来自总体 X 的样本, C 是秩为 k 的
k p 阶矩阵,试检验 H 0 : Cμ Cμ 0 H1 : Cμ Cμ 0 ,其中 μ 0 是已知的向量。
6. 对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根 据以往资料, 该地区城市2周岁男婴的这三项指标的均值 μ 0 = 90,58,16 。 现欲在多元正态 性的假设下检验该地区农村男婴是否与城市男婴有相同的均值。其中
11. 简述因子模型
中载荷矩阵 A 的统计意义。
12. 在进行因子分析时,为什么要进行因子旋转? 13. 比较主成分分析与因子分析的异同点 14. 简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 15. 试分析一组变量的典型变量与其主成分的联系与区别 16. 简述典型相关分析中载荷分析的作用。
同度 hi (i 1, 2,3) ; (3)计算第一公因子对 X 的“贡献”。
2
21. 已知标准化变量 X ( X 1 , X 2 ) 和 Y (Y1 , Y2 ) 的相关矩阵为:
R R = 11 R 21
其中 R11 =
R12 R 22
1 1 , R 22 = , R12 R 21 = 1 1
4
2 6
4 2
1 1 ,而其先验 1 9
概率分别为 q1 q2 0.5 ,误判的损失为 L(2 |1) e , L (1| 2) e ,试用 Bayes 判别法确定 样品 x 属于哪一个总体?
3 5
2 2 17.设三元总体 X 的协方差阵为 Σ 0
0 1 0 3 4 0 2 7 9 0
写出聚类的步骤(即写出每一次类合并以后新的个样品,每个只测量了一个指标,分别是 1,2,6,8,11,使用最短距离法将它们分 类。(样品间采用绝对值距离)
10. 设三个总体 G1 , G2 和 G3 的分布分别为: N (2, 0.5 ) , N (0, 2 ) 和 N (3,1 ) ,试问样 品 x 2.5 应 判 归 哪 一 类 ? 1 ) 按 距 离 判 别 准 则 ; 2 ) 按 贝 叶 斯 判 别 准 则 ( 取
R 的特征值和相应的正则化特征向量分别为:
1 =1.9633,
u1 0.6250, 0.5932, 0.5075
2 =0.6795, u 2 0.2186, 0.4911, 0.8432 3 =0.3572, u3 0.7494, 0.6379, 0.1772
二、证明与计算题 1. 设 X ~ N n ( 1, I ) , 其 中 1 (1 1 1) , 考 虑 统 计 量 aX
n
a X
i 1 i
n
i
,其中
a (a1 , , an ) 满足 ai 0 ,试证明 X
i 1
1 n X i 与 aX 相互独立。 n i 1
(0 1),
X 22. 设X ( X 1 , X 2 ), Y (Y1 , Y2 )为两个随机向量,令Z , 且其协方差阵 Y 0 0 0 100 Σ12 0 1 0.95 0 Σ Var(Z) Σ= 11 = , 1 0 Σ 21 Σ 22 0 0.95 0 0 100 0 试求其第一对典型相关变量和它们的典型相关系数?
1
2. 设 Y ~ N n ( Xβ, I ) ,其中 X 为 n p 阶矩阵且 rank( X ) p ,记 H X( XX) X 和
2
M Ι X( XX) 1 X I H ,证明 MY 与 HY 相互独立。
3. 设 X1 , X 2 , , X n 是 来 自 N p μ, Σ 的 随 机 样 本 , ci 0 i 1, 2,..., 4 ,
试对阅读本领与运算本领之间进行典型相关分析。
试求:1)计算因子载荷矩阵 A,并建立因子模型; 2)计算公因子 F j 的方差贡献 gi (i 1, 2,3) ,并说明其统计意义。
2
20. 设某客观现象可用 X ( X 1 , X 2 , X 3 ) 来描述, 在因子分析时,从约相关阵出发计算出
,3 =0.255,由于 1 +2 / 1 +2 3 85% ,所以找前两个 特征值为 1 =1.754,,2 =1
20 ,应归属于哪一类? 20
14. 金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2 为“金融分析员不满足要求”(两个总体均服从正态分布,且协方差阵相等),今测得两个总 体的若干数据,并由这些数据得到
2 4 ˆ 1 1 ˆ 2 , Σ ˆ1 ,μ μ 6 2 1 4
7. 下面是5个样品两两间的距离矩阵
0 4 D(0) 6 1 6
0 9 0 7 10 0 3 5 8 0
试用最长距离法作系统聚类,并画出聚类图。 8. 考虑采用系统聚类法中的最短距离法对下面的数据做聚类分析,样品的距离已经如下面 的矩阵定义:
( 0.01, F0.01 (3, 2) 99.2, F0.01 (3,3) 29.5, F0.01 (3,4) 16.7)
82.0 4.3107 14.6210 8.9464 1 1 3.172 X 60.2 ,(5S) ( 115.6924) 14.6210 37.3760 14.5 8.9464 37.3760 35.5936
2
2
2
1 i j ) q1 q2 q3 1/ 3; L( j | i ) 0 i j 5 1 3 , 2
11. 设有两个二元总体 G1 和 G2 ,从中分别抽取样本计算得到 X1 , X 2
5.8 2.1 Sp 。假设 Σ1 = Σ 2 ,试用距离判别法建立判别函数和判别规则。 样品 2.1 7.6 6 X 应属于哪个总体? 0
12. 设有三个总体 G1 ,G2 , G3 , 先验概率分布分别为 q1 0.05 ,q2 0.65 ,q3 0.30 。
x0 是一个等待判别的样品。 f1 ( x0 ) 0.10 , f 2 ( x0 ) 0.63 , f3 ( x0 ) 2.4 。试依据最大
后验概率准则,判别 x0 的归属。
特征值所对应的公共因子即可,又知
1,2 对 应 的 正 则 化 特 征 向 量 分 别 为
0.707 0 (2)计算共 u1 0.316 , u 2 0.899 ,试求(1)因子载荷矩阵 A,并建立因子模型; 0.632 0.447
分。
2 2 2
0 2 0 1/ 2 ,试求总体主成 2
1 18. 设X ( X 1 , X 2 , X 3 , X 4 ) ~ N 4 (0, Σ),协方差阵Σ
1 1
,0 1
对某一金融分析员进行判别是否能满足这项工作。进行测量得到两个指标为 x 5, 4 ,且 当两组先验概率分别为 q1 0.269, q2 0.731 ,损失相同。 问该金融分析员满足要求吗? 为什么?
16. 设已知有两个正态总体 G1 , G2 ,且 μ1 = ,μ ,2 = ,Σ1 =Σ 2 =Σ =
阅读能力 x2 、 运算速度 y1 和运算能力 y2 的四种测验, 23. 对 140 名学生进行了阅读速度 x1 、 所得成绩的相关系数阵为
0.03 0.24 0.59 1 0.03 1 0.06 0.07 R= 0.24 0.06 1 0.24 1 0.59 0.07 0.24