2013复习提纲
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 聚类分析
基本概念: 聚类分析的基本思想;系统聚类方法的思想及步骤;利用谱系图聚类; 练习题: 1、聚类分析的基本思想是什么?有哪些常见的聚类方法? 2、设有 5 个产品,每个产品测得一项质量指标 X,其值如下:1, 2, 4.5, 6, 8 .试对 5 个产品按质 量指标根据最长距离法进行分为3类.
X
4 2
(1)
2 12 4 10 , 3 8 3 10
X
3 2
(2)
5 7 k 2, m 2 3 9 . 4 5 n1 4, n2 3
(1) 试求两总体的样本组内离差阵 A1, A2 和合并样本协差阵 S. (2) 今有样品 x0 =(2,8)′,试问按马氏距离准则样品 x0 应判归哪一类. (3) 已知先验概率 q1=0.4, q2=0.6,且 L(2|1)=L(1|2)=1.对简例 1 中提供的资料,试用 Bayes 准 则对样品 x0 =(2,8) ′进行判别归类.
计算因子载荷矩阵 A ,并建立因子模型.
第九章:
基本概念:对应分析方法的基本思想。
第十章:
基本概念:典型相关分析方法分析维数 p, q 1 变量的思想。
表 1:相关阵的特征值和特征向量
Eigenvalues of the Correlation Matrix Eigenvalue 3.54109800 0.31338316 0.07940895 0.06610989 Difference 3.22771484 0.23397420 0.01329906 Proportion 0.8853 0.0783 0.0199 0.0165 Cumulative 0.8853 0.9636 0.9835 1.0000
1 2 3 4
Eigenvectors
Z1 X1 X2 X3 X4
0.496966 0.514571 0.480901 0.506928
Z2
-0.543213 0.210246 0.724621 -0.368294
Z3
-0.449627 -0.46233 0.175177 0.743908
Z4
0.505747 -0.690844 0.461488 -0.232343
μ0=(4,50,10)′, H1: 来自百度文库≠μ0 . 2 、 设 一 个 容 量 为 n=4 的 随 机 样 本 取 自 二 维 正 态 总 体
N 2 ( , ) , 其 数 据 矩 阵 为
1 2 1 0 X 3 2 3 4
1)计算样本均值 X ,样本自方差 S ; 2). 对
量(X1)、钠的含量(X2)和钾的含量(X3),由样本数据计算可得 X (4.64, 45.40, 9.965) , 及
离差阵的逆为
0 0 0.0308503 .试在显著水平为 0.05 下检验 H0:μ= 1 A 0.001620 0.0003193 0 0 . 0135773 0 . 0000830 0 . 0211498
多元统计学复习提纲:
1、复习范围是: 北京大学出版社《应用多元统计分析》第 1-3,5-10 章。 以及课堂所用课件的内容。 注意:自备计算器。禁止考试期间相互借用。
第一章:引言
复习概念: 1、多元统计的概念及主要的研究内容和方法(根据肯德尔的书中概括的) 2、试列出几位为多元统计学的发展做了奠基性工作的统计学家。
1 / 3 2 / 3 0.934 0 1 0.934 0.417 0.835 R 1 / 3 1 0 0.417 0.894 0 0.894 0.447 2/ 3 0 1 0.835 0.447 0.128 0.027 0.103
( X 2 , X 3 ) 的分布; 令Y ( X 2 , X 3 X 1 ) ,求它的分布 (2)
Z 2 X 1 X 2 3 X 3 ,试求随机变量 Z 的分布.
4、设从某书店随机抽取 4 张收据了解图书的销售情况.每张收据记录售书数量 X2 及总金额 X1,具体数值如下:
42 52 48 58 X ( n 4, p 2) 4 2 4 5 4 3
3、设三维随机向量 X=(X1,X2,X3),且
, 1
X1 2 1 1 0 X X 2 ~ N ( 0 , 1 2 0 ), 0 0 0 3 X 3
求解: (1)X1 和 (3) 设
试计算样本均值,样本离差阵,样本协差阵和相关阵.
1 1 1 N ( , ) X ( X , X , X ) ( 1 , 0 , 2 ) 3 1 2 3 5、设 X ~ ,其中 , , 1 4 2 1 2 2
Y1 X 1 X 2 Y Y X X 2 3 2 试求: 的数学期望、自协方差及其分布。
4 4 2 ,试求总体的主成分,并计算每个主成分解 1、设三元总体 X 的协方差阵为
释的贡献率。 2、 在某中学随机抽取某年级 30 名学生, 测得其身高( X 1 )、 体重( X 2 )、 胸围( X 3 )、
和坐高( X 4 )四个变量的数据,利用 SAS 软件做主成分分析,有如表 1 所示的相 关阵的特征值和特征向量结果 (1) 在对数据分析时,应调用哪个过程进行主成分分析; (2) 给出各个主成分的贡献率; (3) 给出累计贡献率达到 95%的主成分.
第二章 多元正态分布及参数估计
复习概念: 1、 随机向量的概念及其数字特征(1, 2, 3,4 及均值,协方差性质 1) 2、 多元正态分布定义 2.2.1(性质 2,推论) ,性质 3,性质 4;定义 2.2.3, 及 2.2.4. 3、 独立性 定理 2.3.1 及推论 1. 4、 多元正态的参数估计及无偏估计。 (均值,离差阵,协方差阵,相关阵的关系) 典型例题: 2-1, 2-6,2-11. 练习题:
1 2 3 4 5 1 0 2 4 3、已知五个样品的之间的距离矩阵如下: D 3 6 4 1 5 6
试采用最长距离法,将五个对象分为3类。
0 9 0 7 10 0 3 5 8 0
第七章: 主成分分析
基本概念: 主成分的定义;主成分分析的基本思想;如何计算总体的主成分;贡献率; 定理 7.1.1 和 定义 7.1.2; 例题 7.1.1 及教材表 7.2.1 练习题:
第八章:因子分析
基本概念:因子分析的基本思想;主成分法因子分析;因子分析与主成分分析的区别; 如方差贡献、因子载荷与相关系数的关系、变量共同度的计算等变量的计算。 练习题: 1、主成分分析和因子分析的异同点. 2、设
X ( X 1 , X 2 , X 3 ) 的相关系数矩阵通过因子分析分解为如下形式
R的特征值和相应的正则化特征向量分别为:
1 1.9633, 2 0.6795, 3 0.3672,
l1 (0.6250, 0.5932, 0.5075) l2 ( 0.2186, 0.4911, 0.8432) l3 (0.7494, 0.6379, 0.1772) .
2 [2, 2] 0 计算统计量 T 的值,并将其变为 F 统计量,同时在显著水平为 0.05 下
2
检验
F (0.05) 199.5, F2,2 (0.05) 19 0 。 ( 2,1 )
第 5 章:判别分析
基本概念: 判别分析的基本思想;距离判别法;Bayes 判别法。 练习题: 1、记二维正态总体 N2((i), )为 Gi(i=1,2)(两总体协差阵相同),已知来自 Gi(i=1,2)的样本数 据阵为
则试计算, 有
X 1 的共性方差 h12 , X 1 的方差 12 , f g2 公共因子 1 对 X 的贡献 1 分别是多少?
其他公因子的方差贡献呢? 3、设标准化变量 X 1 , X 2 , X 3 的协差阵(即相关阵)为
1.00 0.63 0.45 R 0.63 1.00 0.35 0.45 0.35 1.00
6、设
X ( X 1 , X 2 , X 3 ) 服从 N 3 ( , ) ,其中
16 4 2 (1, 0, 2), 4 4 1 2 1 4 ,
试求:
Y X1 X 2 Y 1 Y2 X 2 X 3 的数学期望、自协方差及其分布。 1) X2 X3 X 2 X 3 与 X 1 是否独立。 (2)判断 1
1、设随机向量 X i 服从 N 3 ( , ), i 1, 2, , n, 分布,则如下统计量
W ( X i )( X i ) 或者 W ( X i X )( X i X ) 服从什么分布?
i 1 i 1
n
n
1 2、 设 X ~ N 2 ( , ), 其 中 X ( x1 , x 2 ), ( 1 , 2 ), 2 则 Cov( x1 x 2 , x1 x 2 )=____.
第三章 假设检验
复习概念: 1、主要分布及简单性质: (1)Wishart 分布; (2)Hottelling 分布(定义及性质 1,2,3) 2、单总体均值向量的检验,熟练掌握检验的步骤及检验的思想;掌握对均值向量的检验; 如例题 3.2.1 补充例题: 1、人的出汗多少与人体内钠和钾的含量有一定的关系.今测量了 20 名健康成年女性的出汗