026第十一章 多元统计分析初步(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.1 多元总体和样本
和一元统计学一样,把所研究对象的全体叫 做一个总体. 对象的每一个数量指标是一个随机变量. 我们同时研究一个总体的m个数量指标,可 以把这个总体视为一个m元随机变量,记为 从总体中随机抽取进行观测的对象叫做样本, 一个样本单元的观测结果(m个数值)可以看作这个 m元变量的一次取值,第i个样本的取值记为
为了验证标准,在北京市又抽查了100位成年 女子。经计算,这三个部位的样本协方差阵为
于是
2)两个协方差矩阵相等的检 验

对n个样本单元进行观测,共有n×m个 数据。为了方便,用一个矩阵表示,称为样
本数据矩阵
1.2 多元总体的数字特征
总体Y是m维随机变量,总体的数学期 望(均值向量)定义为
总体Y的协方差矩阵定义为
总体的相关矩阵定义为
其中
1.3 多元样本数字特征
通常无法得到多元总体的数字特征,但能从 样本数据矩阵出发进行估计。 设样本数据矩阵为
2.1 参数估计 1)可以证明,如果样本数据矩阵为

注意到S是对称阵,只需计算上三角块部分。
ቤተ መጻሕፍቲ ባይዱ
2.2 总体均值向量的检验
3)两个正态总体的均值向量相等的检验
4)两个正态总体均值向量相等的检验(协方差 阵未知情形)
因 为
经计算
2.3 总体协方差矩阵的检验 令
例4 从大量的调查中已知北京市成年女子三 个基本部位(身高,胸围,腰围)的协方差阵是
下面不加证明地给出多元正态分布的有
关性质
关于抽样分布有下列一些性质
由维希特分布定义即得
可以证明
多元正态分布的 参数估计与假设检验
上节介绍了多元样本及其分布,讨论了 多元正态分布。在实际问题中,多元正态分 布的参数μ和∑都是未知的,只能观测到样本 数据矩阵。
如何通过样本数据矩阵,对参数μ和∑作 出估计呢? 又怎样检验总体之间是否存在着差异呢? 这就是本节所要讨论的问题。

为 样 本 均 值

为样本离差矩阵,其中

为样本协方差矩阵。

为了讨论问题方便,经常将每个原始数据减 去它的平均数后,用所得的数据作为研究的出发 点。新的数据矩阵称为中心化样本数据矩阵。记 为
由于原始数据矩阵各列数字的单位不同,往往给数 据分析造成一定困难,因此有时先将原始数据标准化,形 成标准化样本数据矩阵。记为
我们同时研究一个总体的m个数量指标可以把这个总体视为一个m元随机变量记为从总体中随机抽取进行观测的对象叫做样本样本一个样本单元的观测结果m个数值可以看作这个m元变量的一次取值第i个样本的取值记为总体y的协方差矩阵协方差矩阵定义为总体的相关矩阵相关矩阵定义为其中13多元样本样本数字特征通常无法得到多元总体的数字特征但能从样本数据矩阵出发进行估计
其中
1.4 几个常用公式 在多元统计分析中,经常要对随机向量进行 线性变换。也就是用一个新的随机向量Z代替原向 量Y,使Z的每一分量是Y各分量的线性组合,用 矩阵形式可将线性变换表为
对于线性变换,有下述公式
1.5多元正态分布
二维正态分布 图形大致如图
如果从二元正态总 体中抽取足够多的几个 点,则这些点大致对称 地分布于一个椭圆内, 越接近椭圆中心,样本 点分布越密;越向外则 越稀疏。 可以在多维空间中类 似地想像多维正态分布。 m维正态分布的样本点大 致对称地分布在一个m维 的椭球中,越近于中心样 本点的密度越大。如图
多元统计分析初步 1.1 多元总体和样本 1.2 1.3 1.4 1.5 多元总体的数字特征 多元样本的数字特征 几个常用公式 多元正态分布
多元正态分布的参数估计与假设检验 2.1 参数估计 2.2 总体均值向量的检验 2.3 总体协方差矩阵的检验
多元统计分析初步
在考虑各种随机现象和它们的统计问题时,我们关心 的往往不是其中的某一个指标,而是好几个数量指标,并 且在这些指标之间又存在着统计联系。 例如:在矿石分类中一般要靠多个指标综合地评判它 属于哪一类。 医生对病人的诊断也是靠对病人各项体检指标的综合 评定。 多元统计分析就是运用数理统计的方法来研究多指标 问题的理论和方法。多元统计分析广泛地应用于工农业、 经济、医学、气象、地质、考古等各个方面。 下面介绍有关基本概念和常用的一些统计方法。
相关文档
最新文档