多元统计分析 第一章 多元正态分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

预备知识
线性代数方面的知识——向量和矩阵是研究多元数据 的重要工具;(要掌握矩阵逆、矩阵特征值、特征向量的 求解)
初等数理统计的知识——多元分析是建立在一元统计 分析基础上的,其许多理论可由一元统计直接推广过来;
本课程的特点与教学方式
教学方式 :理论讲授和上机实习
本课程的特点: 主要介绍各种多元统计分析方法的基本思路和原理,而不讲
课程介绍
多元统计分析是研究多个随机变量之间的相互关 系及内在统计规律性的一门统计学科。
多元统计分析(简称多元分析)是统计学的一个重 要分支.它是应用数理统计学来研究多变量(多指标)问 题的理论和方法 ; 它是一元统计学的推广和发展.
多元统计分析是一门具有很强应用性的课程;它在 自然科学和社会科学等各个领域中得到广泛的应用;它 包括了很多非常有用的数据处理方法.
5、某医院已有100个分别患有胃炎、肝炎、冠心病、糖尿病等的病人资料, 记录了他们每个人若干项症状指标数据。如果对于一个新的病人,当也 测得这若干项症状指标时,可以利用判别分析方法判定他患的是哪种病。 (医学)
6、在地质学中,常常要研究矿石中所含化学成分之间的关系。设在某矿 体中采集了60个标本,对每个标本测得20个化学成分的含量。我们希望 通过对这20个化学成分的分析,了解矿体的性质和矿体形成的主要原因。 (地质学)
述各种方法的数学推导过程; 主要利用统计软件——SPSS,实现各种多元统计方法;从数
据入手,来讲述各种分析方法,最后得出结论; 学习的目标:会使用统计软件SPSS,进行多元统计分析。
多元统计分析方法的应用
• 多元统计分析方法在经济管理、农业、医学、教育学、体育科学、 生态学、地质学、社会学、考古学、环境保护、军事科学、文学等 方面都有广泛的应用,这里我们例举一些实际问题,进一步了解多 元统计分析的应用领域,让大家从感性上加深对多元统计分析的认 识。
1、城镇居民消费水平通常用八项指标来描述,如人均粮食支出、人均副食 支出、人均烟酒茶支出、人均衣着商品支出、人均日用品支出、人均燃 料支出、人均非商品支出。这八项指标存在一定的线性关系。为了研究 城镇居民的消费结构,需要将相关强的指标归并到一起,这实际就是对 指标进行聚类分析。(经济学)
2、在企业经济效益的评价中,涉及到的指标往往很多,如百元固定资产原 值实现产值、百元固定资产原值实现利税、百元资金实现利税、百元工 业总产值实现利税、百元销售收入实现利税、每吨标准煤实现工业产值、 每千瓦时电力实现工业产值、全员劳动生产率、百元流动资金实现产值。 如何将这些具有错综复杂关系的指标综合成几个较少的因子,既有利于 对问题进行分析和解释,又能便于抓住主要矛盾做出科学的评价。可用 主成分分析和因子分析法。
文学上的应用:复旦大学李贤平教授带领他的学生对《红楼梦》进行了 多元统计分析。
把《红楼梦》的120回,作为120个样本,以虚词作为变量,计算在每一 回中(样本)变量(虚词)出现的次数,然后用聚类的方法进行分类。
120回分为两类 前80回为一类------进一步与曹雪芹著作相比分析,答案是肯定的。 后40回为一类------进一步分析,证实不是曹雪芹所写,为高鹗一人所写。
Biblioteka Baidu
参考书
1. 应用多元统计分析(朱建平,科学出版社,2006) 2.实用多元统计分析(方开泰,1989,华东师范大学出版社 3. 多元统计分析引论(张尧庭,方开泰, 科学出版社,1982) 4. 实用多元统计分析(王学仁,1990 ,上海科学技术出版社) 5. 应用多元分析(王学民,1999 ,) 6.应用多元统计分析(高惠璇,2005,北京大学出版社) 7. 统计分析与SPSS的应用(第三版 薛微) 8.社会统计学分析方法—SPSS软件应用(郭志刚,中国人民 大学出版社,1999)
3、某一产品是用两种不同原料生产的,试问此两种原料生产的产品寿命有 无显著差异?又比如,若考察某商业行业今年和去年的经营状况,这时 需要看这两年经营指标的平均水平是否有显著差异以及经营指标之间的 波动是否有显著差异。可用多元正态总体均值向量和协差阵的假设检验。
4、按现行统计报表制度,农村家庭纯收入是指农村常住居民家庭总收入中 扣除从事生产和非生产经营用支出、税款和上交承包集体任务金额以后 剩余的、可直接用于进行生产的、非生产性建设投资、生产性消费的那 一部分收入。如果我们收集某年各个省、自治区、直辖市农民家庭人均 纯收入的数据,可以用相应分析,揭示全国农民人均纯收入的特征以及 各省、自治区、直辖市与各收入指标的关系。
14
目录 上页 下页 返回 结束
随机向量
分布函数
独立性
数字特征
一、随机向量
定义1.1 设 X1, X 2 , , X p 为 p 个随机变量,由它们组成的向
7、研究中国七星瓢虫在黄海、渤海的群聚与近期气象条件的关系。对 1000个类似的鱼类样本,如何根据测量的特征如体重、身长、鳍数、 鳍长、头宽等,我们可以利用聚类分析方法将这类鱼分成几个不同品 种。(生物学)
8、考古学家对挖掘出来的人头盖骨的高、宽等特征来判断是男或女, 根据挖掘出的动物牙齿的有关测试指标,判别它是属于哪一类动物牙 齿、是哪一个时代的。(考古学)
第一章 多元正态分布
§1.1 多元分布的基本概念 §1.2 统计距离和马氏距离 §1.3 多元正态分布 §1.4 均值向量和协方差阵的估计 §1.5 常用分布及抽样分布
2020/2/22
13
目录 上页 下页 返回 结束
2020/2/22
§1.1多元分布的基本概念
§1.1.1 随机向量 §1.1.2 分布函数与密度函数 §1.1.3 多元变量的独立性 §1.1.4 随机向量的数字特征
本课程的内容
第一章 多元正态分布 第二章 均值向量和协方差阵的检验
基础理论
第三章 聚类分析 第四章 判别分析 分类方法
第五章 主成分分析
第六章 因子分析
多变量分析(数据结构简化)
第七章 对应分析
第八章 典型相关分析 两组变量的相关分析
使用的教材
21世纪统计学系列教材
多元统计分析
(中国人民大学出版社,何晓群,2012.1)
相关文档
最新文档