多元统计分析第一章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018/10/21 16 cxt
五、教学安排和要求
1、教学内容: 多元正态分布、聚类分析、判别分析、主成分 分析、因子分析 2、教学目标:掌握多元统计常用基本方法的原理 与应用,能熟练运用一种统计软件——SPSS进 行分析,并能解释软件输出结果及结论 3、教学计划: 理论教学(40课时)+实践教学(8课时) 4、成绩考核:平时15%+实践15%+ 期末70%。 5、教学信箱:zziastatistics@163.com 密码: 选课号303131
F ( x) F ( x1 , x2 ,
其中
, x p ) P( X1 x1 , X 2 x2 ,
, x p ) R p
X p xp )
x ( x1 , x2 ,
性质: F ( x1, x2 , , xp ) 是每个变量 xi (i 1, 2, 连续函数;
, p) 的非降右
2018/10/21
6 cxt
运用主成分分析以97.4%的精度,用三新变 量就取代了原17个变量。根据经济学知识, 斯通给这三个新变量分别命名为总收入F1、 总收入变化率F2和经济发展或衰退的趋势 F3。
2018/10/21
7 cxt
2、分类与判别(归类问题) 对所考察的变量按相似程度进行分类。 (1)聚类分析:根据分析样本的各研究变 量,将性质相似的样本归为一类的方法。 (2)判别分析:判别样本应属何种类型的 统计方法。
4、多元数据的统计推断
点估计 参数估计 统 计 推 断 参数 假设 检验 非参 区间估计 u检验 t检验 F检验 相关与回归 卡方检验 秩和检验 秩相关检验
13 cxt
2018/10/21
三、多元统计的发展
起源于:20世纪20年代 1928年威沙特(Wishart)发表的《多元正 态总体样本协方差矩阵的精确分布》为开端 30年代多元分析在理论上得到迅速发展 费希尔(Fisher)、霍特林(Hotelling)等进 一步发展多元统计。 40年代在心理学、教育学等领域进行应用 因计算量大,发展受到影响
总体 样本、样本均值、样本方差
参数估计 假设检验 几种常用分布
2018/10/21
20 cxt
二、随机向量及其分布
1、随机向量的概念 p个随机变量X1,X2,……,Xp组成的向量 X=( X1,X2,……,Xp)T,称为p维随机向 量。
2、随机向量的概率分布
定义:P维随机向量 X ( X 1 , X 2 , , X p ) 的概率分布函 数定义为
2018/10/21 9 cxt
具体数据见教材第92页 分析结果:将20个国家分为两类 第1类(基础设施落后):巴西、墨西哥、 波兰、匈牙利、智利、俄罗斯、泰国、印度、 马来西亚 第2类(基础设施发达):瑞典、丹麦、美 国、中国台湾、韩国、日本、德国、法国、 新加坡、英国、瑞士
2018/10/21 10 cxt
信息重叠,分析偏误
指标太多,增加问题的复杂性和分析难度 如何避免? 选用主成分分析或因子分析
2018/10/21 5 cxt
例:美国的统计学家斯通(stone)在1947年 关于国民经济的研究。他曾利用美国1929 一1938年各年的数据,得到了17个反映国 民收入与支出的变量要素,例如雇主补贴、 消费资料和生产资料、纯公共支出、净增库 存、股息、利息外贸平衡等等。
2018/10/21 17 cxt
§1.2
随机向量
一、相关基础知识复习 二、随机向量及其分布 三、随机向量的数字特征
2018/10/21
18 cxt
一、相关基础知识复习
线性代数相关知识(附录)
矩阵及其基本运算
向量与特征向量
概率统计中的相关知识
概率统计中的相关知识
随机变量及其分布 总体与样本
2018/10/21
8 cxt
例:根据信息基础设施的发展状况,对世界20个国家 和地区进行分类。 考察指标有6个: 1、X1:每千居民拥有固定电话数目 2、X2:每千人拥有移动电话数目 3、X3:高峰时期每三分钟国际电话的成本 4、X4:每千人拥有电脑的数目 5、X5:每千人中电脑使用率 6、X6:每千人中开通互联网的人数
第一章
§1.1
§1.2
绪论
课程概论
随机ቤተ መጻሕፍቲ ባይዱ量
2018/10/21
1 cxt
§1.1
课程概论
一、什么是多元统计分析 二、多元统计分析的内容和方法 三、多元统计的发展 四、多元统计的应用 五、教学安排和要求
§1.1
课程概论
一、什么是多元统计分析 多元统计分析是研究多个随机变量之间相互 依赖关系以及内在统计规律的一门统计学科。
2018/10/21 14 cxt
20世纪50年代中期——,多元统计在地质、气象、 医学、社会学等方面得到广泛应用 因计算机的出现和发展
我国:70年代初期才开始重视多元统计在各领域的 应用
2018/10/21
15 cxt
四、多元统计的应用
1、教育学 2、医学 3、气象学 4、环境科学 5、地质学 6、考古学 7、经济学 8、社会科学 等等
2018/10/21
3 cxt
二、多元统计分析的内容和方法
1、简化数据结构(降维问题) 将具有错综复杂关系的多个变量综合成数量 较少且互不相关的变量,使研究问题得到简 化但损失的信息又不太多。 (1)主成分分析 (2)因子分析 (3)对应分析等
2018/10/21 4 cxt
指标与指标可能存在相关关系
分布函数的取值范围为[0,1]; F (, x2 , , xp ) F ( x1, , , xp ) F ( x1, x2 , , ) 0
如果:我们想知道我国基础设施发展属于哪 一类型? 运用判别分析
依据:20个国家的分类结果
2018/10/21
11 cxt
3、变量间的相互联系的研究 一是:分析一个或几个变量的变化是否依赖 另一些变量的变化。(回归分析) 二是:两组变量间的相互关系(典型相关分 析)
2018/10/21
12 cxt
五、教学安排和要求
1、教学内容: 多元正态分布、聚类分析、判别分析、主成分 分析、因子分析 2、教学目标:掌握多元统计常用基本方法的原理 与应用,能熟练运用一种统计软件——SPSS进 行分析,并能解释软件输出结果及结论 3、教学计划: 理论教学(40课时)+实践教学(8课时) 4、成绩考核:平时15%+实践15%+ 期末70%。 5、教学信箱:zziastatistics@163.com 密码: 选课号303131
F ( x) F ( x1 , x2 ,
其中
, x p ) P( X1 x1 , X 2 x2 ,
, x p ) R p
X p xp )
x ( x1 , x2 ,
性质: F ( x1, x2 , , xp ) 是每个变量 xi (i 1, 2, 连续函数;
, p) 的非降右
2018/10/21
6 cxt
运用主成分分析以97.4%的精度,用三新变 量就取代了原17个变量。根据经济学知识, 斯通给这三个新变量分别命名为总收入F1、 总收入变化率F2和经济发展或衰退的趋势 F3。
2018/10/21
7 cxt
2、分类与判别(归类问题) 对所考察的变量按相似程度进行分类。 (1)聚类分析:根据分析样本的各研究变 量,将性质相似的样本归为一类的方法。 (2)判别分析:判别样本应属何种类型的 统计方法。
4、多元数据的统计推断
点估计 参数估计 统 计 推 断 参数 假设 检验 非参 区间估计 u检验 t检验 F检验 相关与回归 卡方检验 秩和检验 秩相关检验
13 cxt
2018/10/21
三、多元统计的发展
起源于:20世纪20年代 1928年威沙特(Wishart)发表的《多元正 态总体样本协方差矩阵的精确分布》为开端 30年代多元分析在理论上得到迅速发展 费希尔(Fisher)、霍特林(Hotelling)等进 一步发展多元统计。 40年代在心理学、教育学等领域进行应用 因计算量大,发展受到影响
总体 样本、样本均值、样本方差
参数估计 假设检验 几种常用分布
2018/10/21
20 cxt
二、随机向量及其分布
1、随机向量的概念 p个随机变量X1,X2,……,Xp组成的向量 X=( X1,X2,……,Xp)T,称为p维随机向 量。
2、随机向量的概率分布
定义:P维随机向量 X ( X 1 , X 2 , , X p ) 的概率分布函 数定义为
2018/10/21 9 cxt
具体数据见教材第92页 分析结果:将20个国家分为两类 第1类(基础设施落后):巴西、墨西哥、 波兰、匈牙利、智利、俄罗斯、泰国、印度、 马来西亚 第2类(基础设施发达):瑞典、丹麦、美 国、中国台湾、韩国、日本、德国、法国、 新加坡、英国、瑞士
2018/10/21 10 cxt
信息重叠,分析偏误
指标太多,增加问题的复杂性和分析难度 如何避免? 选用主成分分析或因子分析
2018/10/21 5 cxt
例:美国的统计学家斯通(stone)在1947年 关于国民经济的研究。他曾利用美国1929 一1938年各年的数据,得到了17个反映国 民收入与支出的变量要素,例如雇主补贴、 消费资料和生产资料、纯公共支出、净增库 存、股息、利息外贸平衡等等。
2018/10/21 17 cxt
§1.2
随机向量
一、相关基础知识复习 二、随机向量及其分布 三、随机向量的数字特征
2018/10/21
18 cxt
一、相关基础知识复习
线性代数相关知识(附录)
矩阵及其基本运算
向量与特征向量
概率统计中的相关知识
概率统计中的相关知识
随机变量及其分布 总体与样本
2018/10/21
8 cxt
例:根据信息基础设施的发展状况,对世界20个国家 和地区进行分类。 考察指标有6个: 1、X1:每千居民拥有固定电话数目 2、X2:每千人拥有移动电话数目 3、X3:高峰时期每三分钟国际电话的成本 4、X4:每千人拥有电脑的数目 5、X5:每千人中电脑使用率 6、X6:每千人中开通互联网的人数
第一章
§1.1
§1.2
绪论
课程概论
随机ቤተ መጻሕፍቲ ባይዱ量
2018/10/21
1 cxt
§1.1
课程概论
一、什么是多元统计分析 二、多元统计分析的内容和方法 三、多元统计的发展 四、多元统计的应用 五、教学安排和要求
§1.1
课程概论
一、什么是多元统计分析 多元统计分析是研究多个随机变量之间相互 依赖关系以及内在统计规律的一门统计学科。
2018/10/21 14 cxt
20世纪50年代中期——,多元统计在地质、气象、 医学、社会学等方面得到广泛应用 因计算机的出现和发展
我国:70年代初期才开始重视多元统计在各领域的 应用
2018/10/21
15 cxt
四、多元统计的应用
1、教育学 2、医学 3、气象学 4、环境科学 5、地质学 6、考古学 7、经济学 8、社会科学 等等
2018/10/21
3 cxt
二、多元统计分析的内容和方法
1、简化数据结构(降维问题) 将具有错综复杂关系的多个变量综合成数量 较少且互不相关的变量,使研究问题得到简 化但损失的信息又不太多。 (1)主成分分析 (2)因子分析 (3)对应分析等
2018/10/21 4 cxt
指标与指标可能存在相关关系
分布函数的取值范围为[0,1]; F (, x2 , , xp ) F ( x1, , , xp ) F ( x1, x2 , , ) 0
如果:我们想知道我国基础设施发展属于哪 一类型? 运用判别分析
依据:20个国家的分类结果
2018/10/21
11 cxt
3、变量间的相互联系的研究 一是:分析一个或几个变量的变化是否依赖 另一些变量的变化。(回归分析) 二是:两组变量间的相互关系(典型相关分 析)
2018/10/21
12 cxt