现代统计分析方法与应用(人大何晓群)第12章主成分分析PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章 主成分分析
•§12.1 主成分分析的基本思想 •§12.2 主成分分析的几何意义 •§12.3 总体主成分及其性质 •§12.4 样本主成分的导出 •§12.5 主成分分析步骤及框图 •§12.6 主成分分析的应用
2020/9/29
中国人民大学六西格玛质量管理研究中心
11
目录 上页 下页 返回 结束
2020/9/29
中国人民大学六西格玛质量管理研究中心
44
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
二、主成分分析的基本理论
X1,X2, ,XP
X1,X2, ,XP
2020/9/29
中国人民大学六西格玛质量管理研究中心
55
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
中国人民大学六西格玛质量管理研究中心
1133
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1144
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1155
目录 上页 下页 返回 结束
2020/9/29
中国人民大学六西格玛质量管理研究中心
66
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
X1,X2, ,XP X1,X2, ,XP
X1,X2, ,XP
2020/9/29
中国人民大学六西格玛质量管理研究中心
77
目录 上页 下页 返回 结束
§12.2 主成分分析的几何意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
22
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
一、主成分分析的基本思想 在对某一事物进行实证研究中,为了更全面、准确地反 映出事物的特征及其发展规律,人们往往要考虑与其有关系 的多个指标,这些指标在多元统计中也称为变量。这样就产 生了如下问题:一方面人们为了避免遗漏重要的信息而考虑 尽可能多的指标,而另一方面随着考虑指标的增多增加了问 题的复杂性,同时由于各指标均是对同一事物的反映,不可 避免地造成信息的大量重叠,这种信息的重叠有时甚至会抹 杀事物的真正特征与内在规律。基于上述问题,人们就希望 在定量研究中涉及的变量较少,而得到的信息量又较多。主 成分分析正是研究如何通过原来变量的少数几个线性组合来 解释原来变量绝大多数信息的一种多元统计方法。
2020/9/29
中国人民大学六西格玛质量管理研究中心
2211
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
2222
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1111
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1122
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1166
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1177
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
1.每一个主成分都是各原始变量的线性组合; 2.主成分的数目大大少于原始变量的数目 3.主成分保留了原始变量绝大多数信息 4.各主成分之间互不相关 通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成 分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在 关系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作 引向深入。
2020/9/29
中国人民大学六西格玛质量管理研究中心
88
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
图12-1
中国人民大学六西格玛质量管理研究中心
99
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1100
1188
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
1199
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
2200
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
33
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存 在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或 协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综 合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化 问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说, 利用主成分分析得到的主成分与原始变量之间有如下基本关系:
第十二章 主成分分析
主成分分析(principal components analysis)也 称主分量分析,是由Hotelling于1933年首先提出的。主 成分分析是利用降维的思想,在损失很少信息的前提下 把多个指标转化为几个综合指标的多元统计方法。通常 把转化生成的综合指标称之为主成分,其中每个主成分 都是原始变量的线性组合,且各个主成分之间互不相关, 这就使得主成分比原始变量具有某些更优越的性能。这 样在研究复杂问题时就可以只考虑少数几个主成分而不 至于损失太多信息,从而更容易抓住主要矛盾,揭示事 物内部变量之间的规律性,同时使问题得到简化,提高 分析效率。本章主要介绍主成分分析的基本理论和方法、 主成分分析的计算步骤及主成分分析的上机实现。
•§12.1 主成分分析的基本思想 •§12.2 主成分分析的几何意义 •§12.3 总体主成分及其性质 •§12.4 样本主成分的导出 •§12.5 主成分分析步骤及框图 •§12.6 主成分分析的应用
2020/9/29
中国人民大学六西格玛质量管理研究中心
11
目录 上页 下页 返回 结束
2020/9/29
中国人民大学六西格玛质量管理研究中心
44
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
二、主成分分析的基本理论
X1,X2, ,XP
X1,X2, ,XP
2020/9/29
中国人民大学六西格玛质量管理研究中心
55
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
中国人民大学六西格玛质量管理研究中心
1133
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1144
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1155
目录 上页 下页 返回 结束
2020/9/29
中国人民大学六西格玛质量管理研究中心
66
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
X1,X2, ,XP X1,X2, ,XP
X1,X2, ,XP
2020/9/29
中国人民大学六西格玛质量管理研究中心
77
目录 上页 下页 返回 结束
§12.2 主成分分析的几何意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
22
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
一、主成分分析的基本思想 在对某一事物进行实证研究中,为了更全面、准确地反 映出事物的特征及其发展规律,人们往往要考虑与其有关系 的多个指标,这些指标在多元统计中也称为变量。这样就产 生了如下问题:一方面人们为了避免遗漏重要的信息而考虑 尽可能多的指标,而另一方面随着考虑指标的增多增加了问 题的复杂性,同时由于各指标均是对同一事物的反映,不可 避免地造成信息的大量重叠,这种信息的重叠有时甚至会抹 杀事物的真正特征与内在规律。基于上述问题,人们就希望 在定量研究中涉及的变量较少,而得到的信息量又较多。主 成分分析正是研究如何通过原来变量的少数几个线性组合来 解释原来变量绝大多数信息的一种多元统计方法。
2020/9/29
中国人民大学六西格玛质量管理研究中心
2211
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
2222
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1111
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1122
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1166
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1177
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
1.每一个主成分都是各原始变量的线性组合; 2.主成分的数目大大少于原始变量的数目 3.主成分保留了原始变量绝大多数信息 4.各主成分之间互不相关 通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成 分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在 关系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作 引向深入。
2020/9/29
中国人民大学六西格玛质量管理研究中心
88
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
图12-1
中国人民大学六西格玛质量管理研究中心
99
目录 上页 下页 返回 结束
§12.2 主成分分析的意义
2020/9/29
中国人民大学六西格玛质量管理研究中心
1100
1188
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
1199
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
2200
目录 上页 下页 返回 结束
§12.3 总体主成分及其性质
2020/9/29
中国人民大学六西格玛质量管理研究中心
33
目录 上页 下页 返回 结束
§12.1 主成分分析的基本思想
既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存 在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或 协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综 合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化 问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说, 利用主成分分析得到的主成分与原始变量之间有如下基本关系:
第十二章 主成分分析
主成分分析(principal components analysis)也 称主分量分析,是由Hotelling于1933年首先提出的。主 成分分析是利用降维的思想,在损失很少信息的前提下 把多个指标转化为几个综合指标的多元统计方法。通常 把转化生成的综合指标称之为主成分,其中每个主成分 都是原始变量的线性组合,且各个主成分之间互不相关, 这就使得主成分比原始变量具有某些更优越的性能。这 样在研究复杂问题时就可以只考虑少数几个主成分而不 至于损失太多信息,从而更容易抓住主要矛盾,揭示事 物内部变量之间的规律性,同时使问题得到简化,提高 分析效率。本章主要介绍主成分分析的基本理论和方法、 主成分分析的计算步骤及主成分分析的上机实现。