主成分分析法PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6
3.832E-16
2.017E-15 100.000
7
3.351E-16
1.764E-15 100.000
8
2.595E-16
1.366E-15 100.000
000
10
1.683E-16
8.860E-16 100.000
11
7.026E-17
3.698E-16 100.000
• 因子分析是要利用少数几个公共因子去解释较多个要观测 变量中存在的复杂关系,它不是对原始变量的重新组合,而 是对原始变量进行分解,分解为公共因子与特殊因子两部分. 公共因子是由所有变量共同具有的少数几个因子;特殊因 子是每个原始变量独自具有的因子.
3、应用中的优缺点比较
• 主成分分析 优点:首先它利用降维技术用少数几个综合变量来代替 原始多个变量,这些综合变量集中了原始变量的大部分信 息.其次它通过计算综合主成分函数得分,对客观经济现象 进行科学评价.再次它在应用上侧重于信息贡献影响力综 合评价. 缺点:当主成分的因子负荷的符号有正有负时,综合评价 函数意义就不明确.命名清晰性低.
12
2.750E-19
1.447E-18 100.000
13
-7.503E-17 -3.949E-16 100.000
14
-1.291E-16 -6.794E-16 100.000
15
-1.742E-16 -9.168E-16 100.000
16
-2.417E-16 -1.272E-15 100.000
四、主成分分析法的步骤
1数据归一化处理:数据标准化Z 2计算相关系数矩阵R: 3计算特征值;
特征值越大说明重要程度越大.
4计算主成分贡献率及方差的累计贡献率; 5计算主成分载荷与特征向量:
主成分的负荷值大小反映了主成分因子对可测变量的影响程
度;载荷值越大说明此变量对主成分的解释越多,及贡献越大.6 写出主成分模型
F w 1 X 1 w 2 X 2 w 3 X 3 w n X n
主成分赋权法:计算权重集
• 进行归一化处理
由此即得到权重集:和为1.
4、旋转:
从下表的因子荷载看,第三个主成分因子在10个指标上的 载荷值都不明显,因此很难对第三个主成分因子进行有效定义.
旋转的条件:当某个主成分因子的各载荷值大小都不明显, 很 难对此主成分因子进行有效定义时,采用旋转进一步分析.
.972 .581 .497 .906 .781 .642 .805 .364 .426 .282 .540 .489 .661 .673 .513 .811 .765 .788 .827
提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋
转法。 a. 旋转在 3 次迭代后收敛。
5、碎石图分析
17
-3.333E-16 -1.754E-15 100.000
18
-4.489E-16 -2.363E-15 100.000
19
-1.373E-15 -7.228E-15 100.000
提取方法:主成份分析。
合计 17.
1
八、与因子分析法的区别
1、基本概念
➢ 主成分分析就是将多项指标转化为少数几项综合 指标,用综合指标来解释多变量的方差- 协方差结 构.综合指标即为主成分.所得出的少数几个主成 分,要尽可能多地保留原始变量的信息,且彼此不 相关.
.954 .893 .986 .970 .993 .999 .974 .971 .989
景区整体环境 总体感觉
.985 .961
提取方法 :主成份。 a. 已提取了 2 个成份。
2
.576 -.115 -.216
.411 .161 -.040 .198 -.355 -.292 -.431 -.166 -.220 -.009 .002 -.193 .215 .134 .170 .245
三、主成分分析法的应用
1、基于类型的古村落旅游竞争力分析
本文以社区参与型古村落为主要研究对象,采用主成分 分析法、层次熵法等确定主要的旅游评价指标并获得 其贡献指数.
2、基于主成分分析的新疆与全国旅游产业竞争力评价
本文采用主成分分析PCA方法,对新疆旅游业的竞争能力与全国 其他省、区、直辖市进行比较.对全国31个省、区、直辖市的310 个原始数据,根据PCA方法的原理和步骤进行计算机处理,可以得到 主成分因子的特征值、贡献率与累积贡献率及因子提取结果.前3 个主成分因子的累积贡献率达87.154%,根据累积贡献率大于85%的 主成分因子选取原则,选择前3个主成分因子,而且选择的3个主成 分因子相互之间不存在相关性.
之中,有很多是相关的.人们希望能够找出它们的少 数代表来对它们进行描述. 介绍两种把变量维数降低以便于描述、理解和分 析的方法:主成分分析principal component analysis和因子分析factor analysis.实际上主成分分 析可以说是因子分析的一个特例.
定义: 主成分分析Principal Components Analysis ,PCA也称为主分量分析,是一种通过 降维来简化数据结构的方法,即如何把多个变 量变量转化为少数几个综合变量综合变量,而 这几个综合变量可以反映原来多个变量的大部 分信息.主成分:把相关的变量变为无关的主 成分.
3、写出主成分模型
2、写出主成分模型
成份矩阵a
成份
1
2
一月 二月 三月 四月 五月
.792 -.040
.143 .720 .275
-.274 .102 .594
-.127 .772
提取方法 :主成份。 a. 已提取了 4 个成份。
3 .186 .715
-.618 -.158
.094
4 -.007
个主成分.
按照累积方差的观点,应该提取≥80%或≥85%的值,本例题
提取5个主成分,其累积方差贡献率为85.644%,应该提取
前五个主成分.
确定主成分
两个条件都满足
本操作是选择以特征根大于1为标准提取主成分,提取了2个主成分。按照累积方差的 观点,应该提取>80%或>85%的值,本例题提取2个主成分,其累积方差贡献率为 94.99%,应该提取2个应该提取前两个主成分。
选取主成分的个数,急转处是确定主成分的个数处.
景区满意度碎石图
解释的总方差
成份
合计
初始特征值 方差的 %
累积 %
1
17.559
92.417
92.417
2
1.291
6.794
99.211
3
.115
.607
99.818
4
.035
.182 100.000
5
6.468E-16
3.404E-15 100.000
旋转后的主成分因子载荷矩阵
景区满意度旋转前后成分矩阵图对比
成份矩阵a
成份
1
景区安全 门票价格 交通便捷程度 导游专业解说 游览指引牌 景观解说牌 景观独特性 娱乐项目
.811 .990 .976 .895 .985 .999 .979 .933
餐饮 景区购物 公共卫生设施 公共休息设施 景区卫生状况 工作人员态度 游客投诉服务 居民友好程度 景区环境保护
五、主成分分析法的操作流程
六、主成分分析法的结果分析
1、相关系数R:KMO检验
KMO检验是在主成份分析前对数据的分析: KMO越接近于1越好,等于相关系数,≥0.5就可以.
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的 % 累积 %
合计
方差的 % 累积 %
1
3.957
32.974
.415 -.136
.564 -.037
主成分因子载荷矩阵:
载荷值越大,说明此变量对主成分的解释越多,及 贡献越大;越大越好.
第一主成分的特征值
主成分的综合模型:
F w 1 X 1 w 2 X 2 w 3 X 3 w n X n
k
Wi aij Ej
j1
E j
1 1 2
两个公式之意:F中X1的综合系数w1=F1的x1的系数
90.422
7
.437
3.645
94.066
8
.319
2.662
96.729
9
.134
1.120
97.848
10
.114
.952
98.801
11
.099
.825
99.626
12
.045
.374 100.000
提取方法:主成份分析。
2、确定主成分
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的 %
5
.964
8.034
85.644
6
.573
4.778
90.422
7
.437
3.645
94.066
8
.319
2.662
96.729
9
.134
1.120
97.848
10
.114
.952
98.801
11
.099
.825
99.626
12
.045
.374
100.000
提取方法:主成份分析。
本操作是选择以特征根大于1为标准提取主成分,提取了4
×x1在F1中的方差贡献率+F2的x1的系数×x1在F2中的
方差贡献率…Fn/方差累计贡献率
注意:X1、X2在F1、F2中各自所对应的方差贡献率.
方差贡献率与方差累计贡献率的区别
主成分赋权法
其中,aij描述了因子 i 在第 j 个主成分中的因子得分系数, 即第 i 个因子对第 j 个主成分的贡献,它与该主成分对应 方差的贡献率 Ej的组合,便是需要确定的第 i 个环境因子 的权重值.
➢ 因子分析是研究如何以最少的信息丢失,将众多原 始变量浓缩成少数几个因子变量,以及如何使因子 变量具有较强的可解释性的一种多元统计分析方 法.
因子分析实例:
➢ 不同之处 • 主成分分析中,最终确定的新变量是原始变量的线性组合,
每个主成分都是由原有p 个变量线性组合得到.在诸多主成 分Zi 中,Zi 在方差中占的比重最大,说明它综合原有变量 的能力最强,越往后主成分在方差中的比重也小,综合原信 息的能力越弱.
注意:进行主成分的变量之间必须要有相关 性,经过分析后变量之间独立.
最经典的方法就是用方差来表达,即varF1越大,表 示F1包含的信息越多.因此在所有的线性组合中所 选取的F1应该是方差最大的,故称之为第一主成分 principal component I.
如果第一主成分不足以代表原来p个变量的信息, 再考虑选取F2即第二个线性组合.F2称为第二主成 分principal component II.F1和F2的关系
累积 %
合计
方差的 %
累积 %
1
3.957
32.974
32.974
3.957
32.974
32.974
2
2.424
20.203
53.177
2.424
20.203
53.177
3
1.754
14.619
67.796
1.754
14.619
67.796
4
1.178
9.814
77.610
1.178
9.814
77.610
旋转成份矩阵a
成份
1
2
景区安全 门票价格 交通便捷程度 导游专业解说 游览指引牌 景观解说牌 景观独特性 娱乐项目 餐饮 景区购物 公共卫生设施 公共休息设施 景区卫生状况 工作人员态度 游客投诉服务 居民友好程度 景区环境保护 景区整体环境 总体感觉
.213 .810 .868 .386 .621 .766 .591 .929 .903 .951 .842 .866 .741 .739 .851 .574 .642 .614 .546
• 因子分析 优点:第一它不是对原有变量的取舍,而是根据原始变量 的信息进行重新组合,找出影响变量的共同因子,化简数据; 第二,它通过旋转使得因子变量更具有可解释性,命名清晰 性高. 缺点 :在计算因子得分时,采用的是最小二乘法,此法有 时可能会失效.
总之,主成分分析是因子分析的一个特例.
谢谢观看
主成分分析法
一、主成分分析法概述 二、主成分分析法的基本原理 三、主成分分析法的应用 四、主成分分析法的步骤和方法 五、主成分分析法的操作流程 六、主成分分析法的结果分析 七、应用主成分分析法的注意事项 八、与因子分析法的区别
一、主成分分析法概述
每个人都会遇到有很多变量的数据. 这些数据的共同特点是变量很多,在如此多的变量
32.974
3.957
32.974
32.974
2
2.424
20.203
53.177
2.424
20.203
53.177
3
1.754
14.619
67.796
1.754
14.619
67.796
4
1.178
9.814
77.610
1.178
9.814
77.610
5
.964
8.034
85.644
6
.573
4.778
相关文档
最新文档