主成份分析在综合评价中的运用讲解
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
综合评价 8
Z 1F1 2F2 ... m Fm
主成份分析运用实例 Step2:确定综合评价的指标体系
综合评价 9
1 指标的选取对整个研究过程是至关重要的,选取的合理与 否直接影响到分析结果的客观性 。
2 如果部分指标选取有误,比如本不属于该指标体系的指标 被选入,或是本应该纳入该指标体系的指标却被漏选,最 后得出的评价效果(如综合排名)可能会出现不合理的现 象。
0.240
城镇居民人均可支配 收入
床位数
0.173 0.185
主成份分析运用实例
综合评价 15
Step3:指标数据的收集及处理
1 可以从“中国统计年鉴”或国家统计局网站获取数据
2 数据处理方面有以下几点需注意
1 为消除各指标之间在数量级别和量纲上的不同,就必须对原始数据 进行标准化处理。另外,标准化方法并非主成分综合评价中对原始 数据进行无量纲化的唯一方法 。
Extraction Sums of Squared Loadings
Total % of Variance Cumulativ e %
3.448
57.468
57.468
1.807
30.110
87.577
第二主成 份的方差
累计方 差贡献
率
>85%
结论:取前两各主成份进行综合评价(依据接着往下看)
主成份分析运用实例 Step5:建模结果的解释
综合评价 11
Step2:确定综合评价的指标体系
1 假如指标体系中有N个指标,他们的相关程度有以下几种情况:
1 N个指标完全相关 。此时剔除N-1个指标,只留一个就可以 做出排序了。
2 N个指标完全不相关。此时不可能将它们压缩为较少的指标 ,主成分分析的出发点通常是指标的相关矩阵,如果指标 间完全不相关,相关矩阵为对角阵,主成分分析的去相关 作用就无从谈起 。
3 求R阵的特征根、特征向量和方差贡献率,这一步完成了 原指标到主成分的转换,从多指标综合评价看,就得到了 把原指标合成为主成分 。
4 确定主成分的个数。
5 解释主成分含义。
6 对综合评价值进行分析 。
主成份分析运用实例 3 先看看主成分分析的理论模型
综合评价 6
F1 a11 X 1 a21 X 2 ... a p1 X P
1
.255
.195 .271 .228 .066
.240
2
-.234
.362 -.165 .267 .460
-.239
Extraction Method: Principal Component Analy sis.
Component Scores.
第一、二主成份 F1=0.255*X1+0.195*X2+0.271*X3+0.228*X4+0.066*X5+0.240*X6 得分模型为: F2=-0.234*X1+0.362*X2-0.165*X3+0.267*X4+0.460*X5-0.239*X6
加入新指标前
指标
第一主成分指标系数
人均国内生产总值
0.255
高校数
0.195
农村居民纯收入
0.271
新增固定资产
0.228
卫生机构数
0.066
加入新指标后
指标
第一主成分指标系数
人均国内生产总值
0. 189
高校数
0.222
农村居民纯收入
0.211
新增固定资产
0.238
卫生机构数
0.119
城镇居民人均可支配 收入
卫生机 构数
城镇居民人 均可支配收
入
床位 数
人均国内 生产总值
1.00
高校数 0.33 1.00
农村居民 纯收入
0.95
0.42
1.00
新增固定 资产
0.46
0.84
0.55
1.00
卫生机构 数
城镇居民 人均可支 配收入
-0.14 0.57 -0.002 0.45
1.00
“床位数”与“高校数”、“新增固定资产”、“
Step2:确定综合评价的指标体系
Step3:指标数据的收集及处理
Step4:利用SAS/SPSS建模
Step5:建模结果的解释
Step6:计算综合得分及排名
主成份分析运用实例 Step1:确定综合评价方法及步骤
1 本例采用的是“主成份分析”方法。
综合评价 4
1 主成分分析:将原来的指标重新组合成一组新的互不相关 的几个综合指标来代替原来的指标,同时,所选的少数几 个综合指标又要尽可能地反映原来指标的信息 。
3 N 个指标有一定的相关关系,这才是主成分分析综合评价 的前提条件。
主成份分析运用实例
综合评价 12
Step2:确定综合评价的指标体系
2 在一个即定的指标体系中,如果加入一个或多个与其中部分指 标相关程度较高的新指标,则会引起原指标系数的变化 。
1 与新指标相关程度高的原指标系数变大,与新指标相关程 度低的原指标系数变小。
综合评价 18
1 KMO、Bartlett检验:
KMO检验:值越接近1说明所有指标之间的简单相关系数平方 和远大于偏相关系数平方和,越适合于主成份分析。
Bartlett检验(巴特利特球形检验):相伴概率值小于显著性水 平,则认为相关系数矩阵不可能是单位阵,即原始指标之 间存在相关性,适合作主成份分析。
卫生机构数” 三个指标的相关系数较高
0.87 0.20
0.88
0.41 -0.05
1.00
床位数 0.07 0.88
0.17
0.80
0.73
-0.03
1.00
主成份分析运用实例 Step2:确定综合评价的指标体系
综合评价 14
指标体系中加入一个新指标“床位数”后,再运用主成份分析进行综合评价时 ,会发现以上三个指标的第一主成分指标系数明显变大,其他指标系数变小 :
下面让我们先看一下本例确定的指标体系
主成份分析运用实例 Step2:确定综合评价的指标体系
人均国内生 产总值
新增固定 资产
高等学 校数
指标体系
卫生机 构数
农村居民家庭 人均纯收入
城镇居民人均 可支配收入
综合评价 10
本次讲解采用的 是通用的指标体系
确定这个指标体系 还需注意哪些呢?
主成份分析运用实例
Step3:指标数据的收集及处理
2 统计指标按其作用趋向有正指标、逆指标、适度指标之分;按其表 现形式有绝对数指标、相对数指标、平均数指标之分 。
举例描述其中的几个指标: 逆指标:如生态环境竞争力指标体系中的“人口密度”; 绝对数指标:如国内生产总值; 平均数指标:如人均国内生产总值。
本例的指标体系中,采用“人均国内生产总值”的原因是平均数指 标更能反应全国各省市的实际经济水平。
例如:人均国内生产总值和废水排放达标率,前者是五位数字,后 者为百分数,由于数量级的差别,同样的变异程度,在前者数值上 就显得比较大,通过协方差矩阵S求主成分时,前面的主成分很可能 将倾向于人均国内生产总值这一指标的变异信息,而实际上两者的 变异程度却可能是相同的。
主成份分析运用实例
综合评价 16
25
Q&A ?
F2 a12 X 1 a22 X 2 ... a p2 X P ……
Fm a1m X1 a2m X 2 ... a pm X P
上述方程满足于条件:
a12i
a22i...aFra bibliotek2 pi
1
i 1,2, p
主成份分析运用实例
系数 aij 由下列原则决定 :
1 2
综合评价 7
主成份分析运用实例 综合得分模型如下:
原指标体系为:人均国内生产总值、高等院校数、农村居 民家庭人均纯收入、新增固定资产、卫生机构数、城镇居 民人均可支配收入。
加入一个新的指标——床位数,算得它们的相关系数矩阵 如下:
主成份分析运用实例
综合评价 13
Step2:确定综合评价的指标体系
人均 国内 生产 总值
高校数
农村居 民纯收
入
新增固 定资产
综合评价 20
3 确定主成分的个数时有4个准则可以依据:
1
累计方差贡献率≥85%准则。方差贡献率 =
i
/
k
2
i
原则,先计算特征根 i 的均值 ,然后将之与
i
比较,选取 i
的前k个主成分
3 斯格里准则。其方法为:计算特征根差数,如果m个差数较接近, 出现了较为稳定的差数值,则后面的主成分可忽略。
4 巴特莱特检验(Bartlett test)准则。
1
主成份分析方法原理及综合评价运用
某零售企业老板有这么个问题:
综合评价 2
我想看一下每个门店经营的综合情况
再想看看哪些门店做得比较好,哪些差些
顾客对价格、购物 环境、服务……都
有不同的打分
我们该怎么做?
主成份分析运用实例
综合评价 3
我们来看看下面一个例子:对我国各省市的经济发展状况进行综合评价
Step1:确定综合评价方法及步骤
广东 山东 江苏 上海
福建 天津
海南 宁夏 青海 西藏
省市
… …
排名
1 2 3 4
…
13 14
…
28 29 30 31
综合评价 23
综合得分
7.03 5.95 5.75 5.13
…
0.5 -0.44
…
-5.39 -5.88 -6.05 -6.27
得分为负 说明其位 于平均水
平之下
24
介绍到此,大家对刚开始的那个老板的问题 有没有一个解决方法呢?我们回去看看
主成份分析运用实例 Step6:计算综合得分及排名
综合得分模型为:
Z=3.448*F1+1.807*F2
综合评价 22
根据以上模型算出各省市的综合得分,再根据综合得分对各省市 进行排序,可得下面的“各省市经济发展综合排名表”
主成份分析运用实例
Step6:计算综合得分及排名
各省市经济发展综合排名列表
KMO检验:值为 0.694,认为不太适
合主成分分析
Bartlett检验:相伴 概率为0.000,小于 0.05,认为适合主
成分分析
主成份分析运用实例 Step5:建模结果的解释
综合评价 19
2 方差贡献率情况:
第一主成份 的方差
Total Variance Explained
Initial Eigenv alues
注:一个指标体系中如果有逆指标,需判断其是否应该转换为正指标。 转换方式有“差式”(Ynew=C1-C2Yold)和“商式” (Ynew=C/Yold)两种。
主成份分析运用实例 Step4:利用SAS/SPSS建模
1 SAS建模
2 SPSS建模
综合评价 17
主成份分析运用实例 Step5:建模结果的解释
C o mp on en t 1
Total % of Variance Cumulativ e %
3.448
57.468
57.468
2
1.807
30.110
87.577
3
.457
7.610
95.187
4
.170
2.832
98.020
5
.079
1.313
99.333
6
.040
.667
100.000
Extraction Method: Principal Component Analy sis.
2 运用这种方法可以起到降维和简化数据的作用。
主成份分析运用实例
综合评价 5
Step1:确定综合评价方法及步骤
2 运用主成份分析进行多指标综合评价的基本步骤
1 原始指标数据的标准化,这是主成份分析本身的要求,也 是多指标综合评价中无量纲的要求 。
2 求指标数据的相关矩阵R,R阵是主成分分析的出发点 。
主成份分析运用实例
综合评价 21
Step5:建模结果的解释
4 以下是本例的主成份得分系数矩阵
Component Scor e Coefficient Matrix
Xi为标准化后的值
X3 X4
X1 X2
X5 X6
C o mp on en t
人均 国内 生产总 值 (亿 元 ) 高校 数 农 村 居 民 纯 收 入 (元 ) 新 增 固 定 资 产 (亿 元 ) 卫 生 机 构 数 (个 ) 城镇 居民 人均可 支 配收 入
KMO and Bartlett's Test
Kaiser-Mey er-O lk in Measure of Sampling Adequacy .
Bartlett's Test of S ph er ic ity
Approx. Chi-Square df Sig.
.694
176.201 15
.000