主成分分析在城市综合实力评价中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

主成分分析在城市综合实力评价中的应用
房 镜
(重庆师范大学 数学与计算机科学学院 ,重庆 400047)
摘要 :应用主成分分析法评价陕西省内 9 个城市的综合实力. 首先给出了城市综合实力的评价指 标体系 ,然后利用主成分分析法 ,采用定量与定性相结合的办法对陕西省内 9 个中心城市进行了 实证分析 ,从而得到样本城市综合实力的排序及相对位置. 关键词 :陕西省 ;城市 ;综合实力 ;指标体系 ;主成分分析 ;评价指数 中图分类号 : F 061. 5 文献标识码 :A
99. 226 99. 731 99. 933
100
(4) 计算特征向量 ,写出各主成分的线性表达式 取前两个特征值计算出相应的特征向量 T1 和 T2 如下 :
T1 = (0. 245 ,0. 249 ,0. 249 ,0. 25 ,0. 25 ,0. 25 ,0. 249 ,0. 249 ,0. 177 ,0. 198 ,0. 126 ,0. 244 , 0. 248 ,0. 249 ,0. 245 ,0. 228 , - 0. 056 ,0. 245 ,0. 248) ;
94. 57 27
103. 6 134 747 31. 93 17 680 51 169 528 325
5 580 4 485 12. 710 1 240 901 311. 8
10 38 634
213 7. 02 12 905 154
54. 48 24
75. 59 77 240 22. 86 5 729 18 629 249 488 5 828 4 182 15. 969 1 157 842
标 (称为“主成分”) ,从而达到降维的目的. 评价的具体步骤如下 :
(1) 原始数据的处理 因为在城市综合实力评价指标体系中 ,各指标数值表现形式不一 ,计量单位
也不尽相同 ,没有直接的可比性. 为了消除这些给评价结果带来的影响 ,需要对原始数据进行处理 ,即对不
同计量单位的指标数据进行同度量处理. 本文采用相对化处理方式 , 将不同单位指标转化为无量纲数值.
7 544
X7 651 255 45 656 97 678 80 713 19 147
X8 19 064 307 510 551 1 478 257 1 382 149 565 655
X9
7 748
Байду номын сангаас
4 762
7 049
7 586
5 844
X 10
6 805
3 897
5 226
6 040
3 945
X11 27. 897 5 24. 391 5 22. 262 6 26. 894 4 11. 123 3
83. 4
90. 98
X2
204
35
45
47
36
X3 928. 12 48. 69 261. 12 287. 64 207. 46
X4 4 229 306 200 084 384 734 636 894 134 300
X5 440. 05 18. 13
82. 61
80. 19
60. 57
X6 616 911 20 088 74 007 62 927
(实际应用中常取累积方差贡献率大于等于 80 %) ,确定选取的主成分个数. 本文选取表 3 中累积方差贡
献率达 89. 9 %的前两个主成分 ,这两个主成分可代替原来各项指标描述城市综合实力有 89. 9 %的可靠
性.
表 3 特征值和方差贡献率
主成分 特征值 方差贡献率 总方差贡献率 主成分 特征值 方差贡献率 总方差贡献率
X18 科学教育费用支出 X19 公共图书馆藏书
万人 km2
亿元 万元 亿元 万元 万元 万元
元 元 人
万元 万 m2 万 m3 / d 万 kW ·h
件 m2
万元 千册
表 2 城市综合实力评价指标原始数据
指标 西安
铜川
宝鸡
咸阳
渭南
延安
汉中
安康
商洛
X1 510. 26 74. 78
74. 25
@163. com
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
244
西 安 工 程 科 技 学 院 学 报 第 20 卷
由特征向量可得第一 、第二主成分的线性表达式分别为
F1 = 0. 245 X1 + 0. 249 X2 + 0. 249 X3 + 0. 250 X4 + 0. 2505 + 0. 250 X6 +
0. 249 X7 + 0. 249 X8 + 0. 177 X9 + 0. 198 X10 + 0. 126 X11 +
0. 244 X12 + 0. 248 X13 + 0. 249 X14 + 0. 245 X15 + 0. 228 X16 -
0. 056 X17 + 0. 245 X18 + 0. 248 X19 ;
X1 年末总人口 X2 城市建成面积
X3 国内生产总值 X4 固定资产投资完成额 X5 社会消费品零售总额 X6 地方财政收入 X7 地方财政支出 X8 年末金融机构各项贷款余额
X9 居民人均可支配收入 X10 居民人均消费支出 X11 每万人医生数
X12 地方政府基本建设投资支出 X13 年末城市道路实有面积 X14 供水综合生产能力 X15 全年用电量 X16 交通事故件数 X17 人均公共绿地面积
5 994 5 330 23. 812 651 983 94. 9 5. 5 22 656 646 3. 54 7 691 250
52. 52 28
163. 44 149 823 49. 59 18 308 22 998 637 005
5 395 4 324 24. 124 1 356 193 185. 1 14. 2 80 940 980 6. 17 6 243 180
西安工程科技学院学报
Jo urnal of Xi’an U niver sit y of Engineering Science and Technology
第 20 卷第 2 期 (总 78 期)
2006 年 4 月
Vol. 20 ,No . 2 (Sum No . 78)
文章编号 :16712850X(2006) 0220243204
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 2 期 主成分分析在城市综合实力评价中的应用
245
合指标的方差依次递减 ,彼此互不相关. 实际操作中只需选取前几个总方差贡献率达到一定要求的综合指
(2) 建立相关系数矩阵 利用基于相关阵的主成分分析法 ,对于选取的综合实力指标相对化后的数
据 ,利用 SPSS 统计分析软件[7] ,计算得到城市综合实力指标数据的相关系数矩阵.
(3) 求相关矩阵的特征值 ,确定主成分个数 根据计算出的相关系数矩阵 ,在 SPSS 中求出矩阵的
特征值 ,见表 3. 根据最初几个特征值在全部特征值中的累积方差贡献率大于等于一定的百分率的原则
2 实证分析
2. 1 数据来源 以陕西省的 9 个中心城市 (西安 、铜川 、宝鸡 、咸阳 、渭南 、延安 、汉中 、安康 、商洛) 为研究对象 ,评价分
收稿日期 :2005210208 作者简介 :房镜 (19782) ,女 ,陕西省西安市人 ,重庆师范大学硕士研究生 ,主要研究方向为随机系统分析. E2mail : fj98
析 2003 年的相对综合实力. 数据来源于 2004 年的陕西统计年鉴[5] 及相关背景资料中各中心城市 (不含周 边所辖县 、市) 的数据. 其中有些指标是经过简单计算得来 ,原始数据详见表 2.
表 1 城市综合实力评价指标体系
准则层
指标层
单 位
城市规模 经济总量 人民生活 基础设施建设 城市发展
X 16
4 686
527
1 336
818
2 324
X 17
3. 8
3. 36
6. 2
4. 28
2. 73
X18 77 261
9 251
17 338
7 458
6 960
X 19
3 117
332
540
313
120
37. 46 16
142. 76 316 701 29. 41 19 635 28 082 434 712
具体做法是将各个城市某个指标的数据除以各城市该指标数据的总和 ,即该城市占全部城市的百分比 :
9
∑ Y ij = Y′ij
Y′ij ×100 % , i = 1 , 2 , …9 , j = 1 , 2 , …9 ,
i=1
其中 , Y ij 表示第 i 个城市的第 j 个指标经转化后的无量纲数值 , Y′ij 表示第 i 个城市的第 j 个指标的数值.
1 综合实力评价指标体系
城市的综合实力是指一个城市在一定时期内经济 、社会 、人文环境 、科技及基础设施等各个领域所具 备的现实实力和发展能力的集合. 由于影响城市综合实力的因素很多 ,无法面面俱到. 因此 ,遵循科学性 、 代表性和可行性的原则 ,根据现有的统计指标 ,主要选择影响较大的要素. 本文采用的指标体系分为城市 规模 、经济总量 、人民生活 、基础设施及城市发展等 5 个子系统 ,共有 19 个指标. 因为只是一个相对划分 , 故仍然可能会有指标交叉 ,其中的某些指标既可以划入这个子系统 ,也可以划入另一个子系统. 例如全年 用电量既可以划入人民生活子系统 ,也可以划入基础设施子系统. 考虑到各要素决定综合实力的最终目标 一致性 ,初步分为 3 层 :目标层为城市综合实力 ,准则层为城市规模 、经济总量 、人民生活 、基础设施 、城市 发展等 5 个子系统 ,指标层为 19 个指标 ,详见表 1.
X12 2 110 896 57 083 494 027 732 768 482 520
X13 2 284. 4 269. 7
265
438. 7
283. 2
X 14
197. 4
10. 55
29. 8
53. 9
26. 6
X15 951 106 218 821 220 035 190 939 31 236
我国幅员辽阔 ,城市众多 ,随着城市化水平的不断提高 ,城市在社会和经济发展中的主导作用更加显 著. 不同地区的城市由于地域差异和当地政府管理经营方式的不同 ,使得城市间的发展不均 ,也即城市的 综合实力不同.
定量描述不同城市之间的综合实力 ,能够给当地政府在制定城市发展策略时以一定的参考 ,使得城市 之间在发展竞争的同时 ,能够彼此互相学习 ,借鉴其他城市的经验 ,因地制宜 ,实现全面协调可持续发展. 在我国 ,对于城市综合实力的比较已经有专家学者提出的一些行之有效的指标体系和评价方法[1] . 文献 [ 224 ]探讨了陕西省区域经济发展水平及工业战略选择 、资源配置等问题. 本文选用多元统计分析中的主 成分分析法 ,对陕西省内 9 个中心城市的综合实力进行实证研究.
F1 15. 859 83. 468
F2
1. 229
6. 469
F3
0. 996
5. 240
F4
0. 625
3. 287
83. 468 89. 937 95. 177 98. 464
F5
0. 145
F6
0. 096
F7
0. 038
F8
0. 013
0. 762 0. 505 0. 202 0. 067
T2 = ( - 0. 159 , - 0. 086 ,0. 025 , - 0. 035 , - 0. 042 , - 0. 046 , - 0. 049 , - 0. 088 ,0. 46 ,0. 495 , 0. 542 ,0. 072 , - 0. 098 , - 0. 015 , - 0. 011 , - 0. 246 ,0. 332 , - 0. 098 , - 0. 067) .
110 5. 7 10 311 499 4. 87 8 032 265
2. 2 实证分析 主成分分析的基本思想[6] :设法将原来众多具有一定相关性的指标 (比如 p 个指标) ,重新组合成一组
新的相互无关的综合指标. 数学上的处理就是将原来的 p 个指标作线性组合. 作为新的综合指标 , 这些综
相关文档
最新文档