中国各省经济发展状况分析——基于聚类分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国产经
CHINESE INDUSTRY &ECONOMY
中国产经Chinese Industry &Economy
摘要:近年来,我国经济快速发展,人民生活幸福感也
不断提高,但不同地域的人民幸福感仍有较大差别。
经济的发展状况与人民幸福指数相关联,因此认清目前我国各省的经济发展状况显得尤为重要。
本文通过变量聚类法将搜集到的11个指标聚为知足充裕体验指数、公共服务体验指数和社会信心体验指数。
通过IML 计算3个类成分得分,对各省在3个类成分上分别排名,运用类成分进行系统聚类,将我国各省的经济发展水平划分为4类。
济发展水平最高的北京、上海归属第一类;经济发展水平较高的河北、天津等24个省份为第二类;经济发展水平一般的内蒙古、新疆等4个省为第三类;发展水平较低的西藏为第四类。
本文基于研究结果提出了相应的对策及建议,为进一步提高各省经济发展水平,提高人民幸福指数提供理论依据。
关键词:变量聚类;系统聚类;幸福指数一、问题背景(一)选题背景
自改革开放至今,虽然我国的经济有了快速健康的发展,但各地区仍存有发展不平衡的态势。
党在十七大报告中明确指出:“逐步提高居民收入在国民收入分配中的比重,整顿分配秩序,逐步扭转收入分配差距扩大超势。
”为此,我们根据居民收入的不同种类,将收入状况趋同的地区进行了系统地分类,以找到解决当前面临的增加居民收入问题的突破口。
(二)选题意义
为了更好地提高我国城乡居民的幸福感,清楚地认识我国各省的经济发展状况。
本文采用聚类分析法,对2017年我国31个省、市、自治区的经济发展状况进行了系统性的研究。
通过变量聚类法对我国各省的居民的可支配收入情况进行聚类。
通过选择合理的反应幸福指数的变量用主成分分析法进行排名,并用聚类分析法将幸福指数划分为生活质量与幸福、社会环境与幸福和自然环境与幸福三部分,合理地透视我国经济发展的区域性差异。
并基于研究结果,提出了相应的建议,为进一步提高人民生活幸福指数提供理论依据。
二、理论与方法基础(一)研究分析原理
聚类分析法可以在不知道类别数情况下将相近的样本分类。
聚类分析可建立一种归类准则,按归类准则把观测或变量分类,并确定合理的分类数。
(二)系统聚类法
系统聚类是聚类分析中最常用的方法之一,其基本步骤如下:
1.本文使用类平均法,定义类与类之间的距离,其距离的定义为两类间的平均平方距离,即D p ,q 2=1
n p n q ∑i ∈G p
,j ∈G
q
d ij 2其中,
n p 和n q 分别是类G p 和G q 中观测个数。
2.聚类开始时31个观测各自聚成一类,共31类,随后计算类与类之间的距离。
3.依据类间距离最小原则,将类间距离最近的两类合并为一类,并计算新类与其他类之间的距离。
4.不断重复上述步骤,直至所有类合为一类为止。
5.根据半偏R 2、伪T 2、伪F 2确定最终的分类数。
(三)变量聚类法
变量聚类法类似于因子分析法来对变量进行聚类。
聚类变量使用分层过程形成聚类,将相关的变量组合在一起。
通过设定类指标变量总体变异被该类所解释的比例来最终确定聚类数,从而达到降维的目的。
(四)指标选取
为了更加合理地反映各省的经济发展状况,所选取的指标应该越全面越好,但是由于部分指标数据难以搜集,因此,结合之前的研究,最终选取了比较具有代表性的11个指标来进行聚类分析:分别为人均生产总值(X 1)、居民消费水平(X 2)、人均
可支配收入(X 3)、政府教育支出(X 4)、政府社会保障和就业支出(X 5)
、政府医疗卫生和计划生育支出(X 6)、人均电力消费量(X 7)、人均网上零售额(X 8)、老年人口抚养比(X 9)、人均废水中主要污染物排放量(X 10)
、人均空气中烟(粉)尘排放量(X 11)三、方法在SAS 中的实现(一)变量聚类
首先调用varclus 过程对数据进行变量聚类,将相关性强的变量聚为一类:
表13个聚类的聚类汇总
聚类123
成员641
聚类变异
641
解释的变异4.4045852.974335
1
解释的比例0.73410.74361.0000
第二特征值0.93950.6458
中国各省经济发展状况分析—基于聚类分析
文/王晴、李非凡、崔译丹、刘文婷、汤小曼
-
-69
中国产经Chinese Industry &Economy
解释的总偏差=8.37892比例=0.7617
由表1知,当把11个指标聚为3类时,13个指标变量总体变异的76.17%被类解释。
其中,第一个类中指标变量总体变异的73.41%被类解释,第二个类中指标变量总体变异的74.36%被类所解释,第三个类中指标变量总体变异的100%被类所解释。
3个类中指标总体变异被该类所解释的比例都不小于事先给定的70%,因此聚类过程停止。
根据每一个指标变量的自身相似系数的平方R 2的值。
最终将所选的指标变量分为3类,第一类包括X 1、X 2、X 3、X 8、X 10、X 11,第二类包括X 4、X 5、X 6、X 9,第三类包括X 7。
令1Z -
3Z 表示变量聚类最终得到的3个类成分,
由类成
分关于指标变量的线性组合表达式:
Z 1=0.20987X 1+0.22086X 2+0.22365X 3+0.20733X 8-0.16315X 10+0.12078X 11
Z 2=0.30548X 4+0.29468X 5+0.32013X 6+0.23145X 9Z 3=1.00000X 7综上所述,全国经济发展状况大致可从3方面进行分析,第一类是X 1、X 2、X 3、X 8、X 10、X 11共6个变量,该类指标在一定程
度上反映了该地区居民的收入水平及消费水平,因此称第一类指标1Z 为知足充裕体验指数。
第二类是X 4、X 5、X 6、X 9共4个变量,该类指标在一定程度上反映了该地区政府公共服务水平,因此称第二类指标2Z 为公共服务体验指数。
第三类是X 7,该类指标在一定程度上反映了该地区繁荣程度,因此称第
三类指标
3Z 为社会信心体验指数。
根据上述三大类指标,分别对我国各省的居民的收入和消费水平、政府公共服务水平、地区繁荣程度进行排序,从三个方面剖析各省的经济发展情况。
居民的收入和消费水平较高的省份为北京、上海、天津、浙江、广东、江苏等经济较为发达的省份。
这是因为京津冀、长三角、珠三角,经济发达,必然会带动民生的高质量发展。
西藏、甘肃、贵州等地的居民的收入和消费水平相比最低。
而海南、内蒙古等地区居民的收入和消费水平明显比之前有所提高。
究其原因,是因为我国政府全面深化精准扶贫,努力缩小贫富差距。
由上图可以看出,我国政府公共服务水平最高的省份是西藏、北京、青海、天津、上海等地区。
北京、天津、上海经济飞速发展,交通、餐饮等行业高速发展,政府服务水平高。
而西藏、青海地区虽然经济发展相对缓慢,但青藏铁路的通车打开了该地区的大门,且该地区的教育及相关的医疗保障极大的提高了该地区人民的生活幸福指数。
宁夏、青海、内蒙古、新疆等经济发展水平较弱的地区繁荣程度最高。
西藏、湖南、黑龙江地区繁荣程度最低。
究其原因,是因为国家加大对宁夏、青海等偏远地区的财政支出,深入落实精准扶贫政策,且取得了显著成效。
(二)系统聚类
利用变量聚类分成的居民的收入和消费水平、政府公共服
务水平、地区繁荣程度进行系统聚类,对各个省的经济发展水平进行综合性评价,将全国各省经济发展状况进行划分。
通过聚类输出结果,由半偏R 2可知最佳分类数为{4、3、2},由伪F 统计量可知最佳分类数为{2、3、4},由伪T 2统计量知最佳分类数为{4、5、3}。
所以最终聚为4
类。
图1聚类结果图
结合聚类图1可知,我国各省的经济发展状况共可划分为4类,其中第一类北京、上海,其发展水平最高;第二类是天津、辽宁、福建、山东、江苏、浙江、广东、河北、山西、贵州、云南、陕西、甘肃、吉林、黑龙江、江西、湖北、重庆、安徽、河南、四川、广西、湖南、海南,其经济发展弱于一类,水平较高;第三类是内蒙古、新疆、宁夏、青海,其经济发展水平较为一般,第四类是西藏,其经济发展水平较低。
四、问题的解决与结论
目前,我国经济发达地区的城市人民基本生活水平和幸福感相对较高,在经济的迅猛发展下,城市各项生活指标越完善,公共设施越便利的城市,更享受到城市快速发展带来的生活质量上的提升。
所以对于发达城市,应该在政策上继续能够予以支持,保证经济发展同时,稳中求进。
对于中部经济和社会水平发展较差的城市,虽然这类地区经济发展普遍缓慢,但是不能因为经济发展缓慢就把经济发展作为全部的建设重点,民生的发展同样重要,所以作为领导者,要将经济、民生兼顾发展,在经济发展的基础上带动民生发展,才能寻求一条可靠的路径使得经济、民生得以同步发展和推进。
参考文献:[1]张晓冉.统计分析及其SAS 实现[M].清华大学出版社,2011.
[2]王鹏.收入差距对中国居民主观幸福感的影响分析——
基于中国综合社会调查数据的实证研究[J].中国人口科学,
2011(03).
(作者单位:燕山大学)
-
-70。