全国各省市居民生活水平的比较与分类
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
全国各省市居民生活水平的比较与分类
摘要:运用主成分分析方法对我国全国31地区2008年居民生活水平进行了评价,提取了3 个基本的主成分进行综合评分和排序。按照基于绝对值距离的层次方法进行聚类,并按照居民生活水平的高低将全国各省市分为三类地区,第一类是上海市,第二类是北京、浙江等省市,第三类为西藏自治区。
关键词:全国;居民生活水平;主成分分析;聚类分析
生活水平的评价问题与人民的切身利益息息相关,始终受到了社会学、统计学、经济学等众多领域的广泛关注,是重要的理论研究课题。恩格尔系数通常作为衡量居民生活水平高低的重要指标。它是根据经验数据提出的,是在假定其它一切变量都是常数的前提下才适用的。因此,在以恩格尔系数衡量生活水平高低时与客观现实存在差异,有待改善。鉴于此,本文在评价居民的生活质量时采用了一套综合的指标体系,利用主成分分析方法,对我国31个地区的居民生活水平进行了打分排名和聚类分析,最后对结果进行了比较和分析。 一、 生活水平评价指标体系
本文采用12 项指标:1x 为城镇居民恩格尔系数(%) ,2x 为农村居民恩格尔系数(%),3x 为城镇居民可支配收入(元), 4x 为农民人均纯收入(元),5x 为城镇居民消费支出(元),
6x 为农村居民消费支出
(元),7x 为在岗职工平均工资(元),8x 为农村居民人均住房面积(2
m ),9x 为平均每户家庭人口(人),10x 为平均每户就业者负担
(人) ,11x 为人均日生活用水量(L) ,12x 为人均生活用电量(kW ·h) 。
采用这些指标有其必要的原因。恩格尔系数可以较好的反映不同收入群体的生活水平差距。本文将恩格尔系数设置为城镇居民恩格尔系数(1x )与农村居民恩格尔系数(2x ),符合指标的可比性原则; 居民收入的高低从很大程度上反映了居民生活水平, 因此设置了城镇居民人均可支配收入(3x )、农民人均纯收入(4x )和在岗职工平均工资(7x )3个指标, 对各省份居民的收入进行评价;居民消费直接反映了居民生活水平,设置城镇居民消费支出(5x )与农村居民消费支出(6x )2个指标, 基本上反映了各地省份的基本消费情况,客观评价了居民的生活消费水平;家庭人口直接影响到居民生活水平,因此设置了家庭人口(9x )与平均每户就业者负担(10x )2个指标来反映居民的生活压力;水、电和住房是居民正常生活的必需, 与居民的生活水平有着最直接联系, 因此设置城镇居民人均居住面积(8x )、人均日生活用水量(11x )和人均生活用电量(12x )3个指标。 二、 主成分分析
(一)主成分分析原理
主成分分析法是一种数据降维方法,它是将原来选取的多个指标利用线性变换的方法重新组合成尽可能少的且互不相关的几个综合性指标,并且使这几个指标能尽量多的反映原指标所包含的信息,从而达到简化数据和揭示变量间关系的目的。利用SPSS12. 0软件可一次性进行主成分分析,其主要步骤如下:
1.为排除量纲的影响,首先对原始数据进行标准化,使各指标的均值为0 ,方差为1。
2.计算标准化后的样本相关矩阵R ,求R 的特征值λ及特征向量T;并按1λ≥2λ≥L ≥0 排序。
3.计算累计贡献率,一般按累计贡献率≥80 %的原则确定主成分数。
4.由第3步所确定的主成分如果不能很好地解释现实问题,则对
其进行旋转,直到能较好地说明问题为止。计算旋转后的主成分负荷矩阵,即为标准化后的矩阵与主成分的相关系数。
5.计算主成分得分矩阵,形成一个新的矩阵。
6.以各主成分的信息贡献率为权数,计算各省市的综合评价值。
(二)分析过程
对全国31个省市的数据分布进行统计分组,所有数据均来自《中国统计年鉴2009》。首先将原始数据进行标准化,再对标准化数据(表1)进行主成分分析,提取特征值大于1 的因子,得到第一主成分到第三主成分的特征值分别为6.1512、2.2228、1.2964,累计贡献率分别为51.26%、18.52%、10.80%。前3 个主成分的特征值都大于1 ,并且累积贡献率大于80% ,可反映原始数据的足够信息,因此确定主成分为3 个。通过各主成分说明的方差(表2) ,可用这3 个主成分反映原始的12 项指标。
省市
北京-1.173 -1.645 2.452 2.545 2.128 2.203 3.199 0.654 -1.625 -0.926 -0.749 0.742 天津-0.362 -0.493 1.123 1.288 1.014 0.011 1.338 -0.323 -0.553 -0.178 -0.784 0.941 河北-0.956 -0.955 -0.376 -0.135 -0.576 -0.432 -0.507 -0.098 0.178 -0.178 -0.596 0.072 山西-1.175 -0.827 -0.457 -0.454 -0.679 -0.450 -0.364 -0.492 0.178 -1.301 -0.846 0.608 内蒙古-1.397 -0.494 -0.127 -0.198 0.063 -0.120 -0.310 -0.966 -0.675 -0.272 0.399 1.360 辽宁0.029 -0.558 -0.137 0.222 0.211 0.004 -0.166 -0.504 -0.992 -0.646 -0.482 0.244
吉林-1.125 -0.727 -0.529 -0.072 -0.340 -0.231 -0.622 -0.922 -0.528 -0.178 -0.372 -0.667 黑龙江-0.597 -1.798 -0.842 -0.107 -0.746 0.023 -0.802 -0.943 -0.992 -1.675 0.504 -0.708 上海-0.511 -0.509 2.941 2.901 3.205 3.365 2.762 2.873 -1.552 1.599 0.200 1.968 江苏-0.211 -0.440 0.937 1.035 0.484 0.963 0.317 1.157 -0.553 -0.459 0.400 0.738 浙江-0.561 -1.163 1.952 1.904 1.651 2.361 0.590 2.702 -1.065 -0.739 -0.274 1.035 安徽0.497 0.037 -0.489 -0.406 -0.416 -0.332 -0.339 -0.176 -0.504 -0.365 -0.253 -0.928 福建0.410 0.378 0.757 0.505 0.676 0.541 -0.357 1.352 -0.480 1.973 0.005 0.060 江西0.653 0.860 -0.520 -0.180 -0.711 -0.316 -0.939 0.546 0.690 1.412 -0.033 -1.027 山东-1.213 -0.972 0.342 0.252 0.128 0.171 -0.277 0.116 -0.699 1.693 -0.698 0.008 河南-0.927 -0.934 -0.429 -0.291 -0.667 -0.484 -0.488 -0.006 0.349 -0.272 -0.680 -0.496 湖北0.766 0.455 -0.448 -0.198 -0.433 -0.098 -0.729 0.686 -0.407 0.196 -0.165 -0.644 湖南0.247 1.158 -0.281 -0.264 -0.261 -0.002 -0.522 0.844 -0.041 -0.552 -0.091 -0.916 广东-0.248 0.808 1.201 0.598 1.786 0.674 0.550 -0.363 0.398 1.506 -0.140 0.494 广西0.823 1.521 -0.199 -0.640 -0.378 -0.521 -0.445 0.000 0.739 1.693 0.217 -0.825 海南 1.405 1.506 -0.585 -0.320 -0.458 -0.586 -0.801 -0.838 1.227 0.664 0.006 -0.912 重庆0.181 1.501 -0.144 -0.441 0.180 -0.585 -0.229 0.309 -0.894 0.851 -0.568 -0.736 四川 1.182 1.296 -0.578 -0.443 -0.359 -0.431 -0.454 0.300 -0.528 0.103 -0.651 -0.873 贵州0.981 1.241 -0.798 -1.048 -0.846 -1.040 -0.542 -0.609 0.861 -0.926 -0.619 -0.683 云南 1.901 0.900 -0.424 -0.908 -0.580 -0.518 -0.621 -0.405 0.934 -0.739 -0.467 -0.661 西藏 2.859 1.361 -0.616 -0.875 -0.856 -1.019 1.815 -0.731 3.298 0.851 1.695 -1.363 陕西-0.499 -1.072 -0.522 -0.893 -0.325 -0.525 -0.366 -0.258 -0.138 -0.552 -0.712 -0.626 甘肃-0.124 0.506 -0.995 -1.081 -0.861 -0.891 -0.582 -1.117 0.861 -0.552 -0.185 -0.190 青海0.375 -0.314 -0.827 -0.927 -0.904 -0.577 0.177 -1.125 1.032 -1.301 0.160 1.732 宁夏-0.874 -0.392 -0.504 -0.644 -0.403 -0.452 0.171 -0.817 0.788 -0.833 1.459 2.649 新疆-0.354 -0.236 -0.879 -0.725 -0.729 -0.707 -0.459 -0.843 0.690 0.103 4.320 -0.396
表2 说明的总方差
从相关矩阵表中可得出各公共因子与原始各个指标的相关系数R(表3) 。其中公共因子1与3x、4x、5x、6x、7x和8x的相关系数大,主要反映居民的基本生活情况;公共因子2 与1x、2x、10x相关系数大;公共因子3 与11x相关系数大,主要反映居民的生活负担情况。3个主成分很好地综合了原来12个指标,分别从不同方面反映了各个省份的