我国城镇居民消费结构的地域差异分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我国城镇居民消费结构的地域差异分析——以2010年上半年中国36个大中城市城镇居民消费品支出统计数据为例
内容摘要:运用因子分析和聚类分析方法,对2010年上半年全国36个大中城市城镇居民消费结构进行地域差异研究。首先通过因子分析方法将八项消费指标进行降维,找出两个公共因子,并根据这两个公共因子对36个大中城市进行聚类分析,以进行地域间的差异比较,发现其特点和规律。
关键词:因子分析;聚类分析;消费结构;地域差异
一、研究问题、目的及研究意义
消费作为经济活动中的一环,是实现经济健康平稳发展的关键,而消费结构作为消费的具体内容,它的合理与否,又是消费的关键问题。因而,正确把握城镇居民消费结构的现状及地域间差异具有重要的现实意义。
20世纪90年代以来,中国城镇居民的消费水平和消费结构发生了很大的变化,具体表现为:城镇居民的消费水平有了较大幅度的提高;食品消费仍占有很大比重,但恩格尔系数下降;发展性和享受性消费比重提高;服务性消费的需求不断上升;城镇居民家庭的教育投入增长迅速,文化消费增长却依然缓慢,比重过小等等。刚刚走过的2010年,物价的疯涨更是充斥着每一位中国老百姓的心,通胀预期影响着人们的消费方式和投资观念。那么,在这一年,我国各大中城市的消费结构如何?地域间差异又如何得以体现?
本文利用2010年上半年我国36个大中城市城镇居民消费品支出统计数据,在这个大背景下进行城镇居民消费结构分析,利用因子分析及聚类分析方法,将全国各省市进行分类,针对各类地区居民消费结构及差异进行研究,以期发现特点和规律。以往学界也有对我国城镇居民的消费结构进行分析,如陈彦玲《我国城镇居民消费结构区域差异分析》、刘思嘉《我国城镇居民消费结构的聚类分析及政策建议》、孔蓓蓓《我国城镇居民消费结构比较研究》等,但以往的研究没有这个特殊的大背景,或没有对地区间进行差异研究。因而,本研究在理论以及实践上均有着重要的意义。
二、研究方法及数据说明
(一)研究方法
1、因子分析( Factor Analysis)
因子分析是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量称之为“因子”,每一个主要因子都能反映相互依赖的社会经济指标间的共同作用,抓住这些主要因子就可以帮助我们对复杂的社会经济发展问题进行深入分析、合理解释和正确评价。
因子分析的基本思想是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表一个公共因子,原来观测的每个变量就可表述为公共因子的线性函数和特殊因子之和。通过构造因子分析模型,研究因子载荷矩阵,分析变量共同度、根据公共因子的方差贡献大小选择主要的公共因子,在对因子进行方差最大化正交旋转后,用回归法估计因子得分,以各因子的方差贡献率比重对各因子进行加权汇总,进而得出综合得分进行评价。因子分析以最少的信息丢失,将原始的众多指标综合成较少的几个综合指标,其主要目的就是浓缩数据。
2、聚类分析(Cluster Analysis)
对事物进行分类,是人们认识事物的出发点,是人们认识世界的一种重要方法。聚类分析方法正是这么一种“物以类聚”的多元统计方法,其基本思想是认为所研究的样品或指标之间存在着程度不同的相似性(即亲属关系)。
本文所用的聚类分析方法是系统聚类,即根据一批样品的多个观测指标,具体找出一些能够度量样品之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品聚合为一类,把另外一些彼此相似程度较大的样品又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品都聚合完毕,把不同的类型逐个划分出来,形成一个由小到大的分类系统。可见,应用系统聚类可以把我国消费结构相似程度较高的地区归为一类,不同类别地区的消费结构状况则差异较大,并在此基础上进行不同地域间消费结构的差异分析。
(二)数据说明
本文引用中国统计数据库中的《2010年上半年中国36个大中城市城镇居民消费品支出统计》的八项数据为例进行分析(见附表),包括:食品、衣着、家庭设备用品及服务、医疗保健、交通通讯、文教娱乐及服务、居住、杂项商品及服务。在此,以各地区城镇居民家庭平均每人全年消费性支出的各构成部分作为指标变量,分别记为X1、X2、X3、X4、X5、X6、X7、X8,采用SPSS18.0 for windows 综合运用因子分析和聚类分析等多元统计方法对数据进行分析。
三、数据处理及分析
(一)因子分析处理
1、相关矩阵检验
在因子分析方法的应用中,观测变量之间有较强的相关关系是使用因子分析的前提。表1是根据《2010年上半年中国城镇居民消费品支出统计》的八项数据,计算原始变量之间的相关系数矩阵所得出的结果。从表中可以看出变量间具有较强的相关关系,KMO值达到0.837,表明数据很适合做因子分析。同时,数据通过了巴特利特球体检验( P = 0.000<0.05),说明8个变量间具有较强的相
关性,它们反映的信息有很大的重叠,能提取出公共因子。相关系数矩阵的统计
2、特征值与因子贡献率的计算
表2是利用主成分分析法求得的各因子特征值及贡献百分率。可见,前两个公共因子对样本方差的累积贡献率为79.086%,将近80%,即它们包含原始数据信息总量的79.086%,说明使用这两个公共因子代表原来的8个指标评价全国城镇居民消费结构已有足够的把握。这两个公共因子的选取也可以从碎石图中看出,从第三个公共因子开始特征根都低于1,舍去这些因子,并不会损失很多的
图一:碎石图
3、因子旋转以求得解释因子
初试因子达到了数据简化的目的,然而根据初试因子解,往往很难解释因子的意义。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小,至多达到中等大小。本文采取最大方差法(Varimax)进行因子旋转,经过3次迭代后收敛,旋转前后的因子负荷矩阵如表3所示:
表3:因子旋转前后的因子负荷矩阵
4、因子得分及排名
当因子载荷阵确定以后,便可以计算各因子在每个样本上的具体数值,称之为因子得分。由系数矩阵可以将2个公共因子表示为8个指标的线性形式。则旋转后的因子得分表达式可以写成:
F 1=0.913X
1
+0.906X
2
+0.894X
3
+0.827X
4
+0.799X
5
+0.622X
6
+0.243X
7
+0.021X
8
F 2=0.195X
1
+0.098X
2
+0.042X
3
+0.319X
4
+0.433X
5
+0.593X
6
+0.776X
7
+0.902X
8
以特征根贡献率为权数,综合因子得分计算公式为:F=52.760F
1+26.326F
2
,
各城市的综合因子得分及排序名次如表4所示。
表4:各因子得分及排名