我国城镇居民消费结构的聚类分析及政策建议
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我国城镇居民消费结构的聚类分析及政策建议
摘要:近年来,我国城镇居民的整体消费水平逐渐提高,但各地区间的消费结构仍存在较大差别。文章选用8个城镇居民消费结构统计指标,采用欧式距离平方和离差平方和法,对我国31个省、直辖市及自治区的2008年城镇居民消费结构进行聚类分析和比较研究。这不仅从总体上掌握了我国消费结构类型的地区分布,而且系统分析了我国各地区消费结构的特点及产生原因,为国家制定消费政策提供了决策依据.
关键词:消费结构;聚类分析;政策建议;2008年
一、引言
近年来,随着我国经济的快速发展,城镇居民的收入不断增加。并且在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,我国各地区城镇居民的消费支出也强劲增长,消费结构发生了巨大的变化,结构不合理现象也得到了一定程度的调整。但是,由于各地区的经济发展不平衡及原有经济基础的差异,使各地区的消费结构仍存在着明显差别。为了进一步改善消费结构,正确引导消费,提高我国城市居民的消费水平和生活质量,有必要考察我国各地区城镇居民的消费结构之间的异同并进行比较研究,以期发现特点和规律,从宏观上把握各地区城镇居民的消费现状和不同地区消费水平的差异,为提高我国各地区消费水平和谐增长提供决策依据。
二、聚类分析方法的原理
1.基本思想。聚类分析(Cluster Analysis)是对多属性统计样本进行定量分类的一种多元统计分析方法。其目的在于辨认在某些特征上相似的事物,并把事物就这些特征划分成若干类,使在同一类的事物具有高度共性,而不同类的事物具有高度相异性。这种方法基本思想是:从一批样本的多个观测指标中,找出度量样本之间或指标之间相似程度(亲疏关系)的统计量。构成一个对称的相似性矩阵,在此基础上进一步找寻各样本(或变量)之间或样本组合之间的相似程度,按相似程度的大小。把样本(或变量)逐一归类,关系密切的归类聚集到一个小的分类单位。关系疏远的聚集到一个大的分类单位,直到所有样本或变量都聚集完毕,
形成一个亲疏关系谱系图,能够更自然、更直观地显示分类对象(个体或指标)之间的差异和联系。本文通过对2008年我国31个省、直辖市及自治区的8个聚类分析指标的统计数据进行样本聚类,发现我国各地区之间城镇居民消费结构的差异。
2.主要依据。本文采用系统聚类法(Hierarchical Clustefing Method),这是聚类分析中用得最广泛的一种方法,它涉及相似性度量的选择和类间距离计算方法的确定等关键问题。
(1)相似性的度量。系统聚类法是根据样品或指标之间的亲疏程度来进行合并,衡量亲疏程度的距离是指将每个样品看成是个变量对应的维空间中的一个点,然后在该空间中定义,距离越近,则亲密程度越高,这里对样本进行分类。故采用欧氏距离为度量标准。如公式(1)所示:
22])([t
it p t it ij x x d -=∑ (),...,2,1,n j i = (1)
其中ij x &表示i 地区第t(t=l ,2,3,4,5,6,7,8)种消费支出所占比重,jt x 表示i 地区第t 种消费支出所占比重。ij d 表示i 地区和j 地区的消费结构相似程度。ij d =0说明i 地区和j 地区消费结构完全相同,但实际上i 地区和j 地区的消费结构不可能完全一样。因此,ij d 越大,则i 地区和j 地区的消费结构差异越大,相似性越小;反之,正好相反。
(2)离差平方和法。系统聚类法根据类与类之间距离的计算方法不同,又分为八种类型:最短距离法、最长距离法、中间距离法、类平均法、重心法、离差平方和法等等。由于离差平方和法的类间距离与两类的样品数有较大的关系,两个大的类倾向于有较大的距离,因而易于合并。这既符合我们对聚类的实际要求,也适用于各地区居民消费结构分类的特征,因此本文确定采用离差平方和法计算类与类之间的距离。
离差平方和法(Ward Linkage)由沃德(Ward)提出。是根据方差分析原理得到的,如果分类比较合理,则同类样品之间的离差平方和较小,类与类之间的离差平方和较大。设将n 个样本分成k 类G 1,G 2,… ,G k 用X (t)表示G t 中的第i 个样本(X (t)t 是P 维向量),n t 表示G t 中的样本个数,
是G t 的重心,则在类G t
中的样本的离差平方和为(2):)()()()()(1)(t t i t n i t i t x x x x S t
-'-=∑= (2)
k 个类的类内离差平方和如公式(3):
)()()()()(11)(1t t t t k t n i t t k t t x x x x S S t
-'-==∑∑∑=== (3)
当k 固定时(即分类的类数固定,要选择使S 达到最小的分类),假设类G p 和类G q 合并成新类G r ,则G r 与任一类G i 之间的距离递推(4):
2222
pq i r i iq i r q i TP i r p i n D n n n D n n n n D n n n n D +-+++++= (4)
具体做法是先将11个样本分成n 类,然后每次减少1类,由于每减少l 类,总离差平方和S 要增大,选择使S 增加最小的两类合并。依次进行,直到N 个事物归属为1类为止。
三、消费结构的聚类分析过程
消费结构指居民在生活消费过程中,不同类型消费的比例及其相互之间的配合、替代、制约的关系。就其数量关系来看,消费结构足指在消费过程中不同商品或劳务消费支出占居民总消费支出的比重,反映了一定社会经济条件下人们对各类商品及劳务的需求结构,体现一国或各地区的经济发展水平和居民生活状况。
1.数据的获取及来源。运用聚类分析方法研究城镇居民消费结构。首先要根据研究目标确定相应的聚类分析指标。分类效果如何,关键取决于聚类分析统计指标的合理选择。聚类分析统计指标应该有明确的实际意义,并且具有较强的代表性。本文以2008年我国各地区城镇居民家庭平均每人全年消费性支出为例,选取了具有代表性的八大指标:食品支出(X 1)、衣着支出(X 2)、家庭设备用品及服务支出(X 3)、医疗保健支出(X 4)、交通和通讯支出(X 5)、娱乐教育文化服务支出(X 6)、居住支出(X 7)、杂项商品和服务支出(X 8),对我国31个省、直辖市、自治区(除台湾、港澳外)的城镇居民消费结构进行聚类分析。以便对各地区消费结构特点作系统科学研究。根据《中国统计年鉴(2009)》,获取2008年我国各地区城镇居民家庭平均每人全年消费性支出比例数据。
2.聚类分析结果输出。本文应用软件SPSSl1.5.采用欧氏距离平方和离差平方和法,对我国31个省份的城镇居民消费结构进行聚类分析。输出结果如