对我国各地区城镇居民人均消费性支出的多元统计分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对我国各地区城镇居民人均消费性支出的多元统计分析
聚类分析案例
---对我国各地区城镇居民家庭平均每人全
年消费性支出情况的分析
(一)案例研究背景
近年来,我国国民经济得到了迅速发展,人民生活水平进一步提高,物质文明建设达到了前所未有的水平。但由于我国各地区经济发展水平不均衡,加之各地人口、资源、政策等各方面存在的差异,使各地区居民人均消费水平参差不齐,不同的地区具有不同的特点。在这一背景下,研究我国各地区城镇居民家庭平均每人全年消
费性支出情况,明确各类地区城镇居民人均消费性支出的差异与特点,有利于决策部门从宏观上把握我国各地区的消费情况,协调各地区的发展,切实落实“出口、投资和消费共同发展”的经济政策,推动我国经济再上一个新台阶。
其次,消费结构可以反映居民的生活质量和经济发展水平。一般来说,经济越发达的地区,其消费结构就越趋向于追求安逸享受的消费结构。在这样的消费结构中,奢侈品支出如住房、服务性支出所占的比例就会较大。反之,在经济
较不发达的地区中,生活必需品消费支出所占的比例就会较大。随着社会主义市场经济体制的逐步完善,我国的社会生产力不断日益加快发展,经济总量和综合实力迅速上升,城镇居民的生活水平显著提高。相对过去而言,居民食品方面的消费支出比重在逐渐下降,而在交通通讯、文化娱乐等方面的消费支出比重越来越大。消费结构的变化,反映居民需求的变化。研究我国城镇居民消费性支出情况及其影响因素,对建立合理的消费结构,扩大内需,搞活社会主义市场经济,制定产业政策,促进国民经济的发展都有着极其重要的意义。
(二)初步准备
1、建立数据指标体系:
表1列出2010 年全国31个省、市和自治区的城镇居民家庭平均每人全年消费性支出的八个主要变量数据。其中:
x1——食品;x2——衣着;x3——居住;
x4——家庭设备用品及服务;x5——医疗保健;x6——交通和通信;
x7——教育文化娱乐服务;x8——其它商品和服务;
表1 我国各地区城镇居民家庭平均每人全
位:元
——资料来源:2011年《中国统计年鉴》
2、为了得到更科学的分析结果,对原数据进行标准化处理。标准化之后的数据如下表:
(三)聚类分析
1、运用SPSS对表2的数据进行Q型聚类,采用Ward聚类法,得出聚类表如下:
由上表可以看出,聚类分析的第一部,28
号样本(甘肃)与29号样本(青海)聚成一小类,它们的个体距离是0.369,这个小类将在下面第11步中用到;同理,聚类分析的第11步中,28
号样本(甘肃)与31号样本(新疆)聚成一小类,它们的个体距离是5.800,这个小类将在下面第22步中用到……以此类推,经过30步聚类过程,31个样本最后聚成了一个大类。
2、做出聚类分析的冰柱图、树形图如下:
图3.1 聚类分析冰柱图
图3.2 聚类分析树形图
从上表可以看出:
a) 如果根据各地区城镇居民人均全年消费状况把31各地区分为2类,结果为:
第一类:上海、北京、浙江、广东、天津、
第二类:其他地区
b) 如果根据各地区城镇居民人均全年消费状况把31各地区分为3类,结果为:
第一类:上海
第二类:北京、浙江、广东、天津、
第三类:其他地区
c) 如果根据各地区城镇居民人均全年消费状况把31各地区分为4类,结果为:
第一类:上海
第二类:北京、浙江、广东、天津
第三类:西藏
第四类:其他地区
3、案例分析
如果按分成4类来分析,可对各类的各个指标分别进行描述统计,结果如表3.2所示。
表3.2 聚类分析的各类特征
由表3.2可知,第一类有1个省市(上海),除了医疗保健支出低于第二类,其余各项支出均位于四类之首,其中数额最大的是其他商品和服务支出(例如享受性消费支出、住房支出等),显示上海市居民的人均消费水平较高;第二类有4个省市(北京、浙江、广东、天津),各项指标中除了医疗保健支出高于第一类,其他各项均排名第二,其中交通和通信支出最高;而第三类(西藏)中,食品支出最多,医疗保健支出最少,反映出西藏地区人民生活水平低、医疗卫生等基础设施不健全等问题;第四类(其他地区)的各项消费支出则均处于最低端。这与实际情况相符合。
(四)判别分析
1、将以上数据归为4类,把其中的四川省、广东省作为待判样本。利用SPSS对表2的数据进行判别分析,得结果如下表:
表4.1 特征值
Function Eigenvalue % of Variance Cumulative %
Canonical Correlation
1 7.123a59.4 59.4 .936
2 3.864a32.2 91.7 .891
3 1.001a8.3 100.0 .707
表4.2 标准化典型判别函数系数
Function
1 2 3
Zscore(食品) -.113 -.180 1.090
Zscore(衣着) -.887 -.152 .516
Zscore(居住) -.295 -.068 -.511
Zscore(家庭设备用品及服务) .261 .338 -.745
Zscore(医疗保健) .319 1.484 .592
Zscore(交通和通信) .694 .177 .280
Zscore(教育文化和娱乐服务) .150 .878 -.408
Zscore(其他商品和服务) .907 -1.743 -.187
由表4.1和4.2可知,需选用2个判别函数(m0=2),分别为:
Y1=-0.113*X1-0.887*X2-0.295*X3+0.261*X4+0.31 9*X5+0.694*X6+0.15*X7+0.907*X8
Y2=-0.18*X1-0.152*X2-0.068*X3+0.338*X4+1.484 *X5+0.117*X6+0.878*X7-1.743 *X8
将四川省、广东省的数据分别代入,得:
四川省:Y1=0.176 Y2= -1.658