城镇居民消费结构模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
衣着
医疗保健 7%
家庭设备用品及 服务
10%
10%
食品 衣着 家庭设备用品及服务 医疗保健 交通和通讯 娱乐教育文化服务 居住 杂项商品和服务
图 2:第一类城市城镇居民消费结构 由图 2 可得第一类城市的衣食住消费共占总消费额的 56%,其他服务性消费 占 44%;同时,该地区的恩格尔系数为 40%,根据联合国粮农组织的标准可以判 断该地区城镇居民的生活水平为小康。
第三类城市城镇居民消费结构
杂项商品和服务
6% 居住
娱乐教育文化服 9%
务ቤተ መጻሕፍቲ ባይዱ
食品
13%
44%
交通和通讯
6%
医疗保健
衣着
4% 家庭设备用品及 7%
服务
11%
食品 衣着 家庭设备用品及服务 医疗保健 交通和通讯 娱乐教育文化服务 居住 杂项商品和服务
图 4:第三类城市城镇居民消费结构 第三类城市的衣食住消费占总消费额的 60%,其余消费占 40%;由于该地区 的恩格尔系数为 44%,所以给地区的生活水平为小康。
表 1 变量表
x1 :食品 x2 :衣着 x3 :家庭设备用品及服务 x4 :医疗保健 (数据表见附件 1)
1.分析不同地区的消费结构。 2.对上述指标进行数据分析 。
x5 :交通和通讯 x6 :娱乐教育文化服务 x7 :居住 x8 :杂项商品和服务
二 问题分析
对于问题一中消费结构的探讨,由于城市数量较多,为了便于分析,本文将 先运用聚类分析法,根据欧式空间最小距离原则,通过 MATLAB 软件将 31 个城市 进行分类。再运用统计方法制作百分比饼图,从而分析各地区的的消费结构。
利用标准化公式对原数据 X =(X 1,X 2 ,L ,X 8)进行标准化处理得到一组新
的数据 X *
=
(X
* 1
,X
* 2
,L
,X
* 8
):
X
* i
=
Xi
− µi
,i
= 1,2,L ,8.
σ ii
其中 µi 为 X i 的平均值,σ ii 为 X i 的方差。
这时 X *
=
(X
* 1
,X
* 2
,L
表 2:城市分类详细表 类别 第一类城市 第二类城市 第三类城市 第四类城市
第五类城市
样本号 1
9
19
13、26
剩余全部城市
根据以上分类,本文接下来探讨这五类城市的消费结构 。(注:恩格尔系数
是食品支出总额占个人消费支出总额的比重。它的评价标准为:联合国根据恩格
尔系数的大小,对世界各国的生活水平有一个划分标准,即一个国家平均家庭恩
对于问题二,首先, 本文采用降维的思想,运用主成分分析法减少变量的个 数,借助 MATLAB 软件建立 8 种指标的相关系数矩阵,根据主成分个数提取原则, 提取特征值大于 1 的成分,从而确定两种主成分,它们在反应样本数据信息中所 占的贡献率分别为: 63.7213% ,16.9033% 。其次,本文运用回归分析法,建立主 成分变量与因变量 Z(各地区城镇居民平均每人全年总消费支出)之间的多元线 性回归模型,用最小二乘估计回归系数,从而得出消费性支出的八个主要变量与 各地区城镇居民平均每人全年总消费支出之间的依赖关系。最后,对得到的模型 进行残差分析,剔除异常数据,再次对模型进行回归分析,得到改进后的更合理 的模型。
ρij
=
E(X
* i
X
* j
)
=
Cov(X i ,X j )
σ iiσ jj
其中
E(X
* i
X
* j
)为
X
* i
X
* j
的平均值,
Cov(X
i
,X
j
)
为 X i ,X j 的协方差。
1n
∑ 利用协方差计算公式Cov(x ,y ) =
n
−
1
(x i
i =1
− x )(y i
− y )代入数据可求
得 X =(X 1,X 2 ,L ,X 8)的协方差矩阵 ∑ 为(见附录 2):
对于问题二的数据分析,由于在所给的大量数据中变量较多且各变量之间存 在相关联系,因此,本文将采用降维的思想,运用主成分分析法,通过 MATLAB 软件建立协方差矩阵和相关系数矩阵,根据特征值选取原则确定主成分;其次, 文章将根据主成分与各变量之间的相关系数确定主成分关于各自变量的函数;最 后,由于各变量最终会影响各个城市的人均年消费总额,本文又将运用线性回归 法,拟合出主成分与消费总额之间的函数,从而确定各个变量与年度总消费额之 间的关系。由于数据中可能存在异常数据,这会对回归参数的确定有影响,所以 本文采用了残差分析法剔除异常数据,从而使模型得到了进一步的改进。
第五类城市城镇居民消费结构
杂项商品和服务
娱乐教育文化服 居住 5%
务
9%
12%
食品 43%
交通和通讯
6%
医疗保健 5%
家庭设备用品及 衣着 服务 11%
9%
食品 衣着 家庭设备用品及服务 医疗保健 交通和通讯 娱乐教育文化服务 居住 杂项商品和服务
图 6:第五类城市城镇居民消费结构 第五类城市的衣食住消费占总消费额的 63%,其他服务性消费占 37% ;由于 该地区的恩格尔系数为 43%,所以该地区的消费水平为小康。 通过观察以上五类城市城镇居民结构消费百分比图,本文将五类城市的消费 情况分为两个大方面----物资文化消费和精神文化消费,并绘制表 3 来进行比 较:
格尔系数大于 60%为贫穷;50%-60%为温饱;40%-50%为小康;30%-40%属于
相对富裕;20%-30%为富裕;20%以下为极其富裕)
运用统计方法,通过对数据的整体分析,制作如下百分比图:
第一类城市城镇居民消费结构
杂项商品和服务
6%
居住
娱乐教育文化服 6% 务
食品 40%
15%
交通和通讯
6%
对于上述问题分析,本文将建立以下模型来求解。 5.1 分析不同地区消费结构的数学模型
本文将每个省的城镇居民家庭平均年消费性支出作为一个样本,31 个不同 样本可视为多维空间中的 31 个点,用空间中点与点之间的距离来形容 31 个地区 之间各项指标的相似程度。将相近的样本归为一类,从而分析每类地区的消费结 构。
考虑到各项指标之间可能存在相互依赖关系,将模型进一步推广,得到的模 型将会是含有交互项的非线性的回归模型,使得问题更加贴近实际情况。
关键词 聚类分析;消费结构;主成分分析;多元线性回归;残差分析
1
一 问题重述
居民消费结构是在一定的社会经济条件下,居民在消费过程中所消费的各种 不同类型的消费资料(包括劳务)的比例关系。有实物和价值两种表现形式。实物 形式指居民在消费中,消费了一些什么样的消费资料,以及它们各自的数量。价 值形式指以货币表示的居民在消费过程中消费的各种不同类型的消费资料的比 例关系 。在现实生活中具体的表现为各项生活支出。下表列出了某年全国 31 个省、直辖市和自治区(港、澳、台不在其中)的城镇居民家庭平均每人全年消 费性支出的八个主要变量数据。
(Ⅰ)主成分分析:
问题中的变量太多不但会增加计算的复杂性,而且也给合理的分析问题和解 决问题带来很大的困难;同时,这些变量之间存在一定的相关性,也使得这些变 量所反映的信息在一定程度上有所重叠。为了减少变量的个数,同时提高问题研 究的合理性,本文采用了降维的思想,利用主成分分析法来减少变量的个数,同 时不会使数据反映的信息量有大的损失。由于问题中各变量的变化范围差异较 大,所以要先对原始数据进行标准化处理,从相关矩阵出发来求得主成分。
i =1
X *i :标准化后城镇居民家庭平均每人全年消费性支出的第 i 个主要指标数据;
Z k :第 k 个地区各项消费指标数据样本( k = 1,2,3L,31)
yi :样本的第 i 个主成分;
Y :衡量消费性支出中八个主要指标的综合指标。
其中, i = 1,2,3,4,5,6,7,8 。
五 模型的建立与求解
第四类城市城镇居民消费结构
娱乐教育文化服 务
居住 8%
杂项商品和服务 6%
8%
交通和通讯 7%
医疗保健 3% 家庭设备用品及 服务 5%
食品 51%
衣着 12%
食品 衣着 家庭设备用品及服务 医疗保健 交通和通讯 娱乐教育文化服务 居住 杂项商品和服务
图 5:第四类城市城镇居民消费结构 第四类城市的衣食住消费占总消费额的 71%,其他服务性消费占 29%;由于 该地区的恩格尔系数为 51%,所以该地区的色和那个活水平为温饱。
5
表 3:五类城市消费情况表
占
城
总
市
额类
百别
分
比 消费方 向
第一类城市
第二类城市
第三类城市 第四类城市 第五类城市
物资文化
56%
58%
消费
60%
71%
63%
精神文化
44%
42%
消费
40%
29%
37%
通过百分比图与表 3 的互相参照对比可得以下结论: (1)第一、二、三类城市比较注重精神文化消费 ,其平均百分比占总消费 额的 42%; (2)第三、四类城市注重于物资文化消费,其平均百分比占总消费额 的 67% 。 由此可见,中国各地区的生活水平均有提升空间,但相对于第一、二、三类 城市而言第四、五类城市的生活水平有更大的提升空间。 5.2 对于问题二的模型建立与求解: 由于题目所数据量丰富且变量较多,为此,本文采用了主成分分析法以达到 减少变量个数的目的,从而简化了问题研究的复杂程度。然后,本文利用线性回 归分析的方法,建立了主成分变量与因变量 Z(各地区城镇居民全年平均总消费 支出)之间的线性关系,从而得出消费性支出的八个主要变量与各地区城镇居民 全年平均总消费支出之间的依赖关系。
基于主成分分析的城镇居民消费结构探讨
摘 要 本文讨论了中国 31 个省、直辖市和自治区(港、澳、台不在其中)的城 镇居民消费结构问题。
对于问题一,先运用聚类分析法,将 31 个样本数据视为多维空间的点,根据 欧氏空间最小距离原则将其归为五类;然后,以 8 个消费性支出指标为出发点, 各地区恩格尔系数为衡量标准,运用统计知识绘制各类城市、各项消费指标的百 分比图,分析各类地区的消费结构.
三 基本假设
(1) 大量数据符合平均分布的统计规律; (2) 不考虑城市之间流动性人员的消费性支出对数据造成的误差; (3) 忽略国家宏观调控对各城镇居民消费观的影响。
2
四 符号约定
X i :各省城镇居民家庭平均每人全年消费性支出的第 i 个主要指标数据;
8
Z :居民家庭平均每人全年消费性总支出指标数据;( Z = ∑ X i )
⎡
⎢
⎢
⎢
⎢
∑
=10^5
⎢ ⎢
⎢
⎢
⎢
⎢
⎢⎣
3.4444 0.1749 0.7369 0.2371 0.6225 0.8549 0.6612 0.4533 ⎤
0.1749
0.1451
0.0559
0.0440
0.0133
0.0583 - 0.0407
0.0370
⎥ ⎥
0.7369 0.0559 0.3237 0.0965 0.1349 0.2920 0.1720 0.1057 ⎥
本 j 可归为一类,若 z j 为任意样本时, d (zi , z j ) 均相对较大,则表示样本 i 独立
的成为一类。 根据不同地方的消费特点,运用 MATLAB 软件编程,将 31 个地区划分为五类,
画出聚类谱系图(见图 1)。
3
图 1:31 个地区聚类谱系图 从聚类谱系图可得五种分类的具体划分为表 2 所示:
第二类城市城镇居民消费结构
杂项商品和服务
6%
居住
13%
食品
娱乐教育文化服
40%
务
12%
交通和通讯 11% 医疗保健 5%
衣着 家庭设备用品及5%
服务 8%
食品 衣着 家庭设备用品及服务 医疗保健 交通和通讯 娱乐教育文化服务 居住 杂项商品和服务
图 3:第二类城市城镇居民消费结构
4
第二类城市的衣食住消费占总消费额的 58%,其他服务性消费占 42%;由于 该地区的恩格尔系数为 40%,所以该地区城镇居民的消费水平为小康。
借助欧式空间最小距离公式,将样本分类,并结合八项指标分析每类地区的 消费结构。
将 31 个地区样本按照已给信息顺序进行编号,样本 i 与样本 j 之间的距离
为:
8
∑ d (zi , z j ) =
(xik − x jk )2
k =1
由 d (zi , z j ) 生成距离方阵,记为 (zij )31×31 ,其中 min{d (zi , z j )} 表示样本 i 与样
0.2371
0.0440
0.0965
0.0746
0.0588
0.1119
,X
* 8
)的协方差矩阵就是
X
=(X 1,X 2 ,L ,X 8)的相关
6
矩阵 ρ =(ρij)8×8 ,所以利用 X * 的协方差矩求得的标准化数据 X * 的主成分和利
用 X 的相关矩阵求得的标准化数据 X * 的主成分是相同的。本文是利用 X 的相关
矩阵 ρ =(ρij)8×8 来求 X * 的主成分的,相关系数 ρij 为: