基于全国城镇居民平均每人全年家庭收入来源的统计分析汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于全国城镇居民平均每人全年家庭收入来源的统计分析
摘要本文采用2012年中国省会城市和城镇居民家庭收入来源的统计数据,首先运用各收入来源对家庭可支配收入进行回归分析,然后运用逐步回归法分析工资性收入、经营净收入、财产性收入和转移性收入对可支配收入的显著性关系;然后利用聚类分析对各城市进行分类;最后利用因子分析对各地区进行因子分析,通过计算综合得分,获得各地区综合排名,关键词可支配收入;聚类分析;回归分析;因子分析。
1、研究背景及目的
改革开放以来,我国的国民经济增长迅速,居民的收入水平也大幅提高,但居民收入分配差距也在不断扩大。虽然随着世界范围的经济危机的衰亡,但是经济危机的影响依然存在,各行业各业都在面临了巨大的压力下缓解了过来,从而也深深地影响了我国城镇居民的收入来源。
随着社会的进步和经济的快速发展,我国居民的收入方式已经变得丰富起来,包括工资性收入、经营净收入、财产性收入及转移性收入等多种收入方式,因此,分析我国居民的收入来源变得犹为重要。
本研究目的如下:通过对我国各省城镇居民收入来源的分析,一方面了解我国各省的主要经济结构,另一方面确定各省的收入形式,为国家制定政策提供依据。
2、研究方法
为了研究我国各省城镇居民的收入来源的构成,我们采用了工资性收入、经营净收入、财产性收入、转移性收入、总收入和可支配收入等六大指标。
本研究采用的数据是《分地区城镇居民平均每人全年家庭收入来源》,数据摘自《中国统计年鉴2013》11-14。
本数据分析主要采用的研究方法有聚类分析,回归分析和因子分析。
基恩思路是:首先利用饼图和条形图得出全国的平均收入构成分布比例及各省的品均可支配收入情况;然后运用聚类分析对各省的收入构成情况进行分类;然后运用回归分析研究各收入来源对可支配收入的显著性;最后运用因子分析对各个城市提取公因子,根据提取出的公因子对各个城市进行排名。
3、实证分析
由于从国家统计局网站下载的数据为EXCEL格式,可以将数据导入成SPSS数据,共设置了6个变量,分别是“可支配收入”、“总收入”、“工资性收入”、“财产性收入”、“转移性收入”。样本是中国2012年分地区城镇居民平均每人全年家庭收入来源的统计数据。见附表
3.1简单的统计图形
图1可以看出在所有的的收入来源中,工资性收入占主导地位,转移性收入次之,说明我国家庭的收入来源主要靠就业工资,但是国家的补贴仍然处于重要地位,说明我国居民仍有部分处于失业、待就业状态,国家的扶持让他们能继续维持生计。图2是我国城镇家庭平均可支配收入的比较,通过图形我们可以看出在各个城市的对比中上海处于领先地位,说明上海地区在我国处于比较重要的地位,经济比较发达,人民生活水平比较高。
3.2回归分析
以“可支配收入”为被解释变量,以“工资性收入”、“经营净收入”、“财产性收入”和“转移性收入”为解释变量,进行多元回归,采用逐步回归法。得到的图
3至图5所示
图3
模型汇总e
模型R R 方调整 R 方标准估计的误
差Durbin-Watson
1 .951a.904 .901 1809.732304365
350700
2 .980b.961 .958 1177.160102963
996500
3 .998c.996 .995 388.4602003600
06300
4 .999d.997 .997 335.1407269520
13700
1.853
a. 预测变量: (常量), 工资性收入。
b. 预测变量: (常量), 工资性收入, 转移性收入。
c. 预测变量: (常量), 工资性收入, 转移性收入, 经营净收入。
d. 预测变量: (常量), 工资性收入, 转移性收入, 经营净收入, 财产性收入。
e. 因变量: 可支配收入
综上所述,我们可以得到:
(1)最终模型表达式为:可支配收入=724.066+0.852*工资性收入+0.91*转移性收入+1.056*经营净收入+0.826*财产性收入
(2)最终模型拟合度较好,R²=0.997比较接近于1。
(3)模型中自变量的系数的显著性p都小于0.05,回归方程的线性关系显著。(4)通过逐步回归也间接的表明收入的来源重要性排名上,“工资性收入”占主导地位,“转移性收入”次之,“财产性收入”最少,与饼图的分析结果相同。
(5)分析结论:通过以上分析,可以发现可支配收入与“工资性收入”、“转移性收入”、“经营净收入”和“财产性收入”都有显著关系。
残差-582.714599609
375000 494.2523803710
93750
-.000000000006
718
312.7722703074
87600
32
标准残差-1.739 1.475 .000 .933 32
a. 因变量: 可支配收入
图6为残差统计表,可以看出预测值及标准化的预测值、残差及残差预测值
的最小值、最大值、均值、标准差和样本数。这些数据中无离群值,可以认为模
型是健康的。
除了分析残差统计外,还可以直接做出标准残差的直方图和正态P-P图来观
察其是否服从正态分布。通过图7和图8可以看出残差具有正态分布趋势,因此可
以认为回归模型是恰当的。
图7
图8
图9
通过图9的序列图还可以看出,标化残差均在0上下波动,且波动范围没有超过±2,没有发现明显方差不齐或者比较异常的点。说明模型拟合比较合理。
3.3聚类分析
图10
图11