回归模型拟合精度分析-实用回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用回归分析案例库封面
一、案例背景
研究表明:截至2007年30多年来中国经济增长不是均衡的,而是分阶段的。
文章基于对30年来中国财政收入、第一产业增加值、第二产业增加值、第三产业增加值、人口数和居民消费等因素的研究,消除价格膨胀因素的影响,提出了一个更为合适的分段模型—对数线性模型,并且从经济学角度对所建立的模型给出了合理的解释,结论符合中国实际。
二、数据介绍
数据显示,改革开放30年来,随着社会制度的变迁,中国经济增长趋势是不均衡的,而是分阶段的。
分几个阶段比较合适,对这一问题的研究,既要从我国国情出发,兼顾一些重要国策,又要放眼世界,考虑国际大气候的的影响。
借助散点图1和图2,我们不难发现:自改革开放以来,中国经济增长趋势分为两个阶段比较恰当(以下把分成几段称为几个总体)。
以下分两种情形加以讨论:
单个总体: 1972—2007年,共30年。
两个总体:1972—1992年,共15年;1993—2007年,共15年.
在有5个可供选择的自变量12345,,,,X X X X X 中,考虑到影响财政收入的因素至少
一个,所以财政收入关于这些变量的一切可能的回归方程共有2345
555526
C C C C +++=个。
下面建立变量Y 关于自变量的各种组合的回归方程,同时计算PRESS 和AIC 的值,并对回归方程和回归系数进行显著性检验,作出回归诊断图。
三、分析过程
经过对26个模型中残差标准差、复相关系数、PRESS 和AIC 的对比,发现以下模型最优。
表1 两种情形下最优回归模型及相关参数汇总
于是得到描述财政收入与其他经济因素之间关系的数学模型分别是:
单个总体:1978—2007年: 1.521910.5592 1.1816
2451.0156e+048Y X X X -=;
两个总体:1978—1992年: 1.0368 1.1629 1.16411250.0588Y X X X -=;
1993—2007年:0.4739 1.7248
250.0011Y X X =
从表1可以看出:
1、按照各指标的衡量标准,残差标准差、复相关系数、PRESS 和AIC 的取值自上而下越来越好。
一方面说明阶段的划分是必要的、恰当的,另一方面说明对1993—2007年这15年的回归模型比前15年可信度更高。
2、不同时期影响财政收入的主要因素不同,这与当时的历史背景、社会发展程度密切相关。
总体来看,在1978年—2007年这30年间,影响财政收入的主要因素是第二产业增加值、人口数和居民消费,众多的人口,严重制约着经济增长。
而在改革开放的前15年,影响财政收入的主要因素是第一产业增加值、第二产业增加值和居民消费,这一时期,居民消费制约财政收入的增长。
在改革开放的后15年,影响财政收入的主要因素是第二产业增加值和居民消费,这一时期,居民消费促进财政收入的增长。
上述三个不同阶段下F 统计量的概率值分别为0、2.121e-010和0。
说明每个回归方程中的自变量作为一个整体对因变量Y 的影响是显著的。
T 统计量的概率值比较如下:
表2 两种情形下最优模型中T统计量的概率值
从表2可以看出,当显著性水平0.05
α=时,表中所有的P值都满足Pr(>|t|)<0.05,说明三个回归方程中的每个自变量对因变量的影响显著。
为了考察拟合效果,作出回归诊断图3如
图3 1978—2007年最优回归诊断图图4 1978—1992年最优回归诊断图
图5 1993—2007年最优回归诊断图
从回归诊断图3、图4和图5可以看出:
(1)page1—拟和—残差图,说明残差波动很小,且无规律。
(2)page3—拟和—相应变量图我们可以看到分两段的拟合效果是最好的,所以我们认为改革开放30年间,中国经济增长趋势分成1978—1992年和1993—2007年两个阶段是合理的。
(3)page4—残差正态QQ图显示残差值基本位于过原点的直线上,说明残差来自正态总体。
(4)page5—拟合值与残差散布比较图显示拟合值的取值范围明显大于残差的取值范围,说明解释变量对因变量的作用是显著的。
4.3财政收入与其他各因素之间的关系
表3 财政收入与其他各因素之间的对数回归模型及相关参数汇总
从表3我们可以看出除了模型4稍差一些,其他模型的参数取值相当好。
计算结果中
所有模型的T统计量的概率值都为0。
模型1的F统计量的概率值是8.882e-016,模型4的F统计量的概率值是2.72e-011,其他模型的F统计量的概率值都是0。
说明用对数线性回归模型描述财政收入与其他各因素之间的关系也是合理的。
四、结论
本文根据中国财政收入与其他各因素增长趋势的特点,提出了对数线性模型。
从该模型出发,讨论了中国财政收入与社会各因素之间的关系。
1978年中国实行改革开放政策,经济持续快速增长。
1992年1至2月间,邓小平同志的南巡讲话对中国90年代的经济改革与进步起到了关键的推动作用,中国经济骤然升温,经济增长已经冲出10%,达到了14.2%的高峰。
从1993年至1997年间,中国经济经济增长率呈现连续下滑的局面,从1998年开始,为应对亚洲金融危机,中央政府实施以扩大内需为主基调的宏观调控政策,从数据分析可以看到,宏观调控的效果是明显的,1998年至2002年,中国GDP增长率一直徘徊在7%—8%之间,而在2003年—2007年,连续五年增超10%。
同时党中央、国务院已经意识到了“三农问题”,在2004年,温家宝总理在政府工作报告中谈到,解决农业、农村和农民问题,是我们全部工作的重中之重,各级政府要加强对“三农”的投入。
出台了一系列惠农政策,加大对农业的投入,包括农村税费改革,逐步降低农业税税率,五年内取消农业税等[3]。
这标志着我国的宏观调控水平上升到了一个更高的层次。
总之,这30年来中国财政收入与社会各经济因素的增长趋势分成两个阶段是合理的,即分成1978—1992年,1993—2007年。
通过对改革开放30年以来增长趋势的研究,我们可以清楚地看出中国经济发展的历程。