多重共线性、异方差及自相关的检验和修正
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量经济学
实验报告
多重共线性、异方差及自相关的检验和修正
——以财政收入模型为例
经济学 1班
一、引言
财政收入是一国政府实现政府职能的基本保障,对国民经济的运行及社会的发展起着非凡的作用。首先,它是一个国家各项收入得以实现的物质保证。一个国家财政收入规模的大小通常是衡量其经济实力的重要标志。其次,财政收入是国家对经济实行宏观调控的重要经济杠杆。财政收入的增长情况关系着一个国家的经济的发展和社会的进步。因此,研究财政收入的增长显得尤为重要。
二、数据及模型说明
研究财政收入的影响因素离不开一些基本的经济变量。回归变量的选择是建立回归模型的一个极为重要的问题。如果遗漏了某些重要变量,回归方程的效果肯定不会好;而考虑过多的变量,不仅计算量增大许多,而且得到的回归方程稳定性也很差,直接影响到回归方程的应用。通过经济理论对财政收入的解释以及对实践的观察,对财政收入影响的因素主要有农业增加值、工业增加值、建筑业增加值、总人口数、最终消费、受灾面积等等。
全部数据均来源于中华人民共和国国家统计局网站/
具体数据见附录一。
为分析被解释变量财政收入(Y)和解释变量农业增加值(X1)、工业增加值(X2)、建筑业增加值(X3)、总人口(X4)、最终消费(X5)、受灾面积(X6)的关系。作如下线性图(图1)。
图1
可以看出Y、X1、X2、X3、X5基本都呈逐年增长的趋势,仅增长速率有所变动,而X4和X6在多数年份呈现水平波动,可能这两个自变量和因变量间不一定是线性关系。可以初步建立回归模型如下:
Y=α+β1*X1+β2*X2+β3*X3+β4*X4 +β5*X5+β6*X6 +U i 其中,U i为随机干扰项。
三、模型的检验及验证
(一)多重共线性检验及修正
利用Eviews5.0,做Y对X1、X2、X3、X4、X5和X6的回归,Eviews的最小二乘估计的回归结果如下表(表1)所示:
表1
Dependent Variable: Y
Method: Least Squares
Date: 11/16/13 Time: 20:54
Sample: 1990 2011
Included observations: 22
Variable Coefficient Std. Error t-Statistic Prob.
C 145188.0 26652.27 5.447488 0.0001
X1 -0.972478 0.222703 -4.366701 0.0006
X2 0.210089 0.068192 3.080851 0.0076
X3 -0.100412 0.569465 -0.176327 0.8624
X4 -1.268320 0.247725 -5.119870 0.0001
X5 0.600205 0.130089 4.613794 0.0003
X6 -0.007430 0.044233 -0.167964 0.8689
R-squared 0.999306 Mean dependent var 27186.86
Adjusted R-squared 0.999029 S.D. dependent var 28848.33
S.E. of regression 899.0866 Akaike info criterion 16.69401
Sum squared resid 12125351 Schwarz criterion 17.04116
Log likelihood -176.6341 F-statistic 3600.848
Durbin-Watson stat 1.825260 Prob(F-statistic) 0.000000 由上表的回归结果可见,,该模型可决系数R2=0.9993很高,F检验值3601,明显显著。但是当α=0.05时,时tα/2(n-k)= t0.025(22-6)=2.120,不仅β3、β6的t 检验不显著,而且β1、β3 和β4系数的符号与实际经济情况相反,这表明自变量很可能存在多重共线性。
计算各解释变量的相关系数,得到相关系数矩阵如下表(表2):
表2
X1 X2 X3 X4 X5 X6 X1 1.000000 0.993978 0.988761 0.893103 0.996378 -0.624583
X2 0.993978 1.000000 0.992605 0.870308 0.996884 -0.631555
X3 0.988761 0.992605 1.000000 0.836750 0.992465 -0.614883
X4 0.893103 0.870308 0.836750 1.000000 0.893026 -0.455691
X5 0.996378 0.996884 0.992465 0.893026 1.000000 -0.614527
X6 -0.624583 -0.631555 -0.614883 -0.455691 -0.614527 1.000000
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。
采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y对X1、X2、X3、X4、X5和X6的一元回归,结果如表所示:
表3
以可决系数2R的大小为依据,对解释变量的重要程度进行排序,依次是:X3,X2,X5,X1,X4,X6。
以Y = - 4256.71 + 3.3514 X3为基础,依次引入X2,X5,X1,X4,X6进行逐步回归。
①首先把X2引入模型,回归结果为
y = - 5033.35 + 0.1780 X2 + 2.2677 X3
(2.13) (4.42)
R2 = 0.9955 ,F = 1321
不仅提高了模型的可决系数,β2的t统计量=2.13> tα/2(n-k)= t0.025(22-2)=2.086,通过了t检验。因此保留X2。
②把X5引入模型,回归结果为: