多重共线性、异方差及自相关的检验和修正

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量经济学
实验报告
多重共线性、异方差及自相关的检验和修正
——以财政收入模型为例
经济学 1班
一、引言
财政收入是一国政府实现政府职能的基本保障,对国民经济的运行及社会的发展起着非凡的作用。

首先,它是一个国家各项收入得以实现的物质保证。

一个国家财政收入规模的大小通常是衡量其经济实力的重要标志。

其次,财政收入是国家对经济实行宏观调控的重要经济杠杆。

财政收入的增长情况关系着一个国家的经济的发展和社会的进步。

因此,研究财政收入的增长显得尤为重要。

二、数据及模型说明
研究财政收入的影响因素离不开一些基本的经济变量。

回归变量的选择是建立回归模型的一个极为重要的问题。

如果遗漏了某些重要变量,回归方程的效果肯定不会好;而考虑过多的变量,不仅计算量增大许多,而且得到的回归方程稳定性也很差,直接影响到回归方程的应用。

通过经济理论对财政收入的解释以及对实践的观察,对财政收入影响的因素主要有农业增加值、工业增加值、建筑业增加值、总人口数、最终消费、受灾面积等等。

全部数据均来源于中华人民共和国国家统计局网站/
具体数据见附录一。

为分析被解释变量财政收入(Y)和解释变量农业增加值(X1)、工业增加值(X2)、建筑业增加值(X3)、总人口(X4)、最终消费(X5)、受灾面积(X6)的关系。

作如下线性图(图1)。

图1
可以看出Y、X1、X2、X3、X5基本都呈逐年增长的趋势,仅增长速率有所变动,而X4和X6在多数年份呈现水平波动,可能这两个自变量和因变量间不一定是线性关系。

可以初步建立回归模型如下:
Y=α+β1*X1+β2*X2+β3*X3+β4*X4 +β5*X5+β6*X6 +U i 其中,U i为随机干扰项。

三、模型的检验及验证
(一)多重共线性检验及修正
利用Eviews5.0,做Y对X1、X2、X3、X4、X5和X6的回归,Eviews的最小二乘估计的回归结果如下表(表1)所示:
表1
Dependent Variable: Y
Method: Least Squares
Date: 11/16/13 Time: 20:54
Sample: 1990 2011
Included observations: 22
Variable Coefficient Std. Error t-Statistic Prob.
C 145188.0 26652.27 5.447488 0.0001
X1 -0.972478 0.222703 -4.366701 0.0006
X2 0.210089 0.068192 3.080851 0.0076
X3 -0.100412 0.569465 -0.176327 0.8624
X4 -1.268320 0.247725 -5.119870 0.0001
X5 0.600205 0.130089 4.613794 0.0003
X6 -0.007430 0.044233 -0.167964 0.8689
R-squared 0.999306 Mean dependent var 27186.86
Adjusted R-squared 0.999029 S.D. dependent var 28848.33
S.E. of regression 899.0866 Akaike info criterion 16.69401
Sum squared resid 12125351 Schwarz criterion 17.04116
Log likelihood -176.6341 F-statistic 3600.848
Durbin-Watson stat 1.825260 Prob(F-statistic) 0.000000 由上表的回归结果可见,,该模型可决系数R2=0.9993很高,F检验值3601,明显显著。

但是当α=0.05时,时tα/2(n-k)= t0.025(22-6)=2.120,不仅β3、β6的t 检验不显著,而且β1、β3 和β4系数的符号与实际经济情况相反,这表明自变量很可能存在多重共线性。

计算各解释变量的相关系数,得到相关系数矩阵如下表(表2):
表2
X1 X2 X3 X4 X5 X6 X1 1.000000 0.993978 0.988761 0.893103 0.996378 -0.624583
X2 0.993978 1.000000 0.992605 0.870308 0.996884 -0.631555
X3 0.988761 0.992605 1.000000 0.836750 0.992465 -0.614883
X4 0.893103 0.870308 0.836750 1.000000 0.893026 -0.455691
X5 0.996378 0.996884 0.992465 0.893026 1.000000 -0.614527
X6 -0.624583 -0.631555 -0.614883 -0.455691 -0.614527 1.000000
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y对X1、X2、X3、X4、X5和X6的一元回归,结果如表所示:
表3
以可决系数2R的大小为依据,对解释变量的重要程度进行排序,依次是:X3,X2,X5,X1,X4,X6。

以Y = - 4256.71 + 3.3514 X3为基础,依次引入X2,X5,X1,X4,X6进行逐步回归。

①首先把X2引入模型,回归结果为
y = - 5033.35 + 0.1780 X2 + 2.2677 X3
(2.13) (4.42)
R2 = 0.9955 ,F = 1321
不仅提高了模型的可决系数,β2的t统计量=2.13> tα/2(n-k)= t0.025(22-2)=2.086,通过了t检验。

因此保留X2。

②把X5引入模型,回归结果为:
Y = - 2015.986 + 0.4381 X2 + 2.6685 X3 - 0.2800 X5
(1.68) (4.35) (4.74)
R2 = 0.9959 ,F =1321
虽然可决系数有所提高,但β2的t统计量=1.68<tα/2(n-k)= t0.025(22-2)=2.086,未通过t检验,故剔除X5。

③把X1引入模型,回归结果为:
Y = 3093.76 – 1.4675 X1 + 0.4552 X2 - 2.5575 X3
(-5.60) (6.35) (7.33)
R2 = 0.9976 ,F = 2523
X1的系数为负,与实际经济情况不符,故剔除X1。

④把X4引入模型,回归结果为:
Y = 70427.32 + 0.3817 X2+ 1.4148 X3- 0.6342 X4
(5.38) (3.61) (-4.80)
R2 = 0.9971, F = 2095
同③理,剔除X4。

⑤把X6引入模型,回归结果为
y = 1430.87 + 0.1547 X2 + 2.3486 X3-0.1240 X6
(1.83) (4.61) (-1.24)
R2 = 0.9940, F = 995
同②理,故剔除X6。

因此,最后的模型为:
Y = - 5033.35 + 0.1780 X2 + 2.2677 X3
(2.13) (4.42)
R2 = 0.9955,F = 1321,DW=0.3983
(二)异方差检验及修正
样本数为22,且模型为二元线性回归模型,利用怀特检验对异方差性进行检验,结果如下
表4
White Heteroskedasticity Test:
F-statistic 1.055985 Probability 0.409829
Obs*R-squared 10.80458 Probability 0.325281
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 11/16/13 Time: 20:07
Sample: 1990 2011
Included observations: 22
Variable Coefficient Std. Error t-Statistic Prob.
C 16205445 2907486. 5.573697 0.0000
X2 712.9961 1371.854 0.519732 0.6104
X2^2 -0.040355 0.075495 -0.534531 0.6003
X2*X3 0.518126 0.926080 0.559483 0.5836
X3 -7397.062 8898.931 -0.831230 0.4181
X3^2 -1.559015 2.816414 -0.553546 0.5875
R-squared 0.582026 Mean dependent var 5169863.
Adjusted R-squared 0.451410 S.D. dependent var 6400638.
S.E. of regression 4740753. Akaike info criterion 33.80829
Sum squared resid 3.60E+14 Schwarz criterion 34.10585
Log likelihood -365.8912 F-statistic 1.055985
Durbin-Watson stat 1.114603 Prob(F-statistic) 0.409829
由此可知nR2=10.80458,由White检验知,在α=0.025下,查X2分布表,得临界值X0.052(5)=11.071因为nR2 < X0.052(3)所以接受原假设,表明残差是同方差的,不存在异方差性。

(三)自相关检验及修正
由(一)多重共线性的检验及修正的最后结论可得DW=0.3983。

对样本量为22、2个解释变量的模型在5%显著水平下查DW统计表可知,d L=1.24,d U=1.43,模型中DW<d L,显然该模型中有正自相关。

定义参差序列e=resid,在Eviews命令栏中输入ls e e(-1),使用e t进行滞后一期的自回归,可得回归结果:
e t= 0.7158 e t-1
由式上式可知 ˆ=0.7158,对原模型进行广义差分,得到广义差分方程:
Y t - 0.7158Y t-1-= β1(1-0.7158)+ β2(X t - 0.7158X t-1)+ u t
对此方程进行回归,结果如下:
表5
Dependent Variable: Y-0.7158*Y(-1)
Method: Least Squares
Date: 11/17/13 Time: 22:12
Sample (adjusted): 1991 2011
Included observations: 21 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C -2424.855 437.4611 -5.543019 0.0000
X2-0.7158*X2(-1) 0.287865 0.065796 4.375131 0.0004
X3-0.7158*X3(-1) 1.794766 0.380759 4.713656 0.0002
R-squared 0.990820 Mean dependent var 11495.21
Adjusted R-squared 0.989800 S.D. dependent var 12089.50
S.E. of regression 1220.960 Akaike info criterion 17.18423
Sum squared resid 26833394 Schwarz criterion 17.33344
Log likelihood -177.4344 F-statistic 971.4231
Durbin-Watson stat 1.477669 Prob(F-statistic) 0.000000
由此可得回归结果为(括号内为t统计量):
Y t* = - 2424.855 + 0.287865X2* + 1.794766X3*
(-5.54) (4.38) (4.71)
R2 = 0.9908,F=971,DW=1.48
α=0.01时,查n=20,k=2的DW临界值,d L=0.975,d U=1.161,DW=1.4777>
d U,即在1%的显著性水平下该广义差分模型中已消除自相关,不需要再继续进
行迭代。

同时,其他相关指标,如可决系数、t、F统计量都达到了较理想的水平。

由上述差分方程有:
α= -2424.855/(1-0.7158)=-8532.1956
Yt = - 8532.1956 + 0.2879 X2*+1.7948 X3*
其具体经济意义为:
在其他解释变量不变时,工业增加值每增加1元,财政收入将增加0.2879元。

其他解释变量保持不变时,建筑业增加值每增加1元,财政收入将增加1.7948元。

可见建筑业产值的增加对财政收入的贡献要大于工业产值的增加。

相关文档
最新文档