多重共线性实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【实验名称】:多重共线性的检验方法和处理
【实验目的】:掌握多重共线性的原理
【实验原理】:综合统计检验法、相关系数矩阵检验法、逐步回归法
【实验步骤】:
一、创建一个新的工作文件:
二、输入样本数据:
三、用普通最小二乘法估计模型:
由于解释变量个数较多,并且解释变量之间可能存在相关性,为了降低这种相关性以减弱序列相关性对模型的影响,我们先对各个解释变量和被解释变量取对数:即在Eviews软件的命令框执行:genr lnY=log(Y),genr lnX1=log(X1),genr lnX2=log (X2)……genr lnX5=log(X5)
我们设粮食生产函数为:
LnY=β0+β1lnX1+β2lnX2+β3lnX3+β4lnX4+β5lnX5+μ
用运普通最小二乘法估计:
下表给出了采用Eviews软件对表一的数据进行回归分析的统计结果:Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 10:05
Sample: 1983 2007
C -4.173174 1.923624 -2.169434 0.0429
LNX1 0.381145 0.050242 7.586182 0.0000 LNX2 1.222289 0.135179 9.042030 0.0000 LNX3 -0.081110 0.015304 -5.300024 0.0000 LNX4 -0.047229 0.044767 -1.054980 0.3047
R-squared 0.981597 Mean dependent var 10.70905 Adjusted R-squared 0.976753 S.D. dependent var 0.093396 S.E. of regression 0.014240 Akaike info criterion -5.459968 Sum squared resid 0.003853 Schwarz criterion -5.167438 Log likelihood 74.24960 F-statistic 202.6826 Durbin-Watson stat 1.791427 Prob(F-statistic) 0.000000
根据上表估计出的参数,可以得到如下普通最小二乘法估计模型:
lnY=‐4.17+0.381lnX1+1.222lnX2‐0.081lnX3‐0.047lnX4‐0.101lnX5
四、模型检验:
1、数学检验:
由于R2为0.9816接近于一,且F=202.68>F0.05(5,9)=2.74,故认为粮食产量和上述解释变量之间的总体线性关系显著;但是就X4,X5来说,其t检验的参数较小,尚不能通过t检验,因此怀疑模型中存在多重共线性。
2、经济原理检验:
我们看到X4,X5前面的估计参数为负值,而X4,X5分别代表的是农机动力总量和农业劳动力的总量,这两个因素对粮食产量的影响应该是正的,所以这两个参数的估计量的经济意义也不合理,故认为解释变量间存在多重共线性。
3、检验简单相关系数:
下表给出了lnX1、lnX2、lnX3、lnX4、lnX5两两之间的相关系数:
相关系数表
由上表知:LNX1、LNX4之间的相关系数较大且大于0.8,因此这两个解释变量之间存在高度相关性。
所以就应该在模型中去除这两个解释变量中的一个,那么应该去除哪一个呢,下面就通过多重共线性的处理来得出结果。
五、多重共线性的处理:
1、找出最简单的回归形式:
分别作lnY于lnX1、lnX2、lnX3、lnX4、lnX5之间的回归:
(1)lnY与lnX1进行回归:
下表给出了采用Eviews软件对lnY和lnX1进行回归分析的统计结果:Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 10:37
Sample: 1983 2007
C 8.902008 0.206034 43.20657 0.0000
R-squared 0.770175 Mean dependent var 10.70905 Adjusted R-squared 0.760182 S.D. dependent var 0.093396 S.E. of regression 0.045737 Akaike info criterion -3.255189 Sum squared resid 0.048114 Schwarz criterion -3.157679 Log likelihood 42.68986 F-statistic 77.07599
由上表可以得到模型:
lnY=8.902+0.224lnX1 R2=0.7702 D.W.=0.94 t c=43.2 t lnx1=8.78
(2)类似地,我们可以得到:
lnY=15.15-0.384lnX2 R2=0.0240 D.W.=0.34 t c=2.56 t lnx1= -0.75
lnY=9.619-0.108lnX3 R2=0.0652 D.W.=0.60 t c=11.2 t lnx1= 1.27
lnY=8.949-0.384lnX4 R2=0.6026 D.W.=0.63 t c=30.0 t lnx1= 5.91
lnY=5.601-0.489lnX5 R2=0.1587 D.W.=0.33 t c=2.28 t lnx1= 2.08
可见,粮食生产受农业化肥使用量影响最大,与经验符合,因此选择第一个为初始回归模型。
2、逐步回归:
将其他解释变量分别导入上述初始回归模型,寻找最佳的回归方程,如下表: