多重共线性实验报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【实验名称】:多重共线性的检验方法和处理

【实验目的】:掌握多重共线性的原理

【实验原理】:综合统计检验法、相关系数矩阵检验法、逐步回归法

【实验步骤】:

一、创建一个新的工作文件:

二、输入样本数据:

三、用普通最小二乘法估计模型:

由于解释变量个数较多,并且解释变量之间可能存在相关性,为了降低这种相关性以减弱序列相关性对模型的影响,我们先对各个解释变量和被解释变量取对数:即在Eviews软件的命令框执行:genr lnY=log(Y),genr lnX1=log(X1),genr lnX2=log (X2)……genr lnX5=log(X5)

我们设粮食生产函数为:

LnY=β0+β1lnX1+β2lnX2+β3lnX3+β4lnX4+β5lnX5+μ

用运普通最小二乘法估计:

下表给出了采用Eviews软件对表一的数据进行回归分析的统计结果:Dependent Variable: LNY

Method: Least Squares

Date: 12/19/13 Time: 10:05

Sample: 1983 2007

C -4.173174 1.923624 -2.169434 0.0429

LNX1 0.381145 0.050242 7.586182 0.0000 LNX2 1.222289 0.135179 9.042030 0.0000 LNX3 -0.081110 0.015304 -5.300024 0.0000 LNX4 -0.047229 0.044767 -1.054980 0.3047

R-squared 0.981597 Mean dependent var 10.70905 Adjusted R-squared 0.976753 S.D. dependent var 0.093396 S.E. of regression 0.014240 Akaike info criterion -5.459968 Sum squared resid 0.003853 Schwarz criterion -5.167438 Log likelihood 74.24960 F-statistic 202.6826 Durbin-Watson stat 1.791427 Prob(F-statistic) 0.000000

根据上表估计出的参数,可以得到如下普通最小二乘法估计模型:

lnY=‐4.17+0.381lnX1+1.222lnX2‐0.081lnX3‐0.047lnX4‐0.101lnX5

四、模型检验:

1、数学检验:

由于R2为0.9816接近于一,且F=202.68>F0.05(5,9)=2.74,故认为粮食产量和上述解释变量之间的总体线性关系显著;但是就X4,X5来说,其t检验的参数较小,尚不能通过t检验,因此怀疑模型中存在多重共线性。

2、经济原理检验:

我们看到X4,X5前面的估计参数为负值,而X4,X5分别代表的是农机动力总量和农业劳动力的总量,这两个因素对粮食产量的影响应该是正的,所以这两个参数的估计量的经济意义也不合理,故认为解释变量间存在多重共线性。

3、检验简单相关系数:

下表给出了lnX1、lnX2、lnX3、lnX4、lnX5两两之间的相关系数:

相关系数表

由上表知:LNX1、LNX4之间的相关系数较大且大于0.8,因此这两个解释变量之间存在高度相关性。

所以就应该在模型中去除这两个解释变量中的一个,那么应该去除哪一个呢,下面就通过多重共线性的处理来得出结果。

五、多重共线性的处理:

1、找出最简单的回归形式:

分别作lnY于lnX1、lnX2、lnX3、lnX4、lnX5之间的回归:

(1)lnY与lnX1进行回归:

下表给出了采用Eviews软件对lnY和lnX1进行回归分析的统计结果:Dependent Variable: LNY

Method: Least Squares

Date: 12/19/13 Time: 10:37

Sample: 1983 2007

C 8.902008 0.206034 43.20657 0.0000

R-squared 0.770175 Mean dependent var 10.70905 Adjusted R-squared 0.760182 S.D. dependent var 0.093396 S.E. of regression 0.045737 Akaike info criterion -3.255189 Sum squared resid 0.048114 Schwarz criterion -3.157679 Log likelihood 42.68986 F-statistic 77.07599

由上表可以得到模型:

lnY=8.902+0.224lnX1 R2=0.7702 D.W.=0.94 t c=43.2 t lnx1=8.78

(2)类似地,我们可以得到:

lnY=15.15-0.384lnX2 R2=0.0240 D.W.=0.34 t c=2.56 t lnx1= -0.75

lnY=9.619-0.108lnX3 R2=0.0652 D.W.=0.60 t c=11.2 t lnx1= 1.27

lnY=8.949-0.384lnX4 R2=0.6026 D.W.=0.63 t c=30.0 t lnx1= 5.91

lnY=5.601-0.489lnX5 R2=0.1587 D.W.=0.33 t c=2.28 t lnx1= 2.08

可见,粮食生产受农业化肥使用量影响最大,与经验符合,因此选择第一个为初始回归模型。

2、逐步回归:

将其他解释变量分别导入上述初始回归模型,寻找最佳的回归方程,如下表:

相关文档
最新文档