多重共线性问题的检验和处理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
山西大学
实验报告
实验报告题目:多重共线性问题的检验和处理
学院:
专业:
课程名称:计量经济学
学号:
学生姓名:
教师名称:崔海燕
上课时间:
一、实验目的:
熟悉和掌握Eviews在多重共线性模型中的应用,掌握多重共线性问题的检
验和处理。
二、实验原理:1、综合统计检验法;
2、相关系数矩阵判断;
3、逐步回归法;
三、实验步骤:
(一)新建工作文件并保存
打开Eviews软件,在主菜单栏点击File\new\workfile,输入start date
1978和end date 2006并点击确认,点击save键,输入文件名进行保存。
(二)输入并编辑数据
在主菜单栏点击Quick键,选择empty\group新建空数据栏,根据理论和经
验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、
成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为
负,其余均应为正。
下表给出了1983——2000中国粮食生产的相关数据。
点击name
键进行命名,选择默认名称Group01,保存文件。
Y X1 X2 X3 X4 X5 1983 38728 1660 114047 16209 18022 31151 1984 40731 1740 112884 15264 19497 30868 1985 37911 1776 108845 22705 20913 31130 1986 39151 1931 110933 23656 22950 31254 1987 40208 1999 111268 20393 24836 31663 1988 39408 2142 110123 23945 26575 32249 1989 40755 2357 112205 24449 28067 33225 1990 44624 2590 113466 17819 28708 38914 1991 43529 2806 112314 27814 29389 39098 1992 44264 2930 110560 25895 30308 38669 1993 45649 3152 110509 23133 31817 37680 1994 44510 3318 109544 31383 33802 36628 1995 46662 3594 110060 22267 36118 35530 1996 50454 3828 112548 21233 38547 34820 1997 49417 3981 112912 30309 42016 34840 1998 51230 4084 113787 25181 45208 35177 1999 50839 4124 113161 26731 48996 35768 2000 46218 4146 108463 34374 52574 36043 2001 45264 4254 106080 31793 55172 36513 2002 45706 4339 103891 27319 57930 36870 2003 43070 4412 99410 32516 60387 36546
2004 46947 4637 101606 16297 64028 35269 2005 48402 4766 104278 19966 68398 33970 2006 49804 4928 104958 24632 72522 32561 2007 50160 5108 105638 25064 76590 31444 (三)用普通最小二乘法估计模型参数
用最小二乘法估计模型参数。
分别对y、x1、x2、x3、x4、x5取对数,克服
序列相关性以及成为线性关系,建立y对所有解释变量的回归模型:
lny=β
0+β
1
*lnx1 +β
2
*lnx2+β
3
*lnx3+β
4
*lnx4+β
5
*lnx5+υ
在主菜单栏点击Quick\Estimate Equation,出现对话框,输入“lny C lnx1 lnx1 lnx2 lnx3 lnx4 lnx5”,默认使用最小二乘法进行回归分析,得到多元线性方程模型参数:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 08:49
Sample: 1983 2007
C -4.169757 1.923113 -2.168233 0.0430
LNX1 0.381247 0.050227 7.590497 0.0000
LNX2 1.222210 0.135132 9.044585 0.0000
LNX3 -0.081101 0.015299 -5.301032 0.0000
LNX4 -0.047302 0.044750 -1.057021 0.3038
LNX5 -0.101427 0.057713 -1.757447 0.0949
R-squared 0.981607 Mean dependent var 10.70905
Adjusted R-squared 0.976767 S.D. dependent var 0.093396
S.E. of regression 0.014236 Akaike info criterion -5.460540
Sum squared resid 0.003851 Schwarz criterion -5.168010
Log likelihood 74.25675 F-statistic 202.8006
Durbin-Watson stat 1.792233 Prob(F-statistic) 0.000000
Lny^=-4.16+0.382lnx1+1.222lnx2-0.081lnx3-0.048lnx4-0.102lnx5
从计算结果看,R2 =0.981607,较大并接近于1,F=202.8006>F0.05(5,19)=2.74,故认为粮食生产量与上述所有解释变量间总体线性相关显著。
一般的,t的绝对值大于2,则解释变量对被解释变量关系显著,但是, X4 、X5 前参数未通过t检验,而且符号的经济意义也不合理,故认为解释变量间存在多重共线性。
为了进一步检验多重共线性,进行下面操作。
(四)多重共线性检验
计算解释变量间的两两相关系数,得到简单相关系数矩阵如下:
Lnx1 Lnx2 Lnx3 Lnx4 Lnx5
Lnx1 1 -0.568744133
792 0.451700244
338
0.964356584
116
0.440575584
742
lnx2 -0.56874413
3792 1 -0.214097210
616
-0.697625004
46
-0.073448064
1922
Lnx3 0.451700244
338 -0.214097210
616
1 0.398780107
434
0.411377048
274
Lnx4 0.964356584
116 -0.697625004
46
0.398780107
434
1 0.279917581
652
Lnx5 0.440575584
742 -0.073448064
1922
0.411377048
274
0.279917581
652
1
从相关分析结果来看,部分解释变量间确实存在相关,尤其X1 与X4之间相关性达0.964356584116,高度相关。
为了处理多重共线性,正确选择解释变量,进行逐步回归,首先选择最优的基本方程。
(五)多重共线性检验
1、找出最简单的回归形式,分别做粮食生产量对各个解释变量的回归,得
A.Y对X1回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:15
Sample: 1983 2007
Variable Coefficient Std. Error t-Statistic Prob.
C 8.902008 0.206034 43.20657 0.0000
LNX1 0.224005 0.025515 8.779293 0.0000
R-squared 0.770175 Mean dependent var 10.70905
Adjusted R-squared 0.760182 S.D. dependent var 0.093396
S.E. of regression 0.045737 Akaike info criterion -3.255189
Sum squared resid 0.048114 Schwarz criterion -3.157679
Log likelihood 42.68986 F-statistic 77.07599
Durbin-Watson stat 0.939435 Prob(F-statistic) 0.000000
B.Y对X2回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:15
Sample: 1983 2007
C 15.15748 5.912971 2.563429 0.0174
R-squared 0.024017 Mean dependent var 10.70905 Adjusted R-squared -0.018417 S.D. dependent var 0.093396 S.E. of regression 0.094252 Akaike info criterion -1.809063 Sum squared resid 0.204321 Schwarz criterion -1.711553 Log likelihood 24.61329 F-statistic 0.565986
c.Y对X3回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:16
Sample: 1983 2007
C 9.619722 0.859744 11.18905 0.0000
R-squared 0.065274 Mean dependent var 10.70905 Adjusted R-squared 0.024634 S.D. dependent var 0.093396 S.E. of regression 0.092239 Akaike info criterion -1.852255 Sum squared resid 0.195684 Schwarz criterion -1.754745 Log likelihood 25.15319 F-statistic 1.606139 Durbin-Watson stat 0.597749 Prob(F-statistic) 0.217717
d.Y对X4回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:17
Sample: 1983 2007
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 8.949090 0.298255 30.00479 0.0000
LNX4 0.166976 0.028274 5.905670 0.0000 R-squared 0.602605 Mean dependent var 10.70905 Adjusted R-squared 0.585327 S.D. dependent var 0.093396 S.E. of regression 0.060143 Akaike info criterion -2.707578 Sum squared resid 0.083194 Schwarz criterion -2.610068 Log likelihood 35.84472 F-statistic 34.87693 Durbin-Watson stat 0.625528 Prob(F-statistic) 0.000005
e.Y对X5回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:18
Sample: 1983 2007
Variable Coefficient Std. Error t-Statistic Prob.
C 5.593785 2.453373 2.280039 0.0322
R-squared 0.158970 Mean dependent var 10.70905
Adjusted R-squared 0.122404 S.D. dependent var 0.093396
S.E. of regression 0.087494 Akaike info criterion -1.957881
Sum squared resid 0.176068 Schwarz criterion -1.860371
Log likelihood 26.47352 F-statistic 4.347423
Durbin-Watson stat 0.328025 Prob(F-statistic) 0.048355
可见,x1与y的R^2=0.770175,粮食生产受农业化肥施用量的影响最大,与经验相符合,因此选a为初始的回归模型。
2、逐步回归
a.y 对x1、x2的回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:19
Sample: 1983 2007
C -6.295682 1.814941 -3.468809 0.0022
LNX1 0.297854 0.015482 19.23929 0.0000
LNX2 1.258622 0.150066 8.387127 0.0000
R-squared 0.945246 Mean dependent var 10.70905
Adjusted R-squared 0.940269 S.D. dependent var 0.093396
S.E. of regression 0.022826 Akaike info criterion -4.609666
Sum squared resid 0.011463 Schwarz criterion -4.463401
Log likelihood 60.62083 F-statistic 189.9002
R^2=0.945246,变化显著,t的绝对值大于2,所以可作为独立解释变量保留在模型中。
b.y 对x1、x2、x3的回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:21
Sample: 1983 2007
Variable Coefficient Std. Error t-Statistic Prob.
C -5.999638 1.162078 -5.162852 0.0000
LNX1 0.323385 0.010861 29.77552 0.0000
LNX2 1.290729 0.096153 13.42365 0.0000
R-squared 0.978616 Mean dependent var 10.70905
Adjusted R-squared 0.975561 S.D. dependent var 0.093396
S.E. of regression 0.014601 Akaike info criterion -5.469854
Sum squared resid 0.004477 Schwarz criterion -5.274834
Log likelihood 72.37318 F-statistic 320.3438
Durbin-Watson stat 1.412883 Prob(F-statistic) 0.000000
R^2=0.978616,变化显著,t的绝对值大于2,所以可作为独立解释变量保留在模型中。
c.y 对x1、x2、x3、x4的回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:23
Sample: 1983 2007
C -6.041554 1.682783 -3.590215 0.0018
LNX1 0.322061 0.039161 8.223957 0.0000
LNX2 1.294001 0.135368 9.559117 0.0000
LNX3 -0.086665 0.015730 -5.509509 0.0000
R-squared 0.978617 Mean dependent var 10.70905
Adjusted R-squared 0.974341 S.D. dependent var 0.093396
S.E. of regression 0.014961 Akaike info criterion -5.389916
Sum squared resid 0.004476 Schwarz criterion -5.146141
Log likelihood 72.37395 F-statistic 228.8316
Durbin-Watson stat 1.413284 Prob(F-statistic) 0.000000
R^2=0.978617,变化不太显著,t的绝对值小于2,Prob=0.9722,所以不可作为独立解释变量保留在模型中。
d.y 对x1、x2、x3、x5的回归结果:
Dependent Variable: LNY
Method: Least Squares
Date: 12/19/13 Time: 09:24
Sample: 1983 2007
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C -5.805757 1.144765 -5.071570 0.0001
LNX1 0.329558 0.011499 28.66023 0.0000
LNX2 1.322299 0.096690 13.67562 0.0000
LNX3 -0.081185 0.015344 -5.291084 0.0000
LNX5 -0.063725 0.045504 -1.400427 0.1767
R-squared 0.980525 Mean dependent var 10.70905
Adjusted R-squared 0.976631 S.D. dependent var 0.093396
S.E. of regression 0.014278 Akaike info criterion -5.483399
Sum squared resid 0.004077 Schwarz criterion -5.239624
Log likelihood 73.54249 F-statistic 251.7451
Durbin-Watson stat 1.635719 Prob(F-statistic) 0.000000
R^20.980525,变化不太显著,t的绝对值小于2,Prob=0.1767,且参数符号与经济意义不符,所以不可作为独立解释变量保留在模型中。
R^20.980525,变化不太显著,t的绝对值小于2,Prob=0.1767,且参数符号与经济意义不符,所以不可作为独立解释变量保留在模型中。
因此,最终的粮食生产函数应以Y=f(X1、X2、X3)最优,拟合的结果如下:
Lny^=-5.996+0.323lnx1+1.290lnx2-0.087lnx3。