计量经济学实验五 多重共线性的检验与修正 完成版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

习题
1.下表给出了中国商品进口额Y 、国内生产总值GDP 、消费者价格指数CPI 。

年份 商品进口额 (亿元)
国内生产总值
(亿元)
居民消费价格指数
(1985=100)
1985 1257.8 8964.4 100
1986 1498.3 10202.2 106.5 1987 1614.2 11962.5 114.3 1988 2055.1 14928.3 135.8 1989 2199.9 16909.2 160.2 1990 2574.3 18547.9 165.2 1991 3398.7 21617.8 170.8 1992 4443.3 26638.1 181.7 1993 5986.2 34634.4 208.4 1994 9960.1 46759.4 258.6 1995 11048.1 58478.1 302.8 1996 11557.4 67884.6 327.9 1997 11806.5 74462.6 337.1 1998 11626.1 78345.2 334.4 1999 13736.4 82067.5 329.7 2000 18638.8 89468.1 331.0 2001 20159.2 97314.8 333.3 2002 24430.3 105172.3 330.6 2003
34195.6
117251.9
334.6
资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。

请考虑下列模型:i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。

解:
ln 3.6489 1.796ln 1.2075ln t t t Y GDP CPI =--+
t= (-11.32) (9.93) (-3.415)
20.988770.6.0.1124R F S E ===
(2)你认为数据中有多重共线性吗?
多重共线性的检验 1)综合统计检验法
若 在OLS 法下:R 2与F 值较大,但t 检验值较小,则可能存在多重共线性。

2)简单相关系数检验
在Eviews 软件命令窗口中键入:COR GDP CPI
或在包含所有解释变量的数组窗口中点击View\Correlations ,其结果如图所示。

由相关系数矩阵可以看出,解释变量之间的相关系数均为0.93以上,即解释变量之间是高度相关的。

GDP CPI GDP 1.000000 0.941303 CPI 0.941303
1.000000
3)判定系数检验法
当解释变量多余两个且变量之间呈现出较复杂的相关关系时,可以通过建立辅助回归模型来检验多重共线性。

在Eviews 软件命令窗口中键入:
LS GDP C CPI
得到相应的回归结果,分析方程对应的F 值和T 值,来检验这些变量间是否相关以及相关联程度。

对应的回归结果如下图所示。

上述回归方程的F 检验值非常显著,方程回归系数的T 检验值表明:GDP 与CPI 的T 检验值较大,变量之间相关。

(3)进行以下回归:
i t t i t t i t t v CPI C C GDP v CPI B B Y v GDP A A Y 321221121ln ln ln ln ln ln ++=+=+=++
根据这些回归你能对数据中多重共线性的性质说些什么?
解:进行ls 检验,得到如下的三个结果:
ln 3.745 1.187ln t t Y GDP =-+
t= (-9.143) (30.6594)
20.981939.999.0.1434R F S E ===
ln 3.39 2.254ln t t Y CPI =-+
t= (-4.064) (14.63)
20.922213.93.0.2918R F S E ===
ln 0.1439 1.9273ln t t GDP CPI =+
t= (0.334) (24.21)
20.97586.337.0.15R F S E ===
数据中多重共线性的性质:单个解释变量也可以解释被解释变量,但是本题的两个解释变量之间的相关性较大,若在同一个线性方程中使用就会造成多重共线性。

(4)假设数据有多重共线性,但3
2ˆˆββ和在5%水平上个别地显著,并且总的F 检验也是显著的。

对这样的情形,我们是否应考虑共线性的问题?
解:应该考虑。

此时3
2ˆˆββ和并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响,所以各自的参数已经失去了应有的经济含义。

所以不能根据变量
的参数显著及F 检验的显著来判断没有共线性的情况出现。

如果模型的经济意义明显不合理,我们就要考虑是否有多重共线性的问题出现并予以相应的解决方法来现出多重共线性的影响。

2. 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。

为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计数据,具体如下:
资料来源:《中国统计年鉴》2004、2000年版,中国统计出版社。

要求:
(1) 建立对数线性多元回归模型 解:
(2) 如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么? 解:存在多重共线性,ls 的结果显示R 2与F 值较大,但t 检验值较小,考虑多重共线性的存在。

(3) 如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

解:逐步回归:
2
ln 7.02ln 1 4.873ln 2 1.389ln 30.0477ln 40.0388ln 50.5187ln 60.443ln 7 2.6876
(1.2986)(0.9724)( 1.867)(0.2531)(0.2096)( 1.93)(0.57)(0.5732)0.98173.8y x x x x x x x t R F =--+--++=----==
1
从中可以看出,除lnx7与lnx1 lnx2 lnx3 lnx4 lnx5 lnx6的相关系数不超过0.93外,其余各变量两两之间的相关系数均超过了0.93,说明这些变量均高度相关。

2)、建立基本的一元线性方程:被解释变量对每一个解释变量进行初始回归(得到回归的结果如图所示),选取拟合优度最高的首先进入方程;根据经济理论分析和回归结果,可知中国能源消费总量Y 和国内生产总值(亿元)X1关联度最大,所以建立基本的一元回归方程:
1Y X αβε
=++
Ls lny c lnx1:
Ls lny c lnx2:
Ls lny c lnx3:
Ls lny c lnx4:
Ls lny c lnx5:
Ls lny c lnx6:
1
2ln 9.1630.236ln (73.1914)(0.9607419.78...509)
04R DW Y X ===+2
2ln 9.1840.234ln (73.3964)(0.96014319.63..0.49)89R DW Y X ===+3
2ln 9.5680.2188ln (83.71)(0.95158.2..047.4557)R DW Y X ==+=4
2ln 10.090.2018ln (116.876)0.95(2178..0..50999
86)R D X W Y ==+=5
2ln 10.007380.215ln (112.490.9548..0.97)(18476.)1Y X R DW =+==6
2ln 10.380.3029ln (137.17)0.946..0.(16.7416
4)8Y X R DW =+==
Ls lny c lnx7:
3)、将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程(如表所示):
C Lnx1 Lnx2 Lnx3 Lnx4 Lnx5 Lnx6 Lnx7 R 2 lnY=f(lnX1) 9.168 0.236 0.9607 t 值
73.1914
19.79
7
2ln 4.7567 3.879ln (0.7788)(2.6835)0.31..0.4139
D Y R W X ===-+-
讨论:
第一步:在初始模型中加入lnx2,模型拟合优度提高,但变量未通过t 检验;
第二步:去掉lnx2,引入lnx3,模型拟合优度提高了,但是变量的显著性均未通过t 检验,
且参数的符号不合理(从直观上看,工业增加值越大,中国能源消费总量也应该越大,lnx3前的系数应该为正数);
第三步:去掉lnx3,引入lnx4,不止模型的拟合优度降低了,变量的显著性也未通过检验,
lnx3前的系数符号仍然不合理;
第四步:去掉lnx4,引入lnx5,模型的拟合优度稍微提高了一点,但是变量均未通过检验,
变量的符号仍然不合理;
第五步:去掉lnx5,引入lnx6,模型的拟合优度提高了,但是变量的显著性未通过t 检验; 第六步:去掉lnx6,引入lnx7,模型的拟合优度未明显提高,且变量的显著性均未通过t
检验。

第二步到第六步表明,lnx2到lnx7是多余的,且通过7个变量的相关系数表可以看出,这
些变量之间高度相关。

因此,最终的中国能源消费总量的函数关系式为:
1
2ln 9.1630.236ln (73.1914)0.96(01974.79)8391.62
R F Y X ===+
3.经济理论指出,家庭消费指出Y 不仅取决于可支配收入1X ,还决定于个人财富2X ,即可设定如下回归模型:
i i i i X X Y μβββ++=22110+
试根据下表的资料进行回归分析,并说明估计的模型是否可靠,给出你的分析。

单位: 元 编号 Y
1X
2X
编号 Y
1X
2X
1 700 800 8100 6 1150 1800 18760
2 650 1000 10090 7 1200 2000 20520
3 900 1200 12730 8 1400 2200 22010
4 950 1400 14250 9 1550 2400 24350 5
1100
1600
16930
10
1500
2600
26860
解:
(1)、首先画出Y 与两个变量的线性图:
(2)、进行ls 估计:
(3)、ls 的结果显示R 2与F 值较大,但t 检验值较小,考虑多重共线性的存在。

(4)、进行逐步回归以消除多重共线性:
1)、逐步回归:
cor x1 x2得到2个变量之间的相关系数:
1 0.998577
0.998577 1
从中可以看出,两变量之间的相关系数超过了0.93,说明这两个变量高度相关。

2)、建立基本的一元线性方程:被解释变量对每一个解释变量进行初始回归(得到回归的结果如图所示),选取拟合优度最高的首先进入方程;根据经济理论分析和回归结果,可知中国能源消费总量Y 和国内生产总值(亿元)X1关联度最大,所以建立基本的一元回归方程:
1Y X αβε
=++
Ls y c x1:
Ls y c x2:
3)、将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程(如表所示):
C x1 x2 R 2 Y=f(X1) 244.54 0.509 0.962 t 值
3.813
14.24 Y=f(X1,X2) 245.51 0.868 -0.005 0.9620 t 值
3.53
0.79
-0.083
2245.5158+0.568410.00582(3.5314)(0.7938)(-0.083)0.962 D.W.=2.7
y x x t R =-==1
2244.54550.509t=(3.8128)(14.24320.962.. 2.6)8
R DW Y X ===+22ln 238.99490.0499ln t=
(3.5448)(13.620.9587.. 2.35)9
R DW Y X ===+
讨论:在初始模型中加入lnx2,模型拟合优度未明显提高,且变量未通过t 检验;表明,x2是多余的,且通过2个变量的相关系数表可以看出,这些变量之间高度相关。

因此,最终的中国能源消费总量的函数关系式为:
12244.54550.509t=(3.8128)(14.24320.962.. 2.6)
8
R DW Y X ===+。

相关文档
最新文档