计量经济学上机实验——异方差、共线性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一次上机试验(异方差、多重共线性)
1.利用所给数据实验回归分析;
利用Eviews9.0导入2012年各地区的收入与消费(截面)数据,数据样本量为31个。
在估计计量经济模型之前,借助图形分析城镇家庭人均消费和城镇居民人均可支配收入的变化规律和相关关系,利用Eviews9.0做出两个变量带有回归线的散点图,如下图所示:
图1:CONS与INC散点图
可见,城镇家庭人均消费和城镇居民人均可支配收入之间拟合直线比较合适。设定因变量为城镇家庭人均消费CONS,自变量为城镇居民人均可支配收入INS,根据输出结果,回归后的表达式如下:
CONS=0.6089*INC+1706.847 (1)
t= (18.8087)(2.2041)
R2=0.9242 F=353.7686
分析(1)——斜率。该回归方程的斜率为0.6089,表示我国城镇居民的边际消费倾向,即当城镇居民可支配收入增加100元时,人均消费支出平均将增加60.89元。
分析(2)——给定显著水平α=5%,对参数进行显著性检验。根据Eviews结果给出各回归参数的t统计量的值,t(β0̂)=2.2041, t(β1̂)=18.8087。查t分布表得临界值为
t0.025(31-2)=2.045。显然t(β0̂)=2.2041>2.045,t(β1̂)=18.8087>2.045,根据判定规则,常数项和代表边际消费倾向的斜率的检验结果拒绝原假设,即显著不为0,人均可支配收入对人均消费支出是有显著影响的,常数项在统计上也显著说明其回归不需要去掉常数项。
现在将其变量形式改变成对数形式,新的回归方程如下:
LOG(CONS)=0.9031*LOG(INC)+0.5928 (2)
t = (16.1799)(1.0590)
R2=0.9003 F=261.7895
当变量形式变化之后,收入和消费依然成正相关,但是相关系数略微下降,单从相关系数上来看,新的R2=0.9003<0.9242。回归方程(1)的拟合度优于(2)。输出的各回归参数的t统计值,在显著水平α=5%的情况下,t(β0̂)=1.0590<2.045,可知对常数项的检验不能拒绝原假设,即在统计上是不显著的,可以考虑去掉该常数项重新回归。
2.对“工资分析”进行方程和变量的显著性检验;
利用Eviews9.0导入工资的决定(异方差)的数据,样本量为206个数据。现在设定因变量为雇员的工资w,自变量为雇员的年龄age和受教育年数ed,对其进行多元回归,回归结果如下:
图2:“工资分析”的Eviews回归结果
根据输出结果,得到如下回归方程:
W=−7.5913+0.1012∗AGE+1.0166*ED (3)
s=(1.8939)(0.0259)(0.1185)
t=(-4.0082)(3.9039)(8.5798)
R2=0.2985R̅2=0.2916F=43.1972 σ̂=4.4087对方程进行F检验:在5%的显著水平,自由度为(2,206-2-1)的F分布的临界值为F0.05(2,203)=3.040,可见43.1972>3.040,表明方程的总体线性显著成立。
用p值进行检验:在5%显著水平上,F统计量对应的p值为0.0000,明显小于0.05,说明雇员的年龄和受教育年数对雇员的工资的共同影响是相当显著的,即模型整体显著。
接下来对变量进行显著性检验:
①在5%的显著水平下,自由度为203的t分布的临界值为t0.025(203)=2.270,而t(β0̂)=−4.0082, t(β1̂)=3.9039,t(β2̂)=8.5798,可见常数项、AGE和ED的总体参数值均显著地异于0。
②用p值进行检验:在5%的显著水平上,t统计量对应的p值分别为
p(β1̂)=0.0001<0.05,p(β2̂)=0.0000<0.05
说明雇员的年龄对雇员的工资的影响是显著的,雇员受教育年数对雇员的工资的影响是显著的,两个回归系数显著不为0。
3.给出参数的置信区间;
根据图2的结果可知,β0̂、β1̂和β2̂参数的95%的置信区间分别为
β0̂±t0.025(203)×s(β0̂)=−7.5913±2.270×1.8939=[-11.8905,-3.2921]
β1̂±t0.025(203)×s(β1̂)=0.1012±2.270×0.0259=[0.0424,0.1520]
β2̂±t0.025(203)×s(β2̂)=1.0166±2.270×0.1185=[0.7476,1.2856]
4.检验是否存在异方差;
首先用软件做出残差平方和对解释变量w的估计值ŵ作散点图
图3:残差平方和与解释变量w估计值的散点图
图3的散点图是通过利用Eviews将残差保存在变量序列e中,计算残差平方和e1,
添加新的变量序列w1表示解释变量w的估计值,计算公式为公式(3)的回归方程。从散点图上可以初步判定随机干扰项存在异方差。
对回归的残差进行White检验与Gleiser检验来判断其是否存在异方差。
①White检验。估计结果如下:
图4:White检验结果
根据输出结果,得如下辅助回归方程:
e2=22.78+0.44∗AGE−0.0003∗AGE2−0.16∗AGE∗ED−5.89∗ED+0.37∗ED2 t=(0.4409)(0.2732)(-0.0176)(-0.2133)(-1.0812)(1.8268)r2=0.07027n r2=206*0.07027=14.4756 F=3.0234 其中r2为辅助回归模型的决定系数,F为辅助回归模型的F统计量值。取显著水平α
2(5)=4.351,所以在5%显著水平下拒绝原假设,表=0.05,由于n r2=14.4756 > X0.05
明该回归模型中参数至少有一个显著地不为0.即随机误差项μ存在异方差。
②Glejser检验。
先做|e|对解释变量AGE的辅助回归方程:
|e|=2.1246+0.0332*AGE
t=(3.3242)(2.0258)
做|e|对解释变量1/AGE的辅助回归方程:
|e|=4.5647-40.4570*(1/AGE)