(完整版)多重共线性检验与修正
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题:
选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y的因素有:农业化
肥施用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建
立以下方程:y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:
解:1、检验多重共线性
(1)在命令栏中输入:ls y c x1 x2 x3 x4 x5,则有;
可以看到,可决系数R2和F值都
很高,二自变量x1到x5的t值
均较小,并且x4和x5的t检验
不显著,说明方程很可能存在多
重共线性。
(2)对自变量做相关性分析:
将x1——x5作为组打开,view——covariance analysis——correlation,结果如下:
可以看到x1和x4的相关系数
为0.96,非常高,说明原模型
存在多重共线性
2、多重共线性的修正 (1)逐步回归法
第一步:首先确定一个基准的解释变量,即从x1,x2,x3,x4,x5中选择解释y 的最好的一个建立基准模型。分别用x1,x2,x3,x4,x5对y 求回归,结果如下:
在基准模型的基础上,逐步将x2,x3等加入到模型中, 加入x2,结果:
从上面5个输出结果可以知道,y 对x1的可决系数R2=0.89(最高),因此选择第一个方程作为基准回归模型。即: Y = 30867.31062 + 4.576114592* x1
再加入x3,结果:再加入x4,结果:
拟合优度R2=0.961395,显著提高;
并且参数符号符合经济常识,且均显著。
所以将模型修改为:
Y= -44174.52+ 4.576460*x1+ 0.672680*x2
拟合优度R2=0.984174,显著提高;
并且参数符号符合经济常识(成灾面积越大,粮食产量越低),且均显著。
所以将模型修改为:
Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3
拟合优度R2=0.987158,虽然比上一次拟
合提高了;
但是变量x4的系数为-0.091271,符号不
符合经济常识(农业机械总动力越高,
粮食产量越高),并且x4的t检验不显著。
因此应该从模型中剔除x4。
再加入x5,结果:
拟合优度R2=0.984466,有一定的提高;
并且参数符号符合经济常识,但是变量x5的t检
验值为0.493866,小于临界值,不显著,因此应该
剔除,常数C的t检验值为-1.095407,也不显著,
应该剔除。
Ls y x1 x2 x3
综上所述,
Y=5.361203*x3+0.308763*x2-0.241639*x3