(完整版)多重共线性检验与修正.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题:
选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y 的因素有:农业化肥施
用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程: y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:
解: 1、检验多重共线性
(1)在命令栏中输入: ls y c x1 x2 x3 x4 x5,则有;
可以看到,可决系数R2 和 F 值都
很高,二自变量x1 到 x5 的 t 值
均较小,并且x4 和 x5 的 t 检验
不显著,说明方程很可能存在多
重共线性。
(2)对自变量做相关性分析:
将x1—— x5 作为组打开, view —— covariance analysis—— correlation ,结果如下:
可以看到x1 和 x4 的相关系数
为 0.96,非常高,说明原模型
存在多重共线性
2、多重共线性的修正
(1)逐步回归法
第一步:首先确定一个基准的解释变量,即从 x1, x2, x3, x4, x5 中选择解释 y 的最好的一个建
立基准模型。分别用 x1, x2, x3, x4, x5 对 y 求回归,结果如下:
从上面 5 个输出结果可以知道,y 对 x1
的可决系数R2=0.89(最高),因此选择
第一个方程作为基准回归模型。即:
Y = 30867.31062 + 4.576114592* x1
在基准模型的基础上,逐步将x2, x3 等加入到模型中,
加入 x2,结果:
拟合优度R2=0.961395 ,显著提高;
并且参数符号符合经济常识,且均显著。
所以将模型修改为:
Y= -44174.52+ 4.576460*x1+ 0.672680*x2
再加入 x3,结果:
拟合优度R2=0.984174 ,显著提高;
并且参数符号符合经济常识(成灾面积越大,粮食产
量越低),且均显著。
所以将模型修改为:
Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4,结果:
拟合优度R2=0.987158 ,虽然比上一次拟
合提高了;
但是变量x4 的系数为 -0.091271 ,符号不
符合经济常识(农业机械总动力越高,
粮食产量越高),并且 x4 的 t 检验不显著。
因此应该从模型中剔除x4。
再加入 x5,结果:
拟合优度 R2=0.984466 ,有一定的提高;
并且参数符号符合经济常识,但是变量x5 的 t 检
验值为 0.493866 ,小于临界值,不显著,因此应该
剔除,常数 C 的 t 检验值为 -1.095407 ,也不显著,
应该剔除。
Ls y x1 x2 x3
综上所述,
Y=5.361203*x3+0.308763*x2-0.241639*x3