(完整版)多重共线性检验与修正.doc

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

问题:

选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y 的因素有:农业化肥施

用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程: y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:

解: 1、检验多重共线性

(1)在命令栏中输入: ls y c x1 x2 x3 x4 x5,则有;

可以看到,可决系数R2 和 F 值都

很高,二自变量x1 到 x5 的 t 值

均较小,并且x4 和 x5 的 t 检验

不显著,说明方程很可能存在多

重共线性。

(2)对自变量做相关性分析:

将x1—— x5 作为组打开, view —— covariance analysis—— correlation ,结果如下:

可以看到x1 和 x4 的相关系数

为 0.96,非常高,说明原模型

存在多重共线性

2、多重共线性的修正

(1)逐步回归法

第一步:首先确定一个基准的解释变量,即从 x1, x2, x3, x4, x5 中选择解释 y 的最好的一个建

立基准模型。分别用 x1, x2, x3, x4, x5 对 y 求回归,结果如下:

从上面 5 个输出结果可以知道,y 对 x1

的可决系数R2=0.89(最高),因此选择

第一个方程作为基准回归模型。即:

Y = 30867.31062 + 4.576114592* x1

在基准模型的基础上,逐步将x2, x3 等加入到模型中,

加入 x2,结果:

拟合优度R2=0.961395 ,显著提高;

并且参数符号符合经济常识,且均显著。

所以将模型修改为:

Y= -44174.52+ 4.576460*x1+ 0.672680*x2

再加入 x3,结果:

拟合优度R2=0.984174 ,显著提高;

并且参数符号符合经济常识(成灾面积越大,粮食产

量越低),且均显著。

所以将模型修改为:

Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4,结果:

拟合优度R2=0.987158 ,虽然比上一次拟

合提高了;

但是变量x4 的系数为 -0.091271 ,符号不

符合经济常识(农业机械总动力越高,

粮食产量越高),并且 x4 的 t 检验不显著。

因此应该从模型中剔除x4。

再加入 x5,结果:

拟合优度 R2=0.984466 ,有一定的提高;

并且参数符号符合经济常识,但是变量x5 的 t 检

验值为 0.493866 ,小于临界值,不显著,因此应该

剔除,常数 C 的 t 检验值为 -1.095407 ,也不显著,

应该剔除。

Ls y x1 x2 x3

综上所述,

Y=5.361203*x3+0.308763*x2-0.241639*x3

相关文档
最新文档