(完整版)多重共线性检验与修正

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

问题:

选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y的因素有:农业化

肥施用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建

立以下方程:y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:

解:1、检验多重共线性

(1)在命令栏中输入:ls y c x1 x2 x3 x4 x5,则有;

可以看到,可决系数R2和F值都

很高,二自变量x1到x5的t值

均较小,并且x4和x5的t检验

不显著,说明方程很可能存在多

重共线性。

(2)对自变量做相关性分析:

将x1——x5作为组打开,view——covariance analysis——correlation,结果如下:

可以看到x1和x4的相关系数

为0.96,非常高,说明原模型

存在多重共线性

2、多重共线性的修正 (1)逐步回归法

第一步:首先确定一个基准的解释变量,即从x1,x2,x3,x4,x5中选择解释y 的最好的一个建立基准模型。分别用x1,x2,x3,x4,x5对y 求回归,结果如下:

在基准模型的基础上,逐步将x2,x3等加入到模型中, 加入x2,结果:

从上面5个输出结果可以知道,y 对x1的可决系数R2=0.89(最高),因此选择第一个方程作为基准回归模型。即: Y = 30867.31062 + 4.576114592* x1

再加入x3,结果:再加入x4,结果:

拟合优度R2=0.961395,显著提高;

并且参数符号符合经济常识,且均显著。

所以将模型修改为:

Y= -44174.52+ 4.576460*x1+ 0.672680*x2

拟合优度R2=0.984174,显著提高;

并且参数符号符合经济常识(成灾面积越大,粮食产量越低),且均显著。

所以将模型修改为:

Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3

拟合优度R2=0.987158,虽然比上一次拟

合提高了;

但是变量x4的系数为-0.091271,符号不

符合经济常识(农业机械总动力越高,

粮食产量越高),并且x4的t检验不显著。

因此应该从模型中剔除x4。

再加入x5,结果:

拟合优度R2=0.984466,有一定的提高;

并且参数符号符合经济常识,但是变量x5的t检

验值为0.493866,小于临界值,不显著,因此应该

剔除,常数C的t检验值为-1.095407,也不显著,

应该剔除。

Ls y x1 x2 x3

综上所述,

Y=5.361203*x3+0.308763*x2-0.241639*x3

相关文档
最新文档