第六章 多重共线性

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章多重共线性

前面两章所讲的异方差性和自相关性都是表现在随机误差项中的,我们下面所讲的多重共线性讨论的是模型中的解释变量违背基本假设的问题。

回忆以下我们在讲多元线性回归模型时,基本假定与简单线性回归模型不同的是哪一点?——就是无多重共线性假定:即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关。

这一章我们讨论的多重共线性就是当解释变量违背了这一条基本假定的情形。

第一节多重共线性概念

先看一个实例:我们研究某个地区家庭消费及其影响因素。我们除了引入收入X1以外,还引入了消费者的家庭财产X2作为第2个解释变量。根据抽样数据回归得到以下结果:

Y^=24.7747+0.9415X1-0.0424X2

t=(3.6690) (1.1442) (-0.5261)

R2=0.9635 R2——=0.9531 F=92.4020

这一回归结果说明什么?

1、可决系数和修正可决系数都很理想

2、F统计量高度显著,说明X1、X2联合对Y的影响显著

3、各变量参数的t检验都不显著,不能否定等于零的假设

4、财产变量的系数竟然与预期的符号相反。

为什么会出现这样的结果呢?

再看一个例子:分析某地区汽车保养费用支出与汽车的行程数以及汽车拥有的时间建立模型,通过样本数据估计得:Y^=7.29+27.58X1-151.15X2

t= (0.06) (0.958) (-7.06)

R2——=0.946 F=52.53

这个结果修正可决系数理想,F检验也显著,但X的T检验不显著,X2的T检验虽然显著,但系数符号与经济意义不符。为什么也出现这种结果?

一、多重共线性的概念:

如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。

完全共线性与不完全共线性表示的是一种线性相关程度。比如我们在第一个例子中,发现可支配收入与家庭财富之间有明显的共线性关系,他们的相关系数高达0.9989,第二个例子中汽车的行程数与拥有汽车的时间的相关系数也为0.9960,表明两个变量之间存在一种不完全的线性相关关系,我们可以认为他们之间有程度很高的多重共线性.

不存在多重共线性只说明解释变量之间没有线性关系,而不排除他们之间存在某种非线性关系。

二、产生多重共线性的原因

1、许多经济变量在随时间的变化过程中往往存在共同的变动趋势。这就使得它们之间

容易产生多重共线性。例如在经济繁荣时期,收入、消费、储蓄、投资、就业都趋

向于增长;在经济衰退时期,都趋向于下降。如果将这些变量作为解释变量同时引

入模型,则它们之间极有可能存在很强的相关性。时间序列中的这种增长因素和趋

向因素是造成多重共线性的主要根源

2、用截面数据建立回归模型时,根据研究的具体问题选择的解释变量常常从经济意义

上存在着密切的关联度。比如P69以某一行业的企业为样本建立企业生产函数模型,以产出量为解释变量,选择资本、劳动、技术等投入要素为解释变量。而这些投入

要素的数量往往与产出量呈正比,产出量高的企业,投入的各种要素都比较多,这

就使得投入要素之间出现线性相关性。

3、在模型中大量采用滞后变量也容易产生多重共线性。因为滞后变量从经济性质来看

与原来的变量无区别,只是时间上有所不同,从经济意义上这些变量之间的关联度

比较紧密。P69

一般来讲,解释变量之间存在多重共线性是难以避免的,所以在多元线性回归模型中,我们关心的并不是多重共线性的有无,而是多重共线性的程度。当多重共线性程度过高时,给最小二乘估计量带来严重的后果。因此,我们追求的也是使多重共线性的程度尽可能地减弱。

第二节多重共线性产生的后果

一、OLS估计式变得不确定或不精确

当解释变量完全线性相关时——OLS估计式不确定

从偏回归系数意义看:在X1和X2完全共线性时,即X1=a0+a1X2,无法保持X2不变,去单独考虑X1对Y的影响。

另外,从OLS估计式看:可以证明β1^=0/0 ,β2^=0/0在微积分中,我们知道这种情况称为不定型,即当X1、X2完全共线性条件下,参数的估计值是不确定的。

从估计量的方差看:将X1=a0+a1X2代入模型参数估计量的方差的表达式中,可以得到:Var(β1^)=∞,V ar(β2^)=∞。即参数估计值的方差无穷大,也不是确定的。

1、当解释变量为不完全多重共线性时——OLS估计式不精确

在实际经济问题中,完全共线性是一种不常见的极端情况,大多数情况下是解释变量之间存在不完全的共线性,虽然可以得到普通最小二乘法参数估计量,但参数估计量的方差变得很大,而且会随共线性程度的提高而增大。从而导致估计值不精确。

2、参数估计量经济含义不合理

如果两个解释变量具有线性相关性,那么它们中的一个变量可以由另一个变量表征,这时它们前面的参数并不反映各自与被解释变量之间的结构关系,而是反映他们对被解释变量的共同影响。所以,各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如,本来应该是正的,结果恰是负的。

3、变量的显著性检验失去意义

随着方差的增大,意味着t值将会变小,使得本身在经济意义上对被解释变量影响很强的变量被判定为不显著。

4、区间估计与模型的预测精度降低。

注意:如果研究目的仅在于预测Y,而解释变量X之间的多重共线性关系的性质在未来将继续保持(前提条件),这时多重共线性可能并不是严重的问题,只要可决系数高,F检验显著就可行。但要是分析经济结构就不行了,

第三节多重共线性的检验(判断)

在多元线性回归模型中,由于多重共线性是普遍存在的,造成的后果也比较复杂,因此,对多重共线性的检验缺少统一的准则。下面介绍几种简单容易操作的办法:

一、利用解释变量之间的相关系数判断

由于多重共线性表现为解释变量之间具有相关关系,对于二个解释变量的模型,利用解释变量样本观测值的散点图,或者计算二者的相关系数r,∣r∣越接近1,二者的线性关系越强;对于有两个以上解释变量的模型,可用两两变量的相关系数矩阵来判断。

二、利用可决系数与偏回归系数的显著性检验去判断

当可决系数较高,F检验显著,但偏回归系数的显著性检验不显著时,通常存在多重共线性。

三、利用解释变量之间的辅助回归及检验判断

因为解释变量之间存在多重共线性可以看做是一个解释变量对其余解释变量的近似线性表出,找出这种线性表达式,可以逐次将每个解释变量作为被解释变量对其他解释变量进行回归——称为辅助回归,分别估计其参数,计算可决系数、作F检验。若F检验显著,认为该变量与其他变量存在多重共线性。若不显著,则认为该变量与其他变量不存在严重的多重共线性。

第四节多重共线性的补救

既然当模型出现严重多重共线性时,会产生严重后果,但由于经济系统的复杂性,多重共线性的表现往往比较顽固,欲将多重共线性消除干净几乎是不可能的,只能选用合适的方法减弱影响。目前,常用的方法有以下几种:

一、增大样本容量

在具体建立计量经济模型时,如果变量的样本数据太少,很容易产生多重共线性。而且,多重共线性的后果主要是方差变大,V ar(β1^)=σ2/ΣX1i2(1-r2)当r确定时,增大样本容量,ΣX1i2就越大,使方差变小,从而减轻多重共线性的影响。

但是,增大样本容量只能减轻多重共线性的影响,不能根本解决它。而且增大样本容量在实际操作时都十分困难。

二、利用先验信息

相关文档
最新文档