多重共线性-例题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.多重共线性的经济解释

(1)经济变量在时间上有共同变化的趋势。如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。当这些变量同时进入模型后就会带来多重共线性问题。

0.E+00

1.E+11

2.E+11

3.E+11

4.E+11

80

82

84

86

88

90

92

94

96

98

00

02

GDP

CONS

0.E+00

1.E+11

2.E+11

3.E+11

4.E+11

0.0E+005.0E+101.0E+111.5E+112.0E+112.5E+11

CONS

GDP of HongKong

(2)解释变量与其滞后变量同作解释变量。

0.E+00

1.E+11

2.E+11

3.E+11

4.E+11

80

82

84

86

88

90

92

94

96

98

00

02

GDP

0.E+00

1.E+11

2.E+11

3.E+11

4.E+11

0.E+00

1.E+11

2.E+11

3.E+11

4.E+11

GDP(-1)

GDP

3.多重共线性的后果

(1)当 | r x i x j | = 1,X 为降秩矩阵,则 (X 'X ) -1不存在,βˆ= (X 'X )-1 X 'Y 不可计算。 (2)若 | r x i x j | ≠1,即使 | r x i x j | →1,β

ˆ仍具有无偏性。 E(β

ˆ) = E[(X 'X )-1 X 'Y ] = E[(X 'X ) -1X '(X β + u )] = β + (X 'X )-1X ' E(u ) = β. (3)当 | r x i x j | →1时,X 'X 接近降秩矩阵,即 | X 'X | →0,V ar(βˆ) = σ 2 (X 'X )-1变得很大。所以β

ˆ丧失有效性。以二解释变量线性模型为例,当r x i x j = 0.8时,Var(βˆ)为r x i x j = 0时的Var(β

ˆ)的2.78倍。当r x i x j = 0.95时,Var(βˆ)为r x i x j = 0时的Var(βˆ)的10.26倍。 4.多重共线性的检验

(1)初步观察。当模型的拟合优度(R 2)很高,F 值很高,而每个回归参数估计值的方差Var(βj ) 又非常大(即t 值很低)时,说明解释变量间可能存在多重共线性。

(2)Klein 判别法。计算多重可决系数R 2及解释变量间的简单相关系数r x i x j 。若有某个 | r x i x j | > R 2,则x i ,x j 间的多重共线性是有害的。

(3)回归参数估计值的符号如果不符合经济理论,模型有可能存在多重共线性。

(4)增加或减少解释变量个数时,回归参数估计值变化很大,说明模型有可能存在多重共线性。

(5)此外还有其他一些检验方法,如主成分分析法等,很复杂。 5.多重共线性的克服方法

5.1 直接合并解释变量

当模型中存在多重共线性时,在不失去实际意义的前提下,可以把有关的解释变量直接合并,从而降低或消除多重共线性。

如果研究的目的是预测全国货运量,那么可以把重工业总产值和轻工业总产值合并为工业总产值,从而使模型中的解释变量个数减少到两个以消除多重共线性。甚至还可以与农业总产值合并,变为工农业总产值。解释变量变成了一个,自然消除了多重共线性。 5.2 利用已知信息合并解释变量

通过经济理论及对实际问题的深刻理解,对发生多重共线性的解释变量引入附加条件从而减弱或消除多重共线性。比如有二元回归模型

y t = β0+ β1 x t 1 + β2 x t 2 + u t (7.20)

x 1与x 2间存在多重共线性。如果依据经济理论或对实际问题的深入调查研究,能给出回归系数β1与β2的某种关系,例如

β2 = λβ1 (7.21) 其中 λ 为常数。把上式代入模型(7.20),得

y t = β0+ β1 x t 1 + λβ1 x t 2 + u t = β0 + β1 (x t 1 + λ x t 2) + u t (7.22)

x t = x t 1 + λ x t 2

y t = β0+ β1 x t + u t (7.23)

模型(7.23)是一元线性回归模型,所以不再有多重共线性问题。用普通最小二乘法估

计模型(7.23),得到1ˆβ,然后再利用(7.21)式求出2

ˆβ。 下面以道格拉斯(Douglass )生产函数为例,做进一步说明。

Y t = K L t α C t β e u t (7.24) 其中Y t 表示产出量,L t 表示劳动力投入量,C t 表示资本投入量。两侧取自然对数后, LnY t = LnK t + αLnL t + βLnC t + u t (7.25)

因为劳动力(L t )与资本(C t )常常是高度相关的,所以LnL t 与LnC t 也高度相关,致使无法求出α,β的精确估计值。假如已知所研究的对象属于规模报酬不变型,即得到一个条件

α + β = 1

利用这一关系把模型(7.25)变为

LnY t = LnK t + α LnL t + (1- α) LnC t + u t 整理后,

Ln (t t C Y ) = Ln K t + α Ln (t

t C L

) + u t (7.26)

变成了Ln (Y t /C t ) 对Ln (L t /C t ) 的一元线性回归模型,自然消除了多重共线性。估计出α后,

再利用关系式α + β = 1,估计β。

5.3 增加样本容量或重新抽取样本

这种方法主要适用于那些由测量误差而引起的多重共线性。当重新抽取样本时,克服了测量误差,自然也消除了多重共线性。另外,增加样本容量也可以减弱多重共线性的程度。 5.4 合并截面数据与时间序列数据

这种方法属于约束最小二乘法(RLS )。其基本思想是,先由截面数据求出一个或多个回归系数的估计值,再把它们代入原模型中,通过用因变量与上述估计值所对应的解释变量相减从而得到新的因变量,然后建立新因变量对那些保留解释变量的回归模型,并利用时间序列样本估计回归系数。下面通过一个例子具体介绍合并数据法。

相关文档
最新文档