计量经济学 第七章 多重共线性 PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
R2 = 0.97,而每个回归参数的 t 检验在统计上都不显著,这说明模型中存 在严重的多重共线性。
7.6 案例分析(3例)
把解释变量换成对数形式建模还是存在多重共线性。
y = -134.248 + 0.013x1 + 33.611Lnx2 + 34.363Lnx3 + 27.280Lnx4 – 34.906Lnx5
解释变量间可能存在多重共线性。
(2)Klein 判别法。计算多重可决系数 R2 及解释变量间的简单相关系 数 rxi xj。若有某个 rxi xj > R2,则 xi,xj 间的多重共线性是有害的。
(3)回归参数估计值的符号不符合经济理论。 (4)增加或减少解释变量个数时,回归参数估计值变化很大。
因此我们关心的不是有无多重共线性,而是多重共线性的程度。 随着共线性程度的加强,对参数估计值的准确性、稳定性带来影响。
7.2 多重共线性的经济解释
(1)经济变量在时间上有共同变化的趋势。如在经济上升时期,收入、消费、就业率 等都增长,当经济收缩期,收入、消费、就业率等又都下降。当这些变量同时进入模型 后就会带来多重共线性问题。
7.6 案例分析(3例)
用逐步回归法筛选解释变量。 (1)用每个解释变量分别对被解释变量做简单回归, 以可决系数为标准确定解释变量的重要程度,为解释变量排序。
y = -90.921 + 0.317 x1 (-4.7) (12.2) R2 = 0.92, F = 147.6, T = 14, (1974-1987)
y = 113.375 + 3.081 x5 (18.7) (6.0) R2 = 0.75, F = 36.1, T = 14, (1974-1987)
解释变量的重要程度依次为x1, x3, x2, x4, x5 。
7.6 案例分析(3例)
(2)以第一个回归方程y = -90.921 + 0.317 x1为基础, 依次引入x3, x2, x4, x5 。首先把x3引入模型,
模型是一元线性回归模型,所以不再有多重共线性问题。
7.5 多重共线性的克服方法
下面以道格拉斯(Douglass)生产函数为例,做进一步说明。 Yt = K Lt Ct eut
其中 Yt 表示产出量,Lt 表示劳动力投入量,Ct 表示资本投入量。 两侧取自然对数后,
LnYt = LnKt + LnLt + LnCt + ut 因为劳动力(Lt)与资本(Ct)常常是高度相关的,所以 LnLt 与 LnCt 也高度相关。假如已知研究的对象是规模报酬不变型, 即已知 + = 1。模型变为
7.6 案例分析(3例)
例7.1:天津市粮食需求模型(1974-1987)
y:粮食销售量(万吨 / 年),x1:市常住人口数(万人), x2:人均收入(元 / 年),x3:肉销售量(万吨 / 年), x4:蛋销售量(万吨 / 年),x5:鱼虾销售量(万吨 / 年)。
180 170 Y
160
150
140
y = -3.497 + 0.125 x1 + 0.074 x2 + 2.678 x3 + 3.453 x4 – 4.491 x5
(-0.1) (2.1)
(1.9)
(2.1)
(1.4)
(-2.0)
R2 = 0.97, F = 52.59, DW = 1.97, t0.05(8) = 2.31, T = 14, (1974-1987)
第7章 多重共线性
7.1 非多重共线性假定 7.2 多重共线性的经济解释 7.3 多重共线性的后果 7.4 多重共线性的检验 7.5 多重共线性的克服方法 7.6 案例分析(3 例)
7.1 非多重共线性假定
rk (X 'X ) = rk (X ) = k+1
Y(T1) = X[T (k+1)] [(k+1)1] + u(T1)
7.3 多重共线性的后果
(1)当 rxi xj =1,X 为降秩矩阵,则(X 'X) -1 不存在, ˆ = (X 'X)-1X'Y 不可计算。
(2)若 rxi xj 1,即使 rxi xj 1, ˆ 仍具有无偏性。
E( ˆ )=E[(X 'X)-1X 'Y]=E[(X 'X)-1X '(X+u)]= + (X 'X)-1X ' E(u) =.
(-2.0) (0.1) (1.7)
(1.8)
(1.3)
(-1.6)
R2 = 0.97, F = 50.2, DW = 1.96, T = 14, t0.05(8) = 2.31, (1974-1987) 用Klein判别法进行分析。首先给出解释变量间的简单相关系数矩阵。
因为其中有两个简单相关系数大于R2 = 0.97, 所以根据Klein判别法,模型中存在严重的多重共线性。
LnY = 0 +1(X1/X2) + 3X3+ut 从而克服了X1与X2的多重共线性。
7.5 多重共线性的克服方法
5.6 把数据中心化 把数据中心化有时也是克服多重共线性的有效方法。 例如多项式回归模型
yt = 0 +1 xt + 2 xt2 + 3 xt3 + ut
中,变量之间常存在多重共线性。 可以把解释变量先中心化(各自减自己的均值), 然后建立多元回归模型
20
0.2
0.4
0.6
0.8
r
1
当 rxi xj= 0.8 时,Var( ˆ1 )为 rxi xj = 0 时的 Var( ˆ1 )的 2.78 倍。
当 rxi xj = 0.95 时,Var( ˆ1 )为 rxi xj = 0 时的 Var( ˆ1 )的 10.26 倍。
关于多重共线性回归系数分布的模拟比较(file: multicollinearity)
4.E+11 3.E+11
GDP
CONS
4.E+11
GDP of HongKong
3.E+11
2.E+11
2.E+11
1.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
0.E+00
CONS
0.0E+ 00 5.0E+ 10 1.0E+ 11 1.5E+ 11 2.0E+ 11 2.5E+ 11
模拟模型:Y = 0.4+1.2 x1+ 0.8 x2 + u,r(x1, x2) > 0.96。红色曲线为模拟1万次结果。
模拟模型:Y = 0.4+1.2 x1+ 0.8 x3 + u,r(x1, x3) = 0。蓝色曲线为模拟1万次结果。
5
B1F1
B1F2
4
3
2
1
0
-2
-1
0
1
2
3
真值1 = 1.2
7.5 多重共线性的克服方法
5.1 直接合并解释变量
当模型中存在多重共线性时,在不失去实际意义的前提下,可以把有关的解释变量 直接合并,从而降低或消除多重共线性。
如果研究的目的是预测全国货运量,那么可以把重工业总产值和轻工业总产值合并 为工业总产值,甚至还可以与农业总产值合并,变为工农业总产值。解释变量变成 了一个,自然消除了多重共线性。
y = 99.613 + 0.082 x2 (15.4) (7.6) R2 = 0.83, F = 57.6, T = 14, (1974-1987)
y = 74.648 + 4.893 x3 (9.0) (8.7) R2 = 0.86, F = 75.4, T = 14, (1974-1987)
y = 108.865 + 5.740 x4 (18.3) (6.8) R2 = 0.80, F = 46.8, T = 14, (1974-1987)
解释变量不是完全线性相关的或接近完全线性相关的。
xtixtj 1, xtixtj 不近似等于 1。
就模型中解释变量的关系而言,有三种可能。 (1) xtixtj = 0,解释变量间相关系数等于 0。(少见)
(2) xtixtj = 1,解释变量间完全相关。(少见)
(3)0 < xtixtj < 1,解释变量间存在一定程度的线性相关。(常见)
5.2 利用已知信息合并解释变量
通过经济理论及对实际问题的深刻理解,对发生多重共线性的解释变量引入附加条 件从而减弱或消除多重共线性。
比如有二元回归模型 yt = 0+ 1 xt1 + 2 xt2 + ut x1与x2间存在多重共线性。如果能给出1与2的某种关系,2 = 1其中 为常数。
yt = 0+ 1 xt1 + 1 xt2 + ut = 0 + 1 (xt1 + xt2) + ut 令 xt = xt1 + xt2 得yt = 0+ 1 xt + ut
LnYt = LnKt + LnLt + (1- ) LnCt + ut
整理后,Ln ( Yt Ct
)
=
Ln
Kt
+
Ln
(
Lt Ct
) + ut
变成了一元线性回归模型,自然消除了多重共线性。
7.5 多重共线性的克服方法
5.3 增加样本容量或重新抽取样本
这种方法主要适用于那些由测量误差而引起的多重共线性。当重新抽取样本时,克 服了测量误差,自然也消除了多重共线性。有时,增加样本容量也可以减弱多重共 线性的程度。
①若新变量的引入改进了R2,且回归参数的t检验在统计上也是显著的, 则该变量在模型中予以保留。
②若新变量的引入未能改进R2,且对其他回归参数估计值的t检验也未带 来什么影响,则认为该变量是多余的,应该舍弃。
③若新变量的引入未能改进R2,且显著地影响了其他回归参数估计值的 符号与数值,同时本身的回归参数也通不过t检验,这说明出现了严重的 多重共线性。舍弃该变量。
(3)当 rxi xj 1 时,X 'X 接近降秩矩阵,即 X 'X 0, Var( ˆ )= 2 (X 'X)-1 变得很大。所以 ˆ 丧失有效性。 80 Var( ˆ )
以二元线性回归模型, Yt = 0 +1Xt1 + 2Xt2 + ut,为例,60
40
Var ( ˆ1 ) =
2
1
( X t1 X1 ) 2 1- ( x1x2 ) 2
yt = 0 + 1 (xt 1- x1 )+ 2 (xt2- x2 ) + 3 (xt3- x3 ) + ut
7.5 多重共线性的克服方法
5.7逐步回归法 (1)用被解释变量对每一个所考虑的解释变量做简单回归。按可决系 数大小给解释变量重要性排序。
(2)以可决系数最大的回归方程为基础,按解释变量重要性大小为顺 序逐个引入其余的解释变量。这个过程会出现3种情形。
130
120
110
100 x1
90 520 560 600 640 680 720 760 800 840
180 170 Y
160
150
140
130
120
110
100
90 100 200 300 400 500 600 700 800 900 1000
X2 1200
180 170 Y 160 150 140 130 120 110 100
(2)解释变量与其滞后变量同作解释ቤተ መጻሕፍቲ ባይዱ量。
4.E+11 3.E+11
GDP
4.E+11
GDP
3.E+11
2.E+11
2.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
1.E+11
0.E+00 0.E+00
1.E+11
2.E+11
GDP(-1) 3.E+11 4.E+11
90 68
X3 10 12 14 16 18 20 22 24
180 170 Y
160
150
140
130
120
110
100 X4
90 1 2 3 4 5 6 7 8 9 10 11 12
180 170 Y
160
150
140
130
120
110
100
90
0
4
X5
8
12
16
20
24
7.6案例分析 (例7.1)
5.4 利用解释变量之间的关系
如果解释变量之间存在多重共线性,那么可以利用它们之间的关系,引入附加方程, 从而将单方程模型转化为联立方程模型,克服多重共线性。
5.5 变换模型形式 通过变换模型形式克服多重共线性。例如某产品销量Y取决于其出厂价格X1,市场 价格X2,和市场供应量X3。模型为
LnY = 0 +1X1+ 2X2+ 3X3+ut 通常,X1与X2是高度相关的,如果研究的目的是预测销售量Y,则可以用相对价格 X1/ X2代替X1与X2对销售量Y的影响,
4
一次模拟结果,x1 与 x2 高度相关,x1 与 x3 不相关
因为 r(x1, x2) > 0.96, ˆ1 分布的方差变大(红线)。因为 r(x1, x3) = 0, ˆ1 分布的方差很小(蓝线)。
7.4 多重共线性的检验
(1)初步观察。当模型的拟合优度(R 2)很高,F 值很高,而每个回
归参数估计值的方差 Var(j) 又非常大(即 t 值很低)时,说明