古扎拉蒂《计量经济学基础》第10章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
具体可进一步对上述回归方程作F检验:
构造如下F统计量
Fj
(1
R
2 j
/
(k
2)
R
2 j
)
/
(
n
k
1)
F (k
2, n
k
1)
式中:Rj•2为第j个解释变量对其他解释变 量的回归方程的决定系数,
若存在较强的共线性,则Rj•2较大且接近于 1,这时(1-Rj•2)较小,从而Fj的值较大。
因此,给定显著性水平,计算F值,并与 相应的临界值比较,来判定是否存在相关性。
2 x32i
x22i x32i ( x2i x3i )2
2
x22i (1 r223 )
Var(ˆ3 )
2 x22i
x22i x32i ( x2i x3i )2
2
x32i (1 r223 )
当r23=0时,即解释变量X2,X3完全线性无关
时,
Var(ˆ2 )
2
x22i ,
变量之间存在共线性。
1.检验多重共线性是否存在 (1)对两个解释变量的模型,采用简单相 关系数法 求出X1与X2的简单相关系数r,若|r|接近 1,则说明两变量存在较强的多重共线性。 (2)对多个解释变量的模型,采用综合统 计检验法 若在OLS法下:R2与F值较大,但t检验值较 小,说明各解释变量对Y的联合线性作用显著, 但各解释变量间存在共线性而使得它们对Y的独 立作用不能分辨,故t检验不显著。
Var(ˆ3 )
2
x32i
这时,二元线性回归的OLS估计量的方差相 当于分别作被解释变量关于各个解释变量的一 元线性回归估计。
当r23=1时,即解释变量X2,X3完全正线性相 关时,由上可知,二元模型OLS估计量的方差式 中分母为0,即方差为∞。这也从另一个侧面说 明了解释变量完全线性相关时,OLS估计量无解。
另一等价的检验是:
在模型中排除某一个解释变量Xj,估计模 型; 如果拟合优度与包含Xj时十分接近,则说 明Xj与其它解释变量之间存在共线性。
(2)逐步回归法
以Y为被解释变量,逐个引入解释变量, 构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是 否独立。 如果拟合优度变化显著,则说明新引入的 变量是一个独立解释变量; 如果拟合优度变化很不显著,则说明新引 入的变量与其它变量之间存在共线性关系。
2.判明存在多重共线性的范围 如果存在多重共线性,需进一步确定究竟 由哪些变量引起。 (1)判定系数检验法
使模型中每一个解释变量分别以其余解释 变量为解释变量进行回归,并计算相应的拟合 优度。
如果某一种回归 Xji=1X1i+2X2i+LXLi
的判定系数较大,说明Xj与其他X间存在共线性。
三、多重共线性的后果 1.完全共线性下参数估计量不存在
Y Xβ
的OLS估计量为:
ˆ ( X X )1 X Y
如果存在完全共线性,则(X’X)-1不存在, 无法得到参数的估计量。
2.不完全多重共线性的后果 当模型解释变量之间出现不完全多重共线 性时,普通最小二乘估计方法虽然有解,但是 参数估计量的方差会无限增大,从而产生4种 结果。 为什么参数估计量的方差无限增大 以二元线性回归模型为例来说明解释变量 的线性相关程度较高时,会使OLS估计量的方 差很大。
(4)预测可信度低
[Yˆf T /2 SE(e f ) , Yˆf T /2 SE(e f )]
由于模型回归估计的可信度较低,使预测 结果的可信度也降低。一般来说,预测结果不 可信。但是,如果样本期间解释变量之间的线 性相关关系在所预测的未来期仍然存在,多重 共线性模型的预测结果仍是可用的,但是模型 不能用于做结构分析等。
不完全多重共线性时,Rank(X)=k,满 秩,系数可以估计,但是会导致模型估计结果 出现问题。 注意:解释变量之间不存在线性关系,并 不意味着不存在非线性关系,当解释变量之间 存在非线性关系时,并不违反无多重共线性的 假定。
一个总结 首先,无多重共线性的假定是对理论(即 PRF)模型而言。实际上,当为经验分析搜集 数据时,不能保证回归元之间不存在相关。
10.2 重难点导学
一、多重共线性的性质:符号与假定
多 重 共 线 性 ( multicollinearity) 回归模型中的一些或全部解释变量(样本向量) 之间存在“完全”的线性关系。 即 , 对 向 量 X 1 , X 2 , X k , 存 在 不 全 为0的
一 组 常 数 1 , 2 , k 使 得 1 X 1 2 X 2 k X k 0
完全多重共线性 当解释变量之间完全线性相关时,称解释 变量为完全多重共线性。 完全多重共线性即其中某一解释变量可以 用其余解释变量线性表示(比如: X2=0.5×X3+0.8×X4)。 这种情况在现实经济问题中一般不会出现。
完全多重共线性的数学意义
Y Xβ U
当rank(X)<k时,表示
以上结论可以推广到多个解释变量的线 性回归模型中去。对于二元以上的线性回归 模型,衡量其线性相关的指标为解释变量之 间的多重相关系数,当多重相关系数比较高 时,带来较为严重的多重共线性。
(2)t检验通不过,可能误删重要解释变 量。T统计量=系数值/标准差。由于方差增大, 使估计量的标准差也增大,于是t-统计量值被 低估,t-显著性检验的结果可能不显著,但是 这种不显著可能并不是解释变量本身对被解释 变量的线性影响不显著,而是由于解释变量之 间的多重共线性所造成的。
2.第二类方法:差分法 时间序列数据、线性模型:将原模型变换 为差分模型:
Yi=1X1i+2X2i++kXki+i 可以有效地消除原模型中的多重共线性。
一般讲,增量之间的线性关系远比总量之 间的线性关系弱得多。
3.第三类方法:减小参数估计量的方差
多重共线性的主要后果是参数估计量具有 较大的方差,所以采取适当方法减小参数估计 量的方差,虽然没有消除模型中的多重共线性, 但确能消除多重共线性造成的后果。 例如: ①增加样本容量,可使参数估计量的方差 减小。
Var(ˆ2 )
2 x32i
x22i x32i ( x2i x3i )2
2
x22i (1 r223 )
Var(ˆ3 )
2 x22i
x22i x32i ( x2i x3i )2
2
x32i (1 r223 )
上面两式表明,解释变量之间的线性相关 程度越高,即越接近于1,这时方差的分母就越 小,从而方差就越大。另一方面,还可看出, 该模型式当解释变量存在线性相关关系时,其 OLS估计量的方差是线性无关时方差的 1
(2)滞后变量的引入
在经济计量模型中,往往需要引入滞后 经济变量来反映真实的经济关系。例如,消 费=f(当期收入,前期收入) 显然,两期收入间有较强的线性相关性。
(3)样本资料的限制
由于完全符合理论模型所要求的样本数据
较难收集,抽样时,部分指标在一定抽样范围 内的样本间正好表现出了相关性,即特定样本 可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往 存在多重共线性。 截面数据样本:问题不那么严重,但多重 共线性仍然是存在的。
例:对离差形式的二元回归模型
y 1 x1 2 x2
如果两个解释变量完全相关,如x2=x1,则
y (1 2 )x1
这时,只能确定综合参数1+2的估计值:
1 2 x1i yi / x12i
Yt 1 2 X 2t 3 X 3t ut
(t 1, 2,, n)
Var(ˆ2 )
二、实际经济问题中的多重共线性
一般地,产生多重共线性的主要原因有以 下一个方面: (1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经 济变量(收入、消费、投资、价格)都趋于增 长;衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳 动力投入往往出现高度相关情况,大企业二者 都大,小企业都小。
1 r223
倍。
VIF
1 1 r223
当r23=0.8时,OLS估计量的方差是线性无关 时的2.78倍,即方差膨胀因子为2.78;当 r23=0.95时,方差膨胀因子等于10;当 r23=0.999时,方差膨胀因子等于500,这时方差 为解释变量线性无关时方差的500倍。由此可见 ,多重共线性使方差的增大是十分惊人的。
1.违反非随机假定,工具变量法 2.违反零均值假定,对截距项估计有影响 3.违反同方差假定,异方差现象 4.违反无自相关假定,称自相关 5.违反无多重共线性假定,本章内容 6.违反 正态性假定,不影响最小二乘估计的性
质,不予讨论
本章介绍计量经济学模型经典假设中违背 解释变量线性无关时的情况,这时称之多重共线 性模型。多重共线性分为完全多重共线性与不 完全多重共线性两类。 完全多重共线性指模型中的解释变量之间 完全线性相关,不完全多重共线性指模型中解释 变量之间的线性相关程度较高。
事实上,在本章稍后的说明性例子中将会 发现,在多数应用研究中,几乎不可能找到两 个或多个在某种程度上不相关的(经济)变量。 只是要求不存在非常精确的线性关系。
其次,记住只是在讨论两个或多个变量之 间的完全线性关系。多重共线性并不排除变量 之间的非线性关系。假设X3i=X2i2,这就不违背 不完全共线性的假定,因为变量之间的关系不 是线性的。
1.X1, X2, …,Xk 是非随机的; 2.E(u i) = 0 ,零均值 3.Var(ui)=σ2 i=1,2,… ,n同方差 4.Cov(ui,uj)= 0 i≠j,i,j=1,2,… ,n 无自相关 5.X1, X2, …,Xk 线性无关;无多重共线性 6.ui~N(0,σ2 ) 正态性
五、克服多重共线性的方法
如果模型被检验证明存在多重共线性,则需 要发展新的方法估计模型,最常用的方法有三类。
1.第一类方法:排除引起共线性的变量 找出引起多重共线性的解释变量,将它排 除出去。 以逐步回归法得到最广泛的应用。 注意: 这时,剩余解释变量参数的经济含义和数 值都发生了变化。
国内外经典教材名师讲堂
古扎拉蒂《计量经济学基础》
第10章 多重共线性:回归元 相关会怎么样
主讲老师:李庆海
10.1 本章要点
●多重共线性的性质 ●出现多重共线性时的估计问题 ●出现高度但不完全多重共线性时的估计问题 ●多重共线性的理论后果 ●多重共线性的实际后果 ●多重共线性的侦查 ●多重共线性的补救措施
这时,如果仍按照t-显著性检验的原则将 不显著的解释变量去掉,则会误删掉本来对被 解释变量是有重要影响的解释变量,而t-检验 显著的变量未必是最好的解释变量。比如,消 费模型中有可能将收入变量误删除掉。 (3)模型参数稳定性差。参数的OLS估计 量及方差均对样本的变化反应十分敏感,缺乏 稳定性,从而不可信。
注意: 除非是完全共线性,多重共线性并不意味 着任何基本假设的违背; 因此,即使出现较高程度的多重共线性, OLS估计量仍具有线性性等良好的统计性质。 问题在于,即使OLS法仍是最好的估计方 法,它却不是“完美的”,尤其是在统计推断 上无法给出真正有用的信息。
四、多重共线性的检验
多重共线性表现为解释变量之间具有相关 关系,所以用于多重共线性的检验方法主要是 统计方法:如判定系数检验法、逐步回归检验 法等。 多重共线性检验的任务是: (1)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些
Y1
Y
Y2
Yn
1
2
k
1
X
1
X 21
X 22
X X
k1 k2
矩阵X中,至少有一个列 向量可以用其余列向量线
1
X2n
X kn
性表示。|x'x|=0
u1
wk.baidu.com
U
u2
un
此时,
ˆ ( X X )1 X Y
无法估计
不完全多重共线性 当解释变量之间虽然不是完全线性相关, 但其线性相关程度较高时,即解释变量之间的 多重相关系数较高时,称解释变量为不完全多 重共线性。 这种情况在现实经济问题中比较常见。