多重共线性PPT课件
合集下载
第四章 多重共线性
5
二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形: 1.经济变量之间具有相同的变化趋势。 2.模型中包含滞后变量。 3.利用截面数据建立模型也可能出现多重共线性。 4.样本数据的原因。
6
第二节 多重共线性的后果
一、完全多重共线性产生的后果
1.参数的估计值不确定 2.参数估计值的方差无限大
Cov( ˆ2 ,
ˆ3 )
(1
r223 )
r23 2
x22i
x32i
随着共线性增加,r23趋于1,方差将增大。同样 协方差的绝对值也增大,它们增大的速度决定于
方差扩大(膨胀)因子(variance inflation factor, VIF)
VIF
1
1 r223
这时
Var(ˆ2 )
4.多重共线性严重时,甚至可能使估计的回归系数 符号相反,得出完全错误的结论。(如引例)
18
第三节 多重共线性的检验
本节基本内容: 简单相关系数检验法 方差扩大因子法 直观判断法 病态指数检验法 逐步回归法
19
一、简单相关系数检验法 简单相关系数检验法是利用解释变量之间的线性 相关程度去判断是否存在严重多重共线性的一种 简便方法。适用于只有两个变量的情形。
2
x32i 0
同理
ˆ3
这说明完全多重共线性时,参数估计量的方差将 变成无穷大。
9
关于方差的推导
Var(ˆ2 )
x32i (x22i ) (x32i )
(x2i x3i )2
2
1 X21 X 1 X22
1 X2n
二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形: 1.经济变量之间具有相同的变化趋势。 2.模型中包含滞后变量。 3.利用截面数据建立模型也可能出现多重共线性。 4.样本数据的原因。
6
第二节 多重共线性的后果
一、完全多重共线性产生的后果
1.参数的估计值不确定 2.参数估计值的方差无限大
Cov( ˆ2 ,
ˆ3 )
(1
r223 )
r23 2
x22i
x32i
随着共线性增加,r23趋于1,方差将增大。同样 协方差的绝对值也增大,它们增大的速度决定于
方差扩大(膨胀)因子(variance inflation factor, VIF)
VIF
1
1 r223
这时
Var(ˆ2 )
4.多重共线性严重时,甚至可能使估计的回归系数 符号相反,得出完全错误的结论。(如引例)
18
第三节 多重共线性的检验
本节基本内容: 简单相关系数检验法 方差扩大因子法 直观判断法 病态指数检验法 逐步回归法
19
一、简单相关系数检验法 简单相关系数检验法是利用解释变量之间的线性 相关程度去判断是否存在严重多重共线性的一种 简便方法。适用于只有两个变量的情形。
2
x32i 0
同理
ˆ3
这说明完全多重共线性时,参数估计量的方差将 变成无穷大。
9
关于方差的推导
Var(ˆ2 )
x32i (x22i ) (x32i )
(x2i x3i )2
2
1 X21 X 1 X22
1 X2n
多重共线性PPT课件
协方差同理。
方差膨胀因子(variance-inflating factor, VIF)
1 VIF 1 r223
所以 var b2
2
x22i VIF
2-21
8.5 多重共线性的诊断
在任一给定的情况下,特别是在涉及多于两 个解释变量的模型中,我们怎么知道有没有 共线性?
2-22
1.多重共线性是一个程度问题而不是有无问 题。有意义的区分不在于有无之间,而在于 程度大小。
因为 数。
b2 b3 是一个方程,却有两个未知
对给定的alpha和lamda值,有无穷多个解。
2-15
出现“高度”但“不完全”多重共线性 时的估计问题
仍以上述三变量回归模型为例。 假定 X3i X 2i vi ,其中 vi x2i 0
回归系数估计:
b2
yi x2i 2 x22i vi2
yi x2i
第8章 多重共线性:解释变量
相关会有什么后果?
McGraw-Hill/Irwin
Copyright © 2006 The McGraw-Hill Companies, Inc. All rights reserved.
问题
多重共线性的性质是什么? 多重共线性是否是一个严重的问题? 多重共线性的理论后果是什么? 多重共线性的实际后果是什么? 实践中如何诊断多重共线性? 消除多重共线性的补救措施有哪些?
但在应用计量经济学中,我们的宗旨就是区 分每个变量的单独影响。
2-13
把 X3i yi
X 2i 代入回归方程: b2 x2i b3 x2i ei b2 b3 x2i ei
x2i ei
利用OLS公式得:
b2 b3
x2i yi x22i
计量经济学(第四章多重共线性)
06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分
析
数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理
第6章多重共线性
浙江财经学院 倪伟才
12
例题
例3.3的多重共线性
注意:消费额前面的系数为负的,者符 合常识吗?
题后语:整个回归方程作为整体高度显 著(通过F检验),但有些回归系数不能 通过显著性检验,甚至出现正负号得不 到合理的解释,此时应考虑是否存在多 重共线性。
浙江财经学院 倪伟才
13
四、多重共线性的诊断
(1)R2高,F检验显著,但t检验不显著。
Variable |
VIF
1/VIF
-------------+----------------------
x1 | 482.13 0.002074
x2 | 482.13 0.002074
-------------+----------------------
Mean VIF | 482.13
浙江财经学院 倪伟才
浙江财经学院 倪伟才
17
例题讲解
例3.3多重共线性的判断。(VIF) 1通过辅助回归计算x1的VIF 练习:计算x2的VIF 2:直接产生VIF 3:考虑x1,x2的偏相关系数:0.9776
浙江财经学院 倪伟才
18
stata
相关命令请参考
数据:消费和收入财富的多重共线性.dta reg y x1 x2 vif
浙江财经学院 倪伟才
11
2.近似完全多重共线性的后果
将xi2 xi1 i 代入ˆ1
ˆ1=
(yi x i1 )(2
x
2 i1
i2 ) - (
yi xi1
yii )(
xi21( 2 xi21 i2 ) ( xi21)2
x
2 i1
)
①将x2=λx1+v代入^1说明x2,x1共线性程度越 高,即v越趋于0,从而^1 趋于不确定。② var(^1 )会增大;③参数显著性检验的t统计量: t= ^1 / [var(^1 )] (1/2) ,存在共线时,var(^1 ) 会增大,t值会变小。对于给定,当|t|<t(/2) , 接受 原假设(相关系数0)表明x1对y的影响不显著。总 之,实际上x1对y的影响是显著的,但由于共线性, 可导致x1对y的影响不显著的!
计量经济学第四章 多重共线性
x2i
3 2
x3i
x3i
参数的估计值为:
ˆ2
x32i x2i yi x2i x3i x3i yi
(
x22i )(
x32i ) (
x2i
x 3i
)2
x32i
2
x3i yi x32i 2 2
x32i x32i
x2i x3i x22i
x2i x3i
ˆ1 Y ˆ2 X 2 ˆ3 X 3
ˆ2
x32i x2i yi x2i x3i x3i yi ( x22i )( x32i ) ( x2i x3i )2
ˆ3
x22i x3i yi x2i x3i x2i yi •
(
x22i )(
x32i ) (
x2i
x 3i
)
2
x2i yi x3i yi
x2i x3i x32i
4.2多重共线性的后果
如果X1和X2完全线性相关,则存在非0的λ使得:
1 2 X 2i 3 X 3i 0
则有:
1 2 X 2 3 X 3 0
2 X 2i X 2 3 X3i X3 0
X 2i X3i X 2iYi
X
2 3i
X
3iYi
VAR
COV
(βˆ )
2
(XX)1
2
N X 2i
X 3i
X2i
X
2 2i
X 2i X 3i
经济计量学第七讲多重共线性PPT资料(正式版)
第四节 多重共线性的侦察(2)
二、侦察多重共线性的规则
(一)R2值高而显著的t比率少
(二)回归元之间有高度的两两相关 Ø它只是充分条件而不是必要条件
(三)检查偏相关 Ø偏相关系数不能保证对多重共线性提供 一 个准确的指南。
第四节 多重共线性的侦察(3)
二、侦察多重共线性的规则 (四)辅助回归 做每个解释变量对其他剩余变量 的回归并计算相应的R2值。其中的每 一个回归都被称为是从属或者辅助回 归。
2
j
j
第五节 多重共线性的补救措施
如果存在不完全的多重共线性,
TOj L(1R2 j)1/VIjF
第五节 多重共线性的补救措施
一、先验信息 二、横截面与时间序列数据并用 三、剔除变量与设定偏误 四、变量代换 五、补充新数据 六、在多项式回归中降低共线性 七、拯救多重共线性的其他方法
谢谢观看
(一)完全多重共线性情形
Y = ^1 + ^2X2 + ^3X3 + ^u
^2
(yx2)(x32) - (yx3)(x2x3)
= (x22)(x32) - (x2x3)2
如果 x3 = x2,
^2
=
(yx2)(2x22) - (yx2)(x2x2) (x22)(2 x22) - 2(x2x2)2
=
0 0
经济计量学第七讲多重 共线性
第七讲 多重共线性
第一节 多重共线性的性质 第二节 出现多重共线性时的估计问题 第三节 多重共线性的后果 第四节 多重共线性的侦察 第五节 多重共线性的补救措施
第一节 多重共线性的性质
一、多重共线性的概念 二、多重共线性的来源
一、多重共线性的概念
Y i 1 2 X 2 i 3 X 3 i k X k i u i
《多重共线性》课件
诊断方法比较
检验统计量
检验统计量提供量化指标,可以 明确指出多重共线性的程度,但 其依赖于样本数据,稳定性相对
较差。
图形化诊断
图形化诊断直观易理解,但可能存 在主观性,并且难以量化多重共线 性的程度。
综合运用
在实际应用中,应综合运用多种方 法进行多重共线性的诊断,以确保 诊断结果的准确性和可靠性。
Condition Index
Condition Index是诊断多重共线性的另一种统计量,当某些Condition Index值特别 大时,可能存在多重共线性问题。
图形化诊断
散点图
通过绘制自变量间的散点图,可以直 观地观察到是否存在线性关系,从而 初步判断是否存在多重共线性问题。
相关系数矩阵
通过绘制相关系数矩阵,可以观察到 自变量间的相关系数,当某两个自变 量的相关系数接近1或-1时,可能存 在多重共线性问题。
多重共线性的影响
参数估计值不稳定
01
模型中的参数估计值会随着样本的微小变化而发生较大的变化
,导致模型预测的不稳定性。
模型预测精度降低
02
由于参数估计值的不准确,会导致模型的预测精度降低,预测
结果的可信度下降。
模型解释性差
03
由于解释变量之间的高度相关关系,使得模型难以解释各个解
释变量对因变量的影响程度,降低了模型的解释性。
多重共线性PPT课件
目 录
• 多重共线性的定义 • 多重共线性的成因 • 多重共线性的诊断 • 多重共线性的处理 • 案例分析
01
多重共线性的定义
什么是多重共线性
1
共线性是指解释变量之间存在高度相关性的现象 。
2
在多元线性回归模型中,如果解释变量之间存在 高度相关关系,会导致模型估计的参数不准确, 甚至出现完全错误的结论。
《多重共线性》PPT课件
第八章 多重共线性
多重共线性
多重共线性及其影响 多重共线性的发现和检验 多重共线性的克服和处理
引子: 发展农业和建筑业会减少财政收入吗?
为了分析各主要因素对财政收入的影响,建立财政收
入模型:
CSi 0 1NZi 2GZi 3JZZi
4TPOPi 5CUMi 6SZMi ui
性(approximate multicollinearity)或交互相关 (intercorrelated)。
注意:
完全共线性的情况并不多见,一般出现 的是在一定程度上的共线性,即近似共线 性。
但无论是解释变量之间严格的线性关 系还是较严重的近似线性关系,都会给多 元线性回归分析造成严重的不利影响,甚 至导致回归模型完全失效。
完全多重共线性及其危害
严格多重共线性不是由于数据原因引起,通常是由于模型 把有严格联系的变量引进同一个模型,或者由于虚拟变量 设置不当(如陷入虚拟变量陷阱的情况)而引起的。
对模型
Y X
的最小二乘估计量为 ˆ ( X X )1 X Y
如果存在完全共线性,则 ( X X )1不存在,无法得到参数的
Variable 农业增加值NZ 工业增加值GZ 建筑业增加值JZZ 总人口TPOP 最终消费CUM 受灾面积SZM
截距项 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
模型估计与检验结果分析
●可决系数为0.995,校正的可决系数为0.993,模型 拟合很好。模型对财政收入的解释程度高达99.5%。 ●F统计量为632.10,说明0.05水平下回归方程整体 上显著。 ● t 检验结果表明,除了工业增加值和总人口以外, 其他因素对财政收入的影响均不显著。 ●农业增加值和建筑业增加值的回归系数是负数。 农业和建筑业的发展反而会使财政收入减少吗?! 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢?
多重共线性
多重共线性及其影响 多重共线性的发现和检验 多重共线性的克服和处理
引子: 发展农业和建筑业会减少财政收入吗?
为了分析各主要因素对财政收入的影响,建立财政收
入模型:
CSi 0 1NZi 2GZi 3JZZi
4TPOPi 5CUMi 6SZMi ui
性(approximate multicollinearity)或交互相关 (intercorrelated)。
注意:
完全共线性的情况并不多见,一般出现 的是在一定程度上的共线性,即近似共线 性。
但无论是解释变量之间严格的线性关 系还是较严重的近似线性关系,都会给多 元线性回归分析造成严重的不利影响,甚 至导致回归模型完全失效。
完全多重共线性及其危害
严格多重共线性不是由于数据原因引起,通常是由于模型 把有严格联系的变量引进同一个模型,或者由于虚拟变量 设置不当(如陷入虚拟变量陷阱的情况)而引起的。
对模型
Y X
的最小二乘估计量为 ˆ ( X X )1 X Y
如果存在完全共线性,则 ( X X )1不存在,无法得到参数的
Variable 农业增加值NZ 工业增加值GZ 建筑业增加值JZZ 总人口TPOP 最终消费CUM 受灾面积SZM
截距项 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
模型估计与检验结果分析
●可决系数为0.995,校正的可决系数为0.993,模型 拟合很好。模型对财政收入的解释程度高达99.5%。 ●F统计量为632.10,说明0.05水平下回归方程整体 上显著。 ● t 检验结果表明,除了工业增加值和总人口以外, 其他因素对财政收入的影响均不显著。 ●农业增加值和建筑业增加值的回归系数是负数。 农业和建筑业的发展反而会使财政收入减少吗?! 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢?
多重线性-PPT课件
• 滞后变量的引入
在计量经济模型中,往往需要引入滞后经济变 量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。
• 一般经验
对于采用时间序列数据作样本、以简单线性形 式建立的计量经济学模型,往往存在多重共线性。
以截面数据作样本时,问题不那么严重,但 多重共线性仍然是存在的。
解 该 线 性 方 程 组 得 :
xy xy ˆ x xx
1 i i 2 i i 2 1 i 1 2 y x 0 0 xx x x x x x
1 i 2 i 2 2 i 1 i i 2 1 i i 2 1 i 2 1 i 2 1 i 2 1 i 1 i 2 i 2 2 i 2 2 1 i 2 1 i
第六章 多重共线性 (Multi-Collinearity)
• 第一节 多重共线性的定义 • 第二节 多重共线性的检验 • 第三节 多重共线性的消除
第一节 多重共线性的定义
多重量共线性及产生原因 多重共线性的后果
一、多重共线性的概念及其产 生原因
解释变量之间存在较强的线性相关关系,使 得 XT X 的行列式值近似于0(等于0是完全共 线性),逆阵可求得,但不稳定。出现于多元线 性模型。例:生产函数、需求函数.
在矩阵表示的线性回归模型 Y=XB+N 中,完全共线性指:秩(X)<k+1,即矩阵
1 1 X 1 X11 X21 X12 X22 X1n X2n Xk1 Xk2 Xkn
中 , 至 少 有 一 列 向 量 可 由 其 他 列 向 量 ( 不 包 括 第 一 列 ) 线 性 表 出 。
多重共线性(Multi-Collinearity)
i 0 1 1i 2 2i
k ki i
(i=1,2,…,n)
其基本假设之一是解释变量
X,
1
X2,,
X
k
互相独立 。
如果某两个或多个解释变量之间出现了相关性, 则称为多重共线性。
如果存在
c1X1i+c2X2i+…+ckXki=0
i=1,2,…,n
其中: ci不全为0,即某一个解释变量可以用其它解释 变量的线性组合表示,则称为解释变量间存在完全
2
1
x12i 1 r 2
2
x12i
所以,多重共线性使参数估计量的方差增大。
方差扩大因子(Variance Inflation Factor)为1/(1-r2), 其增大趋势见下表:
相关系 0 0.5 0.8 0.9 0.95 0.96 0.97 0.98 0.99 0.999 数平方 方差扩 1 2 5 10 20 25 33 50 100 1000 大因子
多重共线性(Multi-Collinearity)
§2.8 多重共线性
Multi-Collinearity
一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、案例
一、多重共线性的概念
1、多重共线性
• 对于模型
Y X X X
以二元回归模型中的参数估计量ˆ 为例,ˆ 的方差为
1
1
Var(ˆ )
1
ˆ 2
(X X
)1
22
(
ˆ
2
(
x2
2i
)
x2 )( x2 ) ( x
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2-2
多重共线性的性质
多重共线性(multicollinearity)原先的含义指一 个回归模型中的一些或全部解释变量之间存 在一种“完全”或者准确的线性关系。 l 1 X1 + l 2 X 2 + L + l k X k = 0 现在共线性更为广义,既包括上述完全共线 性,也包括非完全(高度)共线性的形式。
2-18
8.4 多重共线性的实际后果
OLS估计量的方差和标准误较大。 置信区间变宽。 t值不显著 。 R 2值较高,但t值并不都是统计显著的。 OLS估计量及其标准误对数据的微小变化非常敏感, 即它们很不稳定。 回归系数符号有误。 难以评估各个解释变量对回归平方和(ESS)或者 R 2 的贡献。
2-15
出现“高度”但“不完全”多重共线性 时的估计问题
仍以上述三变量回归模型为例。 假定 X 3i = l X 2i + vi ,其中 å vi x2i = 0
回归系数估计:
b2 =
(邋yi x2i )(l
2
2 2 x2 + v i i )- (l 2 2i 2 2 2i
邋yi x2i +
l 1 X1 + l 2 X 2 + L + l k X k + ui = 0
2-3
为什么CLRM假定无多重共线性?
如果多重共线性是完全的,则X变量的回归 系数将是不确定的,并且它们的标准误为无 穷大。 如果多重共线性是不完全的,则虽然回归系 数可以确定,却有较大的标准误(相对于系 数本身来说),也即系数不能以很高的精度 或准确度加以估计。
2-26
8.7 扩展一例:1960-1982年期间美国的鸡肉需求
2-27
8.7 扩展一例:1960-1982年期间美国的鸡肉需求 鸡肉需求函数[方程(8.15)]的共线性诊断 1.相关矩阵
2-28
8.7 扩展一例:1960-1982年期间美国的鸡肉需求 鸡肉需求函数[方程(8.15)]的共线性诊断 2.辅助回归
i 2i 2 2i 2 3i 2 2i 3i
2 x2 i )-
2i 3i
x
)
2-11
假定 X 3i = l X 2i
b2 =
(邋yi x2i Leabharlann (l2 2i2 2
2 x2 i )- (l 2 2i
邋yi x2i )(l
2
2 x2 i)
(邋x )(l
x )- l
(?
x
2 2 2i
)
0 = 0
2-12
2-29
8.8 如何解决多重共线性:补救措施
从模型中删掉一个变量 获取额外的数据或新的样本 重新考虑模型 参数的先验信息 变量变换 其他补救措施
2-30
å x 邋x
2 2i
2 i 3i
随着r23趋于1,即随着共线性增加,两估计 量的方差也增加。 当r23=1时,方差为无穷大。 协方差同理。 方差膨胀因子(variance-inflating factor, VIF)
1 VIF = 2 1- r23
所以
2-21
s2 var (b2 ) = VIF 2 å x2i
8.5 多重共线性的诊断
在任一给定的情况下,特别是在涉及多于两 个解释变量的模型中,我们怎么知道有没有 共线性?
2-22
1.多重共线性是一个程度问题而不是有无问 题。有意义的区分不在于有无之间,而在于 程度大小。 2.由于多重共线性是对被假定为非随机的解 释变量的情况而言,所以它是一种样本特征, 而非总体特征。 因此,我们不做“多重共线性的检验”,但 如果愿意,可以测度它在任一具体样本中显 现的程度。
把 X 3i = l X 2i 代入回归方程: yi = b2 x2i + b3 (l x2i ) + ei
= (b2 + l b3 ) x2i + ei = a x2i + ei
利用OLS公式得:
a = b2 + l b3 =
2-14
å x y å x
2i i 2 2i
因此,虽然 a 可以唯一地估计出来,却无法 唯一的估计出b2和b3。 因为 a = b2 + l b3 是一个方程,却有两个未知 数。 对给定的alpha和lamda值,有无穷多个解。
yi = b2 x2i + b3 x3i + ei
2-10
b2 =
(邋yi x2i )(
(邋y x )( x (邋x )( x )- (? x x )
i 3i 2 2i 2 3i 2 2i 3i
2 x3 i )-
2i 3i
x
)
b3 =
(邋yi x3i )(
(邋y x )( x (邋x )( x )- (? x x )
第8章 多重共线性:解释变量 相关会有什么后果?
McGraw-Hill/Irwin
Copyright © 2006 The McGraw-Hill Companies, Inc. All rights reserved.
问题
多重共线性的性质是什么? 多重共线性是否是一个严重的问题? 多重共线性的理论后果是什么? 多重共线性的实际后果是什么? 实践中如何诊断多重共线性? 消除多重共线性的补救措施有哪些?
回想一下b2的意义:它是在保持X3不变的情 况下,当X2每改变一个单位Y的平均值的变 化率。 但如果X2和X3是完全共线性的,就没有任 何方法能保持X3不变:随着X2改变,X3也 按一个倍数因子 l 改变。 这意味着没有任何方法能从所给的样本中把 X2和X3的各自影响分解开来。 但在应用计量经济学中,我们的宗旨就是区 分每个变量的单独影响。 2-13
2-6
8.1 多重共线性的性质:完全多重共线性的情形
2-7
8.1 多重共线性的性质:完全多重共线性的情形
2-8
8.2 近似或者不完全多重共线性的情形
2-9
图8-2 工资 X 4和价格 X 2 关系
出现完全多重共线性的估计问题
在完全多重共线性的情形中,回归系数是不 确定的,并且标准误是无穷大的。 以三变量回归模型为例。 利用离差形式把三个变量都表示为偏离它们 各自的样本均值的离差,就能把三变量回归 模型写成:
2-4
多重共线性的来源
数据采集所用的方法。例如,抽样限于总体 中诸回归元所取值的一个有限的范围内。 模型或从中取样的总体收到约束。例如,在 做电力消费对收入和住房面积回归时,总体 中有这样的一个约束,即一般来说,收入较 高的家庭比收入较低的家庭有较大的住房。 模型的设定。例如在回归中添加多项式,尤 其当X变量的变化范围较小时。
2-23
一些经验
R-square值高但解释变量t值统计显著的不多。 这是多重共线性的“典型”特征。 解释变量两两高度相关。 检查偏相关系数。 从属回归或辅助回归。 方差膨胀因子。
2-24
2-25
8.6 多重共线性必定不好吗?
取决于研究的目的。 如果是为了利用模型预测应变量的未来均值, 则多重共线性未必是一件坏事。 如果研究的目的不仅仅是预测,而且还要可 靠地估计出模型的参数,则严重的共线性就 是一件“坏事”,因为它导致了估计量的标 准误增大。
2 i 2
yi vi )(l x
2 2 2i
?
2 x2 i)
(邋x )(l
x + v )- l
(?
)
2-16
现在,没有充分理由认为b2不可估计。 当然,当v充分小时,以致非常接近于零, 则几乎完全共线性。
2-17
8.3 多重共线性的理论后果 为什么讨论多重共线性?
在近似共线性的情形下,OLS估计量仍然是 无偏的。 近似共线性并未破坏OLS估计量的最小方差 性。 即使在总体回归方程中变量X 之间不是线性 相关的,但在某个样本中,X 变量之间可能 线性相关。
2-19
OLS估计量的大方差与协方差
var (b2 ) =
å
å
s2 2 2 x2 1 r ( i 23 )
s2 2 2 x3 1 r ( i 23 )
var (b3 ) =
cov (b2 , b3 ) =
- r23s 2
(1- r23 )
x
2 x3 i
2 x 邋 2i
2 x3 i
r23 =
2-20
2-5
一个过度设定的模型(overdetermined)。这种 情况出现在模型的回归元个数大于观测次数 时。 模型中的回归元具有相同的时间趋势,即它 们同时随着时间而增减。如在消费支出对收 入,财富,人口的回归中,收入,财富和人 口可能以多少有些一致的速度递增,从而导 致这些变量之间的共线性。