多重共线性PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
协方差同理。
方差膨胀因子(variance-inflating factor, VIF)
1 VIF 1 r223
所以 var b2
2
x22i VIF
2-21
8.5 多重共线性的诊断
在任一给定的情况下,特别是在涉及多于两 个解释变量的模型中,我们怎么知道有没有 共线性?
2-22
1.多重共线性是一个程度问题而不是有无问 题。有意义的区分不在于有无之间,而在于 程度大小。
因为 数。
b2 b3 是一个方程,却有两个未知
对给定的alpha和lamda值,有无穷多个解。
2-15
出现“高度”但“不完全”多重共线性 时的估计问题
仍以上述三变量回归模型为例。 假定 X3i X 2i vi ,其中 vi x2i 0
回归系数估计:
b2
yi x2i 2 x22i vi2
yi x2i
第8章 多重共线性:解释变量
相关会有什么后果?
McGraw-Hill/Irwin
Copyright © 2006 The McGraw-Hill Companies, Inc. All rights reserved.
问题
多重共线性的性质是什么? 多重共线性是否是一个严重的问题? 多重共线性的理论后果是什么? 多重共线性的实际后果是什么? 实践中如何诊断多重共线性? 消除多重共线性的补救措施有哪些?
但在应用计量经济学中,我们的宗旨就是区 分每个变量的单独影响。
2-13
把 X3i yi
X 2i 代入回归方程: b2 x2i b3 x2i ei b2 b3 x2i ei
x2i ei
利用OLS公式得:
b2 b3
x2i yi x22i
2-14
因此,虽然 可以唯一地估计出来,却无法 唯一的估计出b2和b3。
2-2
多重共线性的性质
多重共线性(multicollinearity)原先的含义指一 个回归模型中的一些或全部解释变量之间存 在一种“完全”或者准确的线性关系。
1X1 2 X2
kXk 0
现在共线性更为广义,既包括上述完全共线 性,也包括非完全(高度)共线性的形式。
1X1 2 X2
kXk i 0
yivi
x22i
x22i
2
x22i vi2
2
x2 2 2i
2-16
现在,没有充分理由认为b2不可估计。 当然,当v充分小时,以致非常接近于零,
则几乎完全共线性。
2-17
8.3 多重共线性的理论后果
为什么讨论多重共线性?
在近似共线性的情形下,OLS估计量仍然是 无偏的。
近似共线性并未破坏OLS估计量的最小方差 性。
yi b2 x2i b3x3i ei
2-10
b2
yi x2i x22i
x32i x32i
yi x3i
x2i x3i
2
x2i x3i
b3
yi x3i x22i
x22i x32i
yi x2i
x2i x3i
2
x2i x3i
2-11
假定 X3i X 2i
b2
yi x2i 2 x22i
x22i
2
x22i
R2 的贡献。
2-19
OLS估计量的大方差与协方差
var b2 var b3
2
x22i 1 r223
2
x32i 1 r223
cov b2 , b3
r23 2
1 r23
x22i
x32i
r23
2-20
x2i x3i
x22i
x32i
随着r23趋于1,即随着共线性增加,两估计 量的方差也增加。
当r23=1时,方差为无穷大。
2-27
8.7 扩展一例:1960-1982年期间美国的鸡肉需求 鸡肉需求函数[方程(8.15)]的共线性诊断 1.相关矩阵
2-28
8.7 扩展一例:1960-1982年期间美国的鸡肉需求 鸡肉需求函数[方程(8.15)]的共线性诊断 2.辅助回归
2-29
8.8 如何解决多重共线性:补救措施
从模型中删掉一个变量 获取额外的数据或新的样本 重新考虑模型 参数的先验信息 变量变换 其他补救措施
yi x2i
x22i
0
2
x2 2 2i
0
2-12
回想一下b2的意义:它是在保持X3不变的情 况下,当X2每改变一个单位Y的平均值的变 化率。
但如果X2和X3是完全共线性的,就没有任 何方法能保持X3不变:随着X2改变,X3也 按一个倍数因子 改变。
这意味着没有任何方法能从所给的样本中把 X2和X3的各自影响分解开来。
模型中的回归元具有相同的时间趋势,即它 们同时随着时间而增减。如在消费支出对收 入,财富,人口的回归中,收入,财富和人 口可能以多少有些一致的速度递增,从而导 致这些变量之间的共线性。
2-6
8.1 多重共线性的性质:完全多重共线性的情形
2-7
8.1 多重共线性的性质:完全多重共线性的情形
2-8
8.2 近似或者不完全多重共线性的情形
2-9
图8-2 工资 X 4和价格X 2 关系
出现完全多重共线性的估计问题
在完全多重共线性的情形中,回归系数是不 确定的,并且标准误是无穷大的。
以三变量回归模型为例。 利用离差形式把三个变量都表示为偏离它们
各自的样本均值的离差,就能把三变量回归 模型写成:
2.由于多重共线性是对被假定为非随机的解 释变量的情况而言,所以它是一种样本特征, 而非总体特征。
因此,我们不做“多重共线性的检验”,但 如果愿意,可以测度它在任一具体样本中显 现的程度。
2-23
一些经验
R-square值高但解释变量t值统计显著的不多。 这是多重共线性的“典型”特征。
解释变量两两高度相关。 检查偏相关系数。 从属回归或辅助回归。 方差膨胀因子。
模型或从中取样的总体收到约束。例如,在 做电力消费对收入和住房面积回归时,总体 中有这样的一个约束,即一般来说,收入较 高的家庭比收入较低的家庭有较大的住房。
模型的设定。例如在回归中添加多项式,尤 其当X变量的变化范围较小时。
2-5
一个过度设定的模型(overdetermined)。这种 情况出现在模型的回归元个数大于观测次数 时。
2-30
2-24
2-25
8.6 多重共线性必定不好吗?
取决于研究的目的。 如果是为了利用模型预测应变量的未来均值,
则多重共线性未必是一件坏事。 如果研究的目的不仅仅是预测,而且还要可
靠地估计出模型的参数,则严重的共线性就 是一件“坏事”,因为它导致了估计量的标 准误增大。
2-26
8.7 扩展一例:1960-1982年期间美国的鸡肉需求
ቤተ መጻሕፍቲ ባይዱ
2-3
为什么CLRM假定无多重共线性?
如果多重共线性是完全的,则X变量的回归 系数将是不确定的,并且它们的标准误为无 穷大。
如果多重共线性是不完全的,则虽然回归系 数可以确定,却有较大的标准误(相对于系 数本身来说),也即系数不能以很高的精度 或准确度加以估计。
2-4
多重共线性的来源
数据采集所用的方法。例如,抽样限于总体 中诸回归元所取值的一个有限的范围内。
即使在总体回归方程中变量X 之间不是线性 相关的,但在某个样本中,X 变量之间可能 线性相关。
2-18
8.4 多重共线性的实际后果
OLS估计量的方差和标准误较大。 置信区间变宽。 t值不显著 。 R2值较高,但t值并不都是统计显著的。 OLS估计量及其标准误对数据的微小变化非常敏感,
即它们很不稳定。 回归系数符号有误。 难以评估各个解释变量对回归平方和(ESS)或者