第四章多重共线性
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时间序列数据经常出现序列相关
5、随机扰动项方差不等于常数=>异方差
截面数据时,经常出现异方差
解决问题的思路
1、定义违反各个基本假定的基本概念 2、违反基本假定的原因、背景 3、诊断基本假定的违反 4、违反基本假定的补救措施(修正)
本章主要介绍
4.1 多重共线性的实例、定义、产生背景; 4.2 多重共线性产生的后果; 4.3 多重共线性的检验; 4.4 多重共线性的修正。 4.5 违反三个假定的总结 4.6 案例
(2)经济变量之间本身具有内在联系(常在截 面数据中出现);横截面数据:生产函数中, 资本投入与劳动力投入往往出现高度相关情 况,大企业二者都大,小企业都小。
4.1.3 产生多重共线性的背景
(3)由于某种决定性因素的影响可能使各个变量向着同 方向变化;
(4)滞后变量引入模型,同一变量的滞后值一般都存在 相互关系;在计量经济模型中,往往需要引入滞后经 济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入)
y (1 2 )x1
只能确定综合参数 1 2 的估计值:
ˆ1 ˆ2 x1i yi
x12i
4.2.2 不完全多重共线性下的 后果
(1)参数估计仍是无偏估计,但不稳定;估计量 及其标准差非常敏感,观测值稍微变化,估计 量就会产生较大的变动。
(2)参数估计式的方差随着共线性程度的增大而 增大。
4.1 多重共线性的实例、定义、 产生背景
4.1.1 实例 例一 消费与收入、家庭财富
例二 汽车保养费与汽车行驶里程、拥 有汽车时间
4.1.2 多重共线性的定义
多重共线性:在多元线性回归模型中, 解释变量之间存在着完全的线性关系或 近似的线性关系
Yi b0 b1X1i b2 X 2i i
(3)t检验失效,区间估计失去意义;估计量的 方差很大,相应标准差增大,进行t检验时,接 受零假设的可能性增大
(4)严重多重共线性时,甚至参数估计式的符号 与其经济意义相反。得出完全错误的结论。
4.2.2 一般共线性下普通最小二乘法参数 估计量非有效
在一般共线性(或称近似共线性)下,虽然 可以得到OLS法参数估计量,但是由参数估计量 方差的表达式为
显然,两期收入间有较强的线性相关性。
有的学者认为多重共线性是一个数据样本的问题。
一般经验
对于采用时间序列数据作样本、以简单线性 形式建立的计量经济学模型,往往存在多重共线 性。
以截面数据作样本时,问题不那么严重,但 多重共线性仍然是存在的。
back
4.2 多重共线性的后果
4.2.1 完全多重共线性下的后果 (1)参数估计值不确定;
x2i yi x12i
x2i x1i
x1i x2i
x1i yi x12i
x22i
x1i yi 2
x12i 0
x1i x2i
x12i x12i
0
x22i
x12i 2 x12i
ˆ1 为不定式; 同理, ˆ2 也为不定式,其值无法确定。
事实上,当 x2 x1 时,原二元回归模型退 化为一元回归模型:
多重共线性分类的矩阵形式
多重共线性表现为两种情况: (1)完全多重共线性:
r( X ) k,也就是| X'X |=0(, X'X)-1不存在 (2)不完全多重共线性:(实际中多为此情况) | X'X | 0,(X'X)-1对角线元素较大
4.1.3 产生多重共线性的背景
(1)时间序列数据中经济变量在时间上常有共 同的变动趋势;时间序列样本:经济繁荣时 期,各基本经济变量(收入、消费、投资、 价格)都趋于增长;衰退时期,又同时趋于 下降。
完全多重共线性 近似多重共线性
1 X1i 2 X 2i 0 1X1i 2 X 2i vi 0
4.1.2 多重共线性的定义--矩阵 形式
在多元线性回归模型Y X中,对X的
基本假定是: 矩阵X的各列向量之间是 线性无关的,即有:
r( X ) k (k n), 即| X'X | 0 如果这一假定不满足,则称模型存在 多重共线性。
1、通常不会发生随机扰动项均值不等于0 的情形。若发生也不会影响解释变量的系 数,只会影响截距项。
2、随机扰动项正态性假设一般能够成立, 就算不成立,在大样本下也会近似成立的。 所以不讨论此假定是否违背。
不满足基本假定的情形(2)
3、解释变量之间相关=>多重共线 4、随机扰动项相关=>序列自相关
第四章 多重共线性
问题的提出
在前述基本假定下OLS估计具有BLUE的优良性。 然而实际问题中,这些基本假定往往不能满足,
使OLS方法失效不再具有BLUE特性。 估计参数时,必须检验基本假定是否满足,并
针对基本假定不满足的情况,采取相应的补救 措施或者新的方法。 检验基本假定是否满足的检验称为计量经济学 检验
2
x12i x12i
x12i
1
ຫໍສະໝຸດ Baidu
2
X Y
x1i x2i
yi yi
1
x1i yi
该回归模型的正规方程为
(XX)Bˆ XY
或
ˆ1 x12i ˆ2 x1i x2i x1i yi
ˆ1 x2i x1i ˆ2 x22i x2i yi
解该线性方程组得:
x1i yi
ˆ1
( X ' X )1不存在,从( X ' X ) =X 'Y
中没法解出唯一的 来。
(2)参数估计值的方差无限大;
例如:对一个离差形式的二元回归模型
y 1 x1 2 x2
如果两个解释变量完全相关,如x2 x1 ,则有
X X
x12i x2i x1i
x1i x2i
x
2 2i
x12i x12i
回顾6项基本假定
(1)解释变量间不相关(无多重共线性)
(2)E(ui)=0
(随机项均值为零)
(3)Var(ui)=2 (同方差)
(4)Cov(ui, uj)=0(随机项无自相关) (5)Cov(X, ui)=0(随机项与解释变量X
不相关)
(6)随机扰动服从正态分布。
不满足基本假定的情形(1)
Cov(ˆ ) 2 (XX)1
可见,由于此时|X’X|0,引起(X’X) -1主对角 线元素较大,从而使参数估计值的方差增大, OLS参数估计量非有效。
仍以二元模型中 ˆ1 为例, ˆ1的方差为
5、随机扰动项方差不等于常数=>异方差
截面数据时,经常出现异方差
解决问题的思路
1、定义违反各个基本假定的基本概念 2、违反基本假定的原因、背景 3、诊断基本假定的违反 4、违反基本假定的补救措施(修正)
本章主要介绍
4.1 多重共线性的实例、定义、产生背景; 4.2 多重共线性产生的后果; 4.3 多重共线性的检验; 4.4 多重共线性的修正。 4.5 违反三个假定的总结 4.6 案例
(2)经济变量之间本身具有内在联系(常在截 面数据中出现);横截面数据:生产函数中, 资本投入与劳动力投入往往出现高度相关情 况,大企业二者都大,小企业都小。
4.1.3 产生多重共线性的背景
(3)由于某种决定性因素的影响可能使各个变量向着同 方向变化;
(4)滞后变量引入模型,同一变量的滞后值一般都存在 相互关系;在计量经济模型中,往往需要引入滞后经 济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入)
y (1 2 )x1
只能确定综合参数 1 2 的估计值:
ˆ1 ˆ2 x1i yi
x12i
4.2.2 不完全多重共线性下的 后果
(1)参数估计仍是无偏估计,但不稳定;估计量 及其标准差非常敏感,观测值稍微变化,估计 量就会产生较大的变动。
(2)参数估计式的方差随着共线性程度的增大而 增大。
4.1 多重共线性的实例、定义、 产生背景
4.1.1 实例 例一 消费与收入、家庭财富
例二 汽车保养费与汽车行驶里程、拥 有汽车时间
4.1.2 多重共线性的定义
多重共线性:在多元线性回归模型中, 解释变量之间存在着完全的线性关系或 近似的线性关系
Yi b0 b1X1i b2 X 2i i
(3)t检验失效,区间估计失去意义;估计量的 方差很大,相应标准差增大,进行t检验时,接 受零假设的可能性增大
(4)严重多重共线性时,甚至参数估计式的符号 与其经济意义相反。得出完全错误的结论。
4.2.2 一般共线性下普通最小二乘法参数 估计量非有效
在一般共线性(或称近似共线性)下,虽然 可以得到OLS法参数估计量,但是由参数估计量 方差的表达式为
显然,两期收入间有较强的线性相关性。
有的学者认为多重共线性是一个数据样本的问题。
一般经验
对于采用时间序列数据作样本、以简单线性 形式建立的计量经济学模型,往往存在多重共线 性。
以截面数据作样本时,问题不那么严重,但 多重共线性仍然是存在的。
back
4.2 多重共线性的后果
4.2.1 完全多重共线性下的后果 (1)参数估计值不确定;
x2i yi x12i
x2i x1i
x1i x2i
x1i yi x12i
x22i
x1i yi 2
x12i 0
x1i x2i
x12i x12i
0
x22i
x12i 2 x12i
ˆ1 为不定式; 同理, ˆ2 也为不定式,其值无法确定。
事实上,当 x2 x1 时,原二元回归模型退 化为一元回归模型:
多重共线性分类的矩阵形式
多重共线性表现为两种情况: (1)完全多重共线性:
r( X ) k,也就是| X'X |=0(, X'X)-1不存在 (2)不完全多重共线性:(实际中多为此情况) | X'X | 0,(X'X)-1对角线元素较大
4.1.3 产生多重共线性的背景
(1)时间序列数据中经济变量在时间上常有共 同的变动趋势;时间序列样本:经济繁荣时 期,各基本经济变量(收入、消费、投资、 价格)都趋于增长;衰退时期,又同时趋于 下降。
完全多重共线性 近似多重共线性
1 X1i 2 X 2i 0 1X1i 2 X 2i vi 0
4.1.2 多重共线性的定义--矩阵 形式
在多元线性回归模型Y X中,对X的
基本假定是: 矩阵X的各列向量之间是 线性无关的,即有:
r( X ) k (k n), 即| X'X | 0 如果这一假定不满足,则称模型存在 多重共线性。
1、通常不会发生随机扰动项均值不等于0 的情形。若发生也不会影响解释变量的系 数,只会影响截距项。
2、随机扰动项正态性假设一般能够成立, 就算不成立,在大样本下也会近似成立的。 所以不讨论此假定是否违背。
不满足基本假定的情形(2)
3、解释变量之间相关=>多重共线 4、随机扰动项相关=>序列自相关
第四章 多重共线性
问题的提出
在前述基本假定下OLS估计具有BLUE的优良性。 然而实际问题中,这些基本假定往往不能满足,
使OLS方法失效不再具有BLUE特性。 估计参数时,必须检验基本假定是否满足,并
针对基本假定不满足的情况,采取相应的补救 措施或者新的方法。 检验基本假定是否满足的检验称为计量经济学 检验
2
x12i x12i
x12i
1
ຫໍສະໝຸດ Baidu
2
X Y
x1i x2i
yi yi
1
x1i yi
该回归模型的正规方程为
(XX)Bˆ XY
或
ˆ1 x12i ˆ2 x1i x2i x1i yi
ˆ1 x2i x1i ˆ2 x22i x2i yi
解该线性方程组得:
x1i yi
ˆ1
( X ' X )1不存在,从( X ' X ) =X 'Y
中没法解出唯一的 来。
(2)参数估计值的方差无限大;
例如:对一个离差形式的二元回归模型
y 1 x1 2 x2
如果两个解释变量完全相关,如x2 x1 ,则有
X X
x12i x2i x1i
x1i x2i
x
2 2i
x12i x12i
回顾6项基本假定
(1)解释变量间不相关(无多重共线性)
(2)E(ui)=0
(随机项均值为零)
(3)Var(ui)=2 (同方差)
(4)Cov(ui, uj)=0(随机项无自相关) (5)Cov(X, ui)=0(随机项与解释变量X
不相关)
(6)随机扰动服从正态分布。
不满足基本假定的情形(1)
Cov(ˆ ) 2 (XX)1
可见,由于此时|X’X|0,引起(X’X) -1主对角 线元素较大,从而使参数估计值的方差增大, OLS参数估计量非有效。
仍以二元模型中 ˆ1 为例, ˆ1的方差为