计量经济学-第7章 多重共线性
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
受灾面积SZM
截距项 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
-0.036836
-11793.34 0.995015 0.993441 481.5380 4405699. -193.4165 1.873809
的线性相关程度去判断是否存在严重多重共线性 的一种简便方法。 判断规则:一般而言,如果每两个解释变量的简 单相关系数(零阶相关系数)比较高,例如大于0.8, 则可认为存在着较严重的多重共线性。
15
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著
16
注意:
较高的简单相关系数只是多重共线性存在的充分 条件,而不是必要条件。特别是在多于两个解释 变量的回归模型中,有时较低的简单相关系数也 可能存在多重共线性。因此并不能简单地依据相
第二节 多重共线性产生的后果
本节基本内容: ●完全多重共线性产生的后果 ●不完全多重共线性产生的后果
9
一、完全多重共线性产生的后果
1.参数的估计值不确定
当解释变量完全线性相关时 ——OLS 估计式不确定
▲ 从偏回归系数意义看:在 X 2 和 X 3 完全共线性时,无法保
持 X 3 不变,去单独考虑 X 2 对Y 的影响( X 2 和 不可区分) ▲ 从OLS估计式看:可以证明此时
1 2 X 2 i 3 X 3 i ... k X ki 0
i 1, 2, ..., n
则称解释变量 X 2 , X 3 , X k 之间存在着完全的多重 共线性。
5
不完全的多重共线性
实际中,常见的情形是解释变量之间存在不完 全的多重共线性。 对于解释变量 X 2 , X 3 , X k,存在不全为0的数 1 , 2 , k ,使得
关系数进行多重共线性的准确判断。
17
二辅助回归法 利用模型中每一个解释变量分别以其余解释变量为解释变量进行回归 ,并计算相应的拟合优度。 如果某一种回归 X j
c 1 X 1 2 X 2 ...
j 1
X
j 1
j 1
X
j 1
... k X k
的判定系数较大,说明Xj与其他X间存在共线性。
0.018460
3191.096 Mean dependent var S.D. dependent var
-1.995382
-3.695704
0.0605
0.0015 5897.824 5945.854 15.41665 15.75537 632.0999 0.000000 3
Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著 24
四、修正多重共线性的经验方法
1 2 X 2 i 3 X 3 i ... k X ki u i 0
i 1, 2, ..., n
其中, u i 为随机变量。这表明解释变量 X 2 , X 3 , X k 只是一种近似的线性关系。
6
二、产生多重共线性的原因
一般地,产生多重共线性的主要原因有以下四个方面:
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著 7
(3)多项式项的引入
如研究企业的成本与产量之间的关系时,往往在成本模型中引
进产量的三次方,即:
Yi 0 1 X 1 i 2 X 1 i 3 X 1 i u i
2 3
在这种模型中,解释变量之间可能存在一定程度的多重共线性。
(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、
投资、价格)都趋于增长;衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力投入往往出现高度
相关情况,大企业二者都大,小企业都小。
(2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济 关系。 例如,消费=f(当期收入, 前期收入),显然,两期收入间有较强的 线性相关性。
经验规则
●方差膨胀因子越大,表明解释变量之间的多重共 性越严重。反过来,方差膨胀因子越接近于1,
多重共线性越弱。
●经验表明,方差膨胀因子≥10时,说明解释变量
与其余解释变量之间有严重的多重共线性,且这
种多重共线性可能会过度地影响最小二乘估计。
21
四、直观判断法
1. 从定性分析认为,一些重要的解释变量的回归系数 可初步判断可能存在严重的多重共线性。
第7章 多重共线性
本章讨论四个问题:
●什么是多重共线性
●多重共线性产生的后果
●多重共线性的检验 ●多重共线性的补救措施
4
一、多重共线性的含义
在计量经济学中所谓的多重共线性(MultiCollinearity),不仅包括完全的多重共线性,还 包括不完全的多重共线性。 对于解释变量 X 2 , X 3 , , X k ,如果存在不全为0的 λ 数 λ 1 , 2 ,... λ k ,使得
的结构关系,而是反映它们对被解释变量的共同影响。1、2 已经失去了应有的经济含义,于是经常表现出似乎反常的现象 :例如1本来应该是正的,结果恰是负的。 在含两个解释变量的回归模型中, ˆ1 的经济含义是:在X2保持 不变的条件下,X1变化一个单位会导致被解释变量平均变化
ˆ 个单位,显然如果两个解释变量存在较强的线性关系,则在保 1
持X2不变的条件下,X1变化一个单位时,X2也会变化,因此,
ˆ 不能正确度量解释变量X1单独对被解释变量的平均影响。 1
13
第三节 多重共线性的检验
本节基本内容:
● 简单相关系数检验法
● 方差扩大(膨胀)因子法 ● 直观判断法 ● 逐步回归法
14
一、简单相关系数检验法
含义:简单相关系数检验法是利用解释变量之间
2 12
导致
1 / (1 r1 2 )
2
的变化非常明显,从而使标准误会发生显著变化。
2 12
如:当
r12
2
由0.9增加到0.95时,1 / (1 r
)
的值由10增加到20。
12
5.如果模型中两个解释变量具有线性相关性,例如
X2= X1 ,
这时,X1和X2前的参数1、2并不反映各自与被解释变量之间
(4)样本资料的限制
由于完全符合理论模型所要求的样本数据较难收集,特定
范围内抽取样本可能存在某种程度的多重共线性。 进一步地讲,如果在实际应用中我们有足够多的样本,解释 变量的多重共线性程度就会大大降低。这就再次说明,多重共线 性本质上是样本问题。
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著 8
,引起了解释变量之间的相关关系发生明显变化,从而导致回归系数
的估计值和标准误发生较大变化(如果不理解,看看本章第三节内容) 。因此,在实证研究中,由于样本数据发生的微小变化而对估计结果
产生较大影响,隐含着模型中可能存在严重的多重共线性。
4.在回归方程中,一些理论上显著的重要解释变量的回归系数的标准误较
小,从而Fj的值较大。因此,给定显著性水平,计算F值,并与相应
的临界值比较,来判定是否存在相关性。
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著 18
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著
19
三、方差扩大(膨胀)因子法
统计上可以证明,解释变量 X 的方差可表示为
R 大,t 统计量值较小而不能拒绝原假设,同时 又很高(或F检验能显著
2
拒绝原假设),这种情况可初步判断存在严重的多重共线性。
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著
23
在例7.1中,利用Eviews6.0对模型进行估计,估计的结果如下:
上式的第一行是对应参数估计值的t统计量,第二行是对应的t检验的p值。从回归结果来看,当显著性水平为5%时,所有参数OLS估计量的p 值都大于0.05,说明t检验的结论是都不能拒绝原假设。而从模型的F检 验来看,F统计量的p值是0,说明模型是显著成立的,同时R2很高 (=0.97)。综上所述,如果按照t检验的结果,所有的解释变量对被解释 变量的影响是不显著的,而按照F检验的结果,模型又具有总体显著性 。也就是说,t检验的结果和F检验的结果相互矛盾,这种矛盾的根源在 于多元线性回归模型存在严重的多重共线性现象。
计量经济学
第7章 多重共线性
1
引子: 发展农业和建筑业会减少财政收入吗?
为了分析各主要因素对财政收入的影响,建立财政收 入模型: CS i 0 1 NZ i 2 GZ i 3 JZZ i
4 TPOP i 5 CUM
i
6 SZM
i
ui
其中: CS财政收入(亿元) ; NZ农业增加值(亿元); GZ工业增加值(亿元); JZZ建筑业增加值(亿元); TPOP总人口(万人); CUM最终消费(亿元); SZM受灾面积(万公顷) 数据样本时期1978年-2003年(资料来源:《中国统计年鉴 2004》,中国统计出版社2004年版)
判别的标准是回归模型是否通过F检验。 具体可进一步对上述回归方程作F检验,构造如下F统计量
Fj R j . /( k 2 )
2
(1 R j . ) /( n k 1)
2wenku.baidu.com
~ F ( k 2 , n k 1)
式中:Rj•2为第j个解释变量对其他解释变量的回归方程的判定系数, 若存在较强的共线性,则Rj•2较大且接近于1,这时(1- Rj•2 )较
的标准误差较大,在回归方程中没有通过显著性检验时,
2如果有些解释变量的回归系数的符号与经济原理相违背,
这种现象表明很可能存在多重共线性。我们在前面已经
说明,多重共线性可能扭曲了参数的经济含义。
22
3.对于原始的多元回归模型,当增加、剔除或者改变一个变量的观测值(
不是异常值)时,回归参数的估计值和标准误发生较大变化,据此可以 判断回归方程可能存在严重的多重共线性。这是因为数据的微小变化
采用普通最小二乘法得到以下估计结果
2
财政收入模型的EViews估计结果
Variable 农业增加值NZ 工业增加值GZ 建筑业增加值JZZ 总人口TPOP 最终消费CUM Coefficient -1.535090 0.898788 -1.527089 0.151160 0.101514 Std. Error 0.129778 0.245466 1.206242 0.033759 0.105329 t-Statistic -11.82861 3.661558 -1.265989 4.477646 0.963783 Prob. 0.0000 0.0017 0.2208 0.0003 0.3473
0 ˆ β2 = 0
X3
的影响
2.参数估计值的方差无限大
OLS估计式的方差成为无穷大: V ar ( ) ˆ 2
10
二、不完全多重共线性产生的后果
如果模型中存在不完全的多重共线性,可以得到 参数的估计值,但是对计量经济分析可能会产生 一系列的影响。
1.参数估计值的方差增大
2 ˆ V ar( β 2 ) = σ
ˆ V ar( β j ) = σ
2 2
j
ˆ 的参数估计式 β j
σ
2 2
1
2
=
xj 1- Rj
xj
V IF j
其中的 V IF j 是变量 X
j
的方差扩大因子
V IF j = 1
(Variance Inflation Factor),即
1 - R j
2
20
其中 R 2 是多个解释变量辅助回归的可决系数 j
1
x 2 i (1 - r2 3 )
^
2
2
=
σ
2 2
1
2
x 2 i (1 - r2 3 )
当 r2 3 增大时 V ar ( 2 ) 也增大
11
2.对参数区间估计时,置信区间趋于变大
3.假设检验容易作出错误的判断
4.可能造成可决系数较高,但对各个参数单独的 t 检验却可能不
显著,甚至可能使估计的回归系数符号相反,得出完全错误的结 论。 5. 5. OLS估计量及其标准误对样本数据微小变化较敏感 以两个解释变量的回归模型为例,OLS估计量的方差和标准误都 与解释变量之间的相关系数有关,而相关系数 r 的微小变化,都