第七章-工具变量、2SLS、GMM
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(相关性),以及Cov wi,i =(0 外生性)。由于
x1,
,x
不是内生变量,故可以把自己作为自己
k-1
的工具变量(因为满足工具变量的两个条件)
记解释变量向量xi xi1 xi,k-1 xik ,则原模型为
yi=xi + i
记工具变量向量为
zi zi1 zi,k-1 zik xi1 xi,k-1 wi 。
消费、投资、净出口。将第一个方程代入第二个
方程,经整理可得Yt=1-11 0+It+Xt +1- t1
可见Yt与 t 相关,因此当单独对Ct= 0+1Yt+ t
进行OLS估计时会碰到解释变量与扰动项相关的 情况
违背解释变量外生性假定也可以出现在滞后被解 释变量作为模型解释变量的情况。例如,消费不 仅受收入的影响,还要受到前期消费水平的影响; 投资不仅受GDP的影响,也要受前期投资水平的 影响。当存在扰动项序列相关时,就会造成解释 变量与扰动项相关的情况
n i=1
xi yi =
XX
-1 Xy=ˆOLS
显然这就是OLS估计量
2、工具变量法作为一种矩估计
假设回归模型为
yi=1x
+
i1
+k-1x
+ i,k-1
k
x
ik+
i
假设只有最后一个解释变量xik为内生变量,即
Cov xik,i 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov xik,wi 0
为外生解释变量向量。记工具变量为 x1 z2 ,其中
z2为方程外的工具变量。在2SLS的第一阶段回归中
x2
OLS
x1,z
2,其R
2包含了内生变量x
与工具变
2
量z 2相关性的信息,但也可能由于x 2与x1的相关性造
成。
为此,应该使用滤去x1影响的“偏R2”(partial R2)
记为R
2 p
具体操作步骤如下:首先作x2对x1回归,
决系数为R2,则Sarg an统计量为
nR2 d 2 m-r
显然,若恰好识别,则m-r=0, 2 0无定义,故
无法使用此检验
3、对解释变量内生性的检验
使用工具变量法的前提是存在内生解释变量,这也 需要检验。如果找到有效的工具变量,则可以借助 工具变量来检验解释变量的内生性 假设存在方程外的工具变量。若所有解释变量都是 外生变量,则OLS比工具变量法更有效,因为此时 如果满足球型扰动项的假定,则OLS是BLUE 在这种情况下使用工具变量法,虽然估计量仍然是 一致的,但反而会增大估计量的方差。反之,若存 在内生解释变量,则OLS是不一致的,而工具变量 法是一致的。
以上介绍的工具变量法仅适用于恰好识别的情况。
在过度识别的情况下,ZX不是方阵, ZX-1 不存在
无法得到工具变量估计量ˆIV。
若扔掉多余的工具变量将会浪费有用的信息,有效 的方法是二阶段最小二乘法
三、二阶段最小二乘法
显然,多个工具变量的线性组合仍然是工具变量 因为仍满足工具变量的两个条件(相关性与外生性) 如果生成工具变量的k个线性组合,则又回到恰好 识别的情形。那么什么样的线性组合才是最有效率 的呢?可以证明在球形扰动项的假设下,由二阶段 最小二乘法(2SLS)所提供的工具变量线性组合是 所有线性组合中最渐近有效的。这个结论类似于小 样本理论中的高斯-马尔可夫定理。
1、矩估计(Method of Moments,MM) 首先以一个例子来说明矩估计方法:假设随机变量
x N , 2 ,其中, 2为待估参数。因为有两
个待估参数,故需要使用以下两个总体矩条件:
一阶中心矩:E x=
二阶中心矩:E x2 =Var x+E x2 = 2+2
用对应的样本矩来替代总体矩条件可得以下联立 方程组,求解后即得到期望与方差的矩估计:
2、检验工具变量的外生性
在恰好识别的情况下,目前公认无法检验工具变量 是否与扰动项相关。在这种情况下,只能进行定性 讨论或参考专家的意见。
在过度识别的情况下,则可进行过度识别检验,即
检验原假设“H
:所有工具变量都是外生的”。如
0
果拒绝该原假设,则认为至少某个工具变量不是外
生的,与扰动项相关。
假设前k-r个解释变量x1, ,xk-r为外生解释变量 而后r个解释变量x , k-r+1 ,xk为内生解释变量。假 设共有m个方程外的工具变量z1, ,zm,其中m>r
变量与扰动项的正交性,可以得到以下总体矩条件
Exii =0 E xi yi-xi =0
E xiyi =E xixi =E xixi -1 E xiyi (假设E xixi 可逆)
以样本矩替代上式中的总体矩,即可得到矩估计:
ˆMM=
1 n
n i=1
xi
xi
-1
1 n
量估计量:
ˆIV=
1 n
n i=1
zi xi
-1
1 n
n zi yi =
i=1
ZX
-1 Zy
其中,Z z1 zn-1 zn 即Z z1 zn-1 zn
下面是工具变量法的大样本性质:
定理:若秩条件r E zixi =k成立(方阵E zixi 满
秩),则在一定的正则条件下,ˆIV是的一致估计 且ˆIV服从渐近正态分布
0
量法一致而OLS不一致,故 ˆIV-ˆOLS 不会收敛于
0。豪斯曼检验正是基于这一思想进行的
秩条件r
E
zi
xi
=k意味着工具变量w
与内生解释
i
变量xi相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量
根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数
2 恰好识别:工具变量个数等于内生解释变量个数
3 过度识别:工具变量个数多于内生解释变量个数
能成立是由于Xˆ Xˆ =PX PX=XPPX=XPX
=PX X=Xˆ X,其中,投影矩阵P为对称幂等矩阵
即P=P,P2=P。因此,可以将ˆIV视为把y对Xˆ 进行
OLS回归而得到,故名“二阶段最小二乘法”
注意,第二阶段回归所得到的残差为e2 y-Xˆ ˆ2SLS 而原方程的残差却是e y-Xˆ2SL(S 这是正确的)
第一阶段:将每个解释变量x1, ,xk分别对所有L个
工具变量z1, ,zL作OLS回归,其中
xi x1i
x ni
n1
,i=1,
,k(注意,不同于第二章
对第i个观测数据x
i的定义)。相当于将x
视作被解释
i
变量。得到拟合值xˆ 1=Px1,xˆ
2=Px
,
2
,xˆ k=Pxk
即xi到Z上的投影
(相当于y对X求回归拟合值yˆ =Py,即y到X上的投影)
于z中仅包含很少与x有关的信息,利用这部分信息 进行的工具变量法估计就不准确,即使样本容量很
大也很难收敛到真实的参数值。这种工具变量称为
弱工具变量,将使ˆIV的小样本性质变得很差,且基
于大样本理论的统计推断失效
判断弱工具变量的方法主要有两种。
方法之一为使用“偏R 2”。假设回归模型为
y=x1 1+x 2 2+,其中只有x 2为内生解释变量,x1
一、工具变量法(Instrumental Variable,IV)
可以引入工具变量w
来解决内生变量问题。一个有
t
效的工具变量应满足以下两个条件:
(1)相关性:工具变量与内生解释变量相关,即
Cov
w
t,p
t
0,p
为内生解释变量
t
(2)外生性:工具变量与扰动项不相关,即
Cov wt,t =0
二、工具变量法作为一种矩估计
把工具变量法的残差对所有外生变量(即所有外生
解释变量与工具变量)进行以下辅助回归:
ei,IV=
1x
+
i1
+ k-r xi,k-r+1zi1+
+ m zim+errori
将工具变量法的残差ei,IV视为对扰动项的估计,则
“扰动项与工具变量z1, ,zm无关”的原假设可
以写为“H0:1=
=
=0?
m
。记此辅助回归的可
可以证明,ng d N 0,S,
其中S E gigi =E i2zizi
进一步,工具变量估计量ˆIV渐近服从正态分布,即
n ˆIV- =S-ZX1 ng d N 0,AVar ˆIV ,其
中渐近方差矩阵AVar
ˆIV
=
E
zi
xi
-1
S
E
zi
xi
-1
用到 E zixi -1 为对称矩阵
由于ˆIV的表达式在形式上完全类似于OLS估计量
故在条件同方差的假设下,ˆIV的协方差矩阵估计量
为Var
ˆIV =s2
Xˆ Xˆ -1,其中,s2 ee n-k
在存在异方差的情况下,则应使用稳健的协方差矩
阵估计量,即Var
ˆIV =
Xˆ Xˆ
-1
n
ei2
xˆ i
xˆ i
证明:抽样误差ˆIV-=ZX-1 Zy-
=ZX-1 ZX+ -=ZX-1 Z
=
1 n
n i=1
zi
xi
-1
1 n
n i=1
zii =S-ZX1 g
p
E zixi -1 E gi =0
=0
其中SZX
1 n
n i=1
zi xi,g
1 n
n i=1
zii
与第三章大样本最小二乘法类似的假定和推导,
x2
OLS
x1,记其残差为e
x
,代表x
2
2中不能由x1解
释的部分;其次,作z2对x1回归,z2 OLS x1,记
其残差为ez2,代表z2中不能由x1解释的部分;最后
对两个残差进行回归,即ex2
OLS
e
,ຫໍສະໝຸດ Baidu得的判
z2
定系数即R
2p,若其较小即可认为z
是弱工具变量
2
判断弱工具变量的另一个方法是,在第一阶段回
归中,x2=x11+z2 2+error,检验原假设 H0: 2=0
一个经验规则是,如果此检验的F统计量大于10, 则可拒绝“存在弱工具变量”的原假设,从而不必 担心弱工具变量问题。在多个内生解释变量的情况 下,将有多个如此的第一阶段回归和F统计量
解决弱工具变量问题的方法是寻找更强的工具变 量或若有较多工具变量,可舍弃弱工具变量
1、检验工具变量与解释变量的相关性
如果工具变量z与内生解释变量x完全不相关,则
无法使用工具变量法,因为E zixi 不可逆。如果 z与x仅仅微弱相关,则可认为E zixi -1 很大,导
致工具变量法估计量的渐近方差AVar ˆIV =
E zixi -1 S E zixi -1 非常之大。直观上看,由
其中,P Z ZZ-1 Z为Z的投影矩阵。写成矩阵形式
Xˆ xˆ1 xˆ 2 xˆ k =P x1 x2 xk =PX
=Z
ZZ
-1
ZX
第二阶段:由于Xˆ 是z1, ,zL的线性组合(参见
第一阶段回归),故Xˆ 恰好包含k个工具变量。使用
Xˆ 为工具变量对原模型y=X+ 进行工具变量法估
计: ˆIV= Xˆ X -1 Xˆ y= Xˆ Xˆ -1 Xˆ y 后一个等号
解释变量内生性的检验使用的是“豪斯曼检验”
其原假设为“H0:所有解释变量均为外生变量” 如果H0成立,则OLS与工具变量法都是一致的
即在大样本下ˆIV与ˆOLS均收敛于真实的参数值
因此,ˆIV-ˆOLS(“对比向量”vector of contrast)
依概率收敛于0。反之,如果H
不成立,则工具变
1 n
1 n
n i=1
xi=ˆ
n
xi2=ˆ 2+ˆ 2
i=1
ˆ=x
ˆ
2=
1 n
n i=1
xi-x 2
其中,x= 1 n
n i=1
x
为样本均值,上面推导中用到:
i
n
n
xi-x 2= xi2-nx2
i=1
i=1
任何随机向量x的函数f x的期望E f x 都被称为
总体矩。事实上,OLS也是一种矩估计。利用解释
定义gi
zi
。由于工具向量与扰动项正交,故
i
E gi =E zii =0为总体矩条件或正交条件
由此可得E zii =0 E zi yi-xi =0 E ziyi =E zixi
=E zixi -1 E ziyi (假定 E zixi -1 存在)
以样本矩代替上式中的总体矩,即可得到工具变
第七章 工具变量、2SLS、 GMM
OLS估计成为一致估计量的前提是解释变量与扰动 项不相关(即前定变量假设),否则,无论样本容 量多大,OLS估计量也不会收敛到参数真值,这将 难以接受。解决方法之一是本章介绍的工具变量法
复习第三章p34-p38
违背前定变量假设可以出现在联立方程中,比如
CYt=t=C0+t+I1tY+t+Xt t ,Yt、Ct、It、Xt分别表示GDP、
Xˆ Xˆ -1
i=1
将Xˆ =ZZZ-1 ZX(或将P ZZZ-1 Z)代入ˆIV的
公式,可得2SLS的最终表达式:
ˆ2SLS= XPX-1 XPy
= XZZZ-1 ZX -1 XZZZ-1 Zy
四、有关工具变量的检验
在使用工具变量法时,必须对工具变量的有效性 进行检验。如果工具变量非有效,则可能导致估 计不一致,或估计量的方差过大。