第七章 工具变量、2SLS、GMM
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ 第二阶段:由于X是 z1, ,z L 的线性组合(参见 ˆ 第一阶段回归),故X恰好包含k个工具变量。使用 ˆ X为工具变量对原模型y=X+ 进行工具变量法估 ˆ ˆ 计: IV= XX
-1
ˆ ˆ ˆ Xy= XX
-1
ˆ Xy
后一个等号
ˆ ˆ 能成立是由于XX= PX PX =XPPX=XPX ˆ = PX X=XX,其中,投影矩阵P为对称幂等矩阵 ˆ ˆ 即P=P,P 2=P。因此,可以将 IV 视为把y对X进行 OLS回归而得到,故名“二阶段最小二乘法”
二、工具变量法作为一种矩估计
1、矩估计(Method of Moments,MM)
首先以一个例子来说明矩估计方法:假设随机变量 x N , 2 ,其中, 2为待估参数。因为有两 个待估参数,故需要使用以下两个总体矩条件: 一阶中心矩:E x = 二阶中心矩:E x =Var x + E x = 2+ 2
n -1
2、工具变量法作为一种矩估计
假设回归模型为 yi=1x i1++ k-1x i,k-1+ k x ik+ i 假设只有最后一个解释变量x ik为内生变量,即 Cov x ik, i 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov x ik,w i 0 (相关性),以及Cov w i, i =(外生性)。由于 0 x1, ,x k-1不是内生变量,故可以把自己作为自己 的工具变量(因为满足工具变量的两个条件)
t 1 方程,经整理可得Yt= 0+I t+X t + 1-1 1-1
可见Yt 与 t 相关,因此当单独对C t= 0+1Yt+ t 进行OLS估计时会碰到解释变量与扰动项相关的 情况
违背解释变量外生性假定也可以出现在滞后被解 释变量作为模型解释变量的情况。例如,消费不 仅受收入的影响,还要受到前期消费水平的影响; 投资不仅受GDP的影响,也要受前期投资水平的 影响。当存在扰动项序列相关时,就会造成解释 变量与扰动项相关的情况
OLS 2
为外生解释变量向量。记工具变量为 x1 z 2 ,其中
量z 2相关性的信息,但也可能由于x 2与x1的相关性造 成。
为此,应该使用滤去x1影响的“偏R 2”(partial R 2) 记为R 2 p
具体操作步骤如下:首先作x 2 对x1回归,
OLS x 2 x1,记其残差为e x 2,代表x 2中不能由x1解
一、工具变量法(Instrumental Variable,IV)
可以引入工具变量w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即 Cov w t,p t 0,p t为内生解释变量 (2)外生性:工具变量与扰动项不相关,即 Cov w t, t =0
第七章 工具变量、2SLS、 GMM
OLS估计成为一致估计量的前提是解释变量与扰动 项不相关(即前定变量假设),否则,无论样本容 量多大,OLS估计量也不会收敛到参数真值,这将 难以接受。解决方法之一是本章介绍的工具变量法
复习第三章p34-p38
违背前定变量假设可以出现在联立方程中,比如 C t= 0+1Yt+ t ,Yt、C t、I t、X t 分别表示GDP、 Yt=C t+I t+X t 消费、投资、净出口。将第一个方程代入第二个
记解释变量向量x i x i1 x i,k-1 x ik ,则原模型为 yi=x + i i 记工具变量向量为 z i z i1 z i,k-1 z ik x i1 x i,k-1 w i 。
定义g i zi i。由于工具向量与扰动项正交,故 E g i =E z i i =0为总体矩条件或正交条件
2 2
用对应的样本矩来替代总体矩条件可得以下联立 方程组,求解后即得到期望与方差的矩估计:
1 n ˆ ˆ =x n x i= i=1 2 1 n 2 n ˆ = x i-x 1 2 2 2 ˆ ˆ x i = + n i=1 n i=1 1 n 其中,x= x i为样本均值,上面推导中用到: n i=1
ˆ ˆ 注意,第二阶段回归所得到的残差为e 2 y-X 2SLS ˆ 而原方程的残差却是e y-X (这是正确的)
2SLS
ˆ 由于 IV的表达式在形式上完全类似于OLS估计量 ˆ 故在条件同方差的假设下, 的协方差矩阵估计量
IV
ˆ 2 ˆ ˆ 为Var IV =s XX
2SLS
= XZ ZZ ZX
-1
-1
XZ ZZ Zy
-1
四、有关工具变量的检验
在使用工具变量法时,必须对工具变量的有效性 进行检验。如果工具变量非有效,则可能导致估 计不一致,或估计量的方差过大。
1、检验工具变量与解释变量的相关性
如果工具变量z与内生解释变量x完全不相关,则 无法使用工具变量法,因为E z i x 不可逆。如果 i z与x仅仅微弱相关,则可认为 E z i x i
即x i到Z上的投影 ˆ (相当于y对X求回归拟合值y=Py,即y到X上的投影) 其中,P Z ZZ Z为Z的投影矩阵。写成矩阵形式
-1
ˆ ˆ ˆ ˆ X x1 x 2 x k =P x1 x 2 x k =PX ZZ -1 ZX =Z
IV
于大样本理论的统计推断失效
判断弱工具变量的方法主要有两种。
方法之一为使用“偏R 2”。假设回归模型为 y=x11+x 2 2+,其中只有x 2为内生解释变量,x1 z 2为方程外的工具变量。在2SLS的第一阶段回归中 x 2 x1,z 2,其R 包含了内生变量x 2与工具变
ˆ = E z x -1 S E z x -1 中渐近方差矩阵AVar IV i i i i 用到 E z i x 为对称矩阵 i
-1
秩条件r E z i x =k意味着工具变量w i与内生解释 i 变量x i 相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数 2 恰好识别:工具变量个数等于内生解释变量个数 3 过度识别:工具变量个数多于内生解释变量个数
以上介绍的工具变量法仅适用于恰好识别的情况。 在过度识别的情况下,ZX不是方阵,ZX 不存在
以样本矩代替上式中的总体矩,即可得到工具变 量估计量: 1 1 n -1 ˆ = IV z i x z i yi = ZX Zy i n i=1 n i=1
n -1
其中,Z z1 z n-1 z n 即Z z1 z n-1 z n
下面是工具变量法的大样本性质:
定理:若秩条件r E zi x =k成立(方阵E zi x 满 i i ˆ 秩),则在一定的正则条件下, IV是的一致估计 ˆ 且 服从渐近正态分布
IV
ˆ -= ZX -1 Zy- 证明:抽样误差 IV
= ZX Z X+ -= ZX Z
工具变量 z1, ,z L 作OLS回归,其中
第一阶段:将每个解释变量x1, ,x k 分别对所有L个 x i x1i x ni n1 ,i=1, ,k(注意,不同于第二章 对第i个观测数据x i的定义)。相当于将x i 视作被解释 ˆ ˆ 变量。得到拟合值x1=Px1,x 2=Px 2, ,x k=Px k ˆ
与第三章大样本最小二乘法类似的假定和推导,
d 可以证明,ng N 0,S ,
其中S E g i g =E i2 z i z i i
ˆ 进一步,工具变量估计量 IV 渐近服从正态分布,即
d ˆ ˆ n IV- =S-1 ng N 0,AVar IV ,其 ZX
-1 -1
1 1 n p z i i =S-1 g = zi x i ZX n i=1 n i=1
n
-1
E zi x E g i =0 i
-1 =0
其中SZX
1 n 1 n zi x ,g z i i i n i=1 n i=1
-1
ee ,其中,s n-k
2
在存在异方差的情况下,则应使用稳健的协方差矩 ˆ ˆ ˆ 阵估计量,即Var IV = XX
-1
n 2 ˆ ˆ ˆ ˆi ei x i x XX i=1
Baidu Nhomakorabea-1
ˆ ˆ =Z ZZ -1 ZX(或将P Z ZZ -1 Z)代入 的 将X IV 公式,可得2SLS的最终表达式: ˆ = XPX -1 XPy
-1
E x i yi-x =0 i
= E x i x E x i yi (假设E x i x 可逆) i i
以样本矩替代上式中的总体矩,即可得到矩估计: 1 1 n -1 ˆ = ˆ MM x i x x i yi = XX Xy=OLS i n i=1 n i=1 显然这就是OLS估计量
-1 -1 -1
很大,导
ˆ 致工具变量法估计量的渐近方差AVar IV = E z i x S E z i x 非常之大。直观上看,由 i i 于z中仅包含很少与x有关的信息,利用这部分信息 进行的工具变量法估计就不准确,即使样本容量很 大也很难收敛到真实的参数值。这种工具变量称为 ˆ 弱工具变量,将使 的小样本性质变得很差,且基
x -x = x -nx
2 i 2 i i=1 i=1
n
n
2
任何随机向量x的函数f x 的期望E f x 都被称为 总体矩。事实上,OLS也是一种矩估计。利用解释 变量与扰动项的正交性,可以得到以下总体矩条件
E x i i =0
E x i yi =E x i x i
E z i yi-x =0 i
-1
由此可得E zi i =0
-1
E z i y i = E z i x i = E z i x E z i yi (假定 E z i x 存在) i i
-1
ˆ 无法得到工具变量估计量 IV。
若扔掉多余的工具变量将会浪费有用的信息,有效 的方法是二阶段最小二乘法
三、二阶段最小二乘法
显然,多个工具变量的线性组合仍然是工具变量 因为仍满足工具变量的两个条件(相关性与外生性) 如果生成工具变量的k个线性组合,则又回到恰好 识别的情形。那么什么样的线性组合才是最有效率 的呢?可以证明在球形扰动项的假设下,由二阶段 最小二乘法(2SLS)所提供的工具变量线性组合是 所有线性组合中最渐近有效的。这个结论类似于小 样本理论中的高斯-马尔可夫定理。