第七章-工具变量、2SLS、GMM

合集下载

计量经济学-工具变量

利用E(zii)=0，在大样本下可得到：
~1
zi yi zi xi
关于0 的估计，仍用~0 Y ~1X 完成。
这种求模型参数估计量的方法称为工具变量法(instrumental variable method)，相应的估计量称为工具变量法估计量（ instrumental variable (IV) estimator）。
CONSP 0 1GDPP 由于：居民人均消费支出（CONSP）与人均国内生产总值（GDPP）相互影响，因此，
容易判断GDPP与同期相关（往往是正相关），OLS估计量有偏并且是非一致的
（低估截距项而高估计斜率项）。
OLS估计结果：
(13.51) (53.47) R2=0.9927 F=2859.23 DW=0.5503 SSR=23240.7
用OLS估计模型，相当于用xi去乘模型两边、对i求和、再略去xii项后得到正规方程：
xi yi 1 xi2
解得:
ˆ1
xi yi xi2
(*)
由于Cov(Xi,i)=E(Xii)=0，意味着大样本下: (xii)/n0
表明大样本下:
ˆ1
xi yi xi2
2. 工具变量并没有替代模型中的解释变量，只是在估计过程中作为“工具”被使用。
上述工具变量法估计过程可等价地分解成下面的两步OLS回归：
第一步，用OLS法进行X关于工具变量Z的回归：
Xˆ i ˆ0 ˆ1Zi
Yˆi ~0 ~1 Xˆ i
容易验证仍有:
~1
zi yi zi xi
如果用GDPPt-1为工具变量，可得如下工具变量法估计结果：

工具变量(IV)：估计与检验

用到 i E zi x 为对称矩阵
－1
秩条件r i E zi x ＝k意味着工具变量w i与内生解释变量x i相关，若不相关，则秩条件无法满足。证略
阶条件：zi中至少包含k个变量根据是否满足阶条件可分为三种情况：
1 不可识别：工具变量个数少于内生解释变量个数 2 恰好识别：工具变量个数等于内生解释变量个数 3 过度识别：工具变量个数多于内生解释变量个数
解释变量内生性检验
Hausman 检验
寻找工具变量的方法：几个实例
方法例子
由来
经典假设所有的解释变量Xi与随机误差项彼此之间不相关。
Cov (u i , X i ) 0
若解释变量Xi和ui相关，则OLS估计量是非一致的，也就是即使当样本容量很大时，OLS估计量也不会接近回归系数的真值。造成误差项与回归变量相关（内生性）的原因很多，但我们主要考虑如下几个方面： • 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
1、矩估计（Method of Moments，MM）
首先以一个例子来说明矩估计方法：假设随机变量 x N ， 2 ，其中， 2为待估参数。因为有两个待估参数，故需要使用以下两个总体矩条件：一阶中心矩：E x ＝
2 2 二阶中心矩：E x ＝Var x ＋ E x ＝＋ 2 2
可以引入工具变量w t 来解决内生变量问题。一个有效的工具变量应满足以下两个条件：（1）相关性：工具变量与内生解释变量相关，即 Cov w t，p t 0，p t为内生解释变量（2）外生性：工具变量与扰动项不相关，即 Cov w t， t ＝0
二、工具变量法作为一种矩估计

第10 章工具变量,2SLS 与GMM

26
量与工具变量）进行以下辅助回归，
ei, IV
=
γ 1
xi1
+"+
γ x K−r i, K−r
+
δ 1
zi1
+
"
+
δ m
zim
+ errori
(10.21)
记此辅助回归的可绝系数为 R2 ，则 Sargan 统计量为，
nR2 ⎯d⎯→ χ2 (m − r) (10.22)
3．究竟该用 OLS 还是 IV：对解释变量内生性的检验 “豪斯曼检验”（Hausman specification test）的原假设为 “ H0 ：所有解释变量均为外生变量”。如果 H0 成立，则
25
然估计法”。
2．检验工具变量的外生性不失一般性，假设前 (K − r) 个解释变量{x1, ", xK−r } 为外生解
释变量，而后 r 个解释变量 {xK−r+1, ", xK }为内生解释变量。
假设共有 m 个方程外的工具变量{z1, ", zm}，其中 m > r 。
把工具变量法的残差对所有外生变量（即所有外生解释变
= C o v (x * , ε
) − β C o v (x * , u
) + C o v(u , ε
) − β Cov(u, u)
=0
=0
=0
= −β Var(u) ≠ 0
(10.12)
故对方程(10.11)进行 OLS 估计是不一致的，这被称为“测
量误差偏差”。
12
10.2 工具量法作为一种矩估计
3
⎧⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎩

2SLS 和 GMM 的区别

Walter Sosa-Escudero
Instrumental Variables
Endogeneities IV under Exact Identiﬁcation IV: the Overidentiﬁed Case Eﬃcient GMM Conditional Homoskedasticity and 2SLS
Simultaneous Equations The simplest supply and s qi qd i s qi In equilibrium:
s d −1 d d s pi = (β2 − β2 ) (xi β1 − xs i β1 + d i
demand system:
s s = xs i β1 + β2 pi + d d dp + = xi β 1 + β 2 i d = qi s i d i
Endogeneities IV under Exact Identiﬁcation IV: the Overidentiﬁed Case Eﬃcient GMM Conditional Homoskedasticity and 2SLS
Instrumental Variables
Walter Sosa-Escudero
Explanatory variable measured with error Ci = β1 + β2 Xi∗ + ui and assume all assumptions for consistency hold. Now suppose we observe a ‘noisy’ version of Xi : Xi = Xi∗ + ωi ωi is a measurement error. We will assume ωi is iid, with 2 and uncorrelated with X ∗ and u . E (ωi ) = 0, V (ωi ) = σω i i Replacing Xi∗ = Xi − ωi , the regression model can be written as Ci = β1 + β2 Xi + νi with ν = −β2 ωi + ui

工具变量法（二）：弱工具变量

工具变量法（二）：弱工具变量世上没有完美的计量方法，因为所有的计量方法与模型均依赖于一定的前提假设。

因此，在估计完计量模型后，通常需要对模型的前提假设进行检验，称为“诊断性检验”（diagnostic checking）或“模型检验”（model checking）。

工具变量法也不例外。

工具变量法的成立依赖于有效的工具变量（valid instruments），即所使用的工具变量须满足相关性（与内生解释变量相关）与外生性（与扰动项不相关）。

工具变量的相关性（Instrument Relevance）在大样本下，2SLS为一致估计。

但对于大多数实践中的有限样本（finite sample），2SLS估计量依然存在偏差（bias），并不以真实参数为其分布的中心，即而且，如果工具变量与内生变量的相关性较弱，则 2SLS 的偏差会变得更为严重。

直观来看，2SLS 的基本思想是通过外生的工具变量，从内生变量中分离出一部分外生变动（exogenous variations），以获得一致估计。

如果工具变量与内生变量的相关性很弱，则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。

因此，利用这些少量信息进行的工具变量法估计就不准确，即使样本容量很大也很难收敛到真实的参数值。

这种工具变量称为“弱工具变量”（weak instruments）。

弱工具变量的后果弱工具变量的后果类似于样本容量过小，会导致 2SLS 的小样本性质变得很差，而 2SLS 的大样本分布也可能离正态分布相去甚远，致使基于大样本理论的统计推断失效。

下面通过蒙特卡洛模拟（Monte Carlo simulation）来直观地考察弱工具变量的后果。

考虑最简单的一元回归模型，假设其数据生成过程（data generating process）为：其中，为内生变量，与扰动项相关；而的真实系数为 2。

假设样本容量为10,000，并使用工具变量进行2SLS 回归。

2sls原理

2sls原理2sls原理解析1. 什么是2sls原理2sls（Two Stage Least Squares）是一种用于解决内生性问题的统计方法。

它通过两个阶段的回归来解决内生性引起的估计偏误问题。

2. 内生性问题内生性是指研究对象之间的关系使得同一方程中的一个变量可能同时被其他变量影响。

在经济学研究中，内生性是非常常见的问题，特别是当我们试图通过回归分析来确定因果效应时。

例如，我们想要研究教育对工资的影响，但我们发现教育水平与个体的家庭背景也存在相关性。

这个相关性可能存在因果关系，即教育决定了个体的家庭背景，也可能存在相反的因果关系，即个体的家庭背景决定了他们的教育水平。

在这种情况下，我们无法准确估计教育对工资的真实影响，因为我们无法将教育与家庭背景的影响区分开来。

3. 第一阶段回归为了解决内生性问题，2sls方法首先进行第一阶段回归。

在第一阶段，我们选择一个外生变量（Instrumental Variable，IV）来替代内生变量，该外生变量与内生变量相关但不与因变量相关。

继续上述的例子，我们可以选择政府实施的教育政策作为我们的外生变量。

政府实施教育政策可能会影响到个体的教育水平，但与个体的家庭背景无关。

我们将家庭背景作为内生变量，使用政府实施的教育政策作为工具变量。

我们先对教育水平与政府实施的教育政策进行回归分析，得到第一阶段的回归系数。

该回归系数代表了教育水平对政府实施的教育政策的影响程度。

4. 第二阶段回归在第一阶段回归得到的第一阶段系数为有效的工具变量后，我们进一步进行第二阶段回归分析。

第二阶段回归分析的目标是估计教育对工资的真实影响，而不受内生性的偏误影响。

我们将工资与个体的教育水平以及其他外生变量进行回归，使用第一阶段得到的有效工具变量作为教育水平的替代。

这样，第二阶段回归的系数代表了教育对工资的真实影响。

5. 2sls的优点与局限性2sls方法可以有效地解决内生性问题，从而得到更准确的因果效应估计。

工具变量法2SLS与GMM

工具变量法2SLS与GMM1第 10 章工具变量，2SLS 与 GMM10.1 解释变量与扰动项相关的例子例农产品市场均衡模型q d = α + α p + u (需求)t 0 1 t t ? q s = β + β p + v(供给) t ? q d 0 1 t t = q s(均衡)tt令q ≡q d=q s，可得t t tq t =α0+α1 p t +u tq =β+βp +vt 0 1 t t两个方程中的被解释变量与解释变量完全一样。

如直接作回归q ?O?LS?→p，估计的是需求函数还是供给函数？t t2图10.1 需求与供给决定市场均衡341 1 1 11 1把线性方程组中的( p t , q t )看成是未知数(内生变量)，把(u t , v t ) 看作已知，可求解( p t , q t )为(u t , v t ) 的函数：p = p (u ,v ) = β0 - α0 + v t - u t ? t t t t α - β α - β ? 1 1 1 1 ?q = q (u ,v ) = α1β0 - α0 β1 + α1v t - β1u t ?? t t t t α - β α - β由于 p t 为(u t , v t ) 的函数，故Cov( p t , u t ) ≠ 0，Cov( p t , v t ) ≠ 0。

OLS 估计值α?1, β? 不是α , β 的一致估计量。

称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量偏差”(endogen eity bias)。

1如能将内生变量分成两部分，一部分与扰动项相关，另一部分与扰动项不相关，可用与扰动项不相关的那部分得到一致估计。

这种分离常借助另一“工具变量”来实现。

假设在图10.1 中，存在某个因素(变量)使得供给曲线经常移动，而需求曲线基本不动，则可估计需求曲线，参见图10.2。

这个使得供给曲线移动的变量就是工具变量。

计量经济学工具变量IV (2SLS)

In other words, it is a variable subject to simultaneous causality.
However, this definition is narrow and IV regression can be used to address OV bias and errors-in-variable bias, not just to simultaneous causality bias.
3. errors-in-variables bias (X is measured with error)(变量误差)
Instrumental variables regression can eliminate bias from these three sources.
Terminology: endogeneity and exogeneity
Y2i = 0 + 1Y1i+2X2i + u2i
(2)
Lets see why Y2 (or Y1) is endogenous
Suppose u1i >0 and u2i =0, then we have Y1i >E(Y1i) from (1)
But in (2), if 2≠0, this will cause a change in Y2i , so Y2i
1. omitted variable bias from a variable that is correlated with X but is unobserved, so cannot be included in the regression;(遗留变量偏差)
2. simultaneous causality bias (X causes Y, Y causes X);(联立因果)

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

为外生解释变量向量。记工具变量为 x1 z2 ，其中
z2为方程外的工具变量。在2SLS的第一阶段回归中
x2
OLS
x1，z
2，其R
2包含了内生变量x
与工具变
2
量z 2相关性的信息，但也可能由于x 2与x1的相关性造
成。
为此，应该使用滤去x1影响的“偏R2”（partial R2）
记为R
2 p
具体操作步骤如下：首先作x2对x1回归，
x2
OLS
x1，记其残差为e
x
，代表x
2
2中不能由x1解
释的部分；其次，作z2对x1回归，z2 OLS x1，记
其残差为ez2，代表z2中不能由x1解释的部分；最后
对两个残差进行回归，即ex2
OLS
e
，所得的判
z2
定系数即R
2p，若其较小即可认为z
是弱工具变量
2
判断弱工具变量的另一个方法是，在第一阶段回
一、工具变量法（Instrumental Variable，IV）
可以引入工具变量w
来解决内生变量问题。一个有
t
效的工具变量应满足以下两个条件：
（1）相关性：工具变量与内生解释变量相关，即
Cov
w
t，p
t
0，p
为内生解释变量
t
（2）外生性：工具变量与扰动项不相关，即
Cov wt，t ＝0
二、工具变量法作为一种矩估计
n i=1
xi yi ＝
XX
－1 Xy＝ˆOLS
显然这就是OLS估计量
2、工具变量法作为一种矩估计
假设回归模型为
yi＝1x
＋
i1
＋k-1x
＋ i，k-1
k
x
ik＋
i
假设只有最后一个解释变量xik为内生变量，即
Cov xik，i 0，因此OLS是不一致的。
假设有一个有效工具变量w满足Cov xik，wi 0
能成立是由于Xˆ Xˆ ＝PX PX＝XPPX＝XPX
＝PX X＝Xˆ X，其中，投影矩阵P为对称幂等矩阵
即P＝P，P2＝P。因此，可以将ˆIV视为把y对Xˆ 进行
OLS回归而得到，故名“二阶段最小二乘法”
注意，第二阶段回归所得到的残差为e2 y－Xˆ ˆ2SLS 而原方程的残差却是e y－Xˆ2SL（S 这是正确的）
消费、投资、净出口。将第一个方程代入第二个
方程，经整理可得Yt＝1－11 0＋It＋Xt ＋1－ t1
可见Yt与 t 相关，因此当单独对Ct＝ 0＋1Yt＋ t
进行OLS估计时会碰到解释变量与扰动项相关的情况
违背解释变量外生性假定也可以出现在滞后被解释变量作为模型解释变量的情况。例如，消费不仅受收入的影响，还要受到前期消费水平的影响；投资不仅受GDP的影响，也要受前期投资水平的影响。当存在扰动项序列相关时，就会造成解释变量与扰动项相关的情况
变量与扰动项的正交性，可以得到以下总体矩条件
Exii ＝0 E xi yi－xi ＝0
E xiyi ＝E xixi ＝E xixi －1 E xiyi （假设E xixi 可逆）
以样本矩替代上式中的总体矩，即可得到矩估计：
ˆMM＝
1 n
n i=1
xi
xi
－1
1 n
量估计量：
ˆIV＝
1 n
n i=1
zi xi
－1
1 n
n zi yi ＝
i=1
ZX
－1 Zy
其中，Z z1 zn-1 zn 即Z z1 zn-1 zn
下面是工具变量法的大样本性质：
定理：若秩条件r E zixi ＝k成立（方阵E zixi 满
秩），则在一定的正则条件下，ˆIV是的一致估计且ˆIV服从渐近正态分布
其中，P Z ZZ－1 Z为Z的投影矩阵。写成矩阵形式
Xˆ xˆ1 xˆ 2 xˆ k ＝P x1 x2 xk ＝PX
＝Z
ZZ
－1
ZX
第二阶段：由于Xˆ 是z1，，zL的线性组合（参见
第一阶段回归），故Xˆ 恰好包含k个工具变量。使用
Xˆ 为工具变量对原模型y＝X＋进行工具变量法估
计： ˆIV＝ Xˆ X －1 Xˆ y＝ Xˆ Xˆ －1 Xˆ y 后一个等号
秩条件r
E
zi
xi
＝k意味着工具变量w
与内生解释
i
变量xi相关，若不相关，则秩条件无法满足。证略
阶条为三种情况：
1 不可识别：工具变量个数少于内生解释变量个数
2 恰好识别：工具变量个数等于内生解释变量个数
3 过度识别：工具变量个数多于内生解释变量个数
1、检验工具变量与解释变量的相关性
如果工具变量z与内生解释变量x完全不相关，则
无法使用工具变量法，因为E zixi 不可逆。如果 z与x仅仅微弱相关，则可认为E zixi －1 很大，导
致工具变量法估计量的渐近方差AVar ˆIV ＝
E zixi －1 S E zixi －1 非常之大。直观上看，由
1 n
1 n
n i=1
xi＝ˆ
n
xi2＝ˆ 2＋ˆ 2
i=1
ˆ＝x
ˆ
2＝
1 n
n i=1
xi－x 2
其中，x＝ 1 n
n i=1
x
为样本均值，上面推导中用到：
i
n
n
xi－x 2＝ xi2－nx2
i=1
i=1
任何随机向量x的函数f x的期望E f x 都被称为
总体矩。事实上，OLS也是一种矩估计。利用解释
第七章工具变量、2SLS、 GMM
OLS估计成为一致估计量的前提是解释变量与扰动项不相关（即前定变量假设），否则，无论样本容量多大，OLS估计量也不会收敛到参数真值，这将难以接受。解决方法之一是本章介绍的工具变量法
复习第三章p34－p38
违背前定变量假设可以出现在联立方程中，比如
CYt＝t＝C0＋t＋I1tY＋t＋Xt t ，Yt、Ct、It、Xt分别表示GDP、
第一阶段：将每个解释变量x1，，xk分别对所有L个
工具变量z1，，zL作OLS回归，其中
xi x1i
x ni
n1
，i＝1，
，k（注意，不同于第二章
对第i个观测数据x
i的定义）。相当于将x
视作被解释
i
变量。得到拟合值xˆ 1＝Px1，xˆ
2＝Px
，
2
，xˆ k＝Pxk
即xi到Z上的投影
（相当于y对X求回归拟合值yˆ ＝Py，即y到X上的投影）
于z中仅包含很少与x有关的信息，利用这部分信息进行的工具变量法估计就不准确，即使样本容量很
大也很难收敛到真实的参数值。这种工具变量称为
弱工具变量，将使ˆIV的小样本性质变得很差，且基
于大样本理论的统计推断失效
判断弱工具变量的方法主要有两种。
方法之一为使用“偏R 2”。假设回归模型为
y＝x1 1＋x 2 2＋，其中只有x 2为内生解释变量，x1
可以证明，ng d N 0，S，
其中S E gigi ＝E i2zizi
进一步，工具变量估计量ˆIV渐近服从正态分布，即
n ˆIV－＝S－ZX1 ng d N 0，AVar ˆIV ，其
中渐近方差矩阵AVar
ˆIV
＝
E
zi
xi
－1
S
E
zi
xi
－1
用到 E zixi －1 为对称矩阵
2、检验工具变量的外生性
在恰好识别的情况下，目前公认无法检验工具变量是否与扰动项相关。在这种情况下，只能进行定性讨论或参考专家的意见。
在过度识别的情况下，则可进行过度识别检验，即
检验原假设“H
：所有工具变量都是外生的”。如
0
果拒绝该原假设，则认为至少某个工具变量不是外
生的，与扰动项相关。
假设前k-r个解释变量x1，，xk-r为外生解释变量而后r个解释变量x ， k-r＋1 ，xk为内生解释变量。假设共有m个方程外的工具变量z1，，zm，其中m>r
归中，x2＝x11＋z2 2＋error，检验原假设 H0： 2＝0
一个经验规则是，如果此检验的F统计量大于10，则可拒绝“存在弱工具变量”的原假设，从而不必担心弱工具变量问题。在多个内生解释变量的情况下，将有多个如此的第一阶段回归和F统计量
解决弱工具变量问题的方法是寻找更强的工具变量或若有较多工具变量，可舍弃弱工具变量
以上介绍的工具变量法仅适用于恰好识别的情况。
在过度识别的情况下，ZX不是方阵， ZX－1 不存在
无法得到工具变量估计量ˆIV。
若扔掉多余的工具变量将会浪费有用的信息，有效的方法是二阶段最小二乘法
三、二阶段最小二乘法
显然，多个工具变量的线性组合仍然是工具变量因为仍满足工具变量的两个条件（相关性与外生性）如果生成工具变量的k个线性组合，则又回到恰好识别的情形。那么什么样的线性组合才是最有效率的呢？可以证明在球形扰动项的假设下，由二阶段最小二乘法（2SLS）所提供的工具变量线性组合是所有线性组合中最渐近有效的。这个结论类似于小样本理论中的高斯－马尔可夫定理。
把工具变量法的残差对所有外生变量（即所有外生
解释变量与工具变量）进行以下辅助回归：
ei,IV＝
1x
＋
i1
＋ k-r xi,k-r＋1zi1＋
＋ m zim＋errori
将工具变量法的残差ei,IV视为对扰动项的估计，则
“扰动项与工具变量z1，，zm无关”的原假设可
以写为“H0：1＝
＝
＝0?
m