第七章-工具变量、2SLS、GMM

合集下载

计量经济学-工具变量

计量经济学-工具变量

利用E(zii)=0,在大样本下可得到:
~1
zi yi zi xi
关于0 的估计,仍用~0 Y ~1X 完成。
这种求模型参数估计量的方法称为工具变 量法(instrumental variable method),相应的估 计 量 称 为 工 具 变 量 法 估 计 量 ( instrumental variable (IV) estimator)。
CONSP 0 1GDPP 由于:居民人均消费支出(CONSP)与人 均国内生产总值(GDPP)相互影响,因此,
容易判断GDPP与同期相关(往往是 正相关),OLS估计量有偏并且是非一致的
(低估截距项而高估计斜率项 )。
OLS估计结果:
(13.51) (53.47) R2=0.9927 F=2859.23 DW=0.5503 SSR=23240.7
用OLS估计模型,相当于用xi去乘模型两边、对i求 和、再略去xii项后得到正规方程:
xi yi 1 xi2
解得:
ˆ1
xi yi xi2
(*)
由于Cov(Xi,i)=E(Xii)=0,意味着大样本下: (xii)/n0
表明大样本下:
ˆ1
xi yi xi2
2. 工具变量并没有替代模型中的解释变量, 只是在估计过程中作为“工具”被使用。
上述工具变量法估计过程可等价地分解成下 面的两步OLS回归:
第一步,用OLS法进行X关于工具变量Z的回归:
Xˆ i ˆ0 ˆ1Zi
Yˆi ~0 ~1 Xˆ i
容易验证仍有:
~1
zi yi zi xi
如果用GDPPt-1为工具变量,可得如下工具 变量法估计结果:

工具变量(IV):估计与检验

工具变量(IV):估计与检验



用到 i E zi x 为对称矩阵
-1
秩条件r i E zi x =k意味着工具变量w i与内生解释 变量x i相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数 2 恰好识别:工具变量个数等于内生解释变量个数 3 过度识别:工具变量个数多于内生解释变量个数
解释变量内生性检验
Hausman 检验
寻找工具变量的方法:几个实例
方法 例子
由来
经典假设 所有的解释变量Xi与随机误差项彼此 之间不相关。
Cov (u i , X i ) 0
若解释变量Xi和ui相关,则OLS估计量是非一致 的,也就是即使当样本容量很大时,OLS估计量 也不会接近回归系数的真值。 造成误差项与回归变量相关(内生性)的原因 很多,但我们主要考虑如下几个方面: • 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
1、矩估计(Method of Moments,MM)
首先以一个例子来说明矩估计方法:假设随机变量 x N , 2 ,其中, 2为待估参数。因为有两 个待估参数,故需要使用以下两个总体矩条件: 一阶中心矩:E x =
2 2 二阶中心矩:E x =Var x + E x = + 2 2
可以引入工具变量w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即 Cov w t,p t 0,p t为内生解释变量 (2)外生性:工具变量与扰动项不相关,即 Cov w t, t =0
二、工具变量法作为一种矩估计

第10 章 工具变量,2SLS 与GMM

第10 章 工具变量,2SLS 与GMM
26
量与工具变量)进行以下辅助回归,
ei, IV
=
γ 1
xi1
+"+
γ x K−r i, K−r
+
δ 1
zi1
+
"
+
δ m
zim
+ errori
(10.21)
记此辅助回归的可绝系数为 R2 ,则 Sargan 统计量为,
nR2 ⎯d⎯→ χ2 (m − r) (10.22)
3.究竟该用 OLS 还是 IV:对解释变量内生性的检验 “豪斯曼检验”(Hausman specification test)的原假设为 “ H0 :所有解释变量均为外生变量”。如果 H0 成立,则
25
然估计法”。
2.检验工具变量的外生性 不失一般性,假设前 (K − r) 个解释变量{x1, ", xK−r } 为外生解
释变量,而后 r 个解释变量 {xK−r+1, ", xK }为内生解释变量。
假设共有 m 个方程外的工具变量{z1, ", zm},其中 m > r 。
把工具变量法的残差对所有外生变量(即所有外生解释变
= C o v (x * , ε
) − β C o v (x * , u
) + C o v(u , ε
) − β Cov(u, u)
=0
=0
=0
= −β Var(u) ≠ 0
(10.12)
故对方程(10.11)进行 OLS 估计是不一致的,这被称为“测
量误差偏差”。
12
10.2 工具量法作为一种矩估计
3
⎧⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎩

2SLS 和 GMM 的区别

2SLS 和 GMM 的区别

Walter Sosa-Escudero
Instrumental Variables
Endogeneities IV under Exact Identification IV: the Overidentified Case Efficient GMM Conditional Homoskedasticity and 2SLS
Simultaneous Equations The simplest supply and s qi qd i s qi In equilibrium:
s d −1 d d s pi = (β2 − β2 ) (xi β1 − xs i β1 + d i
demand system:
s s = xs i β1 + β2 pi + d d dp + = xi β 1 + β 2 i d = qi s i d i
Endogeneities IV under Exact Identification IV: the Overidentified Case Efficient GMM Conditional Homoskedasticity and 2SLS
Instrumental Variables
Walter Sosa-Escudero
Explanatory variable measured with error Ci = β1 + β2 Xi∗ + ui and assume all assumptions for consistency hold. Now suppose we observe a ‘noisy’ version of Xi : Xi = Xi∗ + ωi ωi is a measurement error. We will assume ωi is iid, with 2 and uncorrelated with X ∗ and u . E (ωi ) = 0, V (ωi ) = σω i i Replacing Xi∗ = Xi − ωi , the regression model can be written as Ci = β1 + β2 Xi + νi with ν = −β2 ωi + ui

工具变量法(二):弱工具变量

工具变量法(二):弱工具变量

工具变量法(二):弱工具变量世上没有完美的计量方法,因为所有的计量方法与模型均依赖于一定的前提假设。

因此,在估计完计量模型后,通常需要对模型的前提假设进行检验,称为“诊断性检验”(diagnostic checking)或“模型检验”(model checking)。

工具变量法也不例外。

工具变量法的成立依赖于有效的工具变量(valid instruments),即所使用的工具变量须满足相关性(与内生解释变量相关)与外生性(与扰动项不相关)。

工具变量的相关性(Instrument Relevance)在大样本下,2SLS为一致估计。

但对于大多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中心,即而且,如果工具变量与内生变量的相关性较弱,则 2SLS 的偏差会变得更为严重。

直观来看,2SLS 的基本思想是通过外生的工具变量,从内生变量中分离出一部分外生变动(exogenous variations),以获得一致估计。

如果工具变量与内生变量的相关性很弱,则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。

因此,利用这些少量信息进行的工具变量法估计就不准确,即使样本容量很大也很难收敛到真实的参数值。

这种工具变量称为“弱工具变量”(weak instruments)。

弱工具变量的后果弱工具变量的后果类似于样本容量过小,会导致 2SLS 的小样本性质变得很差,而 2SLS 的大样本分布也可能离正态分布相去甚远,致使基于大样本理论的统计推断失效。

下面通过蒙特卡洛模拟(Monte Carlo simulation)来直观地考察弱工具变量的后果。

考虑最简单的一元回归模型,假设其数据生成过程(data generating process)为:其中,为内生变量,与扰动项相关;而的真实系数为 2。

假设样本容量为10,000,并使用工具变量进行2SLS 回归。

2sls原理

2sls原理

2sls原理2sls原理解析1. 什么是2sls原理2sls(Two Stage Least Squares)是一种用于解决内生性问题的统计方法。

它通过两个阶段的回归来解决内生性引起的估计偏误问题。

2. 内生性问题内生性是指研究对象之间的关系使得同一方程中的一个变量可能同时被其他变量影响。

在经济学研究中,内生性是非常常见的问题,特别是当我们试图通过回归分析来确定因果效应时。

例如,我们想要研究教育对工资的影响,但我们发现教育水平与个体的家庭背景也存在相关性。

这个相关性可能存在因果关系,即教育决定了个体的家庭背景,也可能存在相反的因果关系,即个体的家庭背景决定了他们的教育水平。

在这种情况下,我们无法准确估计教育对工资的真实影响,因为我们无法将教育与家庭背景的影响区分开来。

3. 第一阶段回归为了解决内生性问题,2sls方法首先进行第一阶段回归。

在第一阶段,我们选择一个外生变量(Instrumental Variable,IV)来替代内生变量,该外生变量与内生变量相关但不与因变量相关。

继续上述的例子,我们可以选择政府实施的教育政策作为我们的外生变量。

政府实施教育政策可能会影响到个体的教育水平,但与个体的家庭背景无关。

我们将家庭背景作为内生变量,使用政府实施的教育政策作为工具变量。

我们先对教育水平与政府实施的教育政策进行回归分析,得到第一阶段的回归系数。

该回归系数代表了教育水平对政府实施的教育政策的影响程度。

4. 第二阶段回归在第一阶段回归得到的第一阶段系数为有效的工具变量后,我们进一步进行第二阶段回归分析。

第二阶段回归分析的目标是估计教育对工资的真实影响,而不受内生性的偏误影响。

我们将工资与个体的教育水平以及其他外生变量进行回归,使用第一阶段得到的有效工具变量作为教育水平的替代。

这样,第二阶段回归的系数代表了教育对工资的真实影响。

5. 2sls的优点与局限性2sls方法可以有效地解决内生性问题,从而得到更准确的因果效应估计。

工具变量法2SLS与GMM

工具变量法2SLS与GMM

工具变量法2SLS与GMM1第 10 章工具变量,2SLS 与 GMM10.1 解释变量与扰动项相关的例子例农产品市场均衡模型q d = α + α p + u (需求)t 0 1 t t ? q s = β + β p + v(供给) t ? q d 0 1 t t = q s(均衡)tt令q ≡q d=q s,可得t t tq t =α0+α1 p t +u tq =β+βp +vt 0 1 t t两个方程中的被解释变量与解释变量完全一样。

如直接作回归q ?O?LS?→p,估计的是需求函数还是供给函数?t t2图10.1 需求与供给决定市场均衡341 1 1 11 1把线性方程组中的( p t , q t )看成是未知数(内生变量),把(u t , v t ) 看作已知,可求解( p t , q t )为(u t , v t ) 的函数:p = p (u ,v ) = β0 - α0 + v t - u t ? t t t t α - β α - β ? 1 1 1 1 ?q = q (u ,v ) = α1β0 - α0 β1 + α1v t - β1u t ?? t t t t α - β α - β由于 p t 为(u t , v t ) 的函数,故Cov( p t , u t ) ≠ 0,Cov( p t , v t ) ≠ 0。

OLS 估计值α?1, β? 不是α , β 的一致估计量。

称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量偏差”(endogen eity bias)。

1如能将内生变量分成两部分,一部分与扰动项相关,另一部分与扰动项不相关,可用与扰动项不相关的那部分得到一致估计。

这种分离常借助另一“工具变量”来实现。

假设在图10.1 中,存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动,则可估计需求曲线,参见图10.2。

这个使得供给曲线移动的变量就是工具变量。

计量经济学工具变量IV (2SLS)

计量经济学工具变量IV (2SLS)
In other words, it is a variable subject to simultaneous causality.
However, this definition is narrow and IV regression can be used to address OV bias and errors-in-variable bias, not just to simultaneous causality bias.
3. errors-in-variables bias (X is measured with error)(变量 误差)
Instrumental variables regression can eliminate bias from these three sources.
Terminology: endogeneity and exogeneity
Y2i = 0 + 1Y1i+2X2i + u2i
(2)
Lets see why Y2 (or Y1) is endogenous
Suppose u1i >0 and u2i =0, then we have Y1i >E(Y1i) from (1)
But in (2), if 2≠0, this will cause a change in Y2i , so Y2i
1. omitted variable bias from a variable that is correlated with X but is unobserved, so cannot be included in the regression;(遗留变量偏差)
2. simultaneous causality bias (X causes Y, Y causes X);(联立因果)

第10章-工具变量法,2SLS与GMM

第10章-工具变量法,2SLS与GMM

8
同时对需求方程 qt 0 1 pt ut 两边求与 xt 的协方差:
Cov(qt , xt ) Cov( 0 1 pt ut , xt ) 1 Cov( pt , xt ) Cov(ut , xt ) 1 Cov( pt , xt )
3
把线性方程组中的 ( pt , qt ) 看成是未知数(内生变量),把 (ut , vt ) 看 作已知,可求解 ( pt , qt ) 为 (ut , vt ) 的函数:
0 0 vt ut ( , ) p p u v t t t t 1 1 1 1 q q (u , v ) 1 0 0 1 1vt 1ut t t t t 1 1 1 1
0 0 0
Var(u ) 0
故 OLS 不一致, 称为 “测量误差偏差”(measurement error bias)。 可确定此偏差的方向:
15
1 n ( xi x )( yi y ) ˆ n i 1 1 n 2 x x ( ) i n i 1 Cov( xi , yi ) Cov( xi* u , x* ) Var( xi ) Var( xi* u )
其中, v 为测量误差。代入可得:
y x ( v)
只要 Cov( x, v) 0 ,则 OLS 一致,但可能增大扰动项的方差。
18
10.2 工具变量法作为一种矩估计 1.矩估计 (Method of Moments,MM) 假设随机变量 x ~ N ( , 2 ) ,其中 , 2 为待估参数。 因 为 有 两 个 待 估 参 数 , 故 使 用 两 个 总 体 矩 条 件 (population moment conditions): 一阶矩: E( x) 二阶矩: E( x 2 ) Var( x) E( x) 2 2

计量经济学工具变量IV (2SLS)

计量经济学工具变量IV (2SLS)
is correlated with u1i through (2) The same is true for Y1i and u2i in (2) through (1)
Simultaneous Bias
▪ Can we estimate these two equations consistently?
Without a suitable proxy, no panel data, or if the omitted variable does change with time we need a new approach
Instrumental Variables Regression
Three important threats to internal validity are:
In other words, it is a variable subject to simultaneous causality.
However, this definition is narrow and IV regression can be used to address OV bias and errors-in-variable bias, not just to simultaneous causality bias.
An endogenous variable is one that is correlated with u.
An exogenous variable is one that is uncorrelated with u.
Historical note: “Endogenous” literally means “determined within the system,” that is, a variable that is jointly determined with y.

工具变量法(四):GMM

工具变量法(四):GMM

工具变量法(四):GMMProf. Lars Peter HansenWhat Hansen did with the generalized method of moments is show that when we have more moment conditions than parameters we can best estimate those parameters by giving more weight to the conditions that we have better information about. -- Alex Tabarrok (Marginal Revolution Blog)传统的工具变量法为2SLS,因为它操作方便,且同时适用于恰好识别与过度识别的情形。

然而,2SLS 仅在扰动项同方差的情况下,才是最有效率的。

理由很简单,如果每位个体的扰动项方差不相同(比如,大企业的方差一般不同于小企业的方差),则方差小的个体观测值所包含的信息量更大,而 2SLS 却对所有数据等量齐观地进行处理,故在异方差的情况下不是最有效率的。

在过度识别且存在异方差的情况下,更有效率的做法是“广义矩估计”(Generalized Method of Moments,简记 GMM)。

该方法由芝加哥大学的 Lars Peter Hansen 教授所提出 (Hansen, 1982),已成为最流行的计量方法之一,Hansen 也因此获得 2013年的诺贝尔经济学奖。

顾名思义,广义矩估计为矩估计的推广,故先介绍矩估计。

矩 (Moment)何为矩?简单说,矩就是随机变量之函数的期望。

比如,对于随机变量,其一阶原点矩为其期望,二阶中心矩为其方差,以此类推。

更一般地,考虑随机变量的函数。

显然,仍为随机变量,其期望也称为“矩”(moment)。

进一步推广,随机向量的函数之期望,也称为“矩”。

工具变量法(IV)的Stata操作

工具变量法(IV)的Stata操作

⼯具变量法(IV)的Stata操作Stata操作⼯具变量法的难点在于找到⼀个合适的⼯具变量并说明其合理性,Stata操作其实相当简单,只需⼀⾏命令就可以搞定,我们通常使⽤的⼯具变量法的Stata命令主要就是ivregress命令和ivreg2命令。

ivregress命令ivregress命令是Stata⾃带的命令,⽀持两阶段最⼩⼆乘(2SLS)、⼴义矩估计(GMM)和有限信息最⼤似然估计(LIML)三种⼯具变量估计⽅法,我们最常使⽤的是两阶段最⼩⼆乘法(2SLS),因为2SLS最能体现⼯具变量的实质,并且在球形扰动项的情况下,2SLS是最有效率的⼯具变量法。

顾名思义,两阶段最⼩⼆乘法(2SLS)需要做两个回归:(1)第⼀阶段回归:⽤内⽣解释变量对⼯具变量和控制变量回归,得到拟合值。

(2)第⼆阶段回归:⽤被解释变量对第⼀阶段回归的拟合值和控制变量进⾏回归。

如果要使⽤2SLS⽅法,我们只需在ivregress后⾯加上2sls即可,然后将内⽣解释变量lnjinshipop和⼯具变量bprvdist放在⼀个⼩括号中,⽤=号连接。

选项first表⽰报告第⼀阶段回归结果,选项cluster()表⽰使⽤聚类稳健的标准误。

ivregress 2sls lneduyear (lnjinshipop=bprvdist) lnnightlight lncoastdist tri suitability lnpopdensity urbanrates i.provid , first cluster(provid)第⼀阶段回归结果First-stage regressions-----------------------Number of obs = 274No. of clusters = 28F( 7, 239) = 85.27Prob > F = 0.0000R-squared = 0.6487Adj R-squared = 0.5988Root MSE = 0.4442------------------------------------------------------------------------------| Robustlnjinshipop | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------lnnightlight | .183385 .0682506 2.690.008 .0489354 .3178346lncoastdist | .0350333 .0771580.450.650 -.1169634 .1870299tri | 1.06676 .5637082 1.890.060 -.0437105 2.177231suitability | -.0769726 .0549697 -1.400.163 -.1852596 .0313144lnpopdensity | .196144 .0843727 2.320.021 .0299349 .3623532urbanrates | 3.352916 1.687109 1.990.048 .029414 6.676419|provid |12 | .2051006 .0551604 3.720.000 .096438 .313763213 | -1.890425 .0951146 -19.880.000 -2.077795 -1.703055......64 | -1.301895 .1581021 -8.230.000 -1.613346 -.9904433|bprvdist | -.0846917 .0107859 -7.850.000 -.1059393 -.0634441_cons | 2.126233 .9791046 2.170.031 .1974567 4.05501------------------------------------------------------------------------------从表中可以看出,⼯具变量bprvdist的系数为-0.085,标准误为0.011,在1%的⽔平上显著。

工具变量法GMM估计

工具变量法GMM估计

工具变量法 GMM估计1 OverviewModel过程可以分析线性、非线性(对参数或者对变量)的单方程和方程组。

使用的估计方法有:OLS, 2SLS, SUR, ITSUR, 3SLS, IT3SLS,GMM ,FIML。

MODEL过程分析的模型如下:这里,Y是内生变量,X是外生变量,TEHTA是参数。

观测到的变量要么是内生变量,要么是外生变量。

上面的方程组可以简写为:这个形式称为一般形式。

还可以写成标准形式:标准形式把内生变量放在方程的一边。

两种形式的方程(组)都可以使用MODEL过程估计。

经常用当前外生变量、滞后的外生变量、滞后的内生变量来解释当前内生变量。

这就构成了一个动态模型。

滞后变量不论内生还是外生都看作外生变量。

以上并不要求扰动项独立同分布。

自相关、异方差甚至不同的分布都有可能。

对于异方差可以使用加权估计,GARCH模型也可以修正异方差。

如果难以确定异方差的来源和形式,难以确定权重变量的话,可以使用GMM方法得到比OLS方法更加有效的估计。

方程组一个常见的问题就是联立偏倚。

考虑:这个方程组对参数是非线性的,不能使用线性回归估计。

同时这里Y1和Y2是同时决定的,普通非线性最小二乘方法的结果也是有偏和非一致的。

这称为联立性偏倚。

在线性模型中,处理联立性偏倚的可以把出现在方程右边的内生变量换成其预测值。

预测值与扰动项无关从而消除了联立性偏倚。

预测值是通过工具变量法估计得到的,这称为第一步回归。

利用预测值进行第二次回归称为两段最小二乘。

在非线性模型中,使用线性近似,把非线性方程组线性化后使用工具变量法,反复迭代。

在方程组中,方程之间的扰动项可能相关。

对于大样本情况,可以使用系统方法考虑到方程内和方程之间关系得到更有效的估计。

如果不存在联立性问题,即不存在内生变量作为解释变量的话,可以使用SUR估计。

SUR方法需要估计方程之间扰动项的协方差矩阵∑。

估计步骤为先使用OLS估计方程组,从残差得到∧∑,然后使用SUR。

计量经济学工具变量IV (2SLS)PPT课件

计量经济学工具变量IV (2SLS)PPT课件
Loosely, IV regression breaks x into two parts: a part that might be correlated with u, and a part that is not.
By isolating the part that is not correlated with u, it is
3. errors-in-variables bias (X is measured with error)(变量 误差)
Instrumental variables regression can eliminate bias from these three sources.

Terminology: endogeneity and exogeneity An endogenous variable is one that is correlated
Or we find an instrument zi for the included variable
Suppose for now that you have such a zi (we’ll discuss how to find instrumental variables later)
4
What is Simultaneous Causality
Suppose we have two endogenous variables Y1, Y2 and two exogenous variables X1, X2 such that
Y1i = 0 + 1X1i+2Y2i + u1i
are uncorrelated with ui, and use these to estimate 1.

GMM的stata操作步骤

GMM的stata操作步骤

GMM的sta操作步骤广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。

Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。

reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Sta 提供了如下命令来执行2SLS:xtivreg depvar [varlist1](varlist_2=varlist_iv)(选择项可以为fe,re 等,表示固定效应、随机效应等。

详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。

“恰好识别”时用2SLS。

2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS 前定变量的要求而得到一致估计量。

t p t q t p 二、异方差与自相关检验在球型扰动项的假定下,2SLS是最有效的。

但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo,df(`df')面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。

GMM的stata操作步骤

GMM的stata操作步骤

GMM的stata操作步骤广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。

Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。

reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Stata 提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re 等,表示固定效应、随机效应等。

详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。

“恰好识别”时用2SLS。

2SLS 的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS 前定变量的要求而得到一致估计量。

t p t q t p 二、异方差与自相关检验在球型扰动项的假定下,2SLS 是最有效的。

但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het) estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo, df(`df') 面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

为外生解释变量向量。记工具变量为 x1 z2 ,其中
z2为方程外的工具变量。在2SLS的第一阶段回归中
x2
OLS
x1,z
2,其R
2包含了内生变量x
与工具变
2
量z 2相关性的信息,但也可能由于x 2与x1的相关性造
成。
为此,应该使用滤去x1影响的“偏R2”(partial R2)
记为R
2 p
具体操作步骤如下:首先作x2对x1回归,
x2
OLS
x1,记其残差为e
x
,代表x
2
2中不能由x1解
释的部分;其次,作z2对x1回归,z2 OLS x1,记
其残差为ez2,代表z2中不能由x1解释的部分;最后
对两个残差进行回归,即ex2
OLS
e
,所得的判
z2
定系数即R
2p,若其较小即可认为z
是弱工具变量
2
判断弱工具变量的另一个方法是,在第一阶段回
一、工具变量法(Instrumental Variable,IV)
可以引入工具变量w
来解决内生变量问题。一个有
t
效的工具变量应满足以下两个条件:
(1)相关性:工具变量与内生解释变量相关,即
Cov
w
t,p
t
0,p
为内生解释变量
t
(2)外生性:工具变量与扰动项不相关,即
Cov wt,t =0
二、工具变量法作为一种矩估计
n i=1
xi yi =
XX
-1 Xy=ˆOLS
显然这就是OLS估计量
2、工具变量法作为一种矩估计
假设回归模型为
yi=1x

i1
+k-1x
+ i,k-1
k
x
ik+
i
假设只有最后一个解释变量xik为内生变量,即
Cov xik,i 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov xik,wi 0
能成立是由于Xˆ Xˆ =PX PX=XPPX=XPX
=PX X=Xˆ X,其中,投影矩阵P为对称幂等矩阵
即P=P,P2=P。因此,可以将ˆIV视为把y对Xˆ 进行
OLS回归而得到,故名“二阶段最小二乘法”
注意,第二阶段回归所得到的残差为e2 y-Xˆ ˆ2SLS 而原方程的残差却是e y-Xˆ2SL(S 这是正确的)
消费、投资、净出口。将第一个方程代入第二个
方程,经整理可得Yt=1-11 0+It+Xt +1- t1
可见Yt与 t 相关,因此当单独对Ct= 0+1Yt+ t
进行OLS估计时会碰到解释变量与扰动项相关的 情况
违背解释变量外生性假定也可以出现在滞后被解 释变量作为模型解释变量的情况。例如,消费不 仅受收入的影响,还要受到前期消费水平的影响; 投资不仅受GDP的影响,也要受前期投资水平的 影响。当存在扰动项序列相关时,就会造成解释 变量与扰动项相关的情况
变量与扰动项的正交性,可以得到以下总体矩条件
Exii =0 E xi yi-xi =0
E xiyi =E xixi =E xixi -1 E xiyi (假设E xixi 可逆)
以样本矩替代上式中的总体矩,即可得到矩估计:
ˆMM=
1 n
n i=1
xi
xi
-1
1 n
量估计量:
ˆIV=
1 n
n i=1
zi xi
-1
1 n
n zi yi =
i=1
ZX
-1 Zy
其中,Z z1 zn-1 zn 即Z z1 zn-1 zn
下面是工具变量法的大样本性质:
定理:若秩条件r E zixi =k成立(方阵E zixi 满
秩),则在一定的正则条件下,ˆIV是的一致估计 且ˆIV服从渐近正态分布
其中,P Z ZZ-1 Z为Z的投影矩阵。写成矩阵形式
Xˆ xˆ1 xˆ 2 xˆ k =P x1 x2 xk =PX
=Z
ZZ
-1
ZX
第二阶段:由于Xˆ 是z1, ,zL的线性组合(参见
第一阶段回归),故Xˆ 恰好包含k个工具变量。使用
Xˆ 为工具变量对原模型y=X+ 进行工具变量法估
计: ˆIV= Xˆ X -1 Xˆ y= Xˆ Xˆ -1 Xˆ y 后一个等号
秩条件r
E
zi
xi
=k意味着工具变量w
与内生解释
i
变量xi相关,若不相关,则秩条件无法满足。证略
阶条为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数
2 恰好识别:工具变量个数等于内生解释变量个数
3 过度识别:工具变量个数多于内生解释变量个数
1、检验工具变量与解释变量的相关性
如果工具变量z与内生解释变量x完全不相关,则
无法使用工具变量法,因为E zixi 不可逆。如果 z与x仅仅微弱相关,则可认为E zixi -1 很大,导
致工具变量法估计量的渐近方差AVar ˆIV =
E zixi -1 S E zixi -1 非常之大。直观上看,由
1 n
1 n
n i=1
xi=ˆ
n
xi2=ˆ 2+ˆ 2
i=1
ˆ=x
ˆ
2=
1 n
n i=1
xi-x 2
其中,x= 1 n
n i=1
x
为样本均值,上面推导中用到:
i
n
n
xi-x 2= xi2-nx2
i=1
i=1
任何随机向量x的函数f x的期望E f x 都被称为
总体矩。事实上,OLS也是一种矩估计。利用解释
第七章 工具变量、2SLS、 GMM
OLS估计成为一致估计量的前提是解释变量与扰动 项不相关(即前定变量假设),否则,无论样本容 量多大,OLS估计量也不会收敛到参数真值,这将 难以接受。解决方法之一是本章介绍的工具变量法
复习第三章p34-p38
违背前定变量假设可以出现在联立方程中,比如
CYt=t=C0+t+I1tY+t+Xt t ,Yt、Ct、It、Xt分别表示GDP、
第一阶段:将每个解释变量x1, ,xk分别对所有L个
工具变量z1, ,zL作OLS回归,其中
xi x1i
x ni
n1
,i=1,
,k(注意,不同于第二章
对第i个观测数据x
i的定义)。相当于将x
视作被解释
i
变量。得到拟合值xˆ 1=Px1,xˆ
2=Px

2
,xˆ k=Pxk
即xi到Z上的投影
(相当于y对X求回归拟合值yˆ =Py,即y到X上的投影)
于z中仅包含很少与x有关的信息,利用这部分信息 进行的工具变量法估计就不准确,即使样本容量很
大也很难收敛到真实的参数值。这种工具变量称为
弱工具变量,将使ˆIV的小样本性质变得很差,且基
于大样本理论的统计推断失效
判断弱工具变量的方法主要有两种。
方法之一为使用“偏R 2”。假设回归模型为
y=x1 1+x 2 2+,其中只有x 2为内生解释变量,x1
可以证明,ng d N 0,S,
其中S E gigi =E i2zizi
进一步,工具变量估计量ˆIV渐近服从正态分布,即
n ˆIV- =S-ZX1 ng d N 0,AVar ˆIV ,其
中渐近方差矩阵AVar
ˆIV

E
zi
xi
-1
S
E
zi
xi
-1
用到 E zixi -1 为对称矩阵
2、检验工具变量的外生性
在恰好识别的情况下,目前公认无法检验工具变量 是否与扰动项相关。在这种情况下,只能进行定性 讨论或参考专家的意见。
在过度识别的情况下,则可进行过度识别检验,即
检验原假设“H
:所有工具变量都是外生的”。如
0
果拒绝该原假设,则认为至少某个工具变量不是外
生的,与扰动项相关。
假设前k-r个解释变量x1, ,xk-r为外生解释变量 而后r个解释变量x , k-r+1 ,xk为内生解释变量。假 设共有m个方程外的工具变量z1, ,zm,其中m>r
归中,x2=x11+z2 2+error,检验原假设 H0: 2=0
一个经验规则是,如果此检验的F统计量大于10, 则可拒绝“存在弱工具变量”的原假设,从而不必 担心弱工具变量问题。在多个内生解释变量的情况 下,将有多个如此的第一阶段回归和F统计量
解决弱工具变量问题的方法是寻找更强的工具变 量或若有较多工具变量,可舍弃弱工具变量
以上介绍的工具变量法仅适用于恰好识别的情况。
在过度识别的情况下,ZX不是方阵, ZX-1 不存在
无法得到工具变量估计量ˆIV。
若扔掉多余的工具变量将会浪费有用的信息,有效 的方法是二阶段最小二乘法
三、二阶段最小二乘法
显然,多个工具变量的线性组合仍然是工具变量 因为仍满足工具变量的两个条件(相关性与外生性) 如果生成工具变量的k个线性组合,则又回到恰好 识别的情形。那么什么样的线性组合才是最有效率 的呢?可以证明在球形扰动项的假设下,由二阶段 最小二乘法(2SLS)所提供的工具变量线性组合是 所有线性组合中最渐近有效的。这个结论类似于小 样本理论中的高斯-马尔可夫定理。
把工具变量法的残差对所有外生变量(即所有外生
解释变量与工具变量)进行以下辅助回归:
ei,IV=
1x

i1
+ k-r xi,k-r+1zi1+
+ m zim+errori
将工具变量法的残差ei,IV视为对扰动项的估计,则
“扰动项与工具变量z1, ,zm无关”的原假设可
以写为“H0:1=

=0?
m
相关文档
最新文档