第七章 工具变量、2SLS、GMM
工具变量(IV):估计与检验
用到 i E zi x 为对称矩阵
-1
秩条件r i E zi x =k意味着工具变量w i与内生解释 变量x i相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数 2 恰好识别:工具变量个数等于内生解释变量个数 3 过度识别:工具变量个数多于内生解释变量个数
解释变量内生性检验
Hausman 检验
寻找工具变量的方法:几个实例
方法 例子
由来
经典假设 所有的解释变量Xi与随机误差项彼此 之间不相关。
Cov (u i , X i ) 0
若解释变量Xi和ui相关,则OLS估计量是非一致 的,也就是即使当样本容量很大时,OLS估计量 也不会接近回归系数的真值。 造成误差项与回归变量相关(内生性)的原因 很多,但我们主要考虑如下几个方面: • 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
1、矩估计(Method of Moments,MM)
首先以一个例子来说明矩估计方法:假设随机变量 x N , 2 ,其中, 2为待估参数。因为有两 个待估参数,故需要使用以下两个总体矩条件: 一阶中心矩:E x =
2 2 二阶中心矩:E x =Var x + E x = + 2 2
可以引入工具变量w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即 Cov w t,p t 0,p t为内生解释变量 (2)外生性:工具变量与扰动项不相关,即 Cov w t, t =0
二、工具变量法作为一种矩估计
第10 章 工具变量,2SLS 与GMM
量与工具变量)进行以下辅助回归,
ei, IV
=
γ 1
xi1
+"+
γ x K−r i, K−r
+
δ 1
zi1
+
"
+
δ m
zim
+ errori
(10.21)
记此辅助回归的可绝系数为 R2 ,则 Sargan 统计量为,
nR2 ⎯d⎯→ χ2 (m − r) (10.22)
3.究竟该用 OLS 还是 IV:对解释变量内生性的检验 “豪斯曼检验”(Hausman specification test)的原假设为 “ H0 :所有解释变量均为外生变量”。如果 H0 成立,则
25
然估计法”。
2.检验工具变量的外生性 不失一般性,假设前 (K − r) 个解释变量{x1, ", xK−r } 为外生解
释变量,而后 r 个解释变量 {xK−r+1, ", xK }为内生解释变量。
假设共有 m 个方程外的工具变量{z1, ", zm},其中 m > r 。
把工具变量法的残差对所有外生变量(即所有外生解释变
= C o v (x * , ε
) − β C o v (x * , u
) + C o v(u , ε
) − β Cov(u, u)
=0
=0
=0
= −β Var(u) ≠ 0
(10.12)
故对方程(10.11)进行 OLS 估计是不一致的,这被称为“测
量误差偏差”。
12
10.2 工具量法作为一种矩估计
3
⎧⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎩
第10章-工具变量法,2SLS与GMM
qqtt
0 0
1 pt 1 pt
ut vt
两个方程中的被解释变量与解释变量完全一样。
如直接作回归qt OLS pt ,估计的是需求函数还是供给函数?
2
图 10.1 需求与供给决定市场均衡
3
把线性方程组中的( pt , qt )看成是未知数(内生变量),把(ut , vt )看 作已知,可求解( pt , qt )为(ut , vt )的函数:
由于气温 xt 的变化使得供给函数qts 沿着需求函数qtd 移动,故可估 计需求函数qtd 。
此时,称 xt 为“工具变量”(Instrumental Variable,简记 IV)。
在回归方程中(此处为需求方程),一个有效(valid)的工具变量应 满足以下两个条件。
(i) 相关性:工具变量与内生解释变量相关,即Cov(xt , pt ) 0。
pt
qt
pt (ut ,vt )
0 1
0 1
vt
1
ut
1
qt
(ut
, vt
)
10 1
01 1
1vt 1
1ut 1
由于 pt 为(ut , vt )的函数,故Cov( pt , ut ) 0,Cov( pt , vt ) 0。
OLS 估计值ˆ1, ˆ1不是1, 1的一致估计量。
称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量 偏差”(endogeneity bias)。
1
如果工具变量与内生变量无关,Cov(xt , pt ) 0,则无法定义工 具变量法。
如果工具变量与内生变量的相关性很弱,Cov(xt , pt ) 0,会导 致估计量ˆ1, IV 的方差变得很大,称为“弱工具变量问题”。
工具变量法(四):GMM
工具变量法(四):GMMProf. Lars Peter HansenWhat Hansen did with the generalized method of moments is show that when we have more moment conditions than parameters we can best estimate those parameters by giving more weight to the conditions that we have better information about. -- Alex Tabarrok (Marginal Revolution Blog)传统的工具变量法为2SLS,因为它操作方便,且同时适用于恰好识别与过度识别的情形。
然而,2SLS 仅在扰动项同方差的情况下,才是最有效率的。
理由很简单,如果每位个体的扰动项方差不相同(比如,大企业的方差一般不同于小企业的方差),则方差小的个体观测值所包含的信息量更大,而 2SLS 却对所有数据等量齐观地进行处理,故在异方差的情况下不是最有效率的。
在过度识别且存在异方差的情况下,更有效率的做法是“广义矩估计”(Generalized Method of Moments,简记 GMM)。
该方法由芝加哥大学的 Lars Peter Hansen 教授所提出 (Hansen, 1982),已成为最流行的计量方法之一,Hansen 也因此获得 2013年的诺贝尔经济学奖。
顾名思义,广义矩估计为矩估计的推广,故先介绍矩估计。
矩 (Moment)何为矩?简单说,矩就是随机变量之函数的期望。
比如,对于随机变量,其一阶原点矩为其期望,二阶中心矩为其方差,以此类推。
更一般地,考虑随机变量的函数。
显然,仍为随机变量,其期望也称为“矩”(moment)。
进一步推广,随机向量的函数之期望,也称为“矩”。
工具变量法2SLS与GMM
工具变量法2SLS与GMM1第 10 章工具变量,2SLS 与 GMM10.1 解释变量与扰动项相关的例子例农产品市场均衡模型q d = α + α p + u (需求)t 0 1 t t ? q s = β + β p + v(供给) t ? q d 0 1 t t = q s(均衡)tt令q ≡q d=q s,可得t t tq t =α0+α1 p t +u tq =β+βp +vt 0 1 t t两个方程中的被解释变量与解释变量完全一样。
如直接作回归q ?O?LS?→p,估计的是需求函数还是供给函数?t t2图10.1 需求与供给决定市场均衡341 1 1 11 1把线性方程组中的( p t , q t )看成是未知数(内生变量),把(u t , v t ) 看作已知,可求解( p t , q t )为(u t , v t ) 的函数:p = p (u ,v ) = β0 - α0 + v t - u t ? t t t t α - β α - β ? 1 1 1 1 ?q = q (u ,v ) = α1β0 - α0 β1 + α1v t - β1u t ?? t t t t α - β α - β由于 p t 为(u t , v t ) 的函数,故Cov( p t , u t ) ≠ 0,Cov( p t , v t ) ≠ 0。
OLS 估计值α?1, β? 不是α , β 的一致估计量。
称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量偏差”(endogen eity bias)。
1如能将内生变量分成两部分,一部分与扰动项相关,另一部分与扰动项不相关,可用与扰动项不相关的那部分得到一致估计。
这种分离常借助另一“工具变量”来实现。
假设在图10.1 中,存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动,则可估计需求曲线,参见图10.2。
这个使得供给曲线移动的变量就是工具变量。
计量经济学工具变量IV (2SLS)
However, this definition is narrow and IV regression can be used to address OV bias and errors-in-variable bias, not just to simultaneous causality bias.
3. errors-in-variables bias (X is measured with error)(变量 误差)
Instrumental variables regression can eliminate bias from these three sources.
Terminology: endogeneity and exogeneity
Y2i = 0 + 1Y1i+2X2i + u2i
(2)
Lets see why Y2 (or Y1) is endogenous
Suppose u1i >0 and u2i =0, then we have Y1i >E(Y1i) from (1)
But in (2), if 2≠0, this will cause a change in Y2i , so Y2i
1. omitted variable bias from a variable that is correlated with X but is unobserved, so cannot be included in the regression;(遗留变量偏差)
2. simultaneous causality bias (X causes Y, Y causes X);(联立因果)
Stata学习笔记
Stata学习笔记1、横截⾯数据:多个经济个体的变量在同⼀时间点上的取值,如2012年中国各省的GDP2、时间数列数据:指的是某个经济个体的变量在不同时点上的取值,如1978-2012年⼭东省每年的GDP3、⾯板数据:多个经济个体的变量在不同时点上的取值,如1978-2012年中国各省的GDP⼩样本OLS(最⼩⼆乘法):单⼀⽅程线性回归最常见⽅法条件:解释变量与扰动项正交、扰动项⽆⾃相关、同⽅差。
拟合优度:衡量线性回归模型对样本数据的拟合程度(R2),越⾼说明模型拟合程度越好。
单系数T检验:对回归⽅程扰动项的具体概率进⾏假设显著性⽔平进⾏检验F检验:整个回归⽅程是否显著STATA操作简介:如果数据中包含1949-10-01或1949/10/01的时间变量,导⼊stata后可能会被视为字符串,因此对于⽇度数据,可以使⽤命令gen newvar=date(varname,YMD),将其转换为整数⽇期变量,其中YMD说明原始数据的格式为年⽉⽇,如果原始数据的格式为⽉⽇年则使⽤MDY;对于⽉度数据则gen newvar=monthly(varname,YM)。
.describe:数据的概貌 .drop keep:删除和保留.su:统计特征 Pwcorr:变量之间相关系数Star(.05):5%显著性⽔平 gen:产⽣g intc=log(tc):取⾃然对数. reg:OLS回归.Vce:协⽅差矩阵 reg。
,noc表⽰在进⾏回归时不要常数项⼤样本OLS:只要求解释变量与同期的扰动项正交即可Robust:稳健标准误,如果存在异⽅差,则应使⽤稳健标准误最⼤似然估计法:如果回归⽅程存在⾮线性,则使⽤最⼤似然估计法(MLE)或⾮线性最⼩⼆乘法(NLS)三类在⼤样本下渐进等价的统计检验:Wald test LR(似然⽐检验) LM操作步骤如下:sysuse auto(调⽤数据集)Hist mpg,normal(画变量mpg的直⽅图,并与正态密度⽐较)直⽅图显⽰,变量mpg的分布于正态分布有⼀定差距。
STATA做GMM估计
STATA做GMM估计广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。
Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。
reg ldi lofdiestimates store olsxtivreg ldi (lofdi=l.lofdi ldep lexr)estimates store ivhausman iv ols(在面板数据中使用工具变量,Stata提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。
详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。
“恰好识别”时用2SLS。
2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS前定变量的要求而得到一致估计量。
tptqtp二、异方差与自相关检验在球型扰动项的假定下,2SLS是最有效的。
但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store heteroxtgls enc invs exp imp esc mrl,iglsestimates store homolocal df = e(N_g) - 1lrtest hetero homo, df(`df')面板自相关:xtserial enc invs exp imp esc mrl则存在一种更有效的方法,即GMM。
计量经济学工具变量IV (2SLS)
Simultaneous Bias
▪ Can we estimate these two equations consistently?
Without a suitable proxy, no panel data, or if the omitted variable does change with time we need a new approach
Instrumental Variables Regression
Three important threats to internal validity are:
In other words, it is a variable subject to simultaneous causality.
However, this definition is narrow and IV regression can be used to address OV bias and errors-in-variable bias, not just to simultaneous causality bias.
An endogenous variable is one that is correlated with u.
An exogenous variable is one that is uncorrelated with u.
Historical note: “Endogenous” literally means “determined within the system,” that is, a variable that is jointly determined with y.
工具变量法GMM估计
工具变量法 GMM估计1 OverviewModel过程可以分析线性、非线性(对参数或者对变量)的单方程和方程组。
使用的估计方法有:OLS, 2SLS, SUR, ITSUR, 3SLS, IT3SLS,GMM ,FIML。
MODEL过程分析的模型如下:这里,Y是内生变量,X是外生变量,TEHTA是参数。
观测到的变量要么是内生变量,要么是外生变量。
上面的方程组可以简写为:这个形式称为一般形式。
还可以写成标准形式:标准形式把内生变量放在方程的一边。
两种形式的方程(组)都可以使用MODEL过程估计。
经常用当前外生变量、滞后的外生变量、滞后的内生变量来解释当前内生变量。
这就构成了一个动态模型。
滞后变量不论内生还是外生都看作外生变量。
以上并不要求扰动项独立同分布。
自相关、异方差甚至不同的分布都有可能。
对于异方差可以使用加权估计,GARCH模型也可以修正异方差。
如果难以确定异方差的来源和形式,难以确定权重变量的话,可以使用GMM方法得到比OLS方法更加有效的估计。
方程组一个常见的问题就是联立偏倚。
考虑:这个方程组对参数是非线性的,不能使用线性回归估计。
同时这里Y1和Y2是同时决定的,普通非线性最小二乘方法的结果也是有偏和非一致的。
这称为联立性偏倚。
在线性模型中,处理联立性偏倚的可以把出现在方程右边的内生变量换成其预测值。
预测值与扰动项无关从而消除了联立性偏倚。
预测值是通过工具变量法估计得到的,这称为第一步回归。
利用预测值进行第二次回归称为两段最小二乘。
在非线性模型中,使用线性近似,把非线性方程组线性化后使用工具变量法,反复迭代。
在方程组中,方程之间的扰动项可能相关。
对于大样本情况,可以使用系统方法考虑到方程内和方程之间关系得到更有效的估计。
如果不存在联立性问题,即不存在内生变量作为解释变量的话,可以使用SUR估计。
SUR方法需要估计方程之间扰动项的协方差矩阵∑。
估计步骤为先使用OLS估计方程组,从残差得到∧∑,然后使用SUR。
STATA做GMM估计
STATA做GMM估计广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。
Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。
reg ldi lofdiestimates store olsxtivreg ldi (lofdi=l.lofdi ldep lexr)estimates store ivhausman iv ols(在面板数据中使用工具变量,Stata提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。
详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。
“恰好识别”时用2SLS。
2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS前定变量的要求而得到一致估计量。
tptqtp二、异方差与自相关检验在球型扰动项的假定下,2SLS是最有效的。
但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store heteroxtgls enc invs exp imp esc mrl,iglsestimates store homolocal df = e(N_g) - 1lrtest hetero homo, df(`df')面板自相关:xtserial enc invs exp imp esc mrl则存在一种更有效的方法,即GMM。
GMM的stata操作步骤
GMM的sta操作步骤广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。
Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。
reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Sta 提供了如下命令来执行2SLS:xtivreg depvar [varlist1](varlist_2=varlist_iv)(选择项可以为fe,re 等,表示固定效应、随机效应等。
详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。
“恰好识别”时用2SLS。
2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS 前定变量的要求而得到一致估计量。
t p t q t p 二、异方差与自相关检验在球型扰动项的假定下,2SLS是最有效的。
但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo,df(`df')面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。
GMM的stata操作步骤
GMM的stata操作步骤广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。
Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。
reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Stata 提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re 等,表示固定效应、随机效应等。
详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。
“恰好识别”时用2SLS。
2SLS 的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS 前定变量的要求而得到一致估计量。
t p t q t p 二、异方差与自相关检验在球型扰动项的假定下,2SLS 是最有效的。
但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het) estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo, df(`df') 面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。
GMM的stata操作步骤
GMM的stata操作步骤广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。
Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。
reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Stata 提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re 等,表示固定效应、随机效应等。
详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。
“恰好识别”时用2SLS。
2SLS 的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS 前定变量的要求而得到一致估计量。
t p t q t p 二、异方差与自相关检验在球型扰动项的假定下,2SLS 是最有效的。
但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het) estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo, df(`df') 面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。
计量经济学工具变量IV (2SLS)课件
Y2i = 0 + 1Y1i+2X2i + u2i
(2)
Lets see why Y2 (or Y1) is endogenous
Suppose u1i >0 and u2i =0, then we have Y1i >E(Y1i) from (1)
But in (2), if 2≠0, this will cause a change in Y2i , so Y2i
1. omitted variable bias from a variable that is correlated with X but is unobserved, so cannot be included in the regression;(遗留变量偏差)
2. simultaneous causality bias (X causes Y, Y causes X);(联立因果)
y1 = a1y2 + 1z1 + u1 y2 = a2y1 + 2z2 + u2
▪ For consistency, we need cov(y2,u1)=0, and cov(y1,u2)=0
▪ However, a large u2 means a larger y2, which
implies a larger y1 (if a1>0), so cov(y1,u2)0
The instrumental variable detects movements in xi that
are uncorrelated with ui, and use these to estimate 1.
Two conditions for a valid instrument
非平衡面板数据2sls回归代码
非平衡面板数据2sls回归代码首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。
Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。
reg ldi lofdiestimates store olsxtivreg ldi (lofdi=l.lofdi ldep lexr)estimates storeivhausmaniv ols(在面板数据中使用工具变量,2sls提供了如下命令来执行2SLS:xtivregdepvar [varlist1] (varlist_2=varlist_iv)(选择项可以为fe,re等,表示固定效应、随机效应等。
详见help xtivreg) 如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。
“恰好识别”时用2SLS。
2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS前定变量的要求而得到一致估计量。
二、异方差与自相关检验在球型扰动项的假定下,2SLS 是最有效的。
但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store heteroxtgls enc invs exp imp esc mrl,iglsestimates store homolocal df =e(N_g) - 1lrtest hetero homo, df(`df')面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
工具变量 z1, ,z L 作OLS回归,其中
第一阶段:将每个解释变量x1, ,x k 分别对所有L个 x i x1i x ni n1 ,i=1, ,k(注意,不同于第二章 对第i个观测数据x i的定义)。相当于将x i 视作被解释 ˆ ˆ 变量。得到拟合值x1=Px1,x 2=Px 2, ,x k=Px k ˆ
E z i yi-x =0 i
-1
由此可得E zi i =0
-1
E z i y i = E z i x i = E z i x E z i yi (假定 E z i x 存在) i i
OLS 2
为外生解释变量向量。记工具变量为 x1 z 2 ,其中
量z 2相关性的信息,但也可能由于x 2与x1的相关性造 成。
为此,应该使用滤去x1影响的“偏R 2”(partial R 2) 记为R 2 p
具体操作步骤如下:首先作x 2 对x1回归,
OLS x 2 x1,记其残差为e x 2,代表x 2中不能由x1解
2SLS
= XZ ZZ ZX
-1
-1
XZ ZZ Zy
-1
四、有关工具变量的检验
在使用工具变量法时,必须对工具变量的有效性 进行检验。如果工具变量非有效,则可能导致估 计不一致,或估计量的方差过大。
1、检验工具变量与解释变量的相关性
如果工具变量z与内生解释变量x完全不相关,则 无法使用工具变量法,因为E z i x 不可逆。如果 i z与x仅仅微弱相关,则可认为 E z i x i
与第三章大样本最小二乘法类似的假定和推导,
d 可以证明,ng N 0,S ,
其中S E g i g =E i2 z i z i i
ˆ 进一步,工具变量估计量 IV 渐近服从正态分布,即
d ˆ ˆ n IV- =S-1 ng N 0,AVar IV ,其 ZX
ˆ ˆ 注意,第二阶段回归所得到的残差为e 2 y-X 2SLS ˆ 而原方程的残差却是e y-X (这是正确的)
2SLS
ˆ 由于 IV的表达式在形式上完全类似于OLS估计量 ˆ 故在条件同方差的假设下, 的协方差矩阵估计量
IV
ˆ 2 ˆ ˆ 为Var IV =s XX
x -x = x -nx
2 i 2 i i=1 i=1
n
n
2
任何随机向量x的函数f x 的期望E f x 都被称为 总体矩。事实上,OLS也是一种矩估计。利用解释 变量与扰动项的正交性,可以得到以下总体矩条件
E x i i =0
E x i yi =E x i x i
第七章 工具变量、2SLS、 GMM
OLS估计成为一致估计量的前提是解释变量与扰动 项不相关(即前定变量假设),否则,无论样本容 量多大,OLS估计量也不会收敛到参数真值,这将 难以接受。解决方法之一是本章介绍的工具变量法
复习第三章p34-p38
违背前定变量假设可以出现在联立方程中,比如 C t= 0+1Yt+ t ,Yt、C t、I t、X t 分别表示GDP、 Yt=C t+I t+X t 消费、投资、净出口。将第一个方程代入第二个
下面是工具变量法的大样本性质:
定理:若秩条件r E zi x =k成立(方阵E zi x 满 i i ˆ 秩),则在一定的正则条件下, IV是的一致估计 ˆ 且 服从渐近正态分布
IV
ˆ -= ZX -1 Zy- 证明:抽样误差 IV
= ZX Z X+ -= ZX Z
-1 -1 -1
很大,导
ˆ 致工具变量法估计量的渐近方差AVar IV = E z i x S E z i x 非常之大。直观上看,由 i i 于z中仅包含很少与x有关的信息,利用这部分信息 进行的工具变量法估计就不准确,即使样本容量很 大也很难收敛到真实的参数值。这种工具变量称为 ˆ 弱工具变量,将使 的小样本性质变得很差,且基
即x i到Z上的投影 ˆ (相当于y对X求回归拟合值y=Py,即y到X上的投影) 其中,P Z ZZ Z为Z的投影矩阵。写成矩阵形式
-1
ˆ ˆ ˆ ˆ X x1 x 2 x k =P x1 x 2 x k =PX ZZ -1 ZX =Z
二、工具变量法作为一种矩估计
1、矩估计(Method of Moments,MM)
首先以一个例子来说明矩估计方法:假设随机变量 x N , 2 ,其中, 2为待估参数。因为有两 个待估参数,故需要使用以下两个总体矩条件: 一阶中心矩:E x = 二阶中心矩:E x =Var x + E x = 2+ 2
ˆ = E z x -1 S E z x -1 中渐近方差矩阵AVar IV i i i i 用到 E z i x 为对称矩阵 i
-1
秩条件r E z i x =k意味着工具变量w i与内生解释 i 变量x i 相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数 2 恰好识别:工具变量个数等于内生解释变量个数 3 过度识别:工具变量个数多于内生解释变量个数
以上介绍的工具变量法仅适用于恰好识别的情况。 在过度识别的情况下,ZX不是方阵,ZX 不存在
记解释变量向量x i x i1 x i,k-1 x ik ,则原模型为 yi=x + i i 记工具变量向量为 z i z i1 z i,k-1 z ik x i1 x i,k-1 w i 。
定义g i zi i。由于工具向量与扰动项正交,故 E g i =E z i i =0为总体矩条件或正交条件
IV
于大样本理论的统计推断失效
判断弱工具变量的方法主要有两种。
方法之一为使用“偏R 2”。假设回归模型为 y=x11+x 2 2+,其中只有x 2为内生解释变量,x1 z 2为方程外的工具变量。在2SLS的第一阶段回归中 x 2 x1,z 2,其R 包含了内生变量x 2与工具变
-1
ee ,其中,s n-k
2
在存在异方差的情况下,则应使用稳健的协方差矩 ˆ ˆ ˆ 阵估计量,即Var IV = XX
-1
n 2 ˆ ˆ ˆ ˆi ei x i x XX i=1
-1
ˆ ˆ =Z ZZ -1 ZX(或将P Z ZZ -1 Z)代入 的 将X IV 公式,可得2SLS的最终表达式: ˆ = XPX -1 XPy
-1 -1
1 1 n p z i i =S-1 g = zi x i ZX n i=1 n i=1
n
-1
E zi x E g i =0 i
-1 =0
其中SZX
1 n 1 n zi x ,g z i i i n i=1 n i=1
n -1
2、工具变量法作为一种矩估计
假设回归模型为 yi=1x i1++ k-1x i,k-1+ k x ik+ i 假设只有最后一个解释变量x ik为内生变量,即 Cov x ik, i 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov x ik,w i 0 (相关性),以及Cov w i, i =(外生性)。由于 0 x1, ,x k-1不是内生变量,故可以把自己作为自己 的工具变量(因为满足工具变量的两个条件)
ˆ 第二阶段:由于X是 z1, ,z L 的线性组合(参见 ˆ 第一阶段回归),故X恰好包含k个工具变量。使用 ˆ X为工具变量对原模型y=X+ 进行工具变量法估 ˆ ˆ 计: IV= XX
-1
ˆ ˆ ˆ Xy= XX
-1
ˆ Xy
后一个等号
ˆ ˆ 能成立是由于XX= PX PX =XPPX=XPX ˆ = PX X=XX,其中,投影矩阵P为对称幂等矩阵 ˆ ˆ 即P=P,P 2=P。因此,可以将 IV 视为把y对X进行 OLS回归而得到,故名“二阶段最小二乘法”
-1
E x i yi-x =0 i
= E x i x E x i yi (假设E x i x 可逆) i i
以样本矩替代上式中的总体矩,即可得到矩估计: 1 1 n -1 ˆ = ˆ MM x i x x i yi = XX Xy=OLS i n i=1 n i=1 显然这就是OLS估计量
以样本矩代替上式中的总体矩,即可得到工具变 量估计量: 1 1 n -1 ˆ = IV z i x z i yi = ZX Zy i n i=1 n i=1
n -1
其中,Z z1 z n-1 z n 即Z z1 z n-1 z n
一、工具变量法(Instrumental Variable,IV)
可以引入工具变量w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即 Cov w t,p t 0,p t为内生解释变量 (2)外生性:工具变量与扰动项不相关,即 Cov w t, t =0
t 1 方程,经整理可得Yt= 0+I t+X t + 1-1 1-1
可见Yt 与 t 相关,因此当单独对C t= 0+1Yt+ t 进行OLS估计时会碰到解释变量与扰动项相关的 情况