工具变量(IV):估计与检验
工具变量(IV)详细解说
IV
The 2SLS name notwithstanding, we don‘t usually construct 2SLS estimates in two-steps. For one thing, the resulting standard errors are wrong, as we discuss later. () Where si is the residual from a regression cov( si , si ) V ( si ) of si on X i .This follows from the multivariate regression anatomy formula and the fact that cov( si , si ) V ( si ) . It is also easy to show that, in a model with a single endogenous variable and a single instrument, the 2SLS estimator is the same as the corresponding ILS( Indirect Least Squares ) estimator.(Q3) 由2SLS,
Zi 0 1si i cov( Zi ,i ) 0 cov(Yi , Zi ) cov(Yi , Zi ) / v( Zi ) (4.1.3) cov( si , Zi ) cov( si , Zi ) / v( Zi )
Zi
(IV)
IV
• Q1:The second equality in (4.1.3) is useful because its usually easier to think in terms of regression coefficients than in terms of covariance. 2.
工具变量法
ut )
1
ztut zt xt
(9.8.7)
(9.8.7)两边取期望值:
(ˆ1)
1
(
ztut zt xt
)
1
所以,ˆ1 不是1 的无偏估计量。
(9.8.7)两边取概率极限:
P lim
ˆ1
1
P lim P lim
1
n 1
n
ztut zt xt
1
COV COV
(zt ,ut) (zt , xt)
1
即
P lim ˆ1 1
表明 ˆ1 是1 的一致估计量。
(9.8.8) (9.8.9)
工具变量法是一种单方程估计方法,每次只适用于 模型中的一个结构方程。 显然,对于多个解释变量的单方程也是适用的。 三、工具变量法的有效性
y1 10 12 y2 1g1 y g1 11 x1 12 x2
第二步,分别用工具变量去乘结构方程,并对所有 的样本观测值求和,得到与未知参数一样多的线性 方程组成的方程组。解方程组就得到结构参数的估
二、工具变量法的应用举例 1.设有一个解释变量的结构方程:
yt 0 1 xt ut
(9.8Байду номын сангаас1)
其中xt是该方程所在模型中的内生变量,因而 COV(xt,ut) ≠ 0。在模型的其他结构方程中可找到这 样的外生变量zt,zt与xt高度相关,但zt与ut不相关即 COV(zt,ut)=0,即zt
1k1 xk1 u1
(9.8.20)
模型(9.8.20)共有(g1-1)个内生说明变量和k1个前定
变量
1.若方程(9.8.20)
由阶条件知
K1 G1* G 1
或
stata上机实验第五讲 工具变量(IV)
究竟该用OLS 还是IV
即解释变量是否真的存在内生性? 假设能够找到方程外的工具变量。 1。如果所有解释变量都是外生变量,则OLS
比IV 更有效。在这种情况下使用IV,虽然估 计量仍然是一致的,会增大估计量的方差。2。 如果存在内生解释变量,则OLS 是不一致的, 而IV 是一致的。
豪斯曼检验(Hausman specification test)原假设: H0 :所有解释变量均为外生变量。 H1:至少有一个解释变量为内生变量。
检验方法: estat firststage 1。初步判断可以用偏R2(partial R2) (剔除掉模型中原有外生变量的影响)。 2。 Minimum eigenvalue statistic(最小特征 值统计量),经验上此数应该大于10。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first
使用grilic.dta估计教育投资的回报率。
变量说明:lw80(80年工资对数),s80 (80年时受教育年限),expr80(80年时工 龄),tenure80(80年时在现单位工作年 限), iq(智商),med(母亲的教育年 限),kww(在‘knowledge of the World of Work’测试中的成绩),mrt(婚姻虚拟变量, 已婚=1),age(年龄)。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat overid ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) estat overid
计量经济学重点知识归纳整理
1.一般最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,一般最小二乘法要求样本回来函数尽可以好地拟合这组值,即样本回来线上的点∧i Y 及真实观测点Yt 的“总体误差”尽可能地小。
一般最小二乘法给出的推断标准是:被说明变量的估计值及实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比一般最小二乘法更普遍的意义,或者说一般最小二乘法只是加权最小二乘法中权恒取1时的一种特别状况。
从今意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采纳一般最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服说明变量及随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生说明变量的简化式方程采纳一般小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回来模型的基本假设之一是模型的随机干扰项相互独立或不相关。
假如模型的随机干扰项违反了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是说明变量X 1,X 2,…,Xk 是相互独立的。
IV和GMM相关估计步骤,内生性、异方差性等检验方法
IV和GMM相关估计步骤,内⽣性、异⽅差性…⼯具变量和⼴义矩估计相关步骤⼀、解释变量内⽣性检验⾸先检验解释变量内⽣性(解释变量内⽣性的Hausman 检验:使⽤⼯具变量法的前提是存在内⽣解释变量。
Hausman 检验的原假设为:所有解释变量均为外⽣变量,如果拒绝,则认为存在内⽣解释变量,要⽤IV;反之,如果接受,则认为不存在内⽣解释变量,应该使⽤OLS。
reg ldi lofdiest imat es st ore olsxt ivreg ldi (lofdi=l.lofdi ldep lexr)est imat es st ore ivhausman iv ols(在⾯板数据中使⽤⼯具变量,St at a提供了如下命令来执⾏2SLS:xt ivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。
详⻅help xt ivreg)如果存在内⽣解释变量,则应该选⽤⼯具变量,⼯具变量个数不少于⽅程中内⽣解释变量的个数。
“恰好识别”时⽤2SLS。
2SLS的实质是把内⽣解释变量分成两部分,即由⼯具变量所造成的外⽣的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外⽣部分进⾏回归,从⽽满⾜OLS前定变量的要求⽽得到⼀致估计量。
⼆、异⽅差与⾃相关检验在球型扰动项的假定下,2SLS是最有效的。
但如果扰动项存在异⽅差或⾃相关,⾯板异⽅差检验:xt gls enc invs exp imp esc mrl,igls panel(het)est imat es st ore het eroxt gls enc invs exp imp esc mrl,iglsest imat es st ore homolocal df = e(N_g) - 1lrt est het ero homo, df(`df')⾯板⾃相关:xt serial enc invs exp imp esc mrl则存在⼀种更有效的⽅法,即GMM。
工具变量的检验方法
工具变量的检验方法
工具变量的检验方法主要包括以下几种:
1. 过度识别检验:过度识别检验是一种常用的工具变量检验方法,用于检验工具变量是否有效。
该检验方法通过比较工具变量的拟合优度与其他解释变量的拟合优度,如果工具变量的拟合优度显著高于其他解释变量,则说明工具变量是有效的。
2. 弱工具变量检验:弱工具变量检验是一种用于检验工具变量是否具有足够的解释能力的方法。
该检验方法通过比较工具变量与其他解释变量的相关性,如果工具变量与其他解释变量的相关性较低,则说明工具变量是弱工具变量,可能无法有效地解释被解释变量。
3. 不可识别检验:不可识别检验是一种用于检验工具变量是否可以识别出模型中的参数的方法。
该检验方法通过比较工具变量与其他解释变量的系数,如果工具变量的系数不显著,则说明工具变量无法识别出模型中的参数。
4. 稳健性检验:稳健性检验是一种用于检验工具变量是否稳健的方法。
该检验方法通过比较不同工具变量的估计结果,如果估计结果在不同工具变量下具有相似性,则说明工具变量是稳健的。
这些检验方法可以帮助研究者确定工具变量是否有效,并提高研究结果的可信度。
在使用工具变量方法时,需要根据具体情况选择合适的检验方法,并结合实际数据进行分析和判断。
工具变量法IV两阶段最小二乘法TSLS
YY12
b12Y2 b23Y3
c11 X1 c12 X 2 c23 X 3 u2
u1
Y3 b31Y1 b32Y2 c33 X 3 u3
其中:Y1,Y2 ,Y3 为内生变量, X1, X 2 , X 3为外生变量。
Dongbei University Of Finance & Economics
2)方程组系统估计法 包括:三阶段最小二乘法(3SLS)、完全信息最
大似然估计法(FIML)等。这些方法是对模型中所有 结构方程的参数同时进行估计,从而获得模型全部参 数的估计值。它利用了模型的全部方程信息,称为完 全信息方法。
Dongbei University Of Finance & Economics
/ ˆ23 bˆ12ˆ21
cˆ12 ˆ12 bˆ12ˆ22
若已知πij,即可解出惟一的cij,第一个结构方程得以 估计。这样,结构方程的参数估计值用传统的OLS就 得到了。
Dongbei University Of Finance & Economics
ILS的步骤
一、先对模型作识别判断,找出恰好识别的方程; 二、利用简约式和结构式参数的关系式 B
Y1 11 X1 12 X 2 13 X 3 v1 Y2 21 X1 22 X 2 23 X 3 v2 Y3 31 X1 32 X 2 33 X 3 v3
Dongbei University Of Finance & Economics
第一阶段是对结构方程右端所包含的所有内生变量(作为解 释变量)所对应的简化式方程进行OLS估计,得到内生变量的估计 (回归)值;
(9)8.2工具变量法
即
ˆ P lim β1 = β1
ˆ 表明 β 1 是 β1 的一致估计量。
ˆ 同样可以证明,0是 β 0 的一致估计量(读者可以自己给出)。 β
ˆ ˆ 其中 β 0 的估计量为:β 0 = y − β 1 x 。
工具变量法是解决随机性解释变量与随机项相关时, 估计模型中参数的一种简单有效方法。但是,在实际 问题中,如何选择工具变量是一个比较困难的问题。
β 关于8.2节工具变量法,ˆ0 是 β 0 的一致估计量。
ˆ 在已证明 β 1 是 β 1 的一致估计量的条件下,证明:
ˆ ˆ β 0 不是 β 0 的无偏估计量,但 β 0 是 β 0 的一致估计量。
ˆ ˆ 由于 β 0 = y − β1x
ˆ ˆ ˆ β 0 = y − β1x = ( β 0 + β 1 x + u ) − β1x ˆ = β 0 + ( β 1 − β 1) x + u
选择工具变量应满足的条件: 1.工具变量必须是真正的外生变量; 2.工具变量与所替代的随机解释变量高度相关; 3.工具变量与模型中的其他解释变量不相关,或相关 性很小,避免出现多重共线性。 4.在同一个模型中采用多个工具变量,这些工具变量 之间也必须不相关,或相关性很小,避免出现多重共 线性。
ቤተ መጻሕፍቲ ባይዱ
二、工具变量法 为了讨论方便我们将(8.1.4)写成离差形式
ˆ ˆ E ( β 0) = β 0 + E[( β 1 − β 1) x ] + E (u ) ˆ = β 0 + E[( β 1 − β 1) x ] ≠ β 0
ˆ 其中 E[( β 1 − β 1) x ] ≠ 0
表明:有偏
ˆ ˆ P lim β 0 = P lim [ β 0 + ( β 1 − β 1) x + u ]
工具变量法代码
工具变量法代码工具变量法(Instrumental Variables,简称IV)是一种常用的估计因果效应的方法。
它主要针对的是存在内生性问题的经济学模型,如回归分析中的自变量与误差项存在相关关系。
下文将介绍工具变量法的基本原理,以及其在实践中的使用方法和代码实现。
一、基本原理工具变量法的基本思想是利用一个或多个与内生性自变量相关但不受误差项影响的外生性变量(即工具变量)来代替内生性自变量,在保证模型符合经济学意义的前提下,得到更精确的因果效应估计。
具体来说,对于回归模型:y = α + βx + u其中,x为内生性自变量,u为误差项,我们考虑引入一个外生变量z作为工具变量,那么可以构建如下两个求解方程:x = δ + ρz + vy = α + β(δ + ρz + v) + u其中,δ和ρ是未知的系数。
第一个方程是用工具变量估计内生性自变量的回归式,第二个方程则是运用估计出的内生性自变量对y进行回归。
对于外生性工具变量z,我们可以假定它只会通过自变量x对y产生影响,而不会通过误差项u对y产生影响,即:Cov(z,u) = 0而通过IV估计,我们可以得到内生性自变量x在z上的部分效应(partial effect),从而得出因果效应的估计。
二、实践应用在实践中,工具变量法常常被用来研究各种经济学问题。
例如,研究教育水平对收入的影响、研究医疗保险对医疗消费的影响等。
下面以一个简单的例子来说明如何使用工具变量法。
假设我们想研究家庭收入对孩子的大学入学率的影响,但是我们发现家庭收入存在内生性问题,因为它与其他一些难以观测的因素(如家庭背景、社会阶层等)存在相关关系。
我们考虑使用父母的教育水平和收入作为工具变量,来估计家庭收入与大学入学率之间的因果关系。
代码实现在工具变量法的实现中,常常需要用到Python中的statsmodels(回归模型和统计测试)和pandas(数据处理)两个库。
我们假设有如下数据集:- family_income:家庭收入(千元) - education:父母教育水平(0-未受过教育,1-小学,2-初中,3-高中,4-大学) - college:是否考入本科(0-否,1-是)- random_var:随机变量,用于混淆我们首先看一下家庭收入与大学入学率是否存在内生性问题,可以通过构建回归模型来检验:import statsmodels.api as sm import pandas as pddf = pd.read_csv('data.csv')x = df[['family_income']] y = df[['college']] x = sm.add_constant(x) results = sm.OLS(y, x).fit() print(results.summary())运行上述代码后,我们可以得到回归模型的结果,其中P值可以判断内生性是否显著。
计量经济学工具变量IV(2SLS)
03
工具变量应具有可获得性和相关性。
工具变量的选择标准
1 2
相关性
工具变量应与内生解释变量高度相关,以便有效 地替代内生解释变量。
排除性约束
工具变量与误差项无关,以确保工具变量的有效 性。
3
可获得性
工具变量应易于获取,并且能够用于估计模型。
工具变量的有效性检验
工具变量的概念
工具变量应该与内生解释变量相关, 但与误差项无关。工具变量用于估计 参数,以减少误差项的影响。
计量经济学工具变量IV(2SLS)简介
第一阶段
在这一阶段,工具变量与内 生解释变量进行回归,得到 一个预测值。
第二阶段
在这一阶段,原始的因变量 对预测值进行回归,以得到 参数的估计值。
2SLS的Leabharlann 设提高估计效率由于工具变量的使用,使得与误差项相关的信息被排除在估计过程之外,从而提高了估计的效率 。
扩展应用范围
相较于传统的最小二乘法(OLS),工具变量IV(2SLS)的应用范围更广,尤其适用于存在内生解 释变量的情况。
工具变量IV(2SLS)的局限性
工具变量的有效性
问题
找到一个与内生解释变量相关, 但与误差项无关的工具变量并不 容易,如果工具变量与误差项相 关,会导致估计结果偏误。
参数估计
使用工具变量进行参数估计。
数据收集
收集相关数据以用于估计模型参 数。
工具变量IV(2SLS)在经济学领域的应用
劳动经济学
用于估计工资方程、就业方程等,解决工资 方程中的自选择问题。
金融经济学
用于估计资产定价模型,解决代理问题和市 场摩擦问题。
产业组织
stata上机实验第五讲 工具变量(IV)
究竟该用OLS 还是IV
即解释变量是否真的存在内生性? 假设能够找到方程外的工具变量。 1。如果所有解释变量都是外生变量,那么
OLS 比IV 更有效。在这种情况下使用IV,虽 然估计量仍然是一致的,会增大估计量的方 差。2。如果存在内生解释变量,那么OLS 是不一致的,而IV 是一致的。
豪斯曼检验〔Hausman specification test〕原假设: H0 :所有解释变量均为外生变量。 H1:至少有一个解释变量为内生变量。
3。面板数据格式不符合要求的处理。 例如如下表格格式该如何处理? 处理方法: 扁平数据变长条数据的命令:reshape
use invest2,clear
edit
reshape long invest kstock, i(company) j(year)
company invest2002 invest2003 invest2004 kstock2002 kstock2003 kstock2004
检验方法:
estat firststage
1。初步判断可以用偏R2(partial R2)
(剔除掉模型中原有外生变量的影响)。
2。 Minimum eigenvalue statistic(最小特 征值统计量),经验上此数应该大于10。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first
怎样选择固定效应和随机效应?
随机效严格要求个体效应与解释变量不相关, 即
Cov(ai,XitB)=0 而固定效应模型并不需要这个假设条件。 这是两种模型选择的关键。
面板数据根本命令
1。指定个体截面变量和时间变量:xtset 2。对数据截面个数、时间跨度的整体描述:
工具变量法IV两阶段最小二乘法TSLS
原解释变量 X y2, y3,L , ym1, xk1,L , xk
Dongbei University Of Finance & Economics
三者之间的关系
ILS是TSLS的一种特殊形式,而ILS和TSLS都 是工具变量法。即有:
系数矩阵为:
1 b12 0 c11 c12 0
,
0
1 b23 0
0
c23
b31 b32 1 0
0 c33
Dongbei University Of Finance & Economics
计算出1,得到简化式参数 1,从而 得到模型简化式:
2)大样本下的TSLS估计量是一致的;
3)方程恰好识别时,ILS与TSLS估计一致;
4)模型可识别时,每一个结构方程都可用TSLS估计参数。
TSLS是最常用的方法——先建立理论联立结构方程组模型,再 进行单个方程的TSLS估计。
四、工具变量法IV
ILS和TSLS都属于工具变量法。工具变量法,
即对模型方程中出现随机解释变量X时,选择一个
模型可写成矩阵形式:
Y1 b12Y2 0Y3 c11 X1 c12 X 2 0 X 3 u1 0Y1 Y2 b23Y3 0 X1 0 X 2 c23 X 3 u2 b31Y1 b32Y2 Y3 0 X1 0 X 2 c33 X 3 u3
• 二、对简约式模型逐个方程求OLS,得到简约式 模型中所有的参数估计值;
• 三、将简约式参数估计值代入关系式,求结构方 程参数的估计值。
实证研究中常见的5种工具变量(好用)
实证研究中常见的5种工具变量(好用)/ 工具变量(instrumental variable)是社会科学定量分析中解决内生性问题的重要手段,是基于调查数据进行因果推断的前沿方法。
本文在简要介绍工具变量的定义、原理及估算方法的基础上,对实证分析中较为常见的五类工具变量进行回顾梳理,为今后研究寻找工具变量提供了参考。
同时,对工具变量估计量的权重性特征进行了阐述,并结合实例展示了使用工具变量进行因果推断的基本步骤和要点。
最后,就工具变量方法的潜力和局限性进行了剖析。
因果推断的圣杯在反事实因果的框架之下,基于调查数据的社会学定量分析要进行因果推断,难度极大。
其主要原因在于,社会学家一旦要证明某个他们所感兴趣的“因”会带来一定的“果”,就必须面对一个永恒挑战:“内生性”问题( endogeneity) 。
也即: 如果某个潜在的、无法观测的干扰项,既影响“因”,又影响“果”,那么,利用最小二乘法模型( 简称OLS模型) 进行回归分析所得到的估计量就会是有偏误的,而不具有因果推断力。
在实证分析中,无论是经典的教育回报研究( Card,1999),还是我国学界非常关注的关系网、社会资本研究( Mouw, 2003, 2006; 陈云松、范晓光,2010,2011) ,内生性问题都极为重要且亟待解决。
解决内生性问题的常见方法,主要包括工具变量( instrumental variable,简称IV) 、固定效应模型( fixed effects model,简称FE) 、倾向值匹配( propensity score matching,简称PSM) 、实验以及准实验( experimentsand quasi-experiments) 等等。
近年来,其中不少方法已经逐步在我国社会学界得到评述和应用( 梁玉成, 2010; 陈云松、范晓光, 2010, 2011; 陈云松, 2012; 胡安宁,2012; 魏万青,2012) 。
第15章-工具变量
假定我们有一个可观测到的变量 z,它满足 两个假定 : (1)z 与 u 不相关,即 Cov(z,u)=0 (2) z 与 x 相关,即 Cov(z,x)≠0 (15.4) (15.5)
我们则称 z 是 x 的工具变量 (instrumental variable),有时也简称 x 的工具(instrument) 。
因而我们就能够在充分小的显著水平 (比如 5 %或 1%)上,相对双侧对立假设 H1:π 1≠0 而拒绝虚拟假设
H0 : 0 0
(15.7)
如果真是这样,我们能相当有把握地肯定式 (15.5)是成立的。
对于式 (15.1)中的 log(wage)方程,educ 的 工具变量 z 必须: (1)与能力(以及其他影响工资的无法观测因 素)不相关; (2)与教育相关。
最终,假如我们能为 educ 找到一个工具变 量,我们仍可以根据方程 (15. 1)来进行估 计,为描述该方法,将简单回归模型写成: y=β 0+β 1x+u (15.2)
其中我们认为 x 与 u 相关: Cov(x,u)≠0 (15.3)
无论 x 与 u 是否相关,工具变量法都行得通, 但出于后面将会看到的原因, 若 x 与 u 不相 关,我们还是应该使用 OLS。 为了在 x 与 u 相关时得到 0 和 1 的一致估 计量,我们还需要一些额外信息。这些信息 由一个满足某些性质的新变量给出。
即使能获得,如果我们的兴趣在于变量的影响, 而该变量又不随时间而变化,它对于我们也几 无用处:一阶差分或固定效应估计排除了不随 时间而变化的变量。 此外,迄今为止我们所研 究的面板数据方法,还不能解决与解释变量相 关的时变(即随着时间而不断变化的)遗漏变 量问题。
在本章,我们对内生性问题采用了一种不同的 方法。你将看到如何用工具变量法 (IV)来解决 一个或多个解释变量的内生性问题。就应用计 量经济学中线性方程的估计而言,两阶段最小 二乘法 (2SLS 或 TSLS)的受欢迎程度仅次于普 通最小二乘。
工具变量(IV):估计与检验_图文_图文
• 3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
• 例如具休考虑黄油的需求弹性估计问题 :
根据11个均衡样本点估计的方程究竟是需求函数还是 供给函数?两者都不是。由于这些点是由需求和供给 两者的变化确定的,因此用OLS拟合这些点的直线既 不是需求曲线也不是供给曲线的估计。
利用这些样本点估计出来的OLS拟合线是需求曲 线还是供给曲线,都不是!两个极端的情况如图 :
• 工具变量的外生性:若销售税是外生的,则必 须与需求方程中的误差无关;即销售税必然只 是通过价格间接影响香烟的需求。这看上去是 合理的:主要是因为不同州选择了不同的销售 额、收入、财产和其他公共财政事业的混合税 收,所以不同州的一般销售税是不同的。其中 关于公共财政的选择受到政治考量的驱使而不 是受香烟需求有关的因素影响。
工具变量(IV):估计与检验_图文_图文.ppt
• 由来
• 估计
– 矩估计(不好)
– 2SLS (最常用) – GMM(异方差自相关);LIML(若IV)
• 工具变量有效imum eigenvalue statistic,最小特征值统计量,用于多内 生解释变量
• 相关性条件:
• 1. 当包含一个内生变量但有多个工具变量时,工具 变量相关性的条件为给定W时至少有一个Z对预测X 是有用的(相关的)。
• 2. 当包含多个内生变量时,不但要排除完全多重共 线性问题,而且工具变量必须提供关于这些变量外生 性变动的足够信息,以分离出它们各自对Y的效应。
IV和GMM相关估计步骤,内生性、异方差性等检验方法
IV和GMM相关估计步骤,内生性、异方差性等检验方法工具变量和广义矩估计相关步骤一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。
Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。
reg ldi lofdiestimates store olsxtivreg ldi (lofdi=l.lofdi ldep lexr)estimates store ivhausman iv ols(在面板数据中使用工具变量,Stata提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。
详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。
“恰好识别”时用2SLS。
2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS前定变量的要求而得到一致估计量。
二、异方差与自相关检验在球型扰动项的假定下,2SLS是最有效的。
但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store heteroxtgls enc invs exp imp esc mrl,iglsestimates store homolocal df = e(N_g) - 1lrtest hetero homo, df(`df')面板自相关:xtserial enc invs exp imp esc mrl则存在一种更有效的方法,即GMM。
工具变量法工具变量法具体步骤
工具变量法工具变量法具体步骤工具变量法目录概念某一个变量与模型随机解释变量高度相关,但却不与为丛藓科扭口藓项相关,那么就可以用此变量与模型中相应回归系数的一个一致估计量,这个变量就称为方法变量,这种估计方法就叫工具基本原理变量法。
缺点工具变量法的关键是选择一个有效的优先选择工具变量,由于工具自变量变量可以选择中的困难,工具变量法本身存在两方面不足:一是由于工具变量不是惟一的,因而工具变量估计量有一定的任意性;其二由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关的与所替代而随机解释变量高度相关的变量总的来说事实上是困难的。
工具变量法与内生解释变量可持续性解释变量会造成解读严重的后果:不一致性inconstent 和有偏biased ,因为频域不满足误差以解释线性为条件的期望值为0。
产生解释变量招盛纯一般有三个原因:一、遗漏变量二、测量误差三、联立性第三种情况是无法逐步解决的,前两种可以采用工具变量(IV )法。
IV 会带来的唯一坏处是估计方差的增大,也就是说同时采用OLS 和IV 估计,则前者的方差小于后者。
但IV 的应用是有前提条件的:1.IV 与内生解释函数相关,2.IV 与u 不相关。
在小样本情况下,一般用内生解释变量对IV 进行回归,如果R -sq 值很小的话,一般t值也很小,所以对IV 质量的评价没有大的风险问题,但是当采用大样本时,情况则相反,往往是t 值很大,而R -sq 很小,这时如果采用t 值进行关键问题评价则可能出现出现问题。
这时IV 与内生解释变量之间的若干程度不是阐释太大,但是如果与u 之间有轻微的相关机构的话,则:1、导致很小的不一致性;2、有偏性,并且这种有偏性随着R -sq趋于0而趋于OLS 的有偏性。
所以现在在采用IV 时最好采用R -sq 或F -sta 作为评价标准,另外为了观测IV 与u 的关系,可以将IV 作为解释变量放入方程进行回归,如果没有其他的系数没有多的变化,则说明IV 满足第二个条件。
工具变量的选择与识别问题
工具变量的选择与识别问题工具变量(Instrumental Variable, IV)是经济学中常用的一种方法,用于解决内生性(endogeneity)问题。
内生性是指模型中某个解释变量与误差项相关,可能导致估计结果出现偏误。
工具变量方法通过引入外生变量作为工具变量,可以解决内生性问题,并得到一致性的估计结果。
在进行工具变量的选择与识别时,有几个重要的问题需要考虑。
一、合理性与相关性选择工具变量应具备两个基本特征:合理性和相关性。
合理性指工具变量与内生变量之间存在着某种因果关系,可以被理论机制所支持。
例如,研究教育对收入的影响时,一个合理的工具变量可以是家族教育背景,因为家族教育背景会影响个体的受教育水平。
相关性意味着工具变量能够与内生变量相关,但与误差项不相关。
只有具备这两个特点的变量才能成为有效的工具变量。
二、工具变量的强性工具变量的强性是指工具变量与内生变量的相关性的强度。
如果工具变量与内生变量的相关性很弱,那么工具变量的有效性会大打折扣。
在选择工具变量时,应该优先选择那些与内生变量相关性较强的变量。
三、工具变量的外生性工具变量应该是外生变量,即不受模型中其他变量的影响。
如果工具变量自身受到内生变量的影响,那么它就不再是一个有效的工具变量。
使用一些仪器变量检验方法,例如Hausman检验或者Durbin-Wu-Hausman检验,可以用来检验工具变量的外生性。
四、工具变量与内生性工具变量方法可以用来处理单一内生性问题,也可以扩展到多重内生性问题。
对于单一内生性问题,只需要找到一个有效的工具变量即可。
但对于多重内生性问题,需要选择一组相关性较强且不相关的工具变量,以确保工具变量的有效性。
总之,在选择和识别工具变量时,需要考虑工具变量的合理性、相关性、强性和外生性。
通过合理选择和识别有效的工具变量,可以消除内生性问题,得到具有一致性和有效性的估计结果。
工具变量法的选取标准的案例
工具变量法的选取标准的案例工具变量法(Instrumental Variable, IV)是一种解决内生性问题的方法,它的核心思想是通过引入一个与内生变量相关但与被解释变量无关的工具变量,来估计内生变量对被解释变量的影响。
在使用工具变量法时,选择合适的工具变量非常重要。
下面将以研究教育对经济增长的影响为例,说明工具变量法的选取标准。
一般来说,工具变量要满足两个条件。
首先,工具变量必须与内生变量有相关性,这意味着工具变量对内生变量有预测能力。
其次,工具变量不能与被解释变量相关,否则就无法将工具变量作为一个独立的回归方程中的解释变量。
综合这两个条件,我们可以从实证研究和经济理论中寻找合适的工具变量。
在研究教育对经济增长的影响时,内生变量是教育水平,被解释变量是经济增长率。
教育水平可能受到家庭背景、文化传统等因素的影响,同时教育水平对经济增长也会产生影响,形成一个内生性问题。
为了解决内生性问题,可以选择投入的教育资源作为工具变量,因为教育资源与教育水平有一定的相关性。
具体来说,可以选择教育资源的投入水平作为工具变量。
教育资源的投入水平包括教师数量、教育经费等。
这些变量与教育水平有较强的相关性,教育资源的投入水平较高意味着教育水平较高。
然而,教育资源的投入水平对经济增长的影响应该是通过教育水平来实现的,而与经济增长本身无关。
因此,教育资源的投入水平可以被看作一个符合工具变量的要求的变量,被用来估计教育水平对经济增长的影响。
总之,工具变量法是解决内生性问题的一种有效方法。
在选择工具变量时,需要选择与内生变量有相关性但与被解释变量无关的变量,并进行相关性和合理性检验。
从实证研究和经济理论中寻找合适的工具变量是确保工具变量法有效性的关键步骤。
在研究教育对经济增长的影响时,教育资源的投入水平可以作为一个合理的工具变量,用来解决教育水平的内生性问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用到 i E zi x 为对称矩阵
-1
秩条件r i E zi x =k意味着工具变量w i与内生解释 变量x i相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数 2 恰好识别:工具变量个数等于内生解释变量个数 3 过度识别:工具变量个数多于内生解释变量个数
解释变量内生性检验
Hausman 检验
寻找工具变量的方法:几个实例
方法 例子
由来
经典假设 所有的解释变量Xi与随机误差项彼此 之间不相关。
Cov (u i , X i ) 0
若解释变量Xi和ui相关,则OLS估计量是非一致 的,也就是即使当样本容量很大时,OLS估计量 也不会接近回归系数的真值。 造成误差项与回归变量相关(内生性)的原因 很多,但我们主要考虑如下几个方面: • 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
1、矩估计(Method of Moments,MM)
首先以一个例子来说明矩估计方法:假设随机变量 x N , 2 ,其中, 2为待估参数。因为有两 个待估参数,故需要使用以下两个总体矩条件: 一阶中心矩:E x =
2 2 二阶中心矩:E x =Var x + E x = + 2 2
可以引入工具变量w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即 Cov w t,p t 0,p t为内生解释变量 (2)外生性:工具变量与扰动项不相关,即 Cov w t, t =0
二、工具变量法作为一种矩估计
2、工具变量法作为一种矩估计
假设回归模型为 yi=1x i1+ + k-1x i,k-1+ k x ik+ i 假设只有最后一个解释变量x ik为内生变量,即 Cov x ik, i 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov x ik,w i 0 (相关性),以及Cov w i, i =(外生性)。由于 0 x1, ,x k-1不是内生变量,故可以把自己作为自己 的工具变量(因为满足工具变量的两个条件)
-1
E i x i yi-x =0
= i i 可逆) E x i x E x i yi (假设E x i x
以样本矩替代上式中的总体矩,即可得到矩估计:
n 1 1 -1 ˆ ˆ MM= x i x x y = X X X y = i i i OLS n i=1 n i=1 显然这就是OLS估计量 n -1
3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
我们的工作就是要寻找相应的工具变量将解 释变量分解成内生变量和外生变量,然后利 用两阶段最小二乘法(TSLS)进行估计。 一个例子:考虑货币政策对宏观经济的影响。 由于货币政策的制定者会根据宏观经济的运 行情况来调整货币政策,故货币政策是个内 生变量(双向因果关系)。Romer (2004) 通过阅读历史文献将货币政策的变动分解为 “内生”(对经济的反应)与“外生”(货 币当局的自主调整)的两部分。
上图表明若某个变量使供给曲线移动而使需求保待不 变时会发生什么样的情况。现在所有的均衡价格和均 衡量对都落在这条稳定的需求曲线
工具变量法的本质是联立方程,只不过 ,我们只关心原方程的可识别性
估计:矩估计、TSLS、GMM、LIML
一、工具变量法(Instrumental Variable,IV)
以上介绍的矩估计法仅适用于恰好识别的情况。 在过度识别的情况下,ZX不是方阵, ZX 不存在
-1
ˆ 。 无法得到工具变量估计量 IV
若扔掉多余的工具变量将会浪费有用的信息,有效 的方法是二阶段最小二乘法
三、二阶段最小二乘法
显然,多个工具变量的线性组合仍然是工具变量 因为仍满足工具变量的两个条件(相关性与外生性) 如果生成工具变量的k个线性组合,则又回到恰好 识别的情形。那么什么样的线性组合才是最有效率 的呢?可以证明在球形扰动项的假设下,由二阶段 最小二乘法(2SLS)所提供的工具变量线性组合是 所有线性组合中最渐近有效的。这个结论类似于小 样本理论中的高斯-马尔可夫定理。
用对应的样本矩来替代总体矩条件可得以下联立 方程组,求解后即得到期望与方差的矩估计:
1 n ˆ ˆ=x n x i= i=1 2 1 n 2 n ˆ = x i-x 2 2 1 x 2= ˆ + ˆ n i=1 i n i=1 1 n 其中,x= x i为样本均值,上面推导中用到: n i=1
-1
E z x i i E g i =0
-1 =0
其中SZX
1 n 1 n zi x z i i i,g n i=1 n i=1
与第三章大样本最小二乘法类似的假定和推导,
d 可以证明,ng N 0,S, 2 其中S E gi g = E i zi zi i
n 1 1 -1 ˆ IV= zi x zi yi = ZX Zy i n i=1 n i=1 n -1
其中,Z z1
z n-1 z n 即Z z1
z n-1 z n
下面是工具变量法的大样本性质:
定理:若秩条件r i i 满 E zi x =k成立(方阵E zi x ˆ 是的一致估计 秩),则在一定的正则条件下, IV ˆ 服从渐近正态分布 且
工具变量(instrumental variable, IV)回 归是当回归变量X与误差项u相关时获得总体 回归方程未知系数一致估计量的一般方法。 我们经常称其为IV估计。 其基本思想是:假设方程是:
我们假设ui与Xi相关,则OLS估计量一定是 有偏的和非一致的。工具变量估计是利用另 一个“工具”变量Z将Xi分离成与ui相关和 不相关的两部分。
E i zi yi-x =0
-1
由此可得E zi i =0
-1
E zi yi = i E zi x = i i E zi x E zi yi (假定 E zi x 存在)
以样本矩代替上式中的总体矩,即可得到工具变 量估计量:
2 2 x - x = x - nx i i 2 n n i=1 i=1
任何随机向量x的函数f x 的期望E f x 都被称为 总体矩。事实上,OLS也是一种矩估计。利用解释 变量与扰动项的正交性,可以得到以下总体矩条件
E x i i =0
E x i yi =E x i x i
在经济学中: (1)内生变量:由模型内的变量所决定 的变量称作内生变量。 (2)外生变量:由模型外的变量所决定 的变量称作外生变量。
重要概念:内生变量和外生变量
在计量经济学中,把所有与扰动项相关 的解释变量都称为“内生变量”。这与 一般经济学理论中的定义有所不同。 1。与误差项相关的变量称为内生变量 (endogenous variable)。 2。与误差项不相关的变量称为外生变量 (exogenous variable)。
谁开创了工具变量回归?
1928年的著作的“The Tariff on Animal and Vegetable Oils”的附录B。 作者是谁? Philip Wright 还是他的儿子 Sewall Wright 文体计量学的分析
为什么IV回归是有效的?
例1: Philip Wright的问题 Philip Wright关心的是那个时期的一个重要 经济问题:即如何对诸如黄油,大豆油这样的 动植物油和食用动物设置进口关税。在20世 纪20年代,进口关税是美国主要的税收收入 来源。而理解关税的经济效应的关键在于要有 商品需求和供给曲线的定量估计。由前知供给 弹性为价格上涨1%引起的供给量变化的百分 率,而需求弹性为价格上涨1%引起的需求量 的百分率变化。
工具变量回归
由来 估计
矩估计(不好) 2SLS (最常用) GMM(异方差自相关);LIML(若IV)
工具变量有效性检验
相关性 F检验; Partial R2,单内生解释变量Minimum eigenvalue statistic,最小特征值统计量,用于多内 生解释变量 外生性 过度识别约束检验 J统计量 (又称Sargan 统计量)
ˆ 渐近服从正态分布,即 进一步,工具变量估计量 IV
d ˆ - =S-1 ng ˆ ,其 n N 0 , AVar IV ZX IV -1 -1 ˆ 中渐近方差矩阵AVar IV = i i E zi x S E zi x
IV
-1 ˆ 证明:抽样误差 IV-= ZX Zy-
= ZX Z X+ -= ZX Z
-1 -1
1 1 n -1 p = zi x i zi i =SZX g n i=1 n i=1
n
记解释变量向量x i x i1 yi=x i + i zi zi1 zi,k-1 zik x i1
x i,k-1 x ik ,则原模型为 x i,k-1 w i 。
记工具变量向量为
定义gi zi i。由于工具向量与扰动项正交,故 E gi =E zi i =0为总体矩条件或正交条件