第七章 工具变量2SLSGMM

合集下载

GMM的stata操作步骤

GMM的stata操作步骤

GMM的sta操作步骤广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。

Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。

reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Sta 提供了如下命令来执行2SLS:xtivreg depvar [varlist1](varlist_2=varlist_iv)(选择项可以为fe,re 等,表示固定效应、随机效应等。

详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。

“恰好识别”时用2SLS。

2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS 前定变量的要求而得到一致估计量。

t p t q t p 二、异方差与自相关检验在球型扰动项的假定下,2SLS是最有效的。

但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo,df(`df')面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。

2sls stata代码

2sls stata代码

2sls stata代码使用2sls stata代码进行计量经济分析一、引言在计量经济学中,为了解决内生性问题,研究者常常使用两阶段最小二乘法(Two-Stage Least Squares, 2SLS)进行估计。

2SLS是一种常见的计量经济学方法,它通过建立一个结构方程模型,通过两个阶段的回归来估计内生变量的影响。

二、2SLS方法简介2SLS方法通过建立一个工具变量来解决内生性问题。

在第一阶段,研究者选择一个与内生变量相关但与误差项不相关的工具变量,通过回归得到内生变量的预测值。

在第二阶段,将这个预测值代入原始模型,再次进行回归分析,从而得到内生变量的准确估计。

三、使用Stata进行2SLS分析的步骤在Stata中,可以使用ivregress命令进行2SLS分析。

以下是一个简单的示例,演示了如何使用Stata进行2SLS分析。

1. 导入数据我们需要导入我们的数据集。

可以使用命令"import"或"insheet"导入数据。

2. 第一阶段回归接下来,我们需要进行第一阶段的回归分析,以得到内生变量的预测值。

使用ivregress命令进行第一阶段的回归分析,指定内生变量作为因变量,工具变量作为自变量。

3. 得到预测值在第一阶段回归之后,我们可以得到内生变量的预测值。

使用predict命令将预测值保存起来,以便在第二阶段回归中使用。

4. 第二阶段回归我们进行第二阶段的回归分析,将预测值代入原始模型。

使用ivregress命令进行第二阶段的回归分析,指定因变量和其他解释变量,并使用预测值作为自变量。

5. 结果解读在第二阶段回归之后,我们可以得到最终的估计结果。

通过检查回归系数的显著性和方向,我们可以判断内生变量对因变量的影响。

四、注意事项在进行2SLS分析时,需要注意以下几点:1. 工具变量的选择:工具变量应当与内生变量相关,但与误差项不相关。

2. 检验工具变量的有效性:可以使用Hausman检验或其他相关检验方法来检验工具变量的有效性。

搞定内生性,不可不知的工具变量法笔记

搞定内生性,不可不知的工具变量法笔记

搞定内生性,不可不知的工具变量法笔记内生性( endogeneity)问题,是指由自变量与误差项相关所引发的估计偏倚及统计结果误导性等问题的总称,即违背了线性回归中的正交假定而产生的一系列问题。

内生性问题看似简单,但目前已成为线性回归及其他回归模型中最为棘手的问题。

工具变量法是解决内生性问题的有效方法。

在工具变量估计中,第一,检验是否具有内生性,可以使用豪斯曼检验。

第二,工具变量的正交性检验。

(1)、强度条件,即工具变量应该与内生自变量具有较强的相关性,即该工具变量的应该能够代替或者表达原内生变量的信息,数学表达式为:COV(Z,X)=/0(2)、排除限制条件,即工具变量应该与误差项不相关,也就是与因变量Y中不能被已有的自变量x所表达的部分无关(也是与误差项无关)COV(Z,u)=/0。

工具变量估计二阶段最小二乘法的第一阶段就是利用原模型的内生解释变量对工具变量进行OLS,得到解释变量的拟合值;第二步,利用得到解释变量的拟合值对原模型进行最小二乘法,从而得到方程模型的估计值,这样就可以消除内生性的影响。

首先了解一下二阶段最小二乘法Stata中的命令为ivregress,语法格式为•ivregress estimator depvar [varlist1] (varlist2 = varlist_iv) [if] [in] [weight] [, options]选项介绍estimator分为2sls两阶段最小二乘、liml有限的信息最大似然(liml) 、gmm广义矩方法(gmm)depvardepvar 为被解释变量;varlist1为外生解释变量;varlist2 为所有的内生解释变量;varlist_iv为所有的工具变量;在选项 options 中,vce(robust)表示稳健型标准误可使用 firstfirst 选项报告 2SLS 中第一阶段的回归结果small表示小样本下的自由度调整本文以伍德里奇第十五章数据mroz.dta为例,研究已婚妇女的教育回报,相关数据介绍如下:•••••••••••••use morz.dtaeditdesc*被解释变量label var lwage 已婚妇女工资的对数值*解释变量label var educ 受教育年数 label var exper 工作年限label var expersq 工作年限平方*工具变量label var fatheduc 已婚妇女的父亲的受教育年数label var motheduc 已婚妇女的母亲的受教育年限其中研究问题为:建立lnwage与educ、exper 、expersq的方程,但是包括了影响已婚妇女工资的遗漏变量,可能存在内生性问题,其中能力会对工资产生影响,但是却与解释变量X中的educ相关,内生性存在。

GMM学习笔记

GMM学习笔记

自由度为 m-k
3 3在 / 中输入 广义矩估计 广义矩方法 经典矩方法
Hansen 的表述:
当 l>K 时,称模型参数“过度识别” ,该检验称为过渡识别约束检验。 过渡识别约束检验也称为 Sargan 检验。 即,软件给出的结果是 J,但是判断时,要使用 nJ. 例如,某个模型计 算得到 J=0.029837, 那么,nJ=0.477, 5%的显著性水平下,自由度为 1 的卡方 分布的临界值为 3检验构造的矩条件是否成立。如果矩条件不成立,就要从模型设定方面寻找原因。 另外,如果对模型参数施加约束,则需要进行参数约束检验。
广义矩估计
How?如,IV。及此 页下面这个例子
经典矩估 计中,只取 K 阶样本矩
E(XU)=0,X=X1,X3; E(U)=0; E(ZU)=0,Z=Z1,Z2
损失函数?
对称权矩阵 是 m*m 阶的 W 矩阵反映 了 g 的重要 性
如,以下说明以某一标准选择权矩阵
1
W n2 i
Cov[Zii , Z j j ]
1极大似然估计法(maximumlikelihoodmethod,ML)的应用虽然没有普通最小二乘法广泛,但它是 一个具有更强理论性质的点估计方法,它以极大似然原理为基础,通过概率密度函数或者分布律 来估计总体参数。对于一些特殊类型的计量经济模型,如我们后面将介绍的 Logit 和 Probit 模型, 最小二乘法不再适用,极大似然法成为首选的估计方法。极大似然法的思路 极大似然估计法的 出发点是已知被观测现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率的 那些参数的值来估计该分布的参数,从而提供了一种用于估计刻画一个分布的一组参数的方法。 2广义矩方法确实是一种具有高度概括性的方法。其他的参数估计量可以看做它的特例。比如最 小二乘法估计量(OLS)和最大似然估计量(MLE)都是 GMM 估计量的特例。当待估参数较多时。最 大似然估计需要较为复杂的数值求解。GMM 估计更加方便。GMM 在时间序列及面板数据分析 等许多场合有着广泛的应用

GMM作用与操作

GMM作用与操作
1极大似然估计法(maximumlikelihoodmethod,ML)的应用虽然没有普通最小二乘法广泛,但它是 一个具有更强理论性质的点估计方法,它以极大似然原理为基础,通过概率密度函数或者分布律 来估计总体参数。对于一些特殊类型的计量经济模型,如我们后面将介绍的 Logit 和 Probit 模型, 最小二乘法不再适用,极大似然法成为首选的估计方法。极大似然法的思路 极大似然估计法的 出发点是已知被观测现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率的 那些参数的值来估计该分布的参数,从而提供了一种用于估计刻画一个分布的一组参数的方法。 2广义矩方法确实是一种具有高度概括性的方法。其他的参数估计量可以看做它的特例。比如最 小二乘法估计量(OLS)和最大似然估计量(MLE)都是 GMM 估计量的特例。当待估参数较多时。最 大似然估计需要较为复杂的数值求解。GMM 估计更加方便。GMM 在时间序列及面板数据分析 等许多场合有着广泛的应用
g(
)


g1 g2
gJ
( ( (
) )
)
Biblioteka n 1 n
1 n
z1iei
i

z2i
ei

i


i z Ji ei
2STS
vs
GMM
一阶导
GMM 与 OLS 、MLE、IV、 GEE 的联系和区别 1, OLS:选择解释变量作为工具变量构造矩条件,权利矩阵为单位阵,GMM 即为 OLS。参 数估计值相同,参数估计量的方差—协方差矩阵一般不相同. 2,MLE:用对数似然函数的导数构造等于 0 的矩条件时,所表示的 GMM 等价于 ML 。 3,IV:GMM 中方程个数等于参数个数时,即等价于工具变量估计法。 4,2STS: 2SLS 是工具变量估计方法的特殊情形,而工具变量估计是 GMM 估计的特殊情形。 如果 GMM 中利用了所有先决变量, 2SLS 与 GMM 估计等价。如上图。 5,与 GEE 的对比,GMM 的使用场合是估计方程的个数大于未知参数的个数。而这两者相 等时,可以使用 GEE。 GMM 的检验 对于 GMM,关键是两项检验:

工具变量法(二):弱工具变量

工具变量法(二):弱工具变量

⼯具变量法(⼆):弱⼯具变量世上没有完美的计量⽅法,因为所有的计量⽅法与模型均依赖于⼀定的前提假设。

因此,在估计完计量模型后,通常需要对模型的前提假设进⾏检验,称为 “诊断性检验”(diagnostic checking)或 “模型检验”(model checking)。

⼯具变量法也不例外。

⼯具变量法的成⽴依赖于有效的⼯具变量(valid instruments),即所使⽤的⼯具变量须满⾜相关性(与内⽣解释变量相关)与外⽣性(与扰动项不相关)。

⼯具变量的相关性(Instrument Relevance)在⼤样本下,2SLS为⼀致估计。

但对于⼤多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中⼼,即⽽且,如果⼯具变量与内⽣变量的相关性较弱,则 2SLS 的偏差会变得更为严重。

直观来看,2SLS 的基本思想是通过外⽣的⼯具变量,从内⽣变量中分离出⼀部分外⽣变动(exogenous variations),以获得⼀致估计。

如果⼯具变量与内⽣变量的相关性很弱,则通过⼯具变量分离出的内⽣变量之外⽣变动仅包含很少的信息。

因此,利⽤这些少量信息进⾏的⼯具变量法估计就不准确,即使样本容量很⼤也很难收敛到真实的参数值。

这种⼯具变量称为 “弱⼯具变量”(weak instruments)。

弱⼯具变量的后果弱⼯具变量的后果类似于样本容量过⼩,会导致 2SLS 的⼩样本性质变得很差,⽽ 2SLS 的⼤样本分布也可能离正态分布相去甚远,致使基于⼤样本理论的统计推断失效。

下⾯通过蒙特卡洛模拟(Monte Carlo simulation)来直观地考察弱⼯具变量的后果。

考虑最简单的⼀元回归模型,假设其数据⽣成过程(data generating process)为:其中,为内⽣变量,与扰动项相关;⽽的真实系数为 2。

假设样本容量为10,000,并使⽤⼯具变量进⾏ 2SLS 回归。

工具变量法2SLS与GMM

工具变量法2SLS与GMM

工具变量法2SLS与GMM1第 10 章工具变量,2SLS 与 GMM10.1 解释变量与扰动项相关的例子例农产品市场均衡模型q d = α + α p + u (需求)t 0 1 t t ? q s = β + β p + v(供给) t ? q d 0 1 t t = q s(均衡)tt令q ≡q d=q s,可得t t tq t =α0+α1 p t +u tq =β+βp +vt 0 1 t t两个方程中的被解释变量与解释变量完全一样。

如直接作回归q ?O?LS?→p,估计的是需求函数还是供给函数?t t2图10.1 需求与供给决定市场均衡341 1 1 11 1把线性方程组中的( p t , q t )看成是未知数(内生变量),把(u t , v t ) 看作已知,可求解( p t , q t )为(u t , v t ) 的函数:p = p (u ,v ) = β0 - α0 + v t - u t ? t t t t α - β α - β ? 1 1 1 1 ?q = q (u ,v ) = α1β0 - α0 β1 + α1v t - β1u t ?? t t t t α - β α - β由于 p t 为(u t , v t ) 的函数,故Cov( p t , u t ) ≠ 0,Cov( p t , v t ) ≠ 0。

OLS 估计值α?1, β? 不是α , β 的一致估计量。

称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量偏差”(endogen eity bias)。

1如能将内生变量分成两部分,一部分与扰动项相关,另一部分与扰动项不相关,可用与扰动项不相关的那部分得到一致估计。

这种分离常借助另一“工具变量”来实现。

假设在图10.1 中,存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动,则可估计需求曲线,参见图10.2。

这个使得供给曲线移动的变量就是工具变量。

计量经济学:一般估计方法(NLS、GLS、GMM、逐步筛选、对数极大似然)

计量经济学:一般估计方法(NLS、GLS、GMM、逐步筛选、对数极大似然)

10 *一般估计方法回归方程的估计在特定的条件下选择适当的估计方法会使得结果更加接近实际,更具有说服力。

满足古典线性回归模型的基本假设条件下,利用普通最小二乘法(OLS )估计出来的系数具备优良的线性无偏最小方差(BLUE )的性质。

如果一些条件不能满足,例如出现非线性模型、异方差、序列相关等情形,就无法得到这样的性质。

并且在面对因变量有影响而难以取舍或特殊的计量模型时,就需要改进估计方法以获得更加满意的估计结果。

下面依次介绍几种常见的一般估计方法:非线性最小二乘法(NLS )、广义最小二乘法(GLS )、广义矩阵法(GMM )、逐步筛选最小二乘法、对数极大似然估计法。

10.1 非线性最小二乘法最小二乘法适用的古典假设之一是回归模型是线性的,然而社会经济现象是极其复杂的,有时被解释变量与解释变量之间的关系不一定是线性的。

例如柯布.道格拉斯(Cobb-Dauglass )生产函数模型:321t t t t y L K u ααα=+ ,t=1,2,...,T (10.1.1) 对此方程(10.1.2)进行对数变换,如下式123ln ln ln t t t t y L K u ααα=+++ (10.1.2)虽然式(10.1.2)的变量是非线性形式,此时我们仍能采用估计线性模型的方法,因此模型是参数线性的。

反之,就是参数非线性的,我们就要采用非线性的估计方法。

构建下面的非线性模型:(,)t t t y f x u α=+ ,t=1,2,…,T (10.1.3)式中,y 是被解释变量,x 为解释变量(向量),t u 为误差项,α为待估计的K 维参数向量12(,,...,)k αααα'=,T 是样本个数。

此处讨论的是,f 关于参数α的导数仍含参数α本身,即参数非线性模型。

非线性最小二乘估计是要选择参数向量α的估计值ˆα使残差平方和S(ˆα)最小:[]21ˆˆ()(,)T t t t S y f x αα==-∑ (10.1.4)求解方程,对每个参数分别求偏导数并令这些偏导数为0,得到方程组:[]1ˆˆ(,)()ˆ2(,)0ˆˆT t t t t i i f x S y f x ααααα=∂∂=--=∂∂∑,i=1,2,...,k (10.1.5) 对于参数非线性模型,无法利用普通最小二乘的方法直接求解式(10.1.5)。

两阶段最小二乘法 工具变量法

两阶段最小二乘法 工具变量法

主题:两阶段最小二乘法与工具变量法在计量经济学中的应用1. 介绍两阶段最小二乘法两阶段最小二乘法(Two-Stage Least Squares, 2SLS)是一种常用的计量经济学方法,用于解决内生性问题。

内生性指的是因果关系中的变量之间存在相互影响,从而导致回归估计结果出现偏误。

在这种情况下,传统的最小二乘法估计会产生一系列问题,而2SLS方法则可以有效应对内生性问题。

2. 2SLS的基本原理2SLS方法通过两个阶段的回归来解决内生性问题。

在第一阶段,利用工具变量(Instrumental Variable, IV)对内生变量进行预测,得到预测值。

然后在第二阶段,将这些预测值作为虚拟自变量,代替原内生变量进行回归分析。

这样可以消除内生性带来的偏误,得到更准确的估计结果。

3. 工具变量法的选择选取适当的工具变量对2SLS方法的有效实施至关重要。

工具变量要满足两个条件:工具变量必须与内生变量相关;工具变量不能与误差项相关。

只有在满足这两个条件的前提下,工具变量才能有效地解决内生性问题。

4. 工具变量法的优点和局限性工具变量法作为解决内生性问题的一种重要方法,具有一定的优点。

它能够有效地减少回归估计的偏误,提高估计结果的准确性。

工具变量法在理论上被广泛认可,具有较强的可靠性。

然而,工具变量法也存在局限性,例如工具变量的选择可能受到数据可得性的限制,导致实施时候面临较大挑战。

5. 两阶段最小二乘法与工具变量法在实践中的应用在实际的计量经济学研究中,两阶段最小二乘法与工具变量法被广泛应用于解决内生性问题。

研究人员常常利用2SLS方法来评估一些政策或项目对经济变量的影响,同时选择适当的工具变量来进行估计。

通过这种方法,他们可以更加准确地判断政策或项目对经济变量的影响,为决策提供科学依据。

6. 结语两阶段最小二乘法与工具变量法在计量经济学中发挥着重要作用。

通过2SLS方法和适当的工具变量的选择,研究人员能够更加准确地估计经济模型中存在内生性问题的变量,为实证研究提供可靠的结果和结论。

STATA做GMM估计

STATA做GMM估计

STATA做GMM估计广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。

Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。

reg ldi lofdiestimates store olsxtivreg ldi (lofdi=l.lofdi ldep lexr)estimates store ivhausman iv ols(在面板数据中使用工具变量,Stata提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。

详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。

“恰好识别”时用2SLS。

2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS前定变量的要求而得到一致估计量。

tptqtp二、异方差与自相关检验在球型扰动项的假定下,2SLS是最有效的。

但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store heteroxtgls enc invs exp imp esc mrl,iglsestimates store homolocal df = e(N_g) - 1lrtest hetero homo, df(`df')面板自相关:xtserial enc invs exp imp esc mrl则存在一种更有效的方法,即GMM。

一文读懂GMM的stata操作步骤

一文读懂GMM的stata操作步骤

一文读懂GMM的stata操作步骤来源:网络,由计量经济学服务中心综合整理,转载请注明来源一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。

Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。

reg ldi lofdiestimates store olsxtivreg ldi (lofdi=l.lofdi ldep lexr)estimates storeivhausman iv ols(在面板数据中使用工具变量,Stata 提供了如下命令来执行2SLS:xtivregdepvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re 等,表示固定效应、随机效应等。

详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。

“恰好识别”时用2SLS。

2SLS 的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足 OLS 前定变量的要求而得到一致估计量。

二、异方差与自相关检验在球型扰动项的假定下,2SLS 是最有效的。

但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store heteroxtgls enc invs exp imp esc mrl,iglsestimates store homolocal df =e(N_g) - 1lrtest hetero homo, df(`df')面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即 GMM。

高维回归stata工具变量法命令

高维回归stata工具变量法命令

高维回归stata工具变量法命令
在高维回归分析中,Stata工具变量法的命令是`ivregress`和`ivreg2`。

其中,`ivregress`是Stata自带的命令,支持两阶段最小二乘(2SLS)、广义矩估计(GMM)和有限信息最大似然估计(LIML)三种工具变量估计方法。

而`ivreg2`是一个更新的命令,支持更多的工具变量估计方法。

使用`ivregress`命令时,需要提供因变量、内生解释变量、工具变量和控制变量。

命令会自动进行两阶段最小二乘回归,第一阶段回归使用内生解释变量对工具变量和控制变量进行回归,得到拟合值,第二阶段回归使用被解释变量对第一阶段回归的拟合值和控制变量进行回归。

如果需要控制固定效应或进行聚类分析,可以使用选择项`absorb`和
`cluster`。

选择项`first`可以报告第一阶段回归的结果。

选择项`endog`可以检验内生解释变量是否为内生变量,即进行内生性检验。

请注意,使用工具变量法需要找到一个合适的工具变量并说明其合理性,这是工具变量法的难点。

另外,由于模型设定错误或数据问题,工具变量法可能无法完全消除内生性问题,因此在使用时需要谨慎。

GMM的stata操作步骤

GMM的stata操作步骤

GMM的stata操作步骤广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。

Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。

reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Stata 提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re 等,表示固定效应、随机效应等。

详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。

“恰好识别”时用2SLS。

2SLS 的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS 前定变量的要求而得到一致估计量。

t p t q t p 二、异方差与自相关检验在球型扰动项的假定下,2SLS 是最有效的。

但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het) estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo, df(`df') 面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。

工具变量法GMM估计

工具变量法GMM估计

工具变量法 GMM估计1 OverviewModel过程可以分析线性、非线性(对参数或者对变量)的单方程和方程组。

使用的估计方法有:OLS, 2SLS, SUR, ITSUR, 3SLS, IT3SLS,GMM ,FIML。

MODEL过程分析的模型如下:这里,Y是内生变量,X是外生变量,TEHTA是参数。

观测到的变量要么是内生变量,要么是外生变量。

上面的方程组可以简写为:这个形式称为一般形式。

还可以写成标准形式:标准形式把内生变量放在方程的一边。

两种形式的方程(组)都可以使用MODEL过程估计。

经常用当前外生变量、滞后的外生变量、滞后的内生变量来解释当前内生变量。

这就构成了一个动态模型。

滞后变量不论内生还是外生都看作外生变量。

以上并不要求扰动项独立同分布。

自相关、异方差甚至不同的分布都有可能。

对于异方差可以使用加权估计,GARCH模型也可以修正异方差。

如果难以确定异方差的来源和形式,难以确定权重变量的话,可以使用GMM方法得到比OLS方法更加有效的估计。

方程组一个常见的问题就是联立偏倚。

考虑:这个方程组对参数是非线性的,不能使用线性回归估计。

同时这里Y1和Y2是同时决定的,普通非线性最小二乘方法的结果也是有偏和非一致的。

这称为联立性偏倚。

在线性模型中,处理联立性偏倚的可以把出现在方程右边的内生变量换成其预测值。

预测值与扰动项无关从而消除了联立性偏倚。

预测值是通过工具变量法估计得到的,这称为第一步回归。

利用预测值进行第二次回归称为两段最小二乘。

在非线性模型中,使用线性近似,把非线性方程组线性化后使用工具变量法,反复迭代。

在方程组中,方程之间的扰动项可能相关。

对于大样本情况,可以使用系统方法考虑到方程内和方程之间关系得到更有效的估计。

如果不存在联立性问题,即不存在内生变量作为解释变量的话,可以使用SUR估计。

SUR方法需要估计方程之间扰动项的协方差矩阵∑。

估计步骤为先使用OLS估计方程组,从残差得到∧∑,然后使用SUR。

工具变量(IV):估计与检验

工具变量(IV):估计与检验

与内生解释
i
变量xi相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量
根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数
2 恰好识别:工具变量个数等于内生解释变量个数
3 过度识别:工具变量个数多于内生解释变量个数
以上介绍的矩估计法仅适用于恰好识别的情况。
3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
谁开创了工具变量回归?
1928年的著作的“The Tariff on Animal and Vegetable Oils”的附录B。 作者是谁? Philip Wright 还是他的儿子 Sewall Wright 文体计量学的分析
为什么IV回归是有效的?
例1: Philip Wright的问题
• 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
遗漏变量偏差可采用在多元回归中加入遗漏变量 的方法加以解决,但前提是只有当你有遗漏变量 数据时上述方法才可行。
双向因果关系偏差是指如果有时因果关系是从X 到Y又从Y到X时,此时仅用多元回归无法消除这 一偏差。同样,
变量有测量误差也无法用我们前面学过的方法解 决。
因此,由于这些点是由需求和供给两者的变化 确定的,因此用OLS拟合这些点的直线既不是 需求曲线也不是供给曲线的估计。
Wright的解决办法:

第七章工具变量、2SLS、GMM

第七章工具变量、2SLS、GMM
IV
-1 ˆ 证明:抽样误差 IV-= ZX Zy-
= ZX Z X+ -= ZX Z
-1 -1
1 1 n -1 p = zi x i zi i =SZX g n i=1 n i=1
n
记解释变量向量x i x i1 yi=x i + i zi zi1 zi,k-1 zik x i1
x i,k-1 x ik ,则原模型为 x i,k-1 w i 。
记工具变量向量为
定义gi zi i。由于工具向量与扰动项正交,故 E gi =E zi i =0为总体矩条件或正交条件
公式,可得2SLS的最终表达式: -1 ˆ = XPX XPy
2SLS
= XZ ZZ ZX
-1


-1
XZ ZZ Zy
-1
四、有关工具变量的检验
在使用工具变量法时,必须对工具变量的有效性 进行检验。如果工具变量非有效,则可能导致估 计不一致,或估计量的方差过大。
E i zi yi-x =0
-1
由此可得E zi i =0
-1
E zi yi = i E zi x = i i E zi x E zi yi (假定 E zi x 存在)
以样本矩代替上式中的总体矩,即可得到工具变 量估计量:
以上介绍的工具变量法仅适用于恰好识别的情况。 在过度识别的情况下,ZX不是方阵, ZX 不存在
-1
ˆ 。 无法得到工具变量估计量 IV
若扔掉多余的工具变量将会浪费有用的信息,有效 的方法是二阶段最小二乘法
三、二阶段最小二乘法
显然,多个工具变量的线性组合仍然是工具变量 因为仍满足工具变量的两个条件(相关性与外生性) 如果生成工具变量的k个线性组合,则又回到恰好 识别的情形。那么什么样的线性组合才是最有效率 的呢?可以证明在球形扰动项的假设下,由二阶段 最小二乘法(2SLS)所提供的工具变量线性组合是 所有线性组合中最渐近有效的。这个结论类似于小 样本理论中的高斯-马尔可夫定理。

工具变量法(四):GMM

工具变量法(四):GMM

工具变量法(四):GMMProf. Lars Peter HansenWhat Hansen did with the generalized method of moments is show that when we have more moment conditions than parameters we can best estimate those parameters by giving more weight to the conditions that we have better information about. -- Alex Tabarrok (Marginal Revolution Blog)传统的工具变量法为2SLS,因为它操作方便,且同时适用于恰好识别与过度识别的情形。

然而,2SLS 仅在扰动项同方差的情况下,才是最有效率的。

理由很简单,如果每位个体的扰动项方差不相同(比如,大企业的方差一般不同于小企业的方差),则方差小的个体观测值所包含的信息量更大,而 2SLS 却对所有数据等量齐观地进行处理,故在异方差的情况下不是最有效率的。

在过度识别且存在异方差的情况下,更有效率的做法是“广义矩估计”(Generalized Method of Moments,简记 GMM)。

该方法由芝加哥大学的 Lars Peter Hansen 教授所提出 (Hansen, 1982),已成为最流行的计量方法之一,Hansen 也因此获得 2013年的诺贝尔经济学奖。

顾名思义,广义矩估计为矩估计的推广,故先介绍矩估计。

矩 (Moment)何为矩?简单说,矩就是随机变量之函数的期望。

比如,对于随机变量,其一阶原点矩为其期望,二阶中心矩为其方差,以此类推。

更一般地,考虑随机变量的函数。

显然,仍为随机变量,其期望也称为“矩”(moment)。

进一步推广,随机向量的函数之期望,也称为“矩”。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
? ? x N ?,? 2 ,其中?,? 2为待估参数。因为有两
个待估参数,故需要使用以下两个总体矩条件:
一阶中心矩:E ?x?=?
? ? 二阶中心矩:E x2 =Var ?x?+??E ?x???2 =? 2+? 2
用对应的样本矩来替代总体矩条件可得以下联立 方程组,求解后即得到期望与方差的矩估计:
秩),则在一定的正则条件下,??IV是? 的一致ቤተ መጻሕፍቲ ባይዱ计 且??IV服从渐近正态分布
证明:抽样误差 ??IV-?=?Z?X ?-1 Z?y-?
=?Z?X ?-1 Z??X?+? ?-?=?Z?X ?-1 Z??
? ? =?? ?
1 n
n i=1
zi
-1
x?i ?? ?
? ? ?
1 n
n i=1
zi?i ??=S-ZX1 g
以样本矩替代上式中的总体矩,即可得到矩估计:
? ? ? ? ??MM=?? ?
1 n
n i=1
-1
xix?i ?? ?
?1 ?? n
n xiyi ??=
i=1
?
X?X
-1 X?y=??OLS
显然这就是 OLS估计量
2、工具变量法作为一种矩估计 假设回归模型为
yi=?1xi1+ +? k-1x ? + i,k-1 k xik+?i
由此可得E ?zi?i ?=0 ? E ??zi ?yi-x?i? ???=0 ? E ?zi yi ?=??E ?zix?i ??? ?
? ?=??E ?zix?i ???-1 E ?ziyi ? (假定 ??E ?zix?i ???-1 存在)
以样本矩代替上式中的总体矩,即可得到工具变
量估计量:
假设只有最后一个解释变量xik为内生变量,即
Cov ?xik,?i ?? 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov ?xik,wi ?? 0 (相关性),以及Cov ?wi,?i ?=(0 外生性)。由于
x1, ,xk-1不是内生变量,故可以把自己作为自己 的工具变量(因为满足工具变量的两个条件)
违背解释变量外生性假定也可以出现在滞后被解 释变量作为模型解释变量的情况。例如,消费不 仅受收入的影响,还要受到前期消费水平的影响; 投资不仅受GDP的影响,也要受前期投资水平的 影响。当存在扰动项序列相关时,就会造成解释 变量与扰动项相关的情况
一、工具变量法(Instrumental Variable,IV)
? ? 记解释变量向量 xi ? xi1 xi,k-1 xik ?,则原模型为
yi=x?i? +?i
记工具变量向量为
? ? ? ? zi ? zi1 zi,k-1 zik ? ? xi1 xi,k-1 wi ?。
定义gi ? zi?i。由于工具向量与扰动项正交,故
E ?gi ?=E ?zi?i ?=0为总体矩条件或正交条件
总体矩。事实上, OLS也是一种矩估计。利用解释
变量与扰动项的正交性,可以得到以下总体矩条件
E?xi?i ?=0 ? E ??xi ?yi-x?i? ???=0
? E ?xi yi ?=E ?xix?i ?? ? ?=??E ?xix?i ???-1 E ?xiyi ? (假设E ?xixi??可逆)
第七章 工具变量、2SLS、 GMM
OLS估计成为一致估计量的前提是解释变量与扰动
项不相关(即前定变量假设),否则,无论样本容
量多大,OLS估计量也不会收敛到参数真值,这将
难以接受。解决方法之一是本章介绍的工具变量法
复习第三章p34-p38
违背前定变量假设可以出现在联立方程中,比如
? ? ?
Ct=? 0+? 1Yt+?
? ? ? ? ?? n ??IV-? =S-ZX1 ng ??d? N 0,AVar ??IV ,其
? ? 中渐近方差矩阵AVar ??IV =??E ?zix?i ???-1 S ??E ?zixi????-1
用到??E ?zix?i ???-1 为对称矩阵
秩条件r ??E ?zix?i ???=k意味着工具变量wi与内生解释
变量xi相关,若不相关,则秩条件无法满足。证略 阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
?1?不可识别:工具变量个数少于内生解释变量个数 ?2?恰好识别:工具变量个数等于内生解释变量个数 ?3?过度识别:工具变量个数多于内生解释变量个数
?
??p?
??E ?zix?i ???-1 E ?gi ?=0
=0
? ? 其中SZX
?
1 n
n i=1
z i x?i,g
?
1 n
n i=1
zi?i
与第三章大样本最小二乘法类似的假定和推导,
可以证明,ng ??d? N ?0,S?,
? ? 其中S ? E ?gig?i ?=E ?i2ziz?i
进一步,工具变量估计量??IV渐近服从正态分布,即
? ? ? ? ??IV=?? ?
1 n
n i=1
-1
zix?i ?? ?
?1 ?? n
n i=1
ziyi ??= ?
Z?X
-1 Z?y
其中,Z ? ?z1 zn-1 zn ?? 即Z?? ?z1 ? zn-1 zn
下面是工具变量法的大样本性质:
定理:若秩条件r ??E ?zix?i ???=k成立(方阵E ?zix?i ?满
可以引入工具变量 w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即
Cov ?wt,pt ?? 0,pt为内生解释变量
(2)外生性:工具变量与扰动项不相关,即
Cov ?wt,?t ?=0
二、工具变量法作为一种矩估计
1、矩估计( Method of Moments ,MM) 首先以一个例子来说明矩估计方法:假设随机变量
Yt=Ct+I t+X t
t
,Yt、Ct、It、X
t
分别表示GDP、
消费、投资、净出口。将第一个方程代入第二个
方程,经整理可得Yt=1-1? 1 ?? 0+It+Xt ?+1-?t? 1
可见Yt与?t相关,因此当单独对Ct=? 0+? 1Yt+?t
进行OLS估计时会碰到解释变量与扰动项相关的 情况
?
? ??
? ?
1
? ?? n
1 n
n i=1
xi=??
n
xi2=??2+??2
i=1
?
?
??=x
? ?
?????2=
1 n
n i=1
?xi-x ?2
? 其中,x= 1 n
n i=1
xi为样本均值,上面推导中用到:
n
n
? ? ?xi-x?2= xi2-nx2
i=1
i=1
任何随机向量 x的函数f ?x ?的期望E ??f ?x ???都被称为
相关文档
最新文档