工具变量与两阶段最小二乘法.

合集下载

2sls原理

2SLS原理1. 引言在经济学和社会科学研究中，我们经常需要研究变量之间的因果关系。

然而，由于多种原因，例如内生性、遗漏变量等，我们很难直接观察到这些因果关系。

为了解决这个问题，研究者们提出了一种被广泛应用的方法，即两阶段最小二乘法（Two-Stage Least Squares，2SLS）。

2SLS方法通过使用工具变量（Instrumental Variable，IV）来解决内生性问题。

工具变量是一种与内生变量相关但与被解释变量不相关的变量。

2SLS方法通过两个阶段的回归来估计因果关系，并且可以控制内生性的影响。

2. 2SLS方法的基本原理2SLS方法的基本原理可以通过以下步骤来解释：第一阶段：1.确定内生变量（被解释变量）Y，内生变量（解释变量）X和工具变量Z；2.估计第一阶段回归模型：X=α+βZ+ϵ1；3.通过第一阶段回归模型得到的估计值X̂代替原始的内生变量X。

在第一阶段，我们使用工具变量Z来预测内生变量X，从而消除了内生性的影响。

第二阶段：1.确定内生变量（被解释变量）Y，内生变量（解释变量）X̂和工具变量Z；2.估计第二阶段回归模型：Y=α+βX̂+ϵ2。

在第二阶段，我们使用第一阶段得到的X̂来估计内生变量Y的影响。

通过两个阶段的回归，2SLS方法可以提供一致且有效的估计结果，从而解决内生性问题。

3. 2SLS方法的优势和应用优势：1.解决内生性问题：2SLS方法通过使用工具变量来解决内生性问题，确保因果关系的估计结果可靠；2.一致性估计：2SLS方法在满足一定条件下可以提供一致的估计结果；3.有效性估计：2SLS方法可以提供有效的估计结果，即估计量的方差较小。

应用：2SLS方法广泛应用于经济学和社会科学研究中，例如：1.评估政策效果：研究者可以使用2SLS方法来评估某个政策对经济或社会变量的影响；2.估计需求和供给关系：研究者可以使用2SLS方法来估计需求和供给关系，并进一步分析市场的均衡状况；3.研究教育和健康等领域的影响因素：研究者可以使用2SLS方法来估计教育和健康等领域的影响因素，并提出政策建议。

stata工具变量法：使用2SLS进行ivreg2估计及其检验

stata⼯具变量法：使⽤2SLS进⾏ivreg2估计及其检验转⾃：作为OLS回归不符合假定的问题，还包括解释变量与随机扰动项不相关。

如果出现了违反该假设（即解释变量和随机扰动项相关了）的问题，就需要找⼀个和解释变量⾼度相关的、同时和随机扰动项不相关的变量，作为⼯具变量进⾏回归。

传统来讲，⼯具变量有两个要求：与内⽣变量⾼度相关、与误差项不相关，这两个要求缺⼀不可。

前者的违背会导致弱⼯具，这其中⼀个更有意思的问题是有很多的弱⼯具（many weak instruments）的情况。

⽽后者的违背会使得⼯具变的⽆效（Invalid）。

⼯具变量通常采⽤⼆阶段最⼩⼆乘法（2SLS）进⾏回归，当随机扰动项存在异⽅差或⾃相关的问题，2SLS就不是有效率的，就需要⽤GMM等⽅法进⾏估计，除此之外还需要对⼯具变量的弱⼯具性和内⽣性进⾏检验。

sysuse auto构造⼯具变量结构⽅程初始回归⽅程：mpg = β0+β1turn+β2gear_ratio+µ内⽣变量：turn=z0+z1weight+z2length+z3headroom+ε回归⽅程中内⽣变量为turn，⼯具变量为weight、length、headroom。

2SLS估计1.使⽤ivreg2进⾏2SLS估计ivreg2 mpg gear_ratio (turn=weight length headroom)这⾥运⾏时出现错误提⽰：原因：括号前⾯要有个空格。

结果显⽰：turn变量的估计系数是-1.246，z检验值为-6.33，p值0.000，⼩于0.05，说明turn系数显著，且与mpg呈现负相关。

Underidentification test，⽅程的不可识别检验，得到LM统计值为26.822，p值=0.000，⼩于0.05，强烈拒绝“不可识别”的原假设。

Weak identification test弱⼯具变量检验，得到得到Wald-F统计值为30.303，KP Wald-F统计值为42.063，⼤于所有临界值，说明拒绝“弱⼯具变量”的原假设，即⽅程不存在弱⼯具变量。

工具变量法二阶段回归模型

工具变量法二阶段回归模型是一种用于处理内生性问题的统计方法，主要通过两个阶段的最小二乘法（Two Stage Least Square，2SLS或TSLS）来实现。

在第一阶段，该方法使用工具变量（iv）去做解释变量（x）的回归。

然后在第二阶段，它用工具变量对解释变量的估计值（x'）去对被解释变量（y）做回归。

此方法的逻辑是将内生解释变量分解为两部分，一部分是由工具变量造成的外生部分，另一部分是与扰动项相关的内生部分。

这样的分解能够“治疗”内生性问题，从而得到更加准确的估计结果。

在实际应用中，工具变量的回归操作可以通过多种统计软件实现，例如Stata，其基本操作代码有：ivregress, ivreg2, ivreghdfe, xtivreg, xtivreg2等。

这些工具和方法使得工具变量法二阶段回归模型在处理内生性问题时具有广泛的应用价值。

第15章-工具变量讲解

这样一来 , 我们便把 abil 放人误差项中，而只留下简单回归模型： Log（wage） =β 0+β 1educ+u （15.1 ）其中，u 包含 abil。当然，如果用 OLS 估计方程 (15.1) ，若 educ 与 abil 相关，则得到的结果将是 1 的有偏而又不一致估计量。
第15章工具变量估计与两阶段最小二乘法
在本章中，我们进一步研究多元回归模型中的内生解释变量 (endogenous explanatory Variables）问题。在第 3 章中，我们推导出遗漏一个重要变量时 OLS 估计量的偏误，在第 5 章中，我们说明了在遗漏变量(omitted variables)的情况下，OLS 通常是不一致的。
举例来说，考虑成年劳动者的工资方程中存在无法观测之能力因素的问题。一个简单的模型为： log（wage）=β 0+β 1educ+β 2abil+e 其中，e 是误差项。
在第 9 章中，我们证明了在某些假定下，如何用诸如 IQ 的代理变量代替能力，从而通过以下回归可得到一致估计量 log(wage)对 educ，IQ 回归然而假定不能得到适当的代理变量（或它不具备足以获取 1 一致估计量所需的性质）。
我们一开始先说明，在存在遗漏变量的情况下，如何用 IV 法获得一致估计量。此外， IV 至少能在某些假定下用于解决变量误差 (errors-in-variables)问题。下一章将证明运用 IV 法如何估计联立方程模型。
我们对工具变量估计的论述严格遵照我们在第 1 篇中对普通最小二乘的推导，其中假定我们有一个来自潜在总体的随机样本。这个起点很合人意，因为除了简化符号之外，它还强调用潜在总体来表述对 IV 估计所做的重要假定 (正如用 OLS 时一样)。

工具变量两阶段最小二乘

估计结果与前面相差很大，检验工具变量与内生变量的相关性，发现用三个工具变量时相关性大大提升，故应采用mothedu,fathedu,husedu一起做工具变量。 • 工具变量的好坏直接影响估计结果，实际应用中，寻找合适的工具变量是解决问题的关键，也是困难所在。
两阶段最小二乘法：TSLS
点击选择按钮（Op>ons）对参数估计协方差矩阵的估计方法进行选择，本例采用的是横截面数据，因此采用怀特异方差一致的协方差矩阵估计。
6.2 工具变量估计方法
6.2.2 两阶段最小二乘法：TSLS
两阶段最小二乘法：TSLS
一个内生自变量
Y = β0 + β1X1 + β2 X 2 + β3 X3 + u X1 为内生变量， X2 和X 3 为外生变量，Z1 、Z2 X为1 的工具变量。两阶段最小二乘步骤：
原假设： H0 : α1 = α2 = 0
• 用第五章构造的Tr 统计量进行F检验，若 Tr值够大，通常大于10则认为相关性足够，可做工具变量。
• 若接受原假设，则表明工具变量与内生变量相关性太弱，其不适宜做工具
两阶段最小二乘法：TSLS
一个内生自变量
EViews实现两阶段最小二乘：例子6.2 已婚女性小时工资（续）
• 不相干变量引入不会影响参数估计的无偏性和一致性，但是会影响参数估计的有效性。
6.2 工具变量估计方法
6.2.1 工具变量估计法 6.2.2 两阶段最小二乘法：TSLS
6.2 工具变量估计方法
6.2.1 工具变量估计法
工具变量估计法
一元线性回归模型
Y = β0 + β1X + u
Ø 定义1：如果存在变量Z

工具变量法IV两阶段最小二乘法TSLS

YY12
b12Y2 b23Y3
c11 X1 c12 X 2 c23 X 3 u2
u1
Y3 b31Y1 b32Y2 c33 X 3 u3
其中：Y1,Y2 ,Y3 为内生变量， X1, X 2 , X 3为外生变量。
Dongbei University Of Finance & Economics
2）方程组系统估计法包括：三阶段最小二乘法（3SLS）、完全信息最
大似然估计法（FIML）等。这些方法是对模型中所有结构方程的参数同时进行估计，从而获得模型全部参数的估计值。它利用了模型的全部方程信息，称为完全信息方法。
Dongbei University Of Finance & Economics
/ ˆ23 bˆ12ˆ21
cˆ12 ˆ12 bˆ12ˆ22
若已知πij，即可解出惟一的cij，第一个结构方程得以估计。这样，结构方程的参数估计值用传统的OLS就得到了。
Dongbei University Of Finance & Economics
ILS的步骤
一、先对模型作识别判断，找出恰好识别的方程；二、利用简约式和结构式参数的关系式 B
Y1 11 X1 12 X 2 13 X 3 v1 Y2 21 X1 22 X 2 23 X 3 v2 Y3 31 X1 32 X 2 33 X 3 v3
Dongbei University Of Finance & Economics
第一阶段是对结构方程右端所包含的所有内生变量（作为解释变量）所对应的简化式方程进行OLS估计,得到内生变量的估计（回归)值；

第15章工具变量估计与两阶段最小二乘法

2
15.3 两阶段最小二乘法
2SLS可用于多个内生解释变量的模型中，但工具变量必须满足一定的条件方程才能识别。方程识别的阶条件：被排斥的外生变量的个数至少与结构方程中包含的解释变量一样多。阶条件仅是必要条件，方程识别的充分条件是秩条件，需要用矩阵代数来表述。
15.1 动机：简单回归模型中的遗漏变量
要求（2）容易检验，只需x对z简单回归，检验斜率系数的显著性。内生解释变量和工具变量也可以是二值变量如果现在的工具变量是低劣的，即z可能与u 相关，此时IV估计也是不一致的。OLS估计也是不一致的，但IV估计的偏误要大很多。 2 R 与OLS估计不同，IV估计中的可能为负，对此也没有合理的解释。
15.2 多元回归模型中的IV估计
zk 与 y2 存在某种偏相关，即约简型方程（2） y2 0 1z1 k 1zk 1 k zk v 的系数满足： k 0
同样要求（1）不能检验，只能寄希望于经济逻辑和反思。要求（2）可对约简型方程估计后直接检验。具体的IV估计量可从k+1个矩条件对应的样本方程求出： E u 0, E z1u 0, , E zk 1u 0, E zku 0
15.1 动机：简单回归模型中的遗漏变量
借助于工具变量，回归方程的参数是可识别（identification），即参数可用总体矩表示，而总体矩可用样本矩来估计。用工具变量z 对回归方程两边协方差：
cov z, y 1 cov z, x cov z, u
解出： 1 cov z, y / cov z, x 由此得到工具变量估计量： z z y y
n
ˆ 1

工具变量两阶段最小二乘

1 IV
n−2
∑
n
i =1 i n
ˆ Z ,X = ρ
∑
i =1
( X i − X )(Z i − Z )
2 ( Z − Z ) ∑i=1 i n
2 ( X − X ) ∑i=1 i
ˆ −β ˆ X ˆi = Yi − β u 0 IV 1IV i
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
内生性影响图示：
X
Y
u
dY / dX = β + du / dX
ˆ 是对 β + du / dX 的估计。 β
6.1 内生性
6.1.2 内生性产生的原因
模型设定错误、测量误差和联立性
• 模型设定错误是导致内生性最常见的原因，模型设定错误往往表现为相关变量的缺失，缺失变量成为错误设定模型误差项的一部分，当缺失变量和模型中其他变量相关时，就会导致这些变量的内生性。（工资与教育、能力）、 • 不相干变量引入不会影响参数估计的无偏性和一致性，但是会影响参数估计的有效性。
??模型设定错误是导致内生性最常见的原因模型设定错误往往表现为相关变量的缺失缺失变量成为错误设定模型误差项的一部分当缺失变量和模型中其他变量相关时就会导致这些变量的内生性
第6章
内生性和工具变量估计方法
内生性和工具变量估计方法
6.1 内生性
6.1.1 OLS估计的不一致性 6.1.2 内生性产生的原因
fathedu 作工具变量：
ln(wage) = − 0.441+ 0.059 educ
( 0.989 ) (1.686 )
工具变量估计法
多元线性回归模型

两阶段最小二乘法尔斯比率

两阶段最小二乘法尔斯比率
两阶段最小二乘法（Two-Stage Least Squares，简称2SLS）是一种用于处理内生性（endogeneity）问题的统计方法。

在经济学和其他社会科学中，内生性是一个常见问题，它可能导致OLS（普通最小二乘法）估计量有偏且不一致。

当解释变量与误差项相关时，就会出现内生性问题。

两阶段最小二乘法通常用于估计一个模型，其中一个或多个解释变量是内生的。

这种方法的基本思想是通过找到一个或多个工具变量（instrumental variables）来“净化”或“转换”这些内生解释变量，从而消除它们与误差项之间的相关性。

两阶段最小二乘法的过程如下：
第一阶段：使用工具变量对内生解释变量进行回归。

这个回归的目的是得到内生解释变量的预测值（或称为“拟合值”）。

第二阶段：使用第一阶段得到的预测值作为解释变量，对原模型进行OLS回归。

关于“尔斯比率”（我猜测你可能是指“F-statistic”或“F值”），在统计和回归分析中，
F-statistic用于检验模型的一个或多个解释变量是否对被解释变量有显著影响。

在两阶段最小二乘法中，F-statistic也可以用于检验工具变量的有效性。

如果F-statistic的值很大，那么我们可以拒绝工具变量与误差项不相关的原假设，从而认为工具变量是有效的。

需要注意的是，两阶段最小二乘法并不总是解决内生性问题的最佳方法。

在某些情况下，其他方法（如广义方法矩估计GMM、极大似然估计MLE等）可能更为合适。

此外，工具变量的选择也是至关重要的，因为不恰当的工具变量可能导致估计结果仍然有偏。

回归分析中的二阶段最小二乘法应用技巧

回归分析中的二阶段最小二乘法应用技巧回归分析是统计学领域中常用的一种分析方法，用于研究自变量和因变量之间的关系。

而二阶段最小二乘法则是回归分析中的一种高级技巧，它主要用于解决因变量存在内生性问题的情况。

本文将探讨二阶段最小二乘法的应用技巧，以及在实际研究中的一些注意事项。

第一部分：二阶段最小二乘法的基本原理在回归分析中，如果因变量与某些自变量之间存在内生性问题，即自变量与误差项存在相关性，会导致普通最小二乘法（OLS）估计出现偏误。

这时就需要使用二阶段最小二乘法来解决这个问题。

二阶段最小二乘法的基本原理是通过两个阶段的回归分析来消除内生性问题。

第一阶段，首先利用某些外生的变量来估计内生变量的值；第二阶段，将第一阶段的估计结果代入原始模型中，从而得到纠正后的估计值。

这样，就可以消除内生性问题对估计结果的影响。

第二部分：二阶段最小二乘法的应用技巧在实际应用中，二阶段最小二乘法需要注意以下几个技巧。

首先，选择外生变量。

在第一阶段回归中，选择的外生变量应当能够有效地解释内生变量的变化，且与误差项不相关。

通常，研究者需要通过理论分析和实证检验来确定外生变量的选择。

其次，识别工具变量。

在第一阶段回归中，研究者需要找到一些工具变量，用来代替内生变量。

工具变量应当满足两个条件：与内生变量相关，但与误差项不相关。

这需要一定的经验和技巧。

再次，检验外生性。

在使用二阶段最小二乘法前，需要对外生性进行检验。

一般采用Hausman检验或者Durbin-Wu-Hausman检验来检验外生性假设是否成立。

最后，解释结果。

在得到二阶段最小二乘法的估计结果后，需要对结果进行解释。

研究者应当说明采用二阶段最小二乘法的原因，以及对结果的合理性进行讨论。

第三部分：实际研究中的注意事项在实际研究中，二阶段最小二乘法的应用需要注意以下几个问题。

首先，数据质量。

对于二阶段最小二乘法来说，数据的质量至关重要。

特别是在第一阶段回归中，如果外生变量的选择不当或者存在测量误差，将会影响到最终的估计结果。

工具变量法（IV）的Stata操作

⼯具变量法（IV）的Stata操作Stata操作⼯具变量法的难点在于找到⼀个合适的⼯具变量并说明其合理性，Stata操作其实相当简单，只需⼀⾏命令就可以搞定，我们通常使⽤的⼯具变量法的Stata命令主要就是ivregress命令和ivreg2命令。

ivregress命令ivregress命令是Stata⾃带的命令，⽀持两阶段最⼩⼆乘（2SLS）、⼴义矩估计（GMM）和有限信息最⼤似然估计（LIML）三种⼯具变量估计⽅法，我们最常使⽤的是两阶段最⼩⼆乘法（2SLS），因为2SLS最能体现⼯具变量的实质，并且在球形扰动项的情况下，2SLS是最有效率的⼯具变量法。

顾名思义，两阶段最⼩⼆乘法（2SLS）需要做两个回归：（1）第⼀阶段回归：⽤内⽣解释变量对⼯具变量和控制变量回归，得到拟合值。

（2）第⼆阶段回归：⽤被解释变量对第⼀阶段回归的拟合值和控制变量进⾏回归。

如果要使⽤2SLS⽅法，我们只需在ivregress后⾯加上2sls即可，然后将内⽣解释变量lnjinshipop和⼯具变量bprvdist放在⼀个⼩括号中，⽤=号连接。

选项first表⽰报告第⼀阶段回归结果，选项cluster()表⽰使⽤聚类稳健的标准误。

ivregress 2sls lneduyear (lnjinshipop=bprvdist) lnnightlight lncoastdist tri suitability lnpopdensity urbanrates i.provid , first cluster(provid)第⼀阶段回归结果First-stage regressions-----------------------Number of obs = 274No. of clusters = 28F( 7, 239) = 85.27Prob > F = 0.0000R-squared = 0.6487Adj R-squared = 0.5988Root MSE = 0.4442------------------------------------------------------------------------------| Robustlnjinshipop | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------lnnightlight | .183385 .0682506 2.690.008 .0489354 .3178346lncoastdist | .0350333 .0771580.450.650 -.1169634 .1870299tri | 1.06676 .5637082 1.890.060 -.0437105 2.177231suitability | -.0769726 .0549697 -1.400.163 -.1852596 .0313144lnpopdensity | .196144 .0843727 2.320.021 .0299349 .3623532urbanrates | 3.352916 1.687109 1.990.048 .029414 6.676419|provid |12 | .2051006 .0551604 3.720.000 .096438 .313763213 | -1.890425 .0951146 -19.880.000 -2.077795 -1.703055......64 | -1.301895 .1581021 -8.230.000 -1.613346 -.9904433|bprvdist | -.0846917 .0107859 -7.850.000 -.1059393 -.0634441_cons | 2.126233 .9791046 2.170.031 .1974567 4.05501------------------------------------------------------------------------------从表中可以看出，⼯具变量bprvdist的系数为-0.085，标准误为0.011，在1%的⽔平上显著。

两阶段最小二乘法的回归表格

两阶段最小二乘法的回归表格
在两阶段最小二乘法的回归分析中，通常会生成两个回归表格。

第一个表格显示第一阶段回归的结果，第二个表格显示第二阶段回归的结果。

以下是一个示例表格：
第一阶段回归结果（因变量：Y，自变量：X1, X2, X3）：
第二阶段回归结果（因变量：Y，自变量：Z1, Z2）：
在这个示例中，第一阶段回归是为了找到合适的工具变量（Z1和Z2）来预测内生解释变量（X1、X2和X3），然后这些工具变量被用于第二阶段回归以预测因变量（Y）。

在第一阶段回归中，X1、X2和X3的系数分别代表它们对Z1和Z2的影响。

在第二阶段回归中，Z1和Z2的系数代表它们对Y的影响。

工具变量法IV两阶段最小二乘法TSLS

其中： xk1,L , xk 是方程中出现的前定变量。
原解释变量 X y2, y3,L , ym1, xk1,L , xk
Dongbei University Of Finance & Economics
三者之间的关系
ILS是TSLS的一种特殊形式，而ILS和TSLS都是工具变量法。即有：
系数矩阵为：
1 b12 0 c11 c12 0
,

0
1 b23 0
0
c23

b31 b32 1 0
0 c33
Dongbei University Of Finance & Economics
计算出1，得到简化式参数 1，从而得到模型简化式：
2）大样本下的TSLS估计量是一致的；
3）方程恰好识别时，ILS与TSLS估计一致；
4）模型可识别时，每一个结构方程都可用TSLS估计参数。
TSLS是最常用的方法——先建立理论联立结构方程组模型，再进行单个方程的TSLS估计。
四、工具变量法IV
ILS和TSLS都属于工具变量法。工具变量法，
即对模型方程中出现随机解释变量X时，选择一个
模型可写成矩阵形式：
Y1 b12Y2 0Y3 c11 X1 c12 X 2 0 X 3 u1 0Y1 Y2 b23Y3 0 X1 0 X 2 c23 X 3 u2 b31Y1 b32Y2 Y3 0 X1 0 X 2 c33 X 3 u3
• 二、对简约式模型逐个方程求OLS，得到简约式模型中所有的参数估计值；
• 三、将简约式参数估计值代入关系式，求结构方程参数的估计值。

二阶段最小二乘法的阶条件

二阶段最小二乘法的阶条件二阶段最小二乘法（Two-stage least squares method, 2SLS）是一种用于解决内生性问题的回归方法。

内生性问题指的是模型中的某些解释变量与误差项存在相关性，这会导致最小二乘估计量存在偏误和无效性。

2SLS方法通过两个阶段的回归来解决内生性问题。

在第一阶段，使用外生性变量预测内生性变量，得到预测值。

在第二阶段，使用这些预测值作为替代变量进行回归分析，从而得到有内生性变量的最小二乘估计量。

2SLS方法的有效性和一致性要求满足一些条件。

这些条件包括：第一、外生性的条件：2SLS方法要求至少有一个外生变量可以与内生变量相关，但与误差项不相关。

否则，无法使用该外生变量来解决内生性问题。

第二、无完全共线性的条件：如果外生变量之间存在完全共线性（即线性相关），则无法计算回归系数的标准误差，导致结果不可靠和无效。

因此，外生变量之间应该是线性独立的。

第三、弱工具的条件：弱工具指的是外生变量对内生变量的影响相对较弱。

如果外生变量对内生变量的影响太强，可能会导致2SLS方法的估计量偏误和无效性。

第四、合理的工具的条件：工具变量是用于预测内生变量的外生变量。

合理的工具应该满足两个条件：1）工具变量与内生变量相关；2）工具变量与误差项不相关。

第五、有效的工具的条件：工具变量的预测性能越好，2SLS方法的效果越好。

因此，工具变量应该具有良好的预测性能。

以上是2SLS方法的阶条件，这些条件在使用2SLS方法时需要满足，以确保估计结果的可靠性和有效性。

然而，在实际应用中，满足所有条件是很困难的，所以研究者需要根据具体问题的特点选择合适的方法来解决内生性问题。

第15章工具变量估计与两阶段最小二乘法

具体的IV估计量可从k+1个矩条件对应的样本方程求出：
Eu 0, Ez1u 0,L , E zk1u 0, E zku 0
15.3 两阶段最小二乘法
如果一个内生解释变量有多个工具变量，如何有效运用多个工具变量？以下面结构模型为例： y1 0 1y2 2z1 u1
如果内生解释变量 y2有两个被排斥的外生变量 z2 , z3，且都与 y2相关，则不仅其中任何一个可作为IV，而且它们的任何线性组合也是有效的IV。为了找到最好的IV，需选择与 y2
最高度相关的线性组合，这要求估计约简型方程： y2 0 1z1 2 z2 3z3 v2
第十五章工具变量估计与两阶段最小二乘法
本章研究多元回归模型中的内生解释变量问题。解释变量的内生性常来自遗漏变量问题，这使OLS估计不一致。尽管代理变量法和面板数据的固定效应法可在某些情况下解决内生性问题，但远未完善。本章讨论另一解决解释变量内生性问题的方法：工具变量法（IV）。其受欢迎程度仅次于OLS。
大样本下IV估计量近似服从正态分布，常用的推断方法均适用，但IV估计的方差总是大于OLS方差，特别当z与x的线性相关度很弱时，IV方差会比 OLS方差大很多。由此当x外生时，OLS估计比IV 估计有效得多。
IV估计的关键是找到好的工具变量，工具变量的两个要求具有很大差别，要求（1）涉及无法观测的误差项，通常无法对其进行检验，在绝大多数情况下，我们必须借助于经济行为或反思来维持此假定。
15.3 两阶段最小二乘法
在对 2 , 3 的联合显著性检验之后，使用估计值作
为 y2的IV： yˆ2 ˆ0 ˆ1z1 ˆ2 z2 ˆ3 z3
在多个工具条件下IV估计量称为两阶段最小二乘估计量（2SLS）。原因是当用以上估计值作为IV时，参数的IV估计值等同于 y1 yˆ2 , z1回归的OLS估计值。但标准误和检验统计量不相同。

内生性问题解决方案汇总与案例——计量作业

•多元线性回归模型•古典模型的假定–假定1 线性–假定2 严格外生性–假定3 球形扰动–假定4 无完全共线性1、2、3、内生性的具体表现形式•遗漏解释变量•互为因果•自选择问题•测量误差内生性的解决方案1.工具变量法（IV）这种方法相信大家都已经学过，就是找到一个变量和内生化变量相关，但是和残差项不相关。

在OLS的框架下同时有多个IV，这些工具变量被称为two stage least squares (2SLS) estimator。

具体的说，这种方法是找到影响内生变量的外生变量，连同其他已有的外生变量一起回归，得到内生变量的估计值，以此作为IV，放到原来的回归方程中进行回归。

2. 自然实验法就是找到一个事件，该事件只影响一部分样本，或者只影响解释变量而不影响被解释变量。

3.Difference-in-Difference （DID）法思想是按照一定的标准，找到与样本match的控制组。

在假设外在冲击同时影响两个组别的情况下，做差来剔除掉外界冲击的影响。

4. 动态panel思想是将解释变量和被解释变量的滞后项作为IV进入正文：基本故事是：股票的流动性对经理人的激励合约的设计会产生影响。

具体的说，当流动性提高的时候，经理人会更加倾向于选择现金比重更小（股票比重更高）的激励合同，因为这时股票的变现成本较低；同时，高流动性意味着股票中的信息含量更高，因此薪酬与股价市场回报的敏感性（pay-for-performance sensitivity）会更高。

这里的两个被解释变量分别是cash-based compensation占total compensation的比重，以及pay-for-performance sensitivity （PPS）会更高。

关键解释变量是流动性。

第一部分，基础计量技术，固定效应回归模型。

值得一提的是，虽然这是本文最基础的计量技术，但作者还是进行了细致改进，比如加入管理层的固定效应，以及对标准误进行了管理层层面的CLUSTER调整。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Intermediate Econometrics, Yan Shen 2
Lecture Outline 本课提要

Motivation: Why using IV? 出发点：为何用工具变量？ Statistical Inference with the IV estimator IV 估计中的统计推断 Properties of IV with a poor IV ―坏”工具变量的性质 Computing R squares after IV 计算IV估计的R方 IV estimation of the multiple regression model 多方程回归的IV估计
Intermediate Econometrics, Yan Shen 3
Problem to start with 从这个问题出发…

If important variables are omitted, what should we do? 如果一些重要的变量被遗漏，我们应当怎么办？
Intermediate Econometrics, Yan Shen

Intermediate Econometrics, Yan Shen
7
Instrumental Variable: Who qualifies? 什么样的变量可以作为IV？

In order for a variable, z, to serve as a valid instrument for x, the following must be true 针对内生变量 x 的一个有效的工具变量 z 应当满足如下条件 The instrument must be exogenous 工具变量应为外生 That is, Cov(z,u) = 0 (15.4) 即Cov(z,u) = 0
Intermediate Econometrics, Yan Shen 5
Why Use Instrumental Variables? 为何使用工具变量？
Instrumental Variables (IV) estimation is used when your model has endogenous x’s 当模型解释变量具有内生性时，使用工具变量估计 That is, when Cov(x,u) ≠ 0 即，Cov(x,u) ≠0时
Intermediate Econometrics, Yan Shen 8
Instrumental Variable: Who qualifies? 什么样的变量可以作为IV？
The instrument must be correlated with the endogenous variable x 工具变量应与内生变量 x 相关 That is, Cov(z,x) ≠ 0 (15.5)

Intermediate Econometrics, Yan Shen
6
Why Use Instrumental Variables? 为何使用工具变量？
Thus, IV can be used to address the problem of omitted variable bias 所以，IV可以用来解决遗漏变量偏差 Additionally, IV can be used to solve the classic errors-in-variables problem 而且，IV可用来解决经典的测量误差问题
Intermediate Econometrics, Yan Shen
10
About Cov(z,x)
We can test if Cov(z,x) ≠ 0 我们可以检验是否Cov(z,x) ≠ 0 Just testing H0: p1 = 0 in x = p0 + p1z + v 只需检验 H0: p1 = 0 in x = p0 + p1z + v Sometimes we refer to this regression as the first-stage regression. 有时我们将这个回归称为第一阶段回归。
4
The ways out 一些办法

Ignore the problem, pretend that it does not exist 忽略这个问题，假装这个问题并不存在 Find and use a suitable proxy 使用代理变量 Uses an estimation method that recognizes the presence of the omitted variable 使用一种对遗漏变量稳健的估计方法。
1
Chapter Outline 本章提要

Omitted Variables in a simple regression model 简单回归中的遗漏变量 IV estimation of the Multiple Regression 多方程回归中的工具变量估计 Two Stage Least Squares 两阶段最小二乘法 IV solutions to errors-in-variables problem 用工具变量解决测量误差问题 Testing for endogeneity… 检验内生性
Instrumental Variables & 2SLS 工具变量与两阶段最小二乘法
y = b0 + b1x1 + b2x2 + . . . bkxk + u x1 = p0 + p1z + p2x2 + . . . pkxk &#nometrics, Yan Shen

Intermediate Econometrics, Yan Shen
9
About Cov(z,u) 关于Cov(z,u)

We have to use common sense and economic theory to decide if it makes sense to assume Cov(z,u) = 0 为了判断Cov(z,u) = 0这一假定是否合理，我们不得不依赖于常识和经济理论。

工具变量与两阶段最小二乘法.

2sls原理

stata工具变量法：使用2SLS进行ivreg2估计及其检验

工具变量法二阶段回归模型

第15章-工具变量讲解

工具变量两阶段最小二乘

工具变量法IV两阶段最小二乘法TSLS

第15章 工具变量估计与两阶段最小二乘法

工具变量 两阶段最小二乘

两阶段最小二乘法 尔斯比率

回归分析中的二阶段最小二乘法应用技巧

工具变量法（IV）的Stata操作

两阶段最小二乘法的回归表格

工具变量法IV两阶段最小二乘法TSLS

二阶段最小二乘法的阶条件

第15章 工具变量估计与两阶段最小二乘法

内生性问题解决方案汇总与案例——计量作业

第15章工具变量估计与两阶段最小二乘法

工具变量两阶段最小二乘

两阶段最小二乘法尔斯比率

第15章工具变量估计与两阶段最小二乘法