第15章工具变量与两阶段最小二乘.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第15章 工具变量估计与两阶段最小二乘法
在本章中,我们进一步研究多元回归模型中的内生解释变量(endogenous explanatory variable )问题。在第3章中,我们推导出,遗漏一个重要变量时OLS 估计量的偏误;在第5章中,我们说明了在遗漏变量(omitted variable )的情况下,OLS 通常是非一致性的。第9章则证明了,对未观测到的解释变量给出适宜的代理变量,能消除(或至少减轻)遗漏变量偏误。不幸的是,我们不是总能得到适宜的代理变量。 在前两章中,我们解释了存在不随时间变化的遗漏变量的情况下,对综列数据如何用固定效应估计或一阶差分来估计随时间变化的自变量的影响。尽管这些方法非常有用,可我们不是总能获得综列数据的。即使能获得,如果我们的兴趣在于变量的影响,而该变量不随时间变化,它对于我们也几无用处:一阶差分或固定效应估计排除了不随时间变化的变量。此外,迄今为止我们已研究出的综列数据法还不能解决与解释变量相关的随时间而变化的遗漏变量的问题。
在本章中,我们对内生性问题采用了一个不同的方法。你将看到如何用工具变量法(IV )来解决一个或多个解释变量的内生性问题。就应用计量经济学中线性方程的估计而言,两阶段最小二乘法(2SLS 或TSLS )是第二受人欢迎的,仅次于普通最小二乘。
我们一开始先说明,在存在遗漏变量的情况下,如何用IV 法来获得一致性估计量。此外,IV 能用于解决含误差变量(errors-in-variable )的问题,至少是在某些假定下。下一章将证明运用IV 法如何估计联立方程模型。
我们对工具变量估计的论述严格遵照我们在第1篇中对普通最小二乘的推导,其中假定我们有一个来自基本总体的随机样本。这个起点很合人意,因为除了简化符号之外,它还强调了应根据基本总体来表述对IV 估计所做的重要的假定(正如用OLS 时一样)。如我们在第2篇中所示,OLS 可以应用于时间序列数据,而工具变量法也一样可以。第15.7节讨论IV 法应用于时间序列数据时出现的一些特殊问题。在第15.8节中,我们将论述在混合横截面和综列数据上的应用。
15.1 动机:简单回归模型中的遗漏变量
面对可能发生的遗漏变量偏误(或未观测到的异质性),迄今为止我们已讨论了三种选择:(1)我们可以忽略此问题,承受有偏、非一致性估计量的后果;(2)我们可以试图为未观测到的变量寻找并使用一个适宜的代理变量;(3)我们可以假定遗漏变量不随时间变化,运用第`13与14章中的固定效应或一阶差分方法。若能把估计值与关键参数的偏误方向一同给出,则第一个回答是令人满意的。例如,如果我们能说一个正参数(譬如职业培训对往后工资的影响)的估计量有朝零偏误 ,并且我们找到了一个统计上显著的正的估计值,那么我们还是学到了一些东西:职业培训对工资有正的影响,而我们很可能低估了该影响。不幸的是,相反的情况经常发生,我们的估计值可能在数值上太大了,以致我们要得出任何有用的结论都非常困难。
第9.2节中讨论的代理变量解也能获得令人满意的结果,但并不是总可以找到一个好的代理。该方法试图通过用代理变量取代不可观测的变量,来解决遗漏变量的问题。
另一种方法是将未观测到的变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法。这便是工具变量法所要做的。
举例来说,考虑成年劳动者的工资方程中存在未观测到的能力的问题。一个简单的模型为:
,)log(210e abil educ wage +++=βββ
其中e 是误差项。在第9章中,我们说明了在某些假定下,如何用诸如IQ 的代理变量代替能力,从而通过以下回归可得到一致性估计量
)log(wage 对IQ educ , 回归
然而,假定不能得到适当的代理变量(或它不具备足以获取一致性估计量所需的性质)。这样一来,我们将abil 放入误差项中,留下来的就是简单的回归模型:
,)log(10u educ wage ++=ββ (15.1)
其中u 包含了abil 。当然,如果用OLS 估计方程(15.1),若是educ 与abil 相关,得到的结果将是1β的有偏、非一致性估计量。
最后证明是,假如我们能为educ 找到一个工具变量,我们仍可以根据方程(15.1)来进行估计。为描述该方法,将简单回归模型写成:
,10u x y ++=ββ
(15.2)
其中我们认为x 与u 相关: .0),(Cov ≠u x (15.3) 工具变量法无论x 与u 相关与否都行得通,但是,如果x 与u 不相关,我们应该使用OLS ,其原因我们将在后面看到。
为了获得x 与u 相关时0β和1β的一致性估计量,我们还需要一些另外的信息。这些信息由一个满足某些性质的新变量给出。假定我们有一个可观测到的变量z ,它满足两个假定:(1)z 与u 不相关,即,
.0),(Cov =u z (15.4)
(2)z 与x 相关,即,
.0),(Cov ≠x z (15.5)
我们则称z 是x 的工具变量(instrumental variable )。
有时候,人们把所需条件(15.4)概括为“z 在方程(15.2)中是外生的”。从遗漏变量的角度看,这意味着z 应当对y 无偏效应,也不应当与其它影响y 的因素相关。方程(15.5)意味着z 必然与内生解释变量x 有着正的或负的关系。
对工具变量的两个要求之间有一个非常重要的差别。因为(15.4)是z 与不可观测的误差u 的协方差,我们无法对它进行验证或哪怕是检验:我们必须求助于经济行为或内心感受来维持这一假定。相比之下,给定一个来自总体的随机样本,z 与x 相关(在总体中)的条件则可加以检验。做到这一点最容易的方法是估计一个x 与z 之间的简单回归。在总体中,我们有
.10v z x ++=ππ (15.6) 从而,由于)(V ar ),Cov(1z x z =π,(15.5)中的假定当且仅当01≠π时成立。因而我们就能够以充分小(习惯说充分高——译者)的显著水平(5%或1%)拒绝虚拟假设
0 :H 10=π (15.7) 并接受双侧对立假设0 :H 10≠π。如果真是这样,我们能相当有把握肯定(15.5)是成立的。
对于(15.1)中的log(wage )方程,educ 的工具变量z 必须:(1)与能力(以及其它影响工资的不可观测的因素)不相关,(2)与教育相关。诸如一个人的社会福利登记号的最后一位数字之类的变量,几乎一定满足第一个必需条件:与能力不相关,因为它是随机决定的。然而,该变量与教育不相关,因而是educ