第一组 二阶段最小二乘讲义

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
什么可能是skipped的好的IV?我们所需要的是对score无直接效应, 且与学生能力不相关的IV,同时,该IV必须与skipped相关。一个选择是 利用住宿区与教室之间的距离distance,这也许会增加逃课的可能性 (由于恶劣的天气、睡过头等等)。因而,skipped可能与distance正相 关;这一点可通过skipped对distance的回归并作一个t检验得以验证。
将代入方程,可得到2SLS的最终表达式:
(2)二阶段最小二乘相关检验: 在使用工具变量法估计的时候,必须对工具变量的有效性进行检验, 否则,导致估计结果不一致或估计量的方差过大。
A.检验工具变量与解释变Fra Baidu bibliotek的相关性
前面在使用工具变量进行估计的时候,工具变脸必须与内生解释变量 完全不相关,否则就无法使用工具变量法估计,如果仅仅微弱的相关, 成为“若工具变量”,其后果类似于样本容量较小,导致估计量性质变得 很差,统计推断失效。
根据是否满足阶条件分为三种情况: A. 不可识别:工具变量的个数小于内生解释变量的个数; B. 恰好识别:工具变量的个数等于内生解释变量的个数; C. 过度识别:工具变量的个数大于内生解释变量的个数。
以上介绍的工具变量法仅适用于“恰好识别的情形”,但在实际中存在 多个内生解释变量和工具变量的情况,就会出现“过度识别”的情况,解 决方法之一就是扔掉“多余”的工具变量,但这种方法不是有效的,因为 丢掉的工具变量包含着有用的信息,导致估计的结果不充分,此时运用 二阶段最小二乘为有效估计。
B.检验工具变量的外生性 举例说明,假定我们有单一的被怀疑的内生变量,
其中和是外生的。我们有另外两个外生变量,和,它们不出现在方 程中。
我们在介绍简单的工具变量估计量时,我们强调IV必须满足两个必 需条件:它必须与误差不相关,与内生解释变量相关。我们在相当复杂
的模型中已看到,如何判断在诱导型回归中是否能用一个t或F检验来检
显然,多个工具变量的线性组合仍然是工具变量,仍满足工具变量的 两条件,如果能生成工具变量的线性组合数等于内生解释变量个数,则 又回到了恰好识别的情形。在球型扰动项的假定下,由二阶段最小二乘 法所提供的工具变量线性组合是所有线性组合中最渐进有效的。所以能 良好解决过度识别问题,使工具变量法最终得到有效地一致估计。
单的模型为:
(1)
其中e是误差项。在某些假定下,如何用诸如IQ的代理变量代替能
力,从而通过以下回归可得到一致性估计量 对 进行回归
然而,假定不能得到适当的代理变量(或它不具备足以获取一致性
估计量所需的性质)。这样一来,我们将abil放入误差项中,留下来的
就是简单的回归模型: (2)
其中u包含了abil。当然,可以用OLS估计此方程,但是,如果 educ与abil (即educ与随机误差项u)相关,即educ为内生解释变
A.相关性:工具变量与内生解释变量相关,即 B.外生性:工具变量与扰动项不相关,即 现在我们来证明可得到的工具变量能够用于进行方程一致性参数估
计。特别地,为了根据总体协方差写出,我们对方程两边求与z的协方
差,得到: 现在,在与的假定下,我们可以解出为:
[注意到如果z与x不相关,即,该简单代数式不成立。] 上式表明是z、y 之间的总体协方差除以z、x之间的总体协方差的商,这说明了被识别。
量,则用OLS估计得到的结果将是的有偏、非一致性估计量。 我们把简单回归模型写成: (3)
其中我们认为x与u相关:
此时,假如我们能找到一个变量z,满足两个条件:一是与变量x存 在高度相关关系,即;二是与随机扰动项u不存在相关关系,即;从遗
漏变量的角度看,这意味着z应当对y无偏效应,也不应当与其它影响y
(i)用2SLS估计结构方程,获得2SLS残差。 (ii)将对所有外生变量回归,获得,即。
(iii)在所有IV都与不相关的虚拟假设下,,其中q是模型之外的工
具变量的数目减去内生解释变量的总数目。如果超过了分布中的(例 如)5%临界值,我们拒绝:所有工具变量都是外生的,并推断出至少 部分的IV不是外生的。
distance是否与u不相关?在简单回归模型(4)中,假如u中的一些 因素不与distance相关,那么,distance也许是skipped的一个好的IV,进 而能良好估计模型(4)。如果学生能力有一个好的代理,例如以往学 期的累积GPA,IV法可能根本就不需要。
问题总结:
例子存在的共同问题: 1. 在简单回归模型中存在遗漏重要变量问题,运用OLS估计导致 其得到估计结果不一致。 2. 遗漏变量没有良好的代理变量情况下,会导致解释变量与扰动 项的存在相关关系,即出现内生解释变量情况,导致估计结果 有偏。
我们利用方程(3):z与y之间的协方差为
现在,在与的假定下,我们可以解出为: 给定一个随机样本,我们用对应样本量来估计总体的量。在分子和 分母中约去样本容量后,我们得到的工具变量(IV)估计量 (instrumental variables (IV) estimator):
例二:逃课对考试成绩的因果影响问题 考虑逃课对期末考试平均成绩的因果影响的问题。在一个简单的回
归框架中,我们有 (4)
其中,score是期末考试平均成绩,skipped是该学期逃课的总数目。 此时,在用OLS估计方程时,我们担心skipped可能与u中其它因素相 关:比如,成绩较好(无法观测的能力变量)的学生可能逃课较少等情 况,因而score对skipped的简单回归可能不会给我们一个对逃课的因果 影响的好的估计,因此,我们需要找到一个好的工具变量进行估计。
3.二阶段最小二乘法估计的基本原理和主要步骤 (重点思想和推到步骤)
(1)估计的基本步骤:
第一阶段: 将每个解释变量分别对所有L个工具变量作OLS回归,得到拟合值 为: 其中,为的投影矩阵。写成矩阵形式,可以定义 第二阶段: 由于是的线性组合(参见第一阶段回归),故恰好包含K个工具变 量,使用为工具变量对原模型进行工具变量法估计: 因此,可以看出,可以将视为把对进行OLS回归而得到的,故名 为“二阶段最小二乘”。需要注意的是,第二阶段回归得到的残差为,而 原方程残差确是,因此在进行2SLS最好不要自己去进行两次手工回 归,而是直接使用软件(如STATA)进行回归分析。
解决的可行方法: 1.在没有良好代理变量情况下,通过寻找外生变量作为工具变量进行 估计,解决了内生解释变量导致的有偏估计情况,得参数的到无偏、一 致估计。
2.二阶段最小二乘简单介绍(工具变量相关概 念、使用的情况、解决的问题、主要的估计思想 等)
工具变量法:
(1)由以上引例可以看出在解决内生解释变量问题时,通过需找一个 满足一定条件的外生变量,即工具变量来获取无偏的一致估计,故为工 具变量法。 (2)何为工具变量(IV):在简单回归方程中,一个有效的工具变量 应满足以下两个条件:
其中和是外生的。我们有另外两个外生变量,和,它们不出现在方程 (1)中。如果与不相关,我们该用OLS估计。对此我们如何检验呢? Hausman(1978)建议直接比较OLS和2SLS估计值,判断其差异是否在 统计上显著。毕竟,如果所有变量外生,OLS和2SLS都是一致性的。如 果2SLS与OLS的差异显著,我们断定必定是内生的(保持外生性)。计 算OLS和2SLS,看估计值是否实际上有差异,这是个好主意。为了判断 差异是否在统计上显著,用回归来检验更容易。这是以估计的诱导型为 基础的,此时诱导型为
我们只有一个内生解释变量。如果我们只有的单一个IV,而没有过度识 别约束,也就没什么可检验的。如果我们有的两个IV,如同前面的例子 中那样,则我们有一个过度识别约束。如果我们有三个IV,则有两个过 度识别约束,等等。
检验过度识别约束是相当简单的。我们必须获得2SLS残差,然后做 一个辅助回归。 检验(任意多个)过度识别约束
判断弱工具变量的方法之一为,在第一阶段回归中,,检验原假 设“”,一个经验规则,如果次检验的F统计量大于10,则可拒绝“存在弱 工具变量”的原假设,不必担心弱工具变量问题。在多个内生解释变量 的情况下,将有多个第一阶段回归,固有多个F统计量,此时运用“最小 特征值统计量”。STATA提供了最小特征值统计量的临界值。
给定一个随机样本,我们用对应样本量来估计总体的量。在分子和分母 中约去样本容量后,我们得到的工具变量(IV)估计量(instrumental variables (IV) estimator):
给定x、y和z的样本数据,很容易获得IV估计量。的IV估计量就为:,
除了其中的斜率估计量现在为IV估计量,它看起来就像OLS中的截距估 计量
验第二个必需条件。我们声称第一个必需条件不能被检验,因为它涉及 到IV与未观测到的误差之间的相关。然而,如果我们有不只一个的工具 变量,我们就能有效地检验它们中的一部分是否与结构误差不相关。
作为一个例子,在有另外两个工具变量和的条件下,重新考虑方 程。我们知道仅用作为的IV,就能估计。给定IV估计值,我们就能计算 残差。因为在估计中根本没用到,我们可以验证与在样本中是否相关。 如果它们相关,不是的有效IV。当然,这并没有告诉我们与是否相关; 实际上,因为它是个有用的检验,我们必须假定与不相关。然而,如果 和是用相同的逻辑来选择的——例如母亲的教育和父亲的教育——发现 与相关将使人对用作为IV产生怀疑。
因为和的角色可以交换,若是假定与不相关,我们也可以检验与是 否相关。我们该用哪个检验呢?结果是,我们对检验的选择是无关紧要 的。我们必须假定至少有一个IV是外生的。然后,我们可以对2SLS中 所用的过度识别约束(overidentifying restrictions)进行检验。根据我们 的用意,过度识别约束的数目简单地就是额外的工具变量的数目。假定
C.究竟该用OLS还是工具变量法:对解释变量内生性的检验 当解释变量是外生的时,2SLS估计量不如OLS有效;正如我们已看
到的,2SLS估计值会有非常大的标准误。因此,检验一个解释变量的 内生性是有用的,它说明了2SLS甚至是否必要。获取这样的检验相当 简单。
举例说明,假定我们有单一的被怀疑的内生变量, (1)
与孩子的能力相关(通过母亲的能力和可能通过孩子幼年所受的教养的 质量)。
另外,educ的另一个IV选择是成长过程中兄弟姊妹的数目 (sibs)。一般地说,较多的兄弟姊妹与较低的平均教育水平相联系, 而与个人能力的高低不存在直接关系,这样,它就可以充当educ的工具
变量,进而进行工具变量发进行估计,得到参数的无偏、一致估计。
外,且可能与相关,这意味着它们是的有效的IV。在本节中,我们讨论 如何运用复工具变量。
工具变量法作为矩估计方法,必须满足矩法估计的阶条件。一般的 说,当我们在回归模型中有不只一个的内生解释变量时,在若干复杂的 情况下仍可能不能识别。但是,我们可以容易地表述识别的一个必要条 件,叫做阶条件(order condition)。
的因素相关,此时变量z就称作为变量x的工具变量(IV),则我们就利 用工具变量z可以根据上述方程(3)来进行估计,得到参数的无偏的一 致估计,如劳动经济学家已在工资方程中使用的家庭背景变量作为教育
的IV。例如,母亲的教育(motheduc)与孩子的教育是正相关的,这 一点通过收集劳动者数据样本并做educ对motheduc的简单回归便可以 看出来,因此,motheduc满足相关性条件,但是,母亲的教育也可能
传统的工具变量法一般都通过“二阶段最小二乘法”(2SLS或TSLS)来 实现,顾名思义,就是通过做两个回归来完成估计过程。
第一阶段:用内生解释变量对工具变量回归,即,得到拟合值; 第二阶段:用被解释变量对第一阶段回归的拟合值进行回归,即。
二阶段最小二乘法:
在前一节中,我们假定有单一的内生解释变量(),和的一个工具 变量。可往往我们有不只一个的外生变量,它们被排斥在结构模型之
2012-2013学年高级计量经济学分组名 单
第一组:潘琳、王超、倪远栋、叶寅、李 畅、吴超、卿剑、李珊、刘春梅、王巍、 马哲光、俞力群、田纪华
题目:二阶段最小二乘法(2SLS) 内容: 适用的情况(或条件) 估计原理 步骤 实例
二阶段最小二乘计量方法讲义整理
1.引例(引出问题和方法)
例一:有关工资收入和教育水平、个人能力之间的关系问题 考虑成年劳动者的工资方程中存在未观测到的能力的问题。一个简
相关文档
最新文档