第一组二阶段最小二乘讲义

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

什么可能是skipped的好的IV？我们所需要的是对score无直接效应，且与学生能力不相关的IV，同时，该IV必须与skipped相关。一个选择是利用住宿区与教室之间的距离distance，这也许会增加逃课的可能性（由于恶劣的天气、睡过头等等）。因而，skipped可能与distance正相关；这一点可通过skipped对distance的回归并作一个t检验得以验证。
将代入方程，可得到2SLS的最终表达式：
（2）二阶段最小二乘相关检验：在使用工具变量法估计的时候，必须对工具变量的有效性进行检验，否则，导致估计结果不一致或估计量的方差过大。
A.检验工具变量与解释变Fra Baidu bibliotek的相关性
前面在使用工具变量进行估计的时候，工具变脸必须与内生解释变量完全不相关，否则就无法使用工具变量法估计，如果仅仅微弱的相关，成为“若工具变量”，其后果类似于样本容量较小，导致估计量性质变得很差，统计推断失效。
根据是否满足阶条件分为三种情况： A．不可识别：工具变量的个数小于内生解释变量的个数； B．恰好识别：工具变量的个数等于内生解释变量的个数； C．过度识别：工具变量的个数大于内生解释变量的个数。
以上介绍的工具变量法仅适用于“恰好识别的情形”，但在实际中存在多个内生解释变量和工具变量的情况，就会出现“过度识别”的情况，解决方法之一就是扔掉“多余”的工具变量，但这种方法不是有效的，因为丢掉的工具变量包含着有用的信息，导致估计的结果不充分，此时运用二阶段最小二乘为有效估计。
B.检验工具变量的外生性举例说明，假定我们有单一的被怀疑的内生变量，
其中和是外生的。我们有另外两个外生变量，和，它们不出现在方程中。
我们在介绍简单的工具变量估计量时，我们强调IV必须满足两个必需条件：它必须与误差不相关，与内生解释变量相关。我们在相当复杂
的模型中已看到，如何判断在诱导型回归中是否能用一个t或F检验来检
显然，多个工具变量的线性组合仍然是工具变量，仍满足工具变量的两条件，如果能生成工具变量的线性组合数等于内生解释变量个数，则又回到了恰好识别的情形。在球型扰动项的假定下，由二阶段最小二乘法所提供的工具变量线性组合是所有线性组合中最渐进有效的。所以能良好解决过度识别问题，使工具变量法最终得到有效地一致估计。
单的模型为：
（1）
其中e是误差项。在某些假定下，如何用诸如IQ的代理变量代替能
力，从而通过以下回归可得到一致性估计量对进行回归
然而，假定不能得到适当的代理变量（或它不具备足以获取一致性
估计量所需的性质）。这样一来，我们将abil放入误差项中，留下来的
就是简单的回归模型：（2）
其中u包含了abil。当然，可以用OLS估计此方程，但是，如果 educ与abil （即educ与随机误差项u）相关，即educ为内生解释变
A．相关性：工具变量与内生解释变量相关，即 B．外生性：工具变量与扰动项不相关，即现在我们来证明可得到的工具变量能够用于进行方程一致性参数估
计。特别地，为了根据总体协方差写出，我们对方程两边求与z的协方
差，得到：现在，在与的假定下，我们可以解出为：
[注意到如果z与x不相关，即，该简单代数式不成立。] 上式表明是z、y 之间的总体协方差除以z、x之间的总体协方差的商，这说明了被识别。
量，则用OLS估计得到的结果将是的有偏、非一致性估计量。我们把简单回归模型写成：（3）
其中我们认为x与u相关：
此时，假如我们能找到一个变量z，满足两个条件：一是与变量x存在高度相关关系，即；二是与随机扰动项u不存在相关关系，即；从遗
漏变量的角度看，这意味着z应当对y无偏效应，也不应当与其它影响y
（i）用2SLS估计结构方程，获得2SLS残差。（ii）将对所有外生变量回归，获得，即。
（iii）在所有IV都与不相关的虚拟假设下，，其中q是模型之外的工
具变量的数目减去内生解释变量的总数目。如果超过了分布中的（例如）5%临界值，我们拒绝：所有工具变量都是外生的，并推断出至少部分的IV不是外生的。
distance是否与u不相关？在简单回归模型（4）中，假如u中的一些因素不与distance相关，那么，distance也许是skipped的一个好的IV，进而能良好估计模型（4）。如果学生能力有一个好的代理，例如以往学期的累积GPA，IV法可能根本就不需要。
问题总结：
例子存在的共同问题： 1. 在简单回归模型中存在遗漏重要变量问题，运用OLS估计导致其得到估计结果不一致。 2. 遗漏变量没有良好的代理变量情况下，会导致解释变量与扰动项的存在相关关系，即出现内生解释变量情况，导致估计结果有偏。
我们利用方程（3）：z与y之间的协方差为
现在，在与的假定下，我们可以解出为：给定一个随机样本，我们用对应样本量来估计总体的量。在分子和分母中约去样本容量后，我们得到的工具变量（IV）估计量（instrumental variables (IV) estimator）：
例二：逃课对考试成绩的因果影响问题考虑逃课对期末考试平均成绩的因果影响的问题。在一个简单的回
归框架中，我们有（4）
其中，score是期末考试平均成绩，skipped是该学期逃课的总数目。此时，在用OLS估计方程时，我们担心skipped可能与u中其它因素相关：比如，成绩较好（无法观测的能力变量）的学生可能逃课较少等情况，因而score对skipped的简单回归可能不会给我们一个对逃课的因果影响的好的估计，因此，我们需要找到一个好的工具变量进行估计。
3．二阶段最小二乘法估计的基本原理和主要步骤（重点思想和推到步骤）
（1）估计的基本步骤：
第一阶段：将每个解释变量分别对所有L个工具变量作OLS回归，得到拟合值为：其中，为的投影矩阵。写成矩阵形式，可以定义第二阶段：由于是的线性组合（参见第一阶段回归），故恰好包含K个工具变量，使用为工具变量对原模型进行工具变量法估计：因此，可以看出，可以将视为把对进行OLS回归而得到的，故名为“二阶段最小二乘”。需要注意的是，第二阶段回归得到的残差为，而原方程残差确是，因此在进行2SLS最好不要自己去进行两次手工回归，而是直接使用软件（如STATA）进行回归分析。
解决的可行方法： 1.在没有良好代理变量情况下，通过寻找外生变量作为工具变量进行估计，解决了内生解释变量导致的有偏估计情况，得参数的到无偏、一致估计。
2．二阶段最小二乘简单介绍（工具变量相关概念、使用的情况、解决的问题、主要的估计思想等）
工具变量法：
（1）由以上引例可以看出在解决内生解释变量问题时，通过需找一个满足一定条件的外生变量，即工具变量来获取无偏的一致估计，故为工具变量法。（2）何为工具变量（IV）：在简单回归方程中，一个有效的工具变量应满足以下两个条件：
其中和是外生的。我们有另外两个外生变量，和，它们不出现在方程（1）中。如果与不相关，我们该用OLS估计。对此我们如何检验呢？ Hausman（1978）建议直接比较OLS和2SLS估计值，判断其差异是否在统计上显著。毕竟，如果所有变量外生，OLS和2SLS都是一致性的。如果2SLS与OLS的差异显著，我们断定必定是内生的（保持外生性）。计算OLS和2SLS，看估计值是否实际上有差异，这是个好主意。为了判断差异是否在统计上显著，用回归来检验更容易。这是以估计的诱导型为基础的，此时诱导型为
我们只有一个内生解释变量。如果我们只有的单一个IV，而没有过度识别约束，也就没什么可检验的。如果我们有的两个IV，如同前面的例子中那样，则我们有一个过度识别约束。如果我们有三个IV，则有两个过度识别约束，等等。
检验过度识别约束是相当简单的。我们必须获得2SLS残差，然后做一个辅助回归。检验（任意多个）过度识别约束
判断弱工具变量的方法之一为，在第一阶段回归中，，检验原假设“”，一个经验规则，如果次检验的F统计量大于10，则可拒绝“存在弱工具变量”的原假设，不必担心弱工具变量问题。在多个内生解释变量的情况下，将有多个第一阶段回归，固有多个F统计量，此时运用“最小特征值统计量”。STATA提供了最小特征值统计量的临界值。
给定一个随机样本，我们用对应样本量来估计总体的量。在分子和分母中约去样本容量后，我们得到的工具变量（IV）估计量（instrumental variables (IV) estimator）：
给定x、y和z的样本数据，很容易获得IV估计量。的IV估计量就为：，
除了其中的斜率估计量现在为IV估计量，它看起来就像OLS中的截距估计量
验第二个必需条件。我们声称第一个必需条件不能被检验，因为它涉及到IV与未观测到的误差之间的相关。然而，如果我们有不只一个的工具变量，我们就能有效地检验它们中的一部分是否与结构误差不相关。
作为一个例子，在有另外两个工具变量和的条件下，重新考虑方程。我们知道仅用作为的IV，就能估计。给定IV估计值，我们就能计算残差。因为在估计中根本没用到，我们可以验证与在样本中是否相关。如果它们相关，不是的有效IV。当然，这并没有告诉我们与是否相关；实际上，因为它是个有用的检验，我们必须假定与不相关。然而，如果和是用相同的逻辑来选择的——例如母亲的教育和父亲的教育——发现与相关将使人对用作为IV产生怀疑。
因为和的角色可以交换，若是假定与不相关，我们也可以检验与是否相关。我们该用哪个检验呢？结果是，我们对检验的选择是无关紧要的。我们必须假定至少有一个IV是外生的。然后，我们可以对2SLS中所用的过度识别约束（overidentifying restrictions）进行检验。根据我们的用意，过度识别约束的数目简单地就是额外的工具变量的数目。假定
C.究竟该用OLS还是工具变量法：对解释变量内生性的检验当解释变量是外生的时，2SLS估计量不如OLS有效；正如我们已看
到的，2SLS估计值会有非常大的标准误。因此，检验一个解释变量的内生性是有用的，它说明了2SLS甚至是否必要。获取这样的检验相当简单。
举例说明，假定我们有单一的被怀疑的内生变量，（1）
与孩子的能力相关（通过母亲的能力和可能通过孩子幼年所受的教养的质量）。
另外，educ的另一个IV选择是成长过程中兄弟姊妹的数目（sibs）。一般地说，较多的兄弟姊妹与较低的平均教育水平相联系，而与个人能力的高低不存在直接关系，这样，它就可以充当educ的工具
变量，进而进行工具变量发进行估计，得到参数的无偏、一致估计。
外，且可能与相关，这意味着它们是的有效的IV。在本节中，我们讨论如何运用复工具变量。
工具变量法作为矩估计方法，必须满足矩法估计的阶条件。一般的说，当我们在回归模型中有不只一个的内生解释变量时，在若干复杂的情况下仍可能不能识别。但是，我们可以容易地表述识别的一个必要条件，叫做阶条件（order condition）。
的因素相关，此时变量z就称作为变量x的工具变量（IV），则我们就利用工具变量z可以根据上述方程（3）来进行估计，得到参数的无偏的一致估计，如劳动经济学家已在工资方程中使用的家庭背景变量作为教育
的IV。例如，母亲的教育（motheduc）与孩子的教育是正相关的，这一点通过收集劳动者数据样本并做educ对motheduc的简单回归便可以看出来，因此，motheduc满足相关性条件，但是，母亲的教育也可能
传统的工具变量法一般都通过“二阶段最小二乘法”（2SLS或TSLS）来实现，顾名思义，就是通过做两个回归来完成估计过程。
第一阶段：用内生解释变量对工具变量回归，即，得到拟合值；第二阶段：用被解释变量对第一阶段回归的拟合值进行回归，即。
二阶段最小二乘法：
在前一节中，我们假定有单一的内生解释变量（），和的一个工具变量。可往往我们有不只一个的外生变量，它们被排斥在结构模型之
2012-2013学年高级计量经济学分组名单
第一组：潘琳、王超、倪远栋、叶寅、李畅、吴超、卿剑、李珊、刘春梅、王巍、马哲光、俞力群、田纪华
题目：二阶段最小二乘法（2SLS）内容：适用的情况（或条件）估计原理步骤实例
二阶段最小二乘计量方法讲义整理
1.引例（引出问题和方法）
例一：有关工资收入和教育水平、个人能力之间的关系问题考虑成年劳动者的工资方程中存在未观测到的能力的问题。一个简

第一组 二阶段最小二乘讲义

第一组二阶段最小二乘讲义