第8讲工具变量讲解
工具变量法及其应用
工具变量法及其应用一、工具变量法简介工具变量法是一种在统计分析中常用的技术,主要用于解决回归分析中的内生性问题。
内生性问题通常出现在一个或多个解释变量与误差项相关的情况下,这会导致回归模型的估计结果有偏且不一致。
为了解决这个问题,工具变量法通过引入一个或多个与内生解释变量相关,但与误差项无关的工具变量,来替代内生解释变量。
二、工具变量的选择工具变量的选择是工具变量法的关键步骤。
理想的工具变量应满足与内生解释变量相关,但与误差项无关的条件。
在实践中,通常需要根据研究问题的具体情况和理论依据来选择工具变量。
一些常见的选择方法包括使用先前的研究、使用相关行业的平均值、使用其他相关变量的滞后值等。
三、工具变量法的优缺点工具变量法的优点主要包括:可以解决内生性问题,提高回归模型的估计精度和一致性;可以扩大解释变量的范围,使得模型更全面地反映被解释变量的影响因素;可以降低误差项的相关性,从而降低模型的标准误,提高模型的置信度。
但是,工具变量法也存在一些缺点,如工具变量的选择困难、可能导致过度拟合和模型过度设定等问题。
四、工具变量法在经济学中的应用工具变量法在经济学中有着广泛的应用。
例如,在研究货币政策时,工具变量法可以用来解决货币供应量与通货膨胀之间的内生性问题,从而提高模型的预测精度;在研究劳动市场时,工具变量法可以用来解决工资与就业之间的内生性问题,从而更准确地估计模型的参数。
五、工具变量法在金融学中的应用工具变量法在金融学中也有着广泛的应用。
例如,在研究股票市场时,工具变量法可以用来解决市场收益率与风险之间的内生性问题,从而提高模型的预测能力和风险管理水平;在研究信贷市场时,工具变量法可以用来解决利率与信贷风险之间的内生性问题,从而更准确地估计模型的参数。
六、工具变量法在其他领域的应用工具变量法在其他领域也有着广泛的应用。
例如,在环境科学中,工具变量法可以用来解决环境污染与经济增长之间的内生性问题,从而更准确地估计模型的参数;在医学研究中,工具变量法可以用来解决吸烟与健康之间的内生性问题,从而更准确地估计模型的参数。
题目什么是工具变量请简要解释两阶段最小二乘法的原理
题目什么是工具变量请简要解释两阶段最小二乘法的原理工具变量是经济学研究中常用的一种样本选择技术,在解决内生性问题时发挥重要的作用。
而两阶段最小二乘法(Two-stage Least Squares, 2SLS)则是一种通过工具变量解决内生性问题的统计方法。
本文将简要解释什么是工具变量,并介绍两阶段最小二乘法的原理。
一、什么是工具变量?工具变量是一种被用来估计因果效应的技术。
在经济学研究中,我们通常希望通过观察变量之间的关系来推断因果关系。
然而,当我们的解释变量与误差项存在内生性的时候,观察到的关系可能是虚假的。
内生性指的是解释变量与误差项之间存在相关性,从而导致回归结果的偏误。
例如,假设我们想要研究教育对收入的影响,但教育水平与个体的天赋能力存在相关性,那么在简单的回归模型中,教育水平的系数可能是被天赋能力所驱动的,而隐藏了教育对收入的真实影响。
为了解决内生性问题,我们需要引入工具变量。
工具变量是与解释变量相关但与误差项无关的变量。
通过利用工具变量的性质,我们可以有效地分离出解释变量与误差项之间的关系。
二、两阶段最小二乘法的原理两阶段最小二乘法是一种使用工具变量估计内生变量系数的方法。
它将估计过程分为两个阶段,通过两个回归模型来实现。
第一阶段:通过工具变量来解决内生性问题。
首先,选择一个与内生变量相关的工具变量。
然后,利用工具变量进行回归,得到内生变量的预测值。
这个预测值具有以下性质:它与误差项无关,并且与内生变量存在相关性。
第二阶段:根据第一阶段得到的内生变量的预测值,再次进行回归。
这一次回归的目的是估计解释变量对因变量的影响,并控制了内生性的影响。
通过这两个阶段的回归,我们可以得到内生变量系数的一致估计。
两阶段最小二乘法的核心思想是利用工具变量来消除内生性问题,进而获得内生变量系数的一致估计。
通过第一阶段的回归得到的预测值,我们可以将内生变量视为无误差的外生变量,并在第二阶段的回归中进行计算。
工具变量法工具变量法具体步骤
工具变量法工具变量法具体步骤工具变量法(Instrumental Variable Method)是一种用于处理内生性问题的统计方法,它通过引入一个“工具变量”来解决内生性问题。
工具变量是一个有着良好相关性但不会受到内生性干扰的变量,它可以用来代替内生变量,从而解决内生性的影响。
1.确定内生变量和工具变量:首先,需要确定研究中存在的内生变量和可能的工具变量。
内生变量是对所研究问题有影响的变量,而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。
内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。
2.检验工具变量的相关性:接下来,需要检验所选取的工具变量与内生变量之间的相关性。
这可以通过计算相关系数或进行统计检验来实现。
如果工具变量与内生变量存在显著相关性,那么它可能是一个有效的工具变量。
3.确定工具变量的外生性:除了相关性外,工具变量还需要满足外生性的要求,即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。
这可以通过进行实证分析来判断,例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。
如果工具变量的影响仅通过内生变量介导,则可以认为工具变量满足外生性的要求。
4.估计工具变量模型:一旦确定了有效的工具变量,可以使用工具变量法来估计因果关系。
工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响,并利用工具变量对内生变量进行替代。
通过将工具变量引入估计方程中,可以消除内生性的影响,从而得到无偏的因果关系估计。
5.进行统计推断:在估计了工具变量模型之后,可以进行统计推断来评估估计结果的显著性。
这可以通过计算标准误差、置信区间和假设检验等来实现。
统计推断可以帮助判断估计结果的可靠性,并验证因果关系的存在与否。
总结而言,工具变量法是一种用于解决内生性问题的统计方法。
它通过引入一个有效的工具变量来代替内生变量,消除内生性的干扰,从而得到无偏的因果关系估计。
工具变量法的具体步骤包括确定内生变量和工具变量、检验工具变量的相关性和外生性、估计工具变量模型,并进行统计推断。
工具变量法
工具变量法一、工具变量法得主要思想在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。
经过变换,新得模型中,随机扰动项得表达式为:考伊克模型: ( ,为衰减率) (1、1);适应性期望模型:(,为期望系数)(1、2);部分调整模型:( ,为调整系数) (1、3)。
为原无限分布滞后模型中得扰动项,为变换后得扰动项。
在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。
那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。
内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。
外生解释变量:回归模型中得解释变量与随机扰动项无关;内生解释变量:回归模型中得解释变量与随机扰动项无关;了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。
工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。
工具变量法
工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
《工具变量SLSG》课件
未来的工具变量slsg将更加注重智能化和人性化的设计。通过人工智能和机器学习技术,实现工具变 量slsg的自动化和智能化;同时,将更加注重用户体验和人机交互,使工具变量slsg更加易于使用和 操作。
05
工具变量slsg的实际应用与案例分析
工具变量slsg在经济学中的应用
总结词
经济学中,工具变量slsg被广泛应用于解 决内生性问题,如遗漏变量偏差和同时 性偏差。
《工具变量slsg》ppt课件
• 工具变量slsg简介 • 工具变量slsg的基本原理 • 工具变量slsg的实证分析 • 工具变量slsg的未来发展与展望 • 工具变量slsg的实际应用与案例分析
01
工具变量slsg简介
定义与特点
定义
工具变量(SLSG)是一种用于解决内生性问题的方法,通过引入一个或多个 外生的工具变量来替代或估计内生解释变量,以获得一致的估计结果。
实证分析的案例与结果
数据处理
对收集到的数据进行预处理和 清洗,确保数据的质量和一致 性。
结果分析
对拟合结果进行详细分析,评 估模型的适用性和解释能力。
案例选择
选择具有代表性的案例进行实 证分析,确保案例的典型性和 可信度。
模型拟合
使用所选模型对数据进行拟合 ,得到拟合结果。
结果比较
将实证分析结果与其他相关研 究进行比较,验证结果的可靠 性和创新性。
人工智能与机器学习在工具变量slsg中的应用
随着人工智能和机器学习技术的发展,越来越多的研究开始探索如何将这些技术应用于 工具变量slsg中,以提高其效率和准确性。
大数据处理与分析在工具变量slsg中的研究
随着大数据时代的到来,如何有效地处理和分析大规模数据成为工具变量slsg面临的重 要挑战。当前的研究热点是如何利用先进的数据处理和分析技术,从海量数据中提取有
工具变量法结果解读
工具变量法结果解读一、引言工具变量法是计量经济学中一种重要的估计方法,主要用于解决内生性问题。
通过引入工具变量,工具变量法能够有效地减少误差,提高估计的准确性和可靠性。
然而,对于初学者来说,如何正确解读工具变量法的结果可能是一个挑战。
本文将详细解读工具变量法的理论基础、工具变量的选择、结果解读以及结论,以期帮助读者更好地理解和应用工具变量法。
二、工具变量法的理论基础工具变量法源于经济理论,特别是当一个或多个解释变量与误差项相关时,就会产生内生性问题。
在这种情况下,普通最小二乘法(OLS)的估计结果是有偏的。
为了解决这个问题,我们引入一个或多个与内生解释变量相关,但与误差项无关的工具变量。
这些工具变量通过与内生解释变量的线性组合来“工具化”内生解释变量,从而在估计中起到减少误差和偏误的作用。
三、工具变量的选择选择合适的工具变量是工具变量法的关键步骤。
理想情况下,一个好的工具变量应该与内生解释变量高度相关,同时与误差项无关。
在实践中,我们通常选择那些与内生解释变量相关,同时又遵循随机扰动的因素作为工具变量。
此外,工具变量的数量应该足够多,以便能够充分地“工具化”内生解释变量。
四、结果解读在应用工具变量法后,我们得到了一组估计结果。
这些结果应该如何解读呢?首先,我们需要关注估计系数的符号。
如果估计系数的符号与预期相符,那么我们可以初步认为估计结果是可靠的。
其次,我们需要检验估计结果的显著性。
常用的方法是观察估计系数的p值。
如果p值较小(通常小于0.05),则表明估计结果是显著的。
最后,我们需要检验工具变量的有效性。
这可以通过观察工具变量的系数是否接近于1来初步判断。
如果工具变量的系数接近于1,并且显著,那么我们可以认为工具变量是有效的。
此外,我们还可以使用诸如弱工具检验、过度识别检验等统计方法来进一步检验工具变量的有效性。
五、结论本文对工具变量法的结果解读进行了详细阐述。
通过关注估计系数的符号、显著性以及工具变量的有效性等方面,我们可以更好地理解和应用工具变量法。
工具变量方法原理
工具变量方法原理工具变量方法(Instrumental Variable Method)是一种常用的实证研究方法,用于解决因果关系中的内生性问题。
当研究主变量与随机抽样原则(即不相关性假设)无关时,内生性问题会出现。
在这种情况下,使用传统的OLS(Ordinary Least Squares)回归模型估计将导致参数估计的无效性。
工具变量方法通过利用一个或多个工具变量,来解决内生性问题,并得到一致的估计结果。
工具变量是一个满足两个条件的变量:首先,工具变量与内生变量相关。
其次,工具变量与干扰项不相关。
这样,可以通过回归工具变量来消除内生性问题,从而得到因果关系的一致估计。
工具变量方法的基本思想是在原始模型中引入一个工具变量,在回归分析中用工具变量代替内生变量。
这样,内生变量与工具变量的回归关系就代替了内生变量与因变量的直接关系。
通过估计工具变量与因变量的关系,就可以得到一致的因果关系估计。
Y=α+βX+ε其中,Y是因变量,X是内生变量,α和β是参数,ε是误差项。
由于X与ε存在内生性问题,参数估计将变得无效。
为了解决内生性问题,引入一个工具变量Z。
使用工具变量方法得到的回归方程为:X=α+γZ+ε'其中,γ是工具变量与被解释变量的关系。
将工具变量引入原始模型,得到:Y=α+β(α+γZ+ε')+ε化简后可以得到:Y=α+βα+βγZ+βε'+ε由于内生性问题,βγ≠0,OLS估计将无效。
但是,由于工具变量与ε无相关性,βε'=0。
因此,使用工具变量方法可以得到一致的估计结果,即β的一致估计。
工具变量方法中的关键问题是选择合适的工具变量。
一个好的工具变量要满足两个条件:首先,与内生变量相关,以确保能够消除内生性问题;其次,与干扰项不相关,以确保工具变量不会引入新的内生性问题。
如果工具变量不满足这两个条件,工具变量方法仍然会产生一致的估计结果,但结果可能存在偏误。
要选择合适的工具变量,需要根据研究问题及具体情境进行判断。
工具变量
观测误差
联立偏差
• 当X和Y相互作用,相互影响,互为因果 时,我们应该用联立方程组的形式来描述 它们之间的关系 • 但如果我们仍然采用单一线性方程形式, 以Y为被解释变量,X为解释变量,就会导 致与扰动项相关的情况出现,X成为内生 的解释变量
内生解释变量的影响
• 当 E(u|X ) ≠ 0 时,OLS估计量b有偏且不 一致 • 在大样本条件下,当 计量b不一致
ˆ (X ' X)1 (X ' y) β (X ' X)1 (X ' u) β ( N 1X ' X)1 ( N 1X ' u) β
• 由假定Rank(X)=K和大数定律,样本均值的概率极限等于总 体均值,可得: Plim( N 1X ' X) E(X ' X) A
2、工具变量法作为一种矩估计
假设回归模型为 yi=1x i1++ k-1x i,k-1+ k x ik+ i 假设只有最后一个解释变量x ik为内生变量,即 Cov x ik, i 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov x ik,w i 0 (相关性),以及Cov w i, i =(外生性)。由于 0 x1, ,x k-1不是内生变量,故可以把自己作为自己 的工具变量(因为满足工具变量的两个条件)
(8.3)
• 将y=Xβ+u带入估计量中,可得:
ˆ (Z ' X)1 Z '39; u β
• 可以证明:
ˆ ) E[(Z ' X)1 Z ' uu ' Z( X ' Z) 1 ] Var(β 2 (Z ' X)1 Z ' Z(X ' Z)1 2 (X ' X) 1
工具变量法例子及解析
工具变量法例子及解析工具变量法是经济学中常用的一种回归分析方法,它的作用是削弱内生性问题对回归结果的影响。
本文将通过具体例子和分析,介绍工具变量法的原理、应用和重要性。
一、工具变量法原理工具变量法的核心思想是利用一个与内生变量有关的外生变量来代替内生变量,既能够在一定程度上削弱内生性问题,又能够保留回归模型的一般结构。
其原理可以简单归纳为以下几个步骤:1. 利用可靠性高的工具变量代替内生变量2. 使用工具变量回归得到内生变量的估计值3. 将内生变量的估计值代入原始回归模型,得出正确的回归效果。
通过以上三个步骤,工具变量法可以尽可能地消除内生性问题对回归分析的干扰,从而得到准确的分析结果。
二、工具变量法应用在实际经济研究中,工具变量法的应用非常广泛,以下是几个常见的应用:1. 教育和收入的关系分析这是一个非常经典的实证研究,研究者发现,教育与收入之间存在内生性问题,即教育水平可能受到家庭收入的影响。
为了解决这个问题,研究者使用父母教育程度作为工具变量,用它来代替受教育程度对收入的内生性影响,最终得出正确的研究结果。
2. 运动员收入与绩效的关系分析在研究运动员收入与绩效关系的时候,由于运动员自身的能力或健康状况等因素可能会影响分析结果,因此需要使用工具变量来解决内生性问题。
例如,研究者可以使用运动员所属的地理区域作为工具变量,用它来代替个人因素对收入和绩效的影响,从而得出更加准确的研究结果。
3. 货币政策与经济增长的关系分析在研究货币政策对经济增长的影响时,通常会使用实际利率作为工具变量来解决内生性问题。
由于实际利率受银行制度、资本市场以及政府债券利率等多种因素的影响,因此能够代替内生性较强的利率变量,得出更加准确的研究结果。
三、工具变量法的重要性工具变量法在经济学研究中具有非常重要的地位,它的主要作用在于解决内生性问题,从而得出更加准确的研究结果。
由于内生性问题可能会导致回归结果的偏误,因此如果不进行工具变量法处理,可能得出的结论会与实际情况有较大差距,这对于政策的制定和实施将会带来严重影响。
工具变量的标准
工具变量的标准工具变量在经济学和社会科学研究中起到至关重要的作用,它们用于处理内生性问题,即某种变量可能与因果变量以及其他自变量之间存在内在的相关性。
本文将从工具变量的定义、选择、标准以及使用等方面进行探讨。
工具变量(Instrumental Variables, IV)是一种经济学中用于解决内生性问题的技术手段。
内生性问题主要指的是观测数据中存在的内在的相关性,导致无法直接得到准确的因果关系。
例如,假设我们想研究教育对收入的影响,但由于教育与个体能力水平以及其他影响收入的因素存在共同决定因素,因此无法准确地测量教育对收入的独立影响。
在这种情况下,工具变量可以帮助我们解决内生性问题。
工具变量可以看作是对内生性问题的一个解决方案,它是一种可以从外部影响因果关系的变量。
通过使用工具变量,我们可以利用这种外部影响来估计原始因果效应,而不会受到内生性问题的影响。
工具变量的基本思想是通过利用这种外部影响,将原始内生性问题转化为一个外生性问题,进而得到更准确的因果关系估计。
在选择工具变量时,需要满足一些标准。
首先,工具变量与内生变量之间应该存在一定的相关性,即工具变量对内生变量有一定的影响。
如果工具变量与内生变量没有相关性,那么它就不能有效地解决内生性问题。
其次,工具变量与误差项之间应该不存在相关性。
如果工具变量与误差项之间存在相关性,那么工具变量就不能满足外生性的要求,从而无法有效地解决内生性问题。
此外,工具变量应该具有足够的异质性,即工具变量对不同个体的影响程度应该有所不同。
如果工具变量没有足够的异质性,那么它不能提供有效的“随机试验”条件,无法解决内生性问题。
在实际应用中,我们常常使用一些统计测量指标来评估工具变量是否符合标准。
例如,工具变量的相关性通常可以通过计算工具变量与内生变量之间的相关系数来衡量。
同时,我们可以使用所谓的第一阶段回归来检验工具变量与内生变量以及其他控制变量之间的相关性。
另外,工具变量也需要满足一些经济学上的合理性标准。
工具变量法
工具变量法一.为什么需要使用工具变量法?当模型存在内生解释变量问题,一般为以下三种情形:(1)遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。
否则,就会造成解释变量与残差项相关,从而引起内生性问题。
(2)解释变量与被解释变量相互影响(3)度量误差 (measurement error ):由于在关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。
Ex :i 01122Y i i k ik i X X X ββββμ=+++⋅⋅⋅++ 其中:X 2为内生解释变量 当22Cov(X ,)=E[X ]0i i i i μμ≠时,内生解释变量与随机干扰项同期相关。
此时会导致回归参数估计量是有偏的且不一致,需要用工具变量法进行回归。
二.如何使用工具变量? (一)判断是否需要用工具变量当存在内生性变量时,则需使用工具变量,所以需要对内生性变量进行检验。
在实践中,往往是通过经济学理论先说明是否存在内生性变量,最后再通过检验证明确实存在内生变量。
(1)豪斯曼检验(Hausman )原假设H 0:所有解释变量均为外生变量将内生解释变量关于工具变量与外生变量进行OLS 回归估计 记录残差序列(^^IV OLS ββ−),加入原模型后进行OLS 估计 结果:若差值依概率收敛于0,接受原假设;反之,拒绝。
(2)杜宾-吴-豪斯曼检验(DWH )注:存在异方差的情况下传统豪斯曼检验不适用。
回归模型:'1122y x x ββε=++ z=(x 1,z 2) 第一阶段回归:''21x x z v γδ=++ 检验扰动项v 与ε相关性模型:=v+ερξ 其中:ρ为ε对v 回归系数,ε与v 不相关则ρ=0. 对 ^'''1122y=x x v e ββρ+++ 回归 对原假设H 0:ρ=0. 进行t 检验。
工具变量法~
工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法就是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (1、1); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(1、2);部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) (1、3)。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至就是有偏的这样严重的问题。
那么,我们就是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -?在这里,一个可行的估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量与外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法与普通最小二乘法就是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计就是非一致的,这时就需要引入工具变量。
工具变量的定义及应用要求
工具变量的定义及应用要求工具变量是在计量经济学中使用的一种方法,用于解决内生性问题。
内生性问题指的是自变量(解释变量)与误差项之间存在相关性,从而导致回归结果产生偏误。
工具变量的核心思想是通过引入一个外生性足够强的变量,来替代内生性的自变量,从而消除内生性问题。
在本文中,将介绍工具变量的定义、应用要求以及实际应用,以及工具变量方法在实证研究中的重要意义。
首先,工具变量的定义是指在计量经济模型中,利用一个或一组外生性足够强的变量(即工具变量)来替代内生性自变量,从而消除内生性问题。
工具变量需要满足两个基本要求:第一,工具变量与内生性自变量存在显著相关性;第二,工具变量与误差项不存在相关性。
如果工具变量满足这两个要求,那么使用工具变量进行估计就可以得到无偏的一致估计。
其次,工具变量的应用要求包括两个方面:第一,工具变量必须是外生性的。
外生变量指的是与误差项不相关的变量,通常是与内生性自变量相关但与误差项不相关的变量。
工具变量的外生性是工具变量方法有效性的基础,只有外生性的工具变量才能有效地消除内生性问题。
第二,工具变量必须具有强相关性。
强相关性意味着工具变量与内生性自变量之间存在显著的相关性,这样才能有效地替代内生性自变量,从而消除内生性问题。
在实际应用中,工具变量方法通常用于解决内生性问题。
内生性问题在计量经济学中是一个常见且严重的问题,如果不加以解决,将导致回归结果产生偏误,从而影响到结论的准确性和可靠性。
工具变量方法可以有效地解决内生性问题,得到无偏的一致估计。
因此,在许多实证研究中,特别是涉及到内生性问题的情况下,研究者通常会使用工具变量方法来确保估计结果的准确性。
工具变量方法在实证研究中具有重要的意义。
首先,工具变量方法为研究者提供了一种有效的解决内生性问题的方法,使他们能够得到无偏的一致估计。
其次,工具变量方法在一定程度上放宽了对自变量的外生性假设,使得研究者能够在较宽松的条件下进行估计。
工具变量通俗理解
工具变量通俗理解工具变量在社会科学研究中扮演了重要的角色,它是一种被用来解决内生性问题的方法。
内生性问题指的是研究中存在的因果关系上的混淆。
在研究中,我们常常希望找到因果关系,即某个变量对另一个变量产生了影响,但是由于其他潜在的变量的存在,我们很难准确地判断这种因果关系。
举个例子来说明这个问题。
假设我们想研究教育对收入的影响,我们发现教育水平越高的人收入普遍较高。
但是我们不能简单地得出教育提高了收入这样的结论,因为其他潜在的因素,比如个人的才能和家庭背景也可能会对收入产生影响。
这就是内生性问题,我们无法确定教育是否真正引起了收入的变化。
为了解决内生性问题,研究者们引入了工具变量的概念。
工具变量是一个与感兴趣的变量相关,但与其他潜在影响因素无关的变量。
通过引入工具变量,研究者可以利用工具变量与感兴趣的变量之间的关系来解决内生性问题。
具体来说,工具变量的作用有两个方面。
首先,工具变量通过“随机性”来提供一个外部来源的因果效应。
所谓“随机性”,指的是工具变量与其他潜在影响因素之间没有直接的联系,这样我们可以认为工具变量不会通过其他途径影响感兴趣的变量。
通过工具变量的引入,我们可以得到一个与感兴趣的变量相关的“随机化实验”,从而更好地估计因果效应。
工具变量可以帮助我们解决内生性问题,从而提高研究结果的准确性。
通过利用工具变量与感兴趣的变量之间的关系,我们可以建立一个经济模型,通过对这个模型的估计来得到一个更准确的因果效应。
这种方法被称为工具变量回归,它可以通过建立一个包含工具变量的回归模型来解决内生性问题。
需要注意的是,工具变量的选择是一个关键的问题。
一个好的工具变量应该满足两个条件:首先,它与感兴趣的变量之间应该存在一定的相关性,否则它无法提供有效的工具效应;其次,它与其他潜在影响因素之间应该不存在直接的联系,否则它会引入其他的内生性问题。
在实际研究中,研究者们通过各种方法来选择工具变量。
常见的方法包括利用自然实验和制造实验。
工具变量原理
工具变量原理嘿,你有没有想过,在这个充满各种关系的世界里,要确切地找出两件事之间的因果联系有多难?就像你看到一群小蚂蚁在搬东西,你能直接说因为今天太阳大,所以蚂蚁才搬东西吗?当然不能啦。
这时候呢,就需要一种神奇的东西来帮忙,这个东西就是工具变量。
我有个朋友叫小李,他特别爱研究一些经济现象。
有一次,他想知道教育程度对收入的影响。
你可能觉得这很简单啊,教育程度高的人,知识多、技能强,收入应该就高呗。
可是事情没那么简单。
因为可能还有其他因素在捣乱,比如说家庭背景。
那些家庭条件好的人,可能既容易接受好的教育,又有更多的人脉资源来获取高收入。
这就好比你在煮一锅汤,里面有好多调料混在一起,你想知道盐对味道的影响,可还有糖啊、酱油啊什么的在里面搅和。
这时候工具变量就闪亮登场啦。
工具变量就像是一个超级侦探,它能帮助我们把真正的因果关系挖出来。
那这个工具变量得满足几个条件呢。
第一个条件,它得和我们关心的自变量有关系。
比如说,在小李研究教育程度对收入的影响时,如果把学校到学生家的距离当作工具变量。
一般来说,距离家近的学校可能更容易去,那这个距离就和教育程度有点联系了。
就像你离蛋糕店近,你就更容易去买蛋糕一样。
第二个条件,这个工具变量得和那些干扰因素没啥关系。
学校到家的距离和家庭背景可没什么直接联系吧。
要是这个工具变量和干扰因素有关系,那就像一个叛徒一样,把我们的调查搅得一团糟。
第三个条件,这个工具变量只能通过自变量来影响因变量。
学校到家的距离,它不能直接影响收入,只能通过影响是否能接受教育,然后再对收入产生影响。
这就好像一条链条,一环扣一环,不能乱跳。
我和小李聊天的时候,他给我举了个特别有趣的例子。
他说假如我们想知道吸烟对健康有没有影响。
但是呢,可能那些喜欢吸烟的人,他们的生活习惯也比较不健康,比如熬夜、不爱运动。
这时候怎么找工具变量呢?他说可以把香烟的价格当作工具变量。
你想啊,香烟价格高了,有些人可能就会减少吸烟量。
工具变量法~
工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (1.1); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(1.2);部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) (1.3)。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -?在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
工具变量名词解释
工具变量名词解释
工具变量是一种在计量经济学中被广泛使用的重要概念。
它在研究因
果性问题时具有重要的作用,尤其在面临内生性问题时更加不可或缺。
工具变量指的是一种可以影响特定自变量但不影响因变量的变量,它
可以用来代替原始的自变量,并被用来推断自变量对因变量的影响。
这些变量通常与自变量高度相关,但又与因变量无关。
通过使用工具
变量,我们可以消除内生性问题,从而得到更加准确和可靠的因果性
推断。
例如,如果我们想研究一个人的教育水平对其收入的影响,但我们发
现这两个变量之间存在内生性问题,我们就可以使用工具变量来解决
这个问题。
一个可能的工具变量是该人的家庭背景,因为家庭背景可
能会影响一个人的教育水平,但对其收入没有直接的影响。
通过使用
家庭背景作为工具变量,我们可以得到更准确的教育水平对收入的因
果效应。
值得注意的是,选择适当的工具变量对于结果的正确性至关重要。
一
个好的工具变量应该满足以下三个条件:第一,与自变量高度相关;
第二,与因变量无关;第三,与内生变量的误差项无关。
如果一个工
具变量不满足这些条件,那么使用它推断因果性的结果将可以受到严
重的偏差影响。
在实际应用中,工具变量方法被广泛应用于各种经济学问题的解决中,包括偏误修正、习惯性烟民效应等等。
使用工具变量方法可以帮助我
们理清复杂的因果关系,消除内生性问题,并得出更加准确和可靠的
经济政策建议。
工具变量法工具变量法具体步骤
工具变量法工具变量法具体步骤工具变量法目录概念某一个变量与模型随机解释变量高度相关,但却不与为丛藓科扭口藓项相关,那么就可以用此变量与模型中相应回归系数的一个一致估计量,这个变量就称为方法变量,这种估计方法就叫工具基本原理变量法。
缺点工具变量法的关键是选择一个有效的优先选择工具变量,由于工具自变量变量可以选择中的困难,工具变量法本身存在两方面不足:一是由于工具变量不是惟一的,因而工具变量估计量有一定的任意性;其二由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关的与所替代而随机解释变量高度相关的变量总的来说事实上是困难的。
工具变量法与内生解释变量可持续性解释变量会造成解读严重的后果:不一致性inconstent 和有偏biased ,因为频域不满足误差以解释线性为条件的期望值为0。
产生解释变量招盛纯一般有三个原因:一、遗漏变量二、测量误差三、联立性第三种情况是无法逐步解决的,前两种可以采用工具变量(IV )法。
IV 会带来的唯一坏处是估计方差的增大,也就是说同时采用OLS 和IV 估计,则前者的方差小于后者。
但IV 的应用是有前提条件的:1.IV 与内生解释函数相关,2.IV 与u 不相关。
在小样本情况下,一般用内生解释变量对IV 进行回归,如果R -sq 值很小的话,一般t值也很小,所以对IV 质量的评价没有大的风险问题,但是当采用大样本时,情况则相反,往往是t 值很大,而R -sq 很小,这时如果采用t 值进行关键问题评价则可能出现出现问题。
这时IV 与内生解释变量之间的若干程度不是阐释太大,但是如果与u 之间有轻微的相关机构的话,则:1、导致很小的不一致性;2、有偏性,并且这种有偏性随着R -sq趋于0而趋于OLS 的有偏性。
所以现在在采用IV 时最好采用R -sq 或F -sta 作为评价标准,另外为了观测IV 与u 的关系,可以将IV 作为解释变量放入方程进行回归,如果没有其他的系数没有多的变化,则说明IV 满足第二个条件。
第8讲工具变量讲解
第8讲单方程工具变量回归(完)OLS能够成立的假设之一是解释变量与扰动项不相关。
否则,OLS估计量将是不一致的,即无论样本容量多大,OLS估计量都不会收敛到真实的总体参数。
然而,解释变量与扰动项相关的例子却很多1,解决方法之一就是本讲介绍的工具变量法。
从历史上看,工具变量估计和联立方程系统是同时教授的,更老的教科书仅在联立方程中描述工具变量估计。
然而在最近的几十年,内生性的处理和工具变量估计已经呈现出更广阔的前景,而对于联立方程完整系统设定的兴趣已经减弱。
最新的教材,如Cameron & Trivedi (2005),Davidson & MacKinnon (1993, 2004)和Wooldridge (2010, 2013),把工具变量估计看作现代经济学家的工具包中不可或缺的一部分,用更长的篇幅介绍它,而缩短对联立方程的讨论。
在回归方程中,一个有效(valid)的工具变量应满足以下两个条件:(1)相关性:工具变量与内生解释变量相关;(2)外生性:工具变量与扰动项不相关。
但是,工具变量的这两个条件常常矛盾,即与内生解释变量相关的变量往往与扰动项也相关。
故在实践上,寻找合适的工具变量通常比较困难,需要一定的创造性与想象力。
寻找工具变量的步骤大致可以分为两步:(1)列出与内生解释变量相关的尽可能多的变量的清单(较容易)(2)从这一清单中剔除与扰动项相关的变量(较困难)传统的工具变量法一般通过“两阶段最小二乘法"(2SLS)来实现,顾名思义,即作两个回归。
可以证明,在扰动项的经典假定下,由2SLS得到的工具变量线性组合是所有线性组合中最渐近有效的2。
这个结论类似于小样本理论中的高斯—马尔可夫定理。
第一阶段回归:用内生解释变量对工具变量回归,得到内生解释变量的拟合值。
1 在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。
2在条件同方差的情况下,最优GMM还原为2SLS,而最优GMM是渐近有效的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第8讲单方程工具变量回归(完)OLS能够成立的假设之一是解释变量与扰动项不相关。
否则,OLS估计量将是不一致的,即无论样本容量多大,OLS估计量都不会收敛到真实的总体参1,解决方法之一就是本讲介绍数。
然而,解释变量与扰动项相关的例子却很多的工具变量法。
从历史上看,工具变量估计和联立方程系统是同时教授的,更老的教科书仅在联立方程中描述工具变量估计。
然而在最近的几十年,内生性的处理和工具变量估计已经呈现出更广阔的前景,而对于联立方程完整系统设定的兴趣已经减弱。
最新的教材,如Cameron & Trivedi (2005),Davidson & MacKinnon (1993, 2004)和Wooldridge (2010, 2013),把工具变量估计看作现代经济学家的工具包中不可或缺的一部分,用更长的篇幅介绍它,而缩短对联立方程的讨论。
在回归方程中,一个有效(valid)的工具变量应满足以下两个条件:(1)相关性:工具变量与内生解释变量相关;(2)外生性:工具变量与扰动项不相关。
但是,工具变量的这两个条件常常矛盾,即与内生解释变量相关的变量往往与扰动项也相关。
故在实践上,寻找合适的工具变量通常比较困难,需要一定的创造性与想象力。
寻找工具变量的步骤大致可以分为两步:(1)列出与内生解释变量相关的尽可能多的变量的清单(较容易)(2)从这一清单中剔除与扰动项相关的变量(较困难)传统的工具变量法一般通过“两阶段最小二乘法”(2SLS)来实现,顾名思义,即作两个回归。
可以证明,在扰动项的经典假定下,由2SLS得到的工具变2。
这个结论类似于小样本理论中的量线性组合是所有线性组合中最渐近有效的高斯—马尔可夫定理。
第一阶段回归:用内生解释变量对工具变量回归,得到内生解释变量的拟合值。
1在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。
2在条件同方差的情况下,最优GMM还原为2SLS,而最优GMM是渐近有效的。
1第二阶段回归:用被解释变量对第一阶段回归的拟合值进行回归,得到被解释变量的拟合值。
ivregress —Single-equation instrumental-variables regression命令语法:ivregress estimator depvar [varlist] (varlist= varlist) [if] [in] [weight] [, iv21options](2SLS)(LIML)(GMM)命令描述:ivregress拟合被解释变量depvar对varlist和varlist的线性回归,使用varlist iv12作为varlist的工具变量,varlist和varlist是外生(解释)变量,varlist是内生221iv (解释)变量。
ivregress可以利用两阶段最小二乘法(2SLS),有限信息最大似然法(LIML)和广义矩估计(GMM)执行工具变量估计。
备注和示例ivregress执行工具变量回归和加权工具变量回归。
对于工具变量的一般讨论,请参见Baum (2006),Cameron和Trivedi (2005;2010,第6章),Davidson和MacKinnon (1993,2004),Greene (2012,第8章),以及Wooldridge (2010,2013)。
参见Hall (2005)对于GMM估计的明晰介绍。
Angrist和Pischke (2009,第4章)非正式而全面地介绍了工具变量估计量,包括他们在估计处理效应的使用。
ivregress的语法假设从方程系统拟合一个方程,或拟合一个不用指定剩余方程的函数形式的方程。
为了拟合一个完整的方程系统,使用2SLSequation-by-equation或三阶段最小二乘法,请参阅[R] reg3。
ivregress的一个优点是,可以拟合多方程系统中的一个方程,而不用指定剩余方程的函数形式。
形式上,由ivregress拟合的模型是:2ββ+ u y = z + x (1) ii1ii12ΠΠ+ v z = x+ x (2) i2ii21i1其中y是第i个观测值的因变量,z表示内生回归元(varlist),x表示包1ii2i括的外生回归元(varlist),x表示排除的外生回归元(varlist)。
x 和x统称2i2i1iv1i为工具。
u和v是零均值误差项,u和v元素的相关性假设是非零。
iiii2SLS and LIML estimators最常用的工具变量估计量是2SLS。
例1:2SLS estimator我们有从1980年以来的州人口普查数据,包括自有住房价值的中位数(hsngval)和每月总租金的中位数(rent)。
我们想构建rent为hsngval和生活在城市地区的人口比例(pcturban)的函数:rent=β+βhsngval+βpcturban+ u i 12i ii0其中i表示各个州,u是误差项。
i因为随机冲击影响一个州的租金价格,也可能会影响房屋价值,所以我们把hsngval看作是内生的。
我们相信hsngval和u的相关性不等于零。
另一方面,我们没有理由相信pcturban和u的相关性不为零,所以我们假设pcturban是外生的。
因为把hsngval当作内生回归元,所以必须有一个或多个与hsngval相关但与u不相关的其他变量。
此外,这些排除的外生变量不能直接影响rent,因为如果它们影响rent的话,就应该包含在前面指定的回归方程中。
另外,家庭收入变量(faminc)和地区变量(region),与hsngval相关但与误差项u不相关。
总之,pcturban,faminc和因子变量2.region,3.region和4.region构成了一套工具变量。
为了拟合方程,我们指定了因变量和包括外生变量的自变量。
在括号中,我们指定了内生回归元,一个等号,和排除的外生变量。
其他外生变量必须指定在等号的右边;出现在回归方程中的外生变量自动纳入工具变量。
use hsng,clearivregress 2sls rent pcturban (hsngval = faminc i.region)正如所期望的,具有更高房屋价值的州有更高的租金价格。
生活在城市地区的州人口比例对租金没有显著影响。
3技术说明在联立方程的框架下,写出前面拟合的模型为:hsngval=π+πfaminc +π2.region+π3.region+π4.region+ v ii4ii0231ii rent =β+βhsngval+βpcturban+ u i210iii方程系统是递归的,因为hsngval出现在rent的方程中,但rent并没有出现在hsngval的方程中。
然而,在一般情况下,联立方程系统不是递归的。
由于系统是递归的,我们可以用OLS分别拟合这两个方程,如果我们愿意假设u和v是独立的。
例2:LIML estimator理论和Monte Carlo模拟表明,LIML估计量比2SLS估计量可能会得到更小的偏差,并且置信区间的覆盖率更好。
use hsng,clearivregress liml rent pcturban (hsngval = faminc i.region)这些结果与2SLS结果定性相似,尽管hsngval的系数比2SLS的系数高19%左右。
例3:GMM estimator在扰动项的经典假定下,2SLS是最有效率的。
但如果扰动项存在异方差或自相关,则存在更有效的方法,即“广义矩估计”(Generalized Method of Moments,GMM)。
在某种意义上,GMM之于2SLS,正如GLS之于OLS。
从Hansen (1982)的著名论文以来,GMM已成为了经济学和金融学的常用估计方法,它非常适用于工具变量估计。
对于更一般的GMM估计量,参见[R] gmm。
gmm不限定拟合单个的线性方程,尽管语法更复杂。
use hsng,clearivregress gmm rent pcturban (hsngval = faminc i.region), wmatrix(robust)(wmatrix(robust)是默认选项。
指定wmatrix(robust)项要求一个最优加权矩4阵,当误差项存在异方差时。
)例4:GMM estimator with clustering有关于年轻女性的1968年—1988年NLS(National Longitudinal Survey)工资调查数据,我们想要拟合一个工资模型,工资是年龄、年龄的平方、工作任期、出生年份和教育水平的函数。
我们认为影响女性工资水平的随机冲击,也会影响她的工作任期,所以我们把tenure看作内生的。
额外的工具变量包括,是否加入工会,在过去的一年工作周数,婚姻状况。
因为每名女性都有多个观测值(对应于多年的跟踪调查),所以我们要为每个人进行聚类。
use nlswork,clearivregress gmm ln_wage age c.age#c.age birth_yr grade (tenure = unionwks_work msp), wmatrix(cluster idcode)工作任期和教育年限对工资有显著的正效应。
有关GMM估计更多的内容,参见Baum (2006);Baum,Schaffer和Stillman (2003, 2007);Cameron & Trivedi (2005);Davidson & MacKinnon (1993, 2004);Hayashi (2000);Wooldridge (2010)。
参见Newey & West (1987),Wang & Wu (2012)对于HAC协方差矩阵估计的介绍。
例5:Mincer收入方程遗漏变量的处理Mincer(1958)最早研究了工资与受教育年限的正相关关系,但遗漏了“能力”这个变量,导致遗漏变量偏差。
使用美国面板调查数据(NLS)中的年轻男子组,采用工具变量法处理遗漏变量的问题。
该数据集包括以下变量:lw(工资对数),s(受教育年限),age(年龄),expr(工龄),tenure(在现单位的工作年数),iq(智商),med(母亲的受教育年限),kww(在“knowledge of the World of Work 测试中的成绩),mrt(婚姻虚拟变量,已婚=1),rns(美国南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1),year(有数据的最早年份,1966-1973年中的某一年)。
这是一个两期面板数据。
use grilic,clearcorrelate iq s5(智商(在一定程度上可视为“能力”的代理变量)与受教育年限具有较强的正相关关系(相关系数为0.51))regress lw s expr tenure rns smsa,r(先用OLS回归作为一个参照系,并使用稳健标准差。