第6章 内生性和工具变量估计方法-第6章..
内生性问题
IV与OLS的取舍
(2)所以,当内生性程度不严重或者好的工 具变量找不到时,还不如用OLS。反之, 当内生性程度严重时,就一定要想办法解 决,否则,OLS估计就是不可接受的,当 然,差的IV同样是不可接受的。
好的工具变量的识别
(1): Z与U不相关,即Cov(Z,U)=0; 由于U无法观察,因而难以用正式的工具 进行测量,通常由经济理论来使人们相信 (2): Z与X相关,即Cov(Z,X) ≠ 0. 将X对Z回归即可,看看X的系数是否显著 易于零?
代理变量与工具变量的区别
(1)代理变量要求与扰动项相关,而工具变 量要求与扰动项不相关; (2)在估计时,代理变量使用OLS 法估计, 且被代理变量的信息没有进入到模型中, 而工具变量则使用的是2SLS法估计,工具 变量和内生变量的信息同时被用到了。
到底如何对待内生性问题
(1)需要重点考虑的问题之一; (2)最好在收集数据之前就加以考虑,尤其 是准备获取一手数据的情况下。如何考虑? 应用经济理论。
什么是内生性
• 内生性:就是模型中的一个或多个解释变 量与随机扰动项相关。或者写成: COV(ui,Xi) ≠ 0 。
导致内生性的主要原因
1:遗漏变量,且遗漏变量与引入模型的其他 变量相关。 2:解释变量和被解释变量相互作用,相互影 响,互为因果。
有内生性仍有OLS估计的后果
• 系数估计有偏且不一致。 • 举例说明: • 数学证明:略
IV与OLS估计量的简单比较
IV 估计量:C2=Cov(Z,Y)/ Cov(Z, X) 而OLS估计量是:C2=Cov(X,Y)/ Cov(X, X) (1)因此,当Z=X时,两者将完全一致,换句 话说,当X外生时,它可用作自身的IV, IV 估计量便等同于OLS估计量。 (2)若Z与X不相关, Cov(Z,X) = 0,则IV法无 法给出估计量
傻瓜计量经济学 课程大纲
第一章傻瓜计量经济学概述1.1 计量经济学的定义和作用1.2 傻瓜计量经济学的历史背景和发展1.3 傻瓜计量经济学的研究方法和数据类型1.4 傻瓜计量经济学在实践中的应用第二章傻瓜计量经济学的基本理论2.1 傻瓜计量经济学中的数学基础2.1.1 代数运算和函数关系2.1.2 微积分和优化理论2.2 傻瓜计量经济学的假设和模型2.2.1 傻瓜计量经济学的理论假设2.2.2 傻瓜计量经济学的经济模型2.3 傻瓜计量经济学中的准则和方法2.3.1 傻瓜计量经济学的参数估计方法2.3.2 傻瓜计量经济学的假设检验方法第三章傻瓜计量经济学的回归分析3.1 傻瓜计量经济学中的一元回归分析3.1.1 傻瓜计量经济学中的一元线性回归模型3.1.2 傻瓜计量经济学中的一元非线性回归模型3.2 傻瓜计量经济学中的多元回归分析3.2.1 傻瓜计量经济学中的多元线性回归模型3.2.2 傻瓜计量经济学中的多元非线性回归模型3.3 傻瓜计量经济学中的回归分析拓展3.3.1 傻瓜计量经济学中的时间序列回归模型3.3.2 傻瓜计量经济学中的面板数据回归模型第四章傻瓜计量经济学的因果推断4.1 傻瓜计量经济学中的内生性问题4.1.1 傻瓜计量经济学中的内生变量和工具变量4.1.2 傻瓜计量经济学中的内生性检验方法4.2 傻瓜计量经济学中的因果效应分析4.2.1 傻瓜计量经济学中的因果效应定义和测量4.2.2 傻瓜计量经济学中的因果推断方法第五章傻瓜计量经济学的面板数据分析5.1 傻瓜计量经济学中的面板数据模型5.1.1 傻瓜计量经济学中的固定效应模型5.1.2 傻瓜计量经济学中的随机效应模型5.2 傻瓜计量经济学中的面板数据分析方法5.2.1 傻瓜计量经济学中的面板数据描述和检验5.2.2 傻瓜计量经济学中的面板数据估计和推断第六章傻瓜计量经济学的时间序列分析6.1 傻瓜计量经济学中的时间序列模型6.1.1 傻瓜计量经济学中的平稳时间序列模型6.1.2 傻瓜计量经济学中的非平稳时间序列模型6.2 傻瓜计量经济学中的时间序列分析方法6.2.1 傻瓜计量经济学中的时间序列描述和检验6.2.2 傻瓜计量经济学中的时间序列估计和预测第七章傻瓜计量经济学的高级分析方法7.1 傻瓜计量经济学中的因子分析方法7.2 傻瓜计量经济学中的聚类分析方法7.3 傻瓜计量经济学中的时空分析方法7.4 傻瓜计量经济学中的非参数方法7.5 傻瓜计量经济学中的计量计算方法第八章傻瓜计量经济学的实证研究实例8.1 傻瓜计量经济学的实证研究设计8.2 傻瓜计量经济学的实证研究方法8.3 傻瓜计量经济学的实证研究案例分析8.4 傻瓜计量经济学的实证研究结论和启示结语傻瓜计量经济学课程大纲中涵盖了傻瓜计量经济学的基本理论、回归分析、因果推断、面板数据分析、时间序列分析、高级分析方法以及实证研究实例等内容。
stata中工具变量法
stata中工具变量法工具变量法(Instrumental Variable Method)是应用于计量经济学中的一种估计方法,其主要用途是解决回归分析中的内生性(endogeneity)问题。
内生性指的是自变量与误差项之间存在相关性,这种相关性会导致回归分析结果产生偏误和无效性。
在实践中,我们常常会遇到自变量与误差项之间存在内生性的情况。
一个常见的例子是研究教育对收入的影响,如果使用教育水平作为自变量,可能会出现教育水平与遗传因素等不可观测变量的内生性问题。
为了解决这个问题,可以使用工具变量法。
在Stata中,使用工具变量法进行估计有多种方法。
下面我们将介绍其中两种常见的方法。
第一种方法是使用Stata内置的ivregress命令。
该命令提供了一种简单的工具变量法估计的方式。
下面是一个使用ivregress命令进行工具变量法估计的示例:ivregress 2sls y (x = z)其中,y代表因变量,x代表内生自变量,z代表工具变量。
该命令会同时估计两个方程,第一个方程是自变量对因变量的影响,第二个方程是工具变量对内生自变量的影响。
通过估计这两个方程,可以得到调整后的内生自变量的估计值,从而解决内生性问题。
第二种方法是使用Stata的reg命令结合自定义工具变量进行估计。
这种方法相对于使用ivregress命令更加灵活,适用于一些特殊情况。
下面是一个使用reg命令进行工具变量法估计的示例:reg y (x = z)在这个示例中,y代表因变量,x代表内生自变量,z代表工具变量。
通过在reg命令中指定x和z之间的关系,可以实现工具变量法的估计。
需要注意的是,使用reg命令进行工具变量法估计需要确保工具变量满足一些假设条件,比如工具变量与误差项之间不应存在相关性。
总之,Stata中提供了多种方法进行工具变量法的估计。
根据实际问题的需求和假设条件的满足程度,可以选择合适的方法进行估计。
通过使用工具变量法可以有效解决回归分析中的内生性问题,提高估计结果的准确性和有效性。
内生性与工具变量估计方法
内生性与工具变量估计方法一 一元模型的IV 估计采用MROZ 数据,进行练习。
估计教育对工资收入的回报:01log()wage educ ββμ=++为了便于比较首先得到OLS 估计结果,在命令窗口输入smpl 1 428equation eq01.ls log(wage) c educ教育的系数估计值表明,每多接受一年教育可得到月11%的回报。
接下来,我们用父亲的受教育程度(fatheduc )作为educ 的工具变量。
我们必须认为fatheduc 与u 不相关;第二个要求是educ 与fatheduc 相关。
为了验证第二点,作一个educ 对fatheduc 的回归。
equation eq02.ls educ c fatheduc可以看出,educ 与fatheduc 之间存在统计显著的正相关。
采用fatheduc 作为educ 的工具变量,进行工具变量回归。
equation eq03.tsls log(wage) c educ @ fatheducIV 估计量的标准误是OLS 标准误的2.5倍,这在我们的意料之中。
二 多元模型的IV 估计 采用card 数据,进行练习。
估计教育对工资收入的回报:012log()var wage educ Control iables βββμ=+++为了便于对照,先做OLS 回归 Smpl 1 3010Equation eq01.ls log(wage) c educ exper expersq black smsa south smsa66 reg662 reg663 reg664 reg665 reg666 reg667 reg668 reg669在这个例子中,受教育程度的工具变量是标志着一个人是否在一所四年制大学附近成长的虚拟变量(nearc4)。
为了验证受教育程度与该虚拟变量的偏相关性,先做educ对nearc4以及其他所有外生变量的回归:Equation eq02.ls educ c nearc4 exper expersq black smsa south smsa66 reg662 reg663 reg664 reg665 reg666 reg667 reg668 reg669Nearc4的系数估计值意味着,在其他因素固定的情况下,曾住在大学附近的人所受的教育比不在大学附近长大的人平均多出约1/3年。
第六讲工具变量回归
3. Cragg-Donald Wald F 统计量 4. Kleibergen-Paap Wald rk F 统计量” Stata命令:ivreg2
第六讲工具变量回归
如果存在弱工具变量该怎么办?
1. 如果有很多工具变量,有部分强工具变量和部分 弱工具变量,可以舍弃较弱的工具变量而选用相关性 较强的工具变量子集。在stata中,可以使用ivreg2 命令进行“冗余检验”,以决定选择舍弃哪个工具变 量。(直观上,冗余工具变量是那些第一阶段回归中 不显著的变量。)
造成误差项与回归变量相关(内生性)的原 因很多,但我们主要考虑如下几个方面: 遗漏变量偏差 变量有测量误差 双向因果关系。
第六讲工具变量回归
遗漏变量偏差
第六讲工具变量回归
第六讲工具变量回归
变量有测量误差
测量数据正确时:假设方程为:
Yi01Xiui
当存在测量误差时:方程为:
Yi 01Xivi
所以我们有:
第六讲工具变量回归
识别标准: Sargan 统计量 J统计量 C统计量
过度识别检验的 Stata 命令:
estat overid
第六讲工具变量回归
究竟该用 OLS 还是工具变量法
豪斯曼检验 原假设为: H0 :所有解释变量均为外生变量 reg y x1 Байду номын сангаас2 est store ols ivregress 2sls y x1 (x2=z1 z2) est store iv hausman iv ols, sigmamore
lw工资对数s受教育年限age年龄expr工龄tenure在现单位的工作年数iq智商med母亲的受教育年限kww在knowledgeoftheworldofwork测试中的成绩mrt婚姻虚拟变量已婚1rns美国南方虚拟变量住在南方1smsa大城市虚拟变量住在大城市1year有数据的最早年份19661973年中的某一年
内生性问题原因和处理方法
内生性问题:就是模型中的一个或多个解释变量与随机扰动项相关的问题。
变量的内生性问题总是不可避免的。
内生性引起的问题主要是引起参数估计的不一致。
引起内生性问题的原因:(1)遗漏变量这主要是因为实际的问题中,一个变量往往受到许多变量的影响,在实际建模过程中无法将解释变量全部列出。
在这样的情况下,遗漏的变量的影响就被纳入了误差项中,在该遗漏变量与其他解释变量相关的情况下,就引起了内生性问题。
(2)测量误差关于测量误差引起内生性的问题要基于测量误差的假设。
测量误差可能是对被解释变量y 的测量误差,也可能是由于对解释变量x 的测量误差。
这两种情况引发的结果是不一样的。
( 3) 双向交互影响这种情况引起的内生性问题在现实中最为常见。
其基本的原理可以阐述为,被解释变量y 和解释变量x 之间存在一个交互影响的过程。
x 的数值大小会引起y 取值的变换,但同时y 的变换又会反过来对x 构成影响。
这样,在如下的回归方程中:011k k y x x βββε=+++,如果残差项ε的冲击影响了y 的取值,而这样的影响会通过y 传导到x 上,从而造成了x 和残差项ε的相关。
也就是引起了内生性问题。
内生性问题处理方法:1.工具变量法(IV )就是找到一个变量和内生化变量相关,但是和残差项不相关。
在OLS的框架下同时有多个IV,这些工具变量被称为两阶段最小二乘(2SLS)估计量。
具体的说,这种方法是找到影响内生变量的外生变量,连同其他已有的外生变量一起回归,得到内生变量的估计值,以此作为IV,放到原来的回归方程中进行回归。
2.代理变量法(Proxy)Proxy方法是将不可观测的变量用近似的变量进行替代,也就是说,是在残差项中提取出有用的信息,但是并没有对现有的解释变量进行处理。
3. 自然实验法就是就是发生了某些外部突发事件,使得研究对象仿佛被随机分成了实验组或控制组。
该事件只影响一部分样本,或者只影响解释变量而不影响被解释变量。
Eviews统计第六章
自相关检验及修正的EViews操作
1.绘图检验自相关问题的EViews操作 进行了OLS回归后,选择EViews主窗口的Quick|Graph命令,输入残差序列名 (Resid),选择图形类型,最后单击确定键即得到残差图。绘制残差序列图也可以通 过Equation对象窗口的Resids按钮或View|Acutal,Fitted,Residual命令实现。 2.DW检验操作 通常OLS回归估计输出结果中包含着对模型的D.W.检验结果,无需单独进行操作。通 过查询DW临界值表可以判断模型自相关问题。DW统计量值越接近2,表明自相关程 度越弱。
异方差与加权最小二乘法 3.异方差的常用检验方法
观表现出变量之间的关系。利用时间序列 图、散点图以及残差序列对解释变量的散点图可以直观的 对模型否存在异方差进行初步判断。 (2)怀特检验 怀特检验通过OLS估计求得残差的估计值,然后利用残差 估计值的平方与解释变量及其交叉项辅助回归式,得到拟 合优度 ,从而构建统计量进行检验。 怀特检验的原假设为原回归模型不存在异方差,被择假设 为原回归模型存在异方差。
应用普通最小二乘法时要求模型的随机误差项必须满足:
(1)无偏性假定。即所有随机误差项的期望为0 (2)同方差性假定。即所有随机误差项的方差相等 (3)无序列相关性假定。即随机误差项之间无序列相关性 (4)解释变量与随机误差项相互独立。即解释变量X为非随机变量 (5)正态性假定。即随机误差项服从均值为0的正态分布。
5.异方差形式未知时的模型处理方法-White异方差一致协方差估计 当异方差形式未知时,无法使用加权最小二乘法(Weighted Least Square,WLS)消除异方差,此时需要采用White异方差一致协方差 估计。
应用经济学前沿-教学大纲
《应用经济学前沿》教学大纲Advanced Topics in Applied EconomicsCourse Outline课程编号:150112B课程类型:专业选修课总学时:32讲课学时:30实验(上机)学时:2学分:2适用对象:金融学,经济学先修课程:中级微观经济学,中级宏观经济学,计量经济学Course Code: 150112BCourse Type: Elective CoursePeriods: 32 Lecture: 30 Experiment (Computer): 2Credits: 2Applicable Subjects: Finance, EconomicsPreparatory Courses: Intermediate Microeconomics, Intermediate Macroeconomics, Econometrics一、课程的教学目标本课程属于金融经济学的专业选修课之一,主要结合中英文文献阅读和社会现实问题分析,讲解应用经济学中常用的理论和实证分析方法。
学生通过本课程的学习,能够基本掌握分析社会经济学问题的计量方法,并能撰写规范的实证论文来分析论证社会经济学的现实问题。
要求掌握相关理论和实证分析方法,并能熟练运用一门统计软件进行实际的数据处理和分析。
本课程还有助于学生熟悉实证研究的方法和步骤,开拓学生的研究思路,提高因果逻辑关系的辨析及推断能力,为今后从事相关工作和学习研究打下坚实的基础。
This course is one of the selective courses for financial economics majors. It combines Chinese and English academic journal articles and socioeconomic problems in reality, and focuses on applied economic theory and empirical analysis. After takingthis course, students will be able to use econometric models to analyze general socioeconomic issues, and write a formal research paper. Students are required to master the methods of empirical analysis and use statistical software to do real data analysis. This course will also provide students with an understanding of general methodology in applied research work, improve their logical thinking and lay a foundation for future work.二、教学基本要求本课程主要讲述劳动经济学、卫生经济学、公共经济学等应用经济学领域前沿的研究理论与分析方法。
内生性产生的原因及解决方案
Group 1 (Treat) Group 2 β0 (Control) Difference
28
More general model
Data varies by
state (i) time (t) Outcome is Yit
Many periods Intervention will occur in a group of states but at a variety of times
Difference in difference models
Maybe the most popular identification strategy in applied work today Attempts to mimic random assignment with treatment and “comparison” sample Application of two-way fixed effects model
二、内生性的解决方案
事实上,仅仅为了解决内生性问题,并不需要我 们对内生性问题的缘起有很深入的理解。对于应 用型的实证研究而言,我们只需要掌握解决内生 性问题的具体方案即可。内生性问题的解决方案 一共四种,理论上来讲,这四种方案应对内生性 问题都很有效。但于我个人而言,我对四种方法 的评价是有高低的,由高到低分别介绍如下。
发在统计研究上的我提到的通过换变量的方式来进行稳健性检测主要是通过对主要变量的替换举个最简单的例子如果想测试公司规模对公司盈利是否有显著影响那么我们在文中是以totalassets来衡量公司规模所以在稳健性检验的时候可以用totalsales或者totalnumberofemployee来衡量公司规模看结果是否依然稳定
内生性和工具变量法
内生性和工具变量法从最根本的定义来说,内生外生首先是取决于系统的,在一个系统内部决定的变量,自然就是内生变量,在系统决定的变量,就是外生变量。
比如,给一个系统,比如地球,那么当前情况下地球上一切可以统计的变量都是内生变量,但是阳光就是外生变量。
那么如果以太阳系为研究的系统,那么自然,阳光此时也是内生变量了。
这样说内生性外生性似乎很容易理解,但是涉及到经济问题似乎不是那么好办了,因为经济系统中,所有的变量很难说是完全独立的,比如货币发行量,似乎是央行决定,按理说是外生的吧,但是慢着,央行的货币不是随便发的,也是因为有经济体有需求才会向社会发行货币,这个就是货币外生和货币内生的讨论,研究的文章有很多。
还是先说外生性吧,Leamer定义,如果y对x的条件分布(这个就是给出x 值,对应随机变量y)不随x的生成过程的修正而发生变化,那么x就是外生变量。
外生性似乎还是可以分为两类,前定性(前定变量是指独立于方程中同期和未来误差项的变量),严格外生(严格外生变量是指独立于方程中所有同期、未来,和过去误差项的变量)。
依照这个定义,我什么也看不出来,倒是可以从CLRM假定cov(Ut,Xt)≠0情况考虑。
既然cov(Ut,Xt)≠0可以叫成内生性,那么cov(Ut,Xt)=0大概可以叫外生变量了吧。
chris的书前面把这个假定强化为X是非随机变量,当显然这一假定是靠不住的,X更多情况下是随机变量。
这里涉及到前面曾经困惑的一个概率,随机解释变量,随机解释变量就是说解释变量是随机的,原因根据我的思考总结,大概是这两类,1.观测值存在误差2.根据Y=α+θX+μ,如果Y能影响X,由于Y是随机的,自然X也就带有随机性了。
随机解释变量容易带来内生性的问题,但却也不是必然,比如X是随机解释变量,但是X和u是独立的,也就是说cov(Ut,Xt)=0的时候,是不违背CLRM 假设的。
其实到这里,我们讨论的一切,什么内生性,自相关,异方差,这些为什么要讨论呢,就是因为我们经常用OLS模型进行估计,而CLRM的五个假定就是为了使得OLS的估计具有一致性,无偏性,有效性。
内生性和工具变量法
内生性和工具变量法从最根本的定义来说,内生外生首先是取决于系统的,在一个系统内部决定的变量,自然就是内生变量,在系统决定的变量,就是外生变量。
比如,给一个系统,比如地球,那么当前情况下地球上一切可以统计的变量都是内生变量,但是阳光就是外生变量。
那么如果以太阳系为研究的系统,那么自然,阳光此时也是内生变量了。
这样说内生性外生性似乎很容易理解,但是涉及到经济问题似乎不是那么好办了,因为经济系统中,所有的变量很难说是完全独立的,比如货币发行量,似乎是央行决定,按理说是外生的吧,但是慢着,央行的货币不是随便发的,也是因为有经济体有需求才会向社会发行货币,这个就是货币外生和货币内生的讨论,研究的文章有很多。
还是先说外生性吧,Leamer定义,如果y对x的条件分布(这个就是给出x 值,对应随机变量y)不随x的生成过程的修正而发生变化,那么x就是外生变量。
外生性似乎还是可以分为两类,前定性(前定变量是指独立于方程中同期和未来误差项的变量),严格外生(严格外生变量是指独立于方程中所有同期、未来,和过去误差项的变量)。
依照这个定义,我什么也看不出来,倒是可以从CLRM假定cov(Ut,Xt)≠0情况考虑。
既然cov(Ut,Xt)≠0可以叫成内生性,那么cov(Ut,Xt)=0大概可以叫外生变量了吧。
chris的书前面把这个假定强化为X是非随机变量,当显然这一假定是靠不住的,X更多情况下是随机变量。
这里涉及到前面曾经困惑的一个概率,随机解释变量,随机解释变量就是说解释变量是随机的,原因根据我的思考总结,大概是这两类,1.观测值存在误差2.根据Y=α+θX+μ,如果Y能影响X,由于Y是随机的,自然X也就带有随机性了。
随机解释变量容易带来内生性的问题,但却也不是必然,比如X是随机解释变量,但是X和u是独立的,也就是说cov(Ut,Xt)=0的时候,是不违背CLRM 假设的。
其实到这里,我们讨论的一切,什么内生性,自相关,异方差,这些为什么要讨论呢,就是因为我们经常用OLS模型进行估计,而CLRM的五个假定就是为了使得OLS的估计具有一致性,无偏性,有效性。
内生转换回归模型加工具变量迭代
内生转换回归模型加工具变量迭代下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!内生转换回归模型加工具变量迭代内生性问题在经济学和社会科学研究中是一个常见的挑战。
内生性工具变量与GMM估计PPT文档43页
•
26、我们像鹰一样,生来就是自由的 ,但是 为了生 存,我 们不得 不为自 己编织 一个笼 子,然 后把自 己关在 里面。 ——博 莱索
•
27、法律如果不讲道理,即使延续时 间再长 ,也还 是没有 制约力 的。— —爱·科 克
•Leabharlann 28、好法律是由坏风俗创造出来的。 ——马 克罗维 乌斯
•
29、在一切能够接受法律支配的人类 的状态 中,哪 里没有 法律, 那里就 没有自 由。— —洛克
•
30、风俗可以造就法律,也可以废除 法律。 ——塞·约翰逊
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
内生性与工具变量估计方法
内生性与工具变量估计方法一 一元模型的IV 估计采用MROZ 数据,进行练习。
估计教育对工资收入的回报:01log()wage educ ββμ=++为了便于比较首先得到OLS 估计结果,在命令窗口输入smpl 1 428equation eq01.ls log(wage) c educ教育的系数估计值表明,每多接受一年教育可得到月11%的回报。
接下来,我们用父亲的受教育程度(fatheduc )作为educ 的工具变量。
我们必须认为fatheduc 与u 不相关;第二个要求是educ 与fatheduc 相关。
为了验证第二点,作一个educ 对fatheduc 的回归。
equation eq02.ls educ c fatheduc可以看出,educ 与fatheduc 之间存在统计显著的正相关。
采用fatheduc 作为educ 的工具变量,进行工具变量回归。
equation eq03.tsls log(wage) c educ @ fatheducIV 估计量的标准误是OLS 标准误的2.5倍,这在我们的意料之中。
二 多元模型的IV 估计 采用card 数据,进行练习。
估计教育对工资收入的回报:012log()var wage educ Control iables βββμ=+++为了便于对照,先做OLS 回归 Smpl 1 3010Equation eq01.ls log(wage) c educ exper expersq black smsa south smsa66 reg662 reg663 reg664 reg665 reg666 reg667 reg668 reg669在这个例子中,受教育程度的工具变量是标志着一个人是否在一所四年制大学附近成长的虚拟变量(nearc4)。
为了验证受教育程度与该虚拟变量的偏相关性,先做educ对nearc4以及其他所有外生变量的回归:Equation eq02.ls educ c nearc4 exper expersq black smsa south smsa66 reg662 reg663 reg664 reg665 reg666 reg667 reg668 reg669Nearc4的系数估计值意味着,在其他因素固定的情况下,曾住在大学附近的人所受的教育比不在大学附近长大的人平均多出约1/3年。
第6章内生性和工具变量估计方法 第6章
归系数的OLS估计不是一致估计
6.1 内生性
6.1.1 OLS估计的不一致性
内生性影响图示:
X
Y
u
dY / dX ? ? ? du / dX
?? 是对 ? ? du / dX 的估计。
6.1 内生性
6.1.2内生性产生的原因
模型设定错误、测量误差和联立性
?? ?? ??1 ? ?1 ?
n i?1
(
Xi
?
X)ui
n i ?1
(
Xi
?
X)2
?
n?1 n?1
n i?1
(
Xi
?
X)ui
n i?1
(
Xi
?
X)2
?
Cov(X,u) ? 0 Var( X)
? 多元线性模型下,不仅内生变量前的回归 系数不一致,外生变量前的系数也可能不
一致。
6.1 内生性
6.1.1 OLS估计的不一致性
6.1.1 OLS估计的不一致性
? S 2 Xj
?
n?1Βιβλιοθήκη n i?1(X
ji
?
X j )2 ,
j ? 1,2
? S 2 X j ,u
?
n ?1
n i?
1
(
X
ji
?
X j )ui ,
j ? 1,2
? S ? n 2
?1
X1 , X2
n i ?1
(
X1i
?
X1 )( X2i
?
X2 )
??2 ? ? 2 ?
工具变量估计法
一元线性回归模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.1 内生性
6.1.2 内生性产生的原因
模型设定错误、测量误差和联立性
• 模型设定错误是导致内生性最常见的原因,模型 设定错误往往表现为相关变量的缺失,缺失变量 成为错误设定模型误差项的一部分,当缺失变量 和模型中其他变量相关时,就会导致这些变量的 内生性。(工资与教育、能力)、 • 不相干变量引入不会影响参数估计的无偏性和一 致性,但是会影响参数估计的有效性。
工具变量估计法
一元线性回归模型
Y 0 1 X u
总体矩条件:
Cov(Z,u) E (Zu) E[(Y 0 1 X )Z ] 0 E(u) E(Y 0 1 X ) 0
类比出样本矩条件:
n n
1
(Y
i 1 n
n
i
ˆ ˆ X )Z 0 0 1 i i ˆ ˆ X )0 0 1 i
结论2:工具变量估计的性质 (1)工具变量估计是一致估计 (2)工具变量估计具有渐进正态分布
Z
X
Y
u
工具变量估计法
一元线性回归模型
Y 0 1 X u
结论3:OLS估计和工具变量估计 一元线性回归模型的自变量为外生时,OLS估 计可看做以自变量本身为工具的工具变量估计。 例子6.1 气温与冷饮消费(续)
Y 0 1 X u
假设检验: 统计量
t 1
ˆ 1IV S1IV
给定误差项服从正态分布,则 t1 ~ t (n 2) 若没给定分布,大样本情况下服从标准正态分布。
工具变量估计法
6.2 工具变量估计方法
6.2.1 工具变量估计法 6.2.2 两阶段最小二乘法:TSLS
6.2 工具变量估计方法
6.2.1 工具变量估计法
工具变量估计法
一元线性回归模型
Y 0 1 X u
定义1:如果存在变量 Z ,满足 (1)与 u 不相关 Cov( Z , u ) 0 (2)与 X 相关 Cov(Z , X ) 0 称 Z 为 X 的工具变量,也称工具(instrument)。
6.1 内生性
6.1.1 OLS估计的不一致性
2 1 2 SX n ( X X ) , ji j j i 1 n n
j 1,2
2 1 SX n i1 ( X ji X j )ui , j 1,2 j ,u 2 1 SX n i1 ( X 1i X 1 )( X 2i X 2 ) 1,X 2 n
6.1 内生性
6.1.1 OLS估计的不一致性
模型: Y 0 1 X1 2 X 2 k X k u 若 Cov( X r , u) 0 则 X r 为内生自变量。 • 存在内生自变量时,OLS估计不再有一致性
6.1 内生性
6.1.1 OLS估计的不一致性
以一元回归模型为例: Y 0 1 X u
1 ˆ 1 1 in
n
( X i X )ui
2
i1 ( X i X )
n
1
n 1
n
i 1 n
Cov(X,u) 0 2 Var( X ) (Xi X ) i 1
( X i X )ui
• 多元线性模型下,不仅内生变量前的回归 系数不一致,外生变量前的系数也可能不 一致。
2 ˆ u i1 i n
1 其中, ˆ2 ˆZ ,X
n2
n
n
i 1
( X i X )(Z i Z )
i1 ( X i X )2
2 ( Z Z ) i i 1
n
ˆ ˆ X ˆi Yi u 0 IV 1IV i
工具变量估计法
一元线性回归模型
第6 章
内生性和工具变量估计方法
内生性和工具变量估计方法
6.1 内生性
6.1.1 OLS估计的不一致性 6.1.2 内生性产生的原因
6.2 工具变量估计方法
6.2.1 工具变量估计法 6.2.2 两阶段最小二乘法:TSLS
6.3 内生性检验 重要概念
6.1 内生性
6.1.1 OLS估计的不一致性 6.1.2 内生性产生的原因
2 X Cov ( X 2 , u ) X , X Cov ( X 1 , u ) ˆ 2 2 2 [ X X (1 X , X )]
1 2 1
ˆ 不以概率收敛到 。 只要 X , X 0 , 2 2
1 2
1
2
1
2
6.1 内生性
6.1.1 OLS估计的不一致性
结论1:OLS估计的不一致性 (1)线性回归模型内生自变量回归系数的 OLS估计不是一致估计; (2)如果和内生自变量相关,外生自变量回 归系数的OLS估计不是一致估计
6.1 内生性
6.1.1 OLS估计的不一致性
内生性影响图示:
X
Y
u
dY / dX du / dX
ˆ 是对 du / dX 的估计。
用住房面积 House 作为工具变量
Coldr 0 1AirCd u
工具变量估计法
一元线性回归模型
Y 0 1 X u
方差估计:若 Var (u | Z ) E(u 2 | Z ) 2
S2 1 IV ˆ2 n 2 2 ˆ Z ,X ( X X ) i1 i
6.1 内生性
6.1.1 OLS估计的不一致性
以不带截距项的二元回归模型为例:
Y 1 X1 X 2 u
Cov( X1, u) 0 Cov( X 2 , u) 0
2 2 2 ˆ S S S X1 , X 2 X1 ,u ˆ X1 X 2 ,u 2 2 2 ˆX S X1 S X 2 (1 ) 1,X 2
1
(Y
i 1
i
工具变量估计法
一元线性回归模型
Y 0 1 X u
ˆ Y ˆ 0 IV 1IV ˆ 1IV
n
i 1 n
( Z i Z )(Yi Y )
i 1
( Z i Z )( X i X )
工具变量估计法
一元线性回归模型
Y 0 1 X u