内生性产生的原因及解决方案

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

造成误差项与回归变量相关（内生性）的原因很多，但我们主要考虑如下几个方面：遗漏变量偏差变量有测量误差双向因果关系。

遗漏变量偏差
变量有测量误差

测量数据正确时：假设方程为：
当存在测量误差时：方程为：
Yi 0 1 Xi ui
Yi 0 1 Xi vi
26

Three key variables

Tit =1 if obs i belongs in the state that will eventually be treated Ait =1 in the periods when treatment occurs TitAit -- interaction term, treatment states after the intervention
23
Group 1 (Treat) Group 2 Yc1 (Control) Difference
Y
Treatment effect= (Yt2-Yt1) – (Yc2-Yc1)
Yc1
Yt1 Yc2
Yt2
control treatment t1 t2 time
24
Key Assumption

1.自然实验法

所谓自然实验，就是发生了某些外部突发事件，使得研究对象仿佛被随机分成了实验组或控制组。这是我最喜欢的方法，只是自然实验需要寻找一个事件，并且这个事件只影响解释变量而不影响被解释变量。遇着这种事件是一种缘分，还要能识别出来，这对学者的眼光也是一种挑战。有很多文章声称使用了自然实验，但严格来讲，并没有做到对研究对象进行了随机分组。虽然如此，我对此类文章仍然很是喜欢。
21
Three different presentations

Tabular Graphical Regression equation
22
Difference in Difference
Before Change Yt1 After Change Yt2 Yc2 Difference ΔYt = Yt2-Yt1 ΔYc =Yc2-Yc1 ΔΔY ΔYt – ΔYc

自然实验包括的要素有:一个政策措施(treatment), 一个观察到的结果(outeome),一个对照组 (contorlgoruP)。在评估“政策措施”对“结果” 是否发挥作用时,对照组充当一个参照系。而一个 “准自然实验”和自然实验的区别在于处理组和对照组的选取是否随机。这里的“结果”是以受政策影响的县和没有受政策影响的县之间在增长速度上的差异来衡量。简单连接改革措施和被直管县绩效的做法并不恰当。这样的做法无法排除其他政策或是整体经济的影响,因而是无法衡量改革真实效果的。
25
Basic Econometric Model

Data varies by

state (i) time (t) Outcome is Yit

Only two periods Intervention will occur in a group of observations (e.g. states, firms, etc.)
第五讲内生性
差项彼此之间不相关。
OLS经典假设所有的解释变量Xi与随机误
Cov(ui, Xi ) 0
若解释变量Xi和ui相关，则OLS估计量是非一致的，也就是即使当样本容量很大时，OLS估计量也不会接近回归系数的真值。当解释变量和随机误差项相关时，模型存在着内生性问题。
在计量经济学中，把所有与扰动项相关的解释变量都称为“内生变量”。这与一般经济学理论中的定义有所不同。 1。与误差项相关的变量称为内生变量 (endogenous variable)。 2。与误差项不相关的变量称为外生变量 (exogenous variable)。

遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决，但前提是只有当你有遗漏变量数据时上述方法才可行。双向因果关系偏差是指如果有时因果关系是从 X到Y又从Y到X时，此时仅用多元回归无法消除这一偏差。同样，变量有测量误差也无法用我们前面学过的方法解决。因此我们就必须寻找一种新的方法。

Capture differences across groups that are constant over time Capture differences over time that are common to all groups
所以我们有：
Yi 0 1 Xi vi

0 1 Xi [ 1( Xi Xi ) ui]
vi 1( Xi Xi) ui
可知，误差项中包含所以可以得到：如果
Xi Xi Cov( Xi Xi, Xi) 0
则回归结果有偏，非一致我们假设则有

Yit = β0 + β1Tit + β2Ait + β3TitAit + εit
27
Yit = β0 + β1Tit + β2Ait + β3TitAit + εit
Before Change β0+ β1 After Change Difference β0+ β1+ β2+ β3 ΔYt = β2 + β3 β0 + β 2 ΔYc = β2 ΔΔY = β3
17
2.双重差分法ຫໍສະໝຸດ Baidu

Difference-in-Difference （DID）一般称为双重差分法，或倍差法。倘若出现了一次外部冲击，这次冲击影响了一部分样本，对另一部分样本则无影响，而我们想看一下这次外部冲击到底有何影响，双重差分法就是用来研究这次冲击的净效应的。其基本思想是，将受冲击的样本视作实验组，再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组，而后做差，做差剩下来的便是这次冲击的净效应。双重差分法实际上是固定效应的一个变种，差分的过程实际上是排除固定效应的过程。ZERA在《计量论文写作和发表的黑客教程》有一个非常简明风趣的举例，我转述于此，以飨读者。
19
Problem set up

Cross-sectional and time series data One group is ‘treated’ with intervention Have pre-post data for group receiving intervention Can examine time-series changes but, unsure how much of the change is due to secular changes

使用Davidson-MacKinnon检验

xtivreg 后使用 dmexogxt * Davidson-MacKinnon (1993) 检验 * H0：OLS 和 xtivreg 都是一致的，即内生性问题对OLS的估计结果影响不大 xtivreg tl size ndts tang (npr=tobin L1.npr), fe dmexogxt Davidson-MacKinnon检验得到F统计量的 P值小于0.05，代表有内生性
29

ui is a state effect vt is a complete set of year (time) effects Analysis of covariance model Yit = β0 + β3 TitAit + ui + λt + εit

30

Group effects
Difference in difference models

Maybe the most popular identification strategy in applied work today Attempts to mimic random assignment with treatment and “comparison” sample Application of two-way fixed effects model
可以推导出：
Cov( Xi, ui) r1
2
u
/ (1 r1 1)
检验方法：豪斯曼检验检验豪斯曼检验（ Hausman specification test） H0 ：所有解释变量均为外生变量。 H1：至少有一个解释变量为内生变量。 quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store iv hausman iv ols ，若 Hausman 检验失效（检验统计量为负值），则使用dmexogxt，否则仍Hausman 检验为主。
20
Difference in difference models

Basic two-way fixed effects model

Cross section and time fixed effects

Use time series of untreated group to establish what would have occurred in the absence of the intervention Key concept: can control for the fact that the intervention is more likely in some types of states
Xi Xi wi
ˆ 1
p

2
2
x 2 w
x
1
结论：1。由于
2x 1 2 2 x w
2。回归的性质决定于w的标准差
x p ˆ w 1 2 1 0 2 x w
2 2 p
x p ˆ w 1 2 1 1 2 x w
2 2 p
双向因果关系

之前我们假定因果关系是从回归变量到因变量的(X导致了Y)。但如果因果关系同时也是从因变量到一个或多个回归变量(Y导致了X)的呢？如果是这样的话，因果关系是向前的也是“向后” 的，即存在双向因果关系，如果存在双向因果关系，则OLS回归中同时包含了这两个效应，因此OLS估计量是有偏的、非一致的。
二、内生性的解决方案

事实上，仅仅为了解决内生性问题，并不需要我们对内生性问题的缘起有很深入的理解。对于应用型的实证研究而言，我们只需要掌握解决内生性问题的具体方案即可。内生性问题的解决方案一共四种，理论上来讲，这四种方案应对内生性问题都很有效。但于我个人而言，我对四种方法的评价是有高低的，由高到低分别介绍如下。

Control group identifies the time path of outcomes that would have happened in the absence of the treatment In this example, Y falls by Yc2-Yc1 even without the intervention Note that underlying ‘levels’ of outcomes are not important (return to this in the regression equation)
Group 1 (Treat) Group 2 β0 (Control) Difference
28
More general model

Data varies by

state (i) time (t) Outcome is Yit

Many periods Intervention will occur in a group of states but at a variety of times