工具变量

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Std. Err. .0143998 .1852259
[95% Conf. Interval] .0803451 -.5492673 .1369523 .1788736
. reg educ fatheduc if inlf==1
Source Model Residual Total educ fatheduc _cons SS 3 84 . 84 1 98 3 1 84 5 .3 5 42 8 2 23 0 .1 9 62 6 Coef. .2 6 94 4 16 10 . 23 7 05 df 1 426 427 MS 38 4 .8 41 9 83 4. 3 31 81 7 56 5. 2 22 94 2 06 t 9 .4 3 3 7 .1 0 P>|t| 0. 00 0 0. 00 0 Number of obs F( 1, 426) Prob > F R-squared Adj R-squared Root MSE = = = = = = 42 8 8 8 .8 4 0. 0 00 0 0. 1 72 6 0. 1 70 6 2. 0 81 3
6
例 15.1 已婚妇女的教育回报率的估计 . reg lwage educ if inlf==1
Source Model Residual Total lwage educ _cons SS 26.3264193 197.001022 223.327441 Coef. .1086487 -.1851968 df 1 426 427 MS 26.32641 93 .4624437 13 .5230150 84 t 7 .55 -1 .00 P>|t| 0.000 0.318 Number of obs F( 1, 426) Prob > F R-squared Adj R-squared Root MSE = = = = = = 428 56.93 0.0000 0.1179 0.1158 .68003
[95% Conf. Interval] -. 0 0 9 5 42 - .4 3 1 1 9 47 . 1 2 7 8 89 1. 3 1 3 4 02
10
例 15.2 男性教育回报率的估计
. regress lwage educ Source Model Residual Total lwage educ _cons SS 1 6. 1 37 70 4 2 1 49 . 51 85 7 9 1 65 . 65 62 8 3 Coef. .0 5 98 39 2 5. 9 73 06 3 df 1 9 33 9 34 MS 1 6 .1 3 77 04 2 . 1 60 2 55 71 2 . 1 77 3 62 18 8 t 1 0. 0 3 7 3. 4 0 P>|t| 0 .0 0 0 0 .0 0 0 Number of obs F( 1, 933) Prob > F R-squared Adj R-squared Root MSE = = = = = = 9 35 1 00 . 70 0 .0 0 00 0 .0 9 74 0 .0 9 64 . 40 0 32
2
在教育回报率的例子中,假定真实模型将对数工资对教育和能力回 归:现在能力不可观测,而且没有代理变量 没有代理变量IQ 没有代理变量 事实上使用的回归:将对数工资对教育回归,但由于误差项包含能 力,并且教育水平与能力相关,此时会出现教育的内生性问题 内生性问题。 内生性问题 一个好的IV应当与教育水平高度相关,并且与误差项不相关。 ——问:IQ是好的工具变量吗? ——答:不。它同时与教育和误差项相关。 文献中使用的IV:(1) 父母亲的教育水平;(2) 兄弟姐妹数目,依赖 的假说是:兄弟姐妹越多,平均受教育水平越低 注意:无论我们使用其中的哪一个作为IV,我们都需要肯定它们与 能力不相关。 满足零条件均值条件:OLS x u 内生性:OLS估计将有偏 x y u y 工具变量的解决思路 z x u y=β0+ β1x+u(x)→→dy/dx=β1+du/dx
σ2 ˆ ˆ β1的渐近方差是 Var β1 = 2 2 nσ x ρ x , z
( )
ˆ 估计的渐近方差为 se β1 = SSTx Rx2, z SSTx : xi的离差平方和 Rx2, z : 将x对z回归的 R 2 ˆ σ 2 : 前面提到的对σ 2的一致估计
5
( )
2
ˆ σ2
9
. ivregress 2sls lwage (educ=fatheduc) if inlf==1,first First-stage regressions Number of obs F( 1, 426) Prob > F R-squared Adj R-squared Root MSE educ fatheduc _cons Coef. . 2 6 9 44 1 6 1 0 . 2 37 0 5 Std. Err. . 0 2 8 5 86 3 . 2 7 5 9 36 3 t 9.43 37 . 1 0 P>|t| 0.000 0.000 = = = = = = 4 28 8 8 . 84 0 . 0 0 00 0 . 1 7 26 0 . 1 7 06 2 . 0 8 13
σ x2 : x的总体方差 σ 2 : u的总体方差 ρ x2, z : x和z总体相关系数的平方
IV与OLS估计比较
IV与OLS的标准差的不同之处仅在于将x对z回归得到 的Rx,z2 由于R 的标准差会比较大。 由于 x,z2 < 1,IV的标准差会比较大。 , 的标准差会比较大 当Cov(x,u) ≠ 0 ,OLS不是一致估计,当(15.4), (15.5) 成立时,IV是一致估计。 x和z的相关性越强,IV的标准差越小。
= = = = =
4 28 2 . 85 0 . 0 9 14 0 . 0 9 34 . 6 8 7 78
lwage educ _cons Instrumented: Instruments:
Coef. . 0 5 9 17 3 5 . 4 4 1 10 3 4 educ fatheduc
Std. Err. . 0 3 5 0 59 6 . 4 4 5 0 58 3
3
y
对于y = β0 + β1x + u ,且给定假定(15.4) 及(15.5), β1 可以被识别,即我们可以将β1表示为总体矩的函数, 并且这些矩可以通过样本估计。 =0 由于 Cov(z, y) = β1Cov(z, x) + Cov(z, u),于是 β1 = Cov(z,y) / Cov(z,x) 则β1的工具变量估计为
工具变量与两阶段最小二乘
1
15.1 使用工具变量的动机:简单回归模型中的遗漏变量问题
(1)如果一些重要的变量被遗漏,我们应当怎么办? ——忽略这个问题,假装这个问题并不存在?使用代理变量? (2)当模型解释变量具有内生性时(即,Cov (x, u) ≠0时) 所以,IV可以用来解决:(1)遗漏变量偏差;(2)经典的测量误差问题; (3)变量的内生性(逆向因果性) 工具变量的条件: (1) 应为外生变量 Cov(z, u) = 0; ; (15.4) ) (2)工具变量应与内生变量 x 相关 工具变量应与内生变量 相关Cov(z, x) ≠ 0 (15.5) ) 千万注意: (1)Cov(z, u) = 0无法验证,我们只能依赖常识和经济理论 常识和经济理论,这需要 常识和经济理论 理论修养和积累。 (2)但是我们可以检验是否Cov(z, x) ≠ 0,即只需检验 H0: p1 = 0 x = p0 + p1z + v 这个回归有时被称为第一阶段回归。
[95% Conf. Interval] .2 1 3 2 5 38 9. 6 9 4 6 85 .3 2 5 6 2 95 10 . 7 7 9 42
Instrumental variables (2SLS) regression
Number of obs Wald chi2(1) 1 Prob > chi2 R-squared Root MSE z 1.69 0.99 P>|z| 0.091 0.322
ˆ β1 =
∑ (z − z )( y − y ) ∑ (z − z )(x − x )
i i i i
当z=x时,我们得到β1的OLS估计,这意味着当x是外生时, 可以用它作自己的IV,这时IV估计与OLS估计恒等。
4
当假定(15.4) 和(15.5) 成立时,可以应用大数定律证明 IV估计是β1的一致估计。 同方差假定: E(u2|z) = s2 = Var(u) (15.11) 当假定(15.4), (15.5), (15.11) 成立时,给定渐近方差, 可以估 计β1的标准差
lwage educ _cons Instrumented: Instruments:
Coef. .0 5917 35 .4 4110 34 educ fatheduc
Std. Err. .0 350 596 .4 450 583
[95% Conf. Interval] -.0 095 42 -.43 119 47 .12 7889 1 .31 3402
Std. Err. .0 2 85 8 63 .2 7 59 3 63
[95% Conf. Interval] . 21 32 5 38 9 .6 94 6 85 .3 25 6 29 5 10 .7 7 94 2
7
. ivreg lwage (educ=fatheduc) if inlf==1
Instrumental variables (2SLS) regression Source Model Residual Total lwage educ _cons Instrumented: Instruments: SS 2 0 .8 6 7 3 6 0 6 2 02 . 4 6 0 0 8 2 2 3. 3 2 7 4 4 1 Coef. . 05 9 1 7 3 5 . 44 1 1 0 3 4 educ fatheduc df 1 426 427 MS 2 0 . 8 6 73 6 0 6 . 4 7 5 2 58 4 0 4 . 5 2 3 0 15 0 8 4 t 1.68 0.99 P>|t| 0.093 0.323 Number of obs F( 1, 426) Prob > F R-squared Adj R-squared Root MSE = = = = = = 42 8 2 .8 4 0 . 0 92 9 0 . 0 93 4 0 . 0 91 3 . 6 8 93 9
Std. Err. .0 05 9 63 1 .0 81 3 73 7
[95% Conf. Interval] . 0 48 1 36 6 5 . 81 3 36 6 . 07 15 4 18 6 .1 32 7 59
11
. ivregress 2sls lwage (educ=sibs),first First-stage regressions Number of obs F( 1, 9 3 3) Prob > F R-squared Adj R-squared Root MSE educ sibs _cons Coef. - . 22 7 9 16 4 1 4. 1 3 87 9 Std. Err. . 0 30 2 7 68 . 1 13 1 3 82 t - 7 . 53 12 4 . 97 P>|t| 0 . 0 00 0 . 0 00 = = = = = = 93 5 5 6 .6 7 0 . 0 00 0 0 . 0 57 3 0 . 0 56 2 2 . 1 34 0
Std. Err. . 0 3 5 14 1 8 . 4 4 6 10 1 8
[95% Conf. Interval] - . 0 0 98 9 9 4 - . 4 3 57 3 1 2 . 1 2 8 2 46 3 1 . 3 1 7 93 8
8ቤተ መጻሕፍቲ ባይዱ
. ivregress 2sls lwage (educ=fatheduc) if inlf==1 Instrumental variables (2SLS) regression Number of obs Wald chi2(1) 1 Prob > chi2 R-squared Root MSE z 1. 69 0. 99 P>|z| 0. 091 0. 322 = = = = = 428 2.85 0. 0914 0. 0934 .6 8778
相关文档
最新文档