工具变量法的Stata命令及实例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
●本实例使用数据集“grilic.dta”。
●先看一下数据集的统计特征:
●考察智商与受教育年限的相关关系:
上表显示,智商(在一定程度上可以视为能力的代理变量)与受教育年限具有强烈的正相关关系(相关系数为0.51)。
●作为一个参考系,先进行OLS回归,并使用稳健标准差:
其中expr, tenure, rns, smsa均为控制变量,而我们主要感兴趣的是变量受教育年限(s)。
回归的结果显示,教育投资的年回报率为10.26%,这个似乎太高了。可能的原因是,由于遗漏变量“能力”与受教育正相关,故“能力”对工资的贡献也被纳入教育的贡献,因此高估了教育的回报率。
●引入智商iq作为能力的代理变量,再进行OLS回归:
虽然教育的投资回报率有所下降,但是依然很高。
●由于用iq作为能力的代理变量有测量误差,故iq是内生变量,
考虑使用变量(med(母亲的受教育年限)、kww(在“knowledge of the World of Work”中的成绩)、mrt(婚姻虚拟变量,已婚=1)
age(年龄))作为iq的工具变量,进行2SLS回归,并使用稳健的标准差:
在此2SLS回归中,教育回报率反而上升到13.73%,而iq对工资的贡献居然为负值。使用工具变量的前提是工具变量的有效性。
为此,进行过度识别检验,考察是否所有的工具变量均外生,即与扰动项不相关:
结果强烈拒绝所有工具变量均外生的原假设。
●考虑仅使用变量(med, kww)作为iq的工具变量,再次进行2SLS
回归,同时显示第一阶段的回归结果:
上表显示,教育的回报率为6.08%,较为合理,再次进行过度识别检验:
接受原假设,认为(med,kww)外生,与扰动项不相关。
●进一步考察有效工具变量的第二个条件,即工具变量与内生变量
的相关性。从第一阶段的回归结果可以看出,工具变量对内生变量具有较好的解释力。更正式的检验如下:
从以上结果可以看出,虽然Shea’s partial R^2不到0.04,但是F统计量为13.40>10。
我们知道,虽然2SLS是一致的,但却是有偏的,故使用2SLS 会带来“显著性水平扭曲”(size distortion),而且这种扭曲随着弱工具变量而增大。上表的最后部分显示,如果在结构方程中对内生解释变量的显著性进行“名义显著性水平”(nominal size)为5%的沃尔德检验,加入可以接受的“真实显著性水平”(true size)不超过15%,则可以拒绝“弱工具变量”的原假设,因为最小特征值统计量为14.91,大于临界值11.59。
总之我们有理由认为不存在弱工具变量。但为了稳健起见,下面使用对弱工具变量更不敏感的有限信息最大似然法(LIML): 结果发现,LIML的系数估计值与2SLS非常接近,这也从侧面印证了“不存在弱工具变量”。
使用工具变量法的前提是存在内生解释变量,为此须进行豪斯曼检验,其原假设是“所有的解释变量均为外生”:
上表显示,可以在5%的显著性水平下拒绝“所有解释变量均外生的原假设”,即认为存在内生解释变量iq。由于传统的豪斯曼检验建立在同方差的前提下,故在上述回归中均没有使用稳健标准差。
●由于传统的豪斯曼检验在异方差的情形下不成立,下面使用异方
差稳健的DWH检验:
据此可认为iq为内生解释变量。
●如果存在异方差,则GMM比2SLS更有效。为此进行如下的最
优GMM估计:
●进行过度识别检验:
●由于p值为0.70,故认为所有的工具变量均为外生。考虑迭代
GMM:
●如果希望将以上各种估计法的系数估计值及其标准差列在同一
张表中,可使用如下命令:
●