stata上机实验第五讲 工具变量(IV)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Stata上机实验
二阶段最小二乘法:2SLS
主要思想:进行两阶段回归。 假设方程为: y=b1x1+b2x2+u
其中x1是外生变量,x2是内生变量,找到两 个变量z1和z2,作为x2的工具变量。 第一阶段回归:reg x2 x1 z1 z2 x2结合了z1 和z2的信息,此时取出x2的拟合值x2_hat。 第二阶段回归: reg y x1 x2_hat
u建se立g方ril程ic.:dtal ,w c8 le0 a r 1 s 8 0 2 e x p r 8 0 3 t e n u r e 8 0
reg lw80 s80 expr80 tenure80
对方程进行分析: 1。遗漏变量问题:认为方程遗漏了“能力”这个
变量,加入iq(智商)作为“能力”的代理变量。 2。测量误差问题:iq(智商)对“能力”的测量存
广义矩估计法:GMM
基本思想: 求解如下一般化目标函数,使之最小化 J(b_GMM) = n*g(b_GMM)'*W*g(b_GMM) 其中,W 为权重矩阵
在球型扰动项的假定下,2SLS 是最有效的。但如 果扰动项存在异方差或自相关,则广义矩估计方法 效果更好。
GMM方法又分为两步GMM法和迭代GMM方法。
在误差。 3。变量内生性问题:s80可能与扰动项中除“能力”
以外的其他因素相关,因此是内生变量。
解决方法:使用med,kww,mrt,age作为内生解 释变量iq与s80的工具变量。
1。使用2SLS。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first 2。使用两步GMM 。
quiቤተ መጻሕፍቲ ባይዱtly reg lw80 s80 expr80 tenure80 iq
est store ols
quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age)
est store iv
hausman iv ols
一些面板数据教材
ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) 3。使用迭代GMM 。
ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age),igmm
几点注意事项:
1。2SLS只能通过stata完成,利用定义手动计算的 结果是错误的,因为残差序列是错误的。
检验方法: estat firststage 1。初步判断可以用偏R2(partial R2) (剔除掉模型中原有外生变量的影响)。 2。 Minimum eigenvalue statistic(最小特征 值统计量),经验上此数应该大于10。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first
面板数据分析 (美)萧政 著 横截面与面板数据的经济计量分析 伍德里奇
著,王忠玉 译 Baltagi. Econometric Analysis of Panel Data
最新动态可关注期刊: Journal of Econometrics
面板数据一些前沿问题
面板向量自回归模型(Panel VAR) 面板单位根检验(Panel Unit Root test) 面板协整分析(Panel Cointegeration) 门槛面板数据模型(Panel Threshold) 面板联立方程组 面板空间计量
究竟该用OLS 还是IV
即解释变量是否真的存在内生性? 假设能够找到方程外的工具变量。 1。如果所有解释变量都是外生变量,则OLS
比IV 更有效。在这种情况下使用IV,虽然估 计量仍然是一致的,会增大估计量的方差。2。 如果存在内生解释变量,则OLS 是不一致的, 而IV 是一致的。
豪斯曼检验(Hausman specification test)原假设: H0 :所有解释变量均为外生变量。 H1:至少有一个解释变量为内生变量。
使用grilic.dta估计教育投资的回报率。
变量说明:lw80(80年工资对数),s80 (80年时受教育年限),expr80(80年时工 龄),tenure80(80年时在现单位工作年 限), iq(智商),med(母亲的教育年 限),kww(在‘knowledge of the World of Work’测试中的成绩),mrt(婚姻虚拟变量, 已婚=1),age(年龄)。
2。不可能单独为每个内生变量指定一组特定的工 具变量, 所有外生变变量都作为自己的工具变量。
3。在大样本下,IV 估计是一致的,但在小样本下, IV 估计并非无偏估计量,有些情况下偏误可能很严 重。
弱工具变量检验
工具变量Z与 X 的相关性较低时,2SLS 估计 量存在偏误,Z 称为“弱工具变量”。
estat firststage
过度识别检验
检验工具变量是否与干扰项相关,即工具变量是否 为外生变量。目前仅限于在过度识别的情况下,进 行过度识别检验。
2SLS根据Sargan统计量进行过度识别检验 ,GMM 使用Hansen J Test进行过度识别检验。 命令均为: estat overid 检验工具变量的外生性 H0:所有工具变量都是外生的。 H1:至少有一个工具变量不是外生的,与扰动项相 关。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat overid ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) estat overid
静态面板数据
静态面板数据模型,是指解释变量中不包含 被解释变量的滞后项(通常为一阶滞后项) 的 情形。但严格地讲,随机干扰项服从某种序 列相关的模型,如AR(1), AR(2), MA(1) 等, 也不是静态模型。静态面板数据主要有两种 模型------固定效应模型和随机效应模型。
二阶段最小二乘法:2SLS
主要思想:进行两阶段回归。 假设方程为: y=b1x1+b2x2+u
其中x1是外生变量,x2是内生变量,找到两 个变量z1和z2,作为x2的工具变量。 第一阶段回归:reg x2 x1 z1 z2 x2结合了z1 和z2的信息,此时取出x2的拟合值x2_hat。 第二阶段回归: reg y x1 x2_hat
u建se立g方ril程ic.:dtal ,w c8 le0 a r 1 s 8 0 2 e x p r 8 0 3 t e n u r e 8 0
reg lw80 s80 expr80 tenure80
对方程进行分析: 1。遗漏变量问题:认为方程遗漏了“能力”这个
变量,加入iq(智商)作为“能力”的代理变量。 2。测量误差问题:iq(智商)对“能力”的测量存
广义矩估计法:GMM
基本思想: 求解如下一般化目标函数,使之最小化 J(b_GMM) = n*g(b_GMM)'*W*g(b_GMM) 其中,W 为权重矩阵
在球型扰动项的假定下,2SLS 是最有效的。但如 果扰动项存在异方差或自相关,则广义矩估计方法 效果更好。
GMM方法又分为两步GMM法和迭代GMM方法。
在误差。 3。变量内生性问题:s80可能与扰动项中除“能力”
以外的其他因素相关,因此是内生变量。
解决方法:使用med,kww,mrt,age作为内生解 释变量iq与s80的工具变量。
1。使用2SLS。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first 2。使用两步GMM 。
quiቤተ መጻሕፍቲ ባይዱtly reg lw80 s80 expr80 tenure80 iq
est store ols
quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age)
est store iv
hausman iv ols
一些面板数据教材
ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) 3。使用迭代GMM 。
ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age),igmm
几点注意事项:
1。2SLS只能通过stata完成,利用定义手动计算的 结果是错误的,因为残差序列是错误的。
检验方法: estat firststage 1。初步判断可以用偏R2(partial R2) (剔除掉模型中原有外生变量的影响)。 2。 Minimum eigenvalue statistic(最小特征 值统计量),经验上此数应该大于10。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first
面板数据分析 (美)萧政 著 横截面与面板数据的经济计量分析 伍德里奇
著,王忠玉 译 Baltagi. Econometric Analysis of Panel Data
最新动态可关注期刊: Journal of Econometrics
面板数据一些前沿问题
面板向量自回归模型(Panel VAR) 面板单位根检验(Panel Unit Root test) 面板协整分析(Panel Cointegeration) 门槛面板数据模型(Panel Threshold) 面板联立方程组 面板空间计量
究竟该用OLS 还是IV
即解释变量是否真的存在内生性? 假设能够找到方程外的工具变量。 1。如果所有解释变量都是外生变量,则OLS
比IV 更有效。在这种情况下使用IV,虽然估 计量仍然是一致的,会增大估计量的方差。2。 如果存在内生解释变量,则OLS 是不一致的, 而IV 是一致的。
豪斯曼检验(Hausman specification test)原假设: H0 :所有解释变量均为外生变量。 H1:至少有一个解释变量为内生变量。
使用grilic.dta估计教育投资的回报率。
变量说明:lw80(80年工资对数),s80 (80年时受教育年限),expr80(80年时工 龄),tenure80(80年时在现单位工作年 限), iq(智商),med(母亲的教育年 限),kww(在‘knowledge of the World of Work’测试中的成绩),mrt(婚姻虚拟变量, 已婚=1),age(年龄)。
2。不可能单独为每个内生变量指定一组特定的工 具变量, 所有外生变变量都作为自己的工具变量。
3。在大样本下,IV 估计是一致的,但在小样本下, IV 估计并非无偏估计量,有些情况下偏误可能很严 重。
弱工具变量检验
工具变量Z与 X 的相关性较低时,2SLS 估计 量存在偏误,Z 称为“弱工具变量”。
estat firststage
过度识别检验
检验工具变量是否与干扰项相关,即工具变量是否 为外生变量。目前仅限于在过度识别的情况下,进 行过度识别检验。
2SLS根据Sargan统计量进行过度识别检验 ,GMM 使用Hansen J Test进行过度识别检验。 命令均为: estat overid 检验工具变量的外生性 H0:所有工具变量都是外生的。 H1:至少有一个工具变量不是外生的,与扰动项相 关。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat overid ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) estat overid
静态面板数据
静态面板数据模型,是指解释变量中不包含 被解释变量的滞后项(通常为一阶滞后项) 的 情形。但严格地讲,随机干扰项服从某种序 列相关的模型,如AR(1), AR(2), MA(1) 等, 也不是静态模型。静态面板数据主要有两种 模型------固定效应模型和随机效应模型。