IV和GMM相关估计步骤,内生性、异方差性等检验方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

IV和GMM相关估计步骤,内⽣性、异⽅差性…

⼯具变量和⼴义矩估计相关步骤

⼀、解释变量内⽣性检验

⾸先检验解释变量内⽣性(解释变量内⽣性的Hausman 检验:使⽤⼯具变量法的前提是存在内⽣解释变量。Hausman 检验的原假设为:所有解释变量均为外⽣变量,如果拒绝,则认为存在内⽣解释变量,要⽤IV;反之,如果接受,则认为不存在内⽣解释变量,应该使⽤OLS。

reg ldi lofdi

est imat es st ore ols

xt ivreg ldi (lofdi=l.lofdi ldep lexr)

est imat es st ore iv

hausman iv ols

(在⾯板数据中使⽤⼯具变量,St at a提供了如下命令来执⾏2SLS:xt ivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。详⻅help xt ivreg)

如果存在内⽣解释变量,则应该选⽤⼯具变量,⼯具变量个数不少于⽅程中内⽣解释变量的个数。“恰好识别”时⽤2SLS。2SLS的实质是把内⽣解释变量分成两部分,即由⼯具变量所造成的外⽣的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外⽣部分进⾏回归,从⽽满⾜OLS前定变量的要求⽽得到⼀致估计量。

⼆、异⽅差与⾃相关检验

在球型扰动项的假定下,2SLS是最有效的。但如果扰动项存在异⽅差或⾃相关,⾯板异⽅差检验:

xt gls enc invs exp imp esc mrl,igls panel(het)

est imat es st ore het ero

xt gls enc invs exp imp esc mrl,igls

est imat es st ore homo

local df = e(N_g) - 1

lrt est het ero homo, df(`df')

⾯板⾃相关:xt serial enc invs exp imp esc mrl

则存在⼀种更有效的⽅法,即GMM。从某种意义上,GMM之于2SLS正如GLS之于OLS。好识别的情况下,GMM还原为普通的⼯具变量法;过度识别时传统的矩估计法⾏不通,只有这时才有必要使⽤GMM,过度识别检验(Overident ificat ion T est或J T est):est at overid

三、⼯具变量效果验证

⼯具变量:⼯具变量要求与内⽣解释变量相关,但⼜不能与被解释变量的扰动项相关。由于这两个要求常常是⽭盾的,故在实践上寻找合适的⼯具变量常常很困难,需要相当的想象⼒与创作性。常⽤滞后变量。

需要做的检验:检验⼯具变量的有效性。

(1) 检验⼯具变量与解释变量的相关性

如果⼯具变量z与内⽣解释变量完全不相关,则⽆法使⽤⼯具变量法;如果与仅仅微弱地相关,。这种⼯具变量被称为“弱⼯具变量”(weak inst rument s)后果就象样本容量过⼩。检验弱⼯具变量的⼀个经验规则是,如果在第⼀阶段回归中,F统计量⼤于10,则可不必担⼼弱⼯具变量问题。St at a命令:est at first(显示第⼀个阶段回归中的统计量)

(2) 检验⼯具变量的外⽣性(接受原假设好)

在恰好识别的情况下,⽆法检验⼯具变量是否与扰动项相关。在过度识别(⼯具变量个数>内⽣变量个数)的情况下,则可进⾏过度识别检验(Overident ificat ion T est),检验原假设所有⼯具变量都是外⽣的。如果拒绝该原假设,则认为⾄少某个变量不是外⽣的,即与扰动项相关。0H

Sargan统计量,St at a命令:est at overid

四、GMM过程

在St at a输⼊以下命令,就可以进⾏对⾯板数据的GMM估计。

. ssc inst all ivreg2 (安装程序ivreg2 )

. ssc inst all rankt est (安装另外⼀个在运⾏ivreg2 时需要⽤到的辅助程序rankt est)

. use "t raffic.dt a"(打开⾯板数据)

. xt set panelvar t imevar (设置⾯板变量及时间变量)

. ivreg2 y x1 (x2=z1 z2),gmm2s (进⾏⾯板GMM估计,其中2s指的是2-st ep GMM)

⼯具变量和GMM在Panel dat a中的运⽤

第⼀节 关于⾯板数据PANEL DAT A

1、⾯板数据回归为什么好

⼀般⽽⾔,⾯板数据模型的误差项由两部分组成,⼀部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,⾯板数据模型也常常被成为⾮观测效应模型;另外⼀部分概括了因截⾯因时间⽽变化的不可观测因素,通常被成为特异性误差或特异扰动项(事实上这第⼆部分误差还可分成两部分,⼀部分是不因截⾯变化但随时间变化的⾮观测因素对应的误差项Vt,这⼀部分⼀般⼤家的处理办法是通过在模型中引⼊时间虚拟变量来加以剥离和控制,另⼀部分才是因截⾯因时间⽽变化的不可观测因素。不过⼀般计量经济学的⾯板数据分析中都主要讨论两部分,在更⾼级⼀点的统计学或计量经济学中会讨论误差分量模型,它⼀般讨论三部分误差)。

⾮观测效应模型⼀般根据对时不变⾮观测效应的不同假设可分为固定效应模型和随机效应模型。传统上,⼤家都习惯这样分类:如果把⾮观测效应看做是各个截⾯或个体特有的可估计参数,并且不随时间⽽变化,则模型为固定效应模型;如果把⾮观测效应看作随机变量,并且符合⼀个特定的分布,则模型为随机效应模型。

不过,上述定义不是⼗分严谨,⽽且⼀个⾮常容易让⼈产⽣误解的地⽅是似乎固定效应模型中的⾮观测效应是随时间不变的,是固定的,⽽随机效应模型中的⾮观测效应则不是固定的,⽽是随时间变化的。

⼀个逻辑上⽐较⼀致和严谨,并且越来越为⼤家所接受的假设是(参⻅Wooldridge的教材和Mundlak1978年的论⽂),不论固定效应还是随机效应都是随机的,都是概括了那些没有观测到的,不随时间⽽变化的,但影响被解释变量的因素(尤其当截⾯个体⽐较⼤的时候,这种

相关文档
最新文档