使用GMM方法分析动态面板数据

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

GMM 方法与动态面板数据——一个简介

2015年8月

在阅读文献中经常看到有使用GMM 方法分析动态面板数据,但没有深入研究。最近开始自己用此方法时,感觉很困惑,因为使用此方法的文献中,对方法的原理大多语焉不详。对该方法的适用性,为什么用此方法,以及方法优缺点介绍聊聊几句。因此,通过读文献很难对该方法有全面的把握。

由于时常有学生过来问我怎么用GMM 方法处理动态面板数据,不能总是含糊地回答,同时自己也在写这方面的文章,因此找来几本参考书,搜集了大量的文献,详细阅读之后,撰写本文。文中主要内容摘要并整理自Roodman (2009),这是STATA 命令xtabond2命令的作者所写的介绍性文章,应该有权威性,如果该文不准确,那么所有使用此命令做的研究将全部失效。同时参考了Cameron and Trivedi (2009)和(Angrist and Pischke ,2009)等书籍。本文仅为作者对该方法的理解,如有不妥、疑问或建议请联系:hyang_zhang@ 。

(一) 为什么要用GMM 方法

本文所谓动态面板数据(Dynamic Panel data, DPD)分析,指的是分析中采用如下的回归方程:

,,1i t i t it i it Y Y X u αβε-=+++ (1)

1,...,i N =,1,...,t T =

其中,,1i t Y -是因变量的滞后项,i u 是个体i 的固定效应。因变量的滞后项和固定效应同时存在,是动态面板数据分析特殊性的关键。如果固定效应不存在,那么回归方程变为:

,,1i t i t it it Y Y X αβε-=++ (2)

这时,用OLS 或者随机效应模型回归分析即可。如果因变量的滞后项,1i t Y α-不存在,那么回归方程变为:

,i t it i it Y X u βε=++ (3)

对于该模型,用固定效应模型分析即可。如果因变量的滞后项和固定效应都存在,那么对于(1)式这样的回归方程,如果采用差分方法去掉固定效应,会得到如下的结果

,,1i t i t it it Y Y X αβε-∆=∆+∆+∆ (4)

其中,,,-1=-i t i t i t Y Y Y ∆,,-1,-1,-2=-i t i t i t Y Y Y ∆,,,,-1=-i t i t i t X X X ∆,,,,-1=-i t i t i t εεε∆。如果(1)式代表了真实的变量之间关系,那么,1i t Y -∆和it ε∆之间必有相关性,因为:

,-1,-1,-2,2,1,1=-=(1)i t i t i t i t i t i t Y Y Y Y X αβε---∆-++,

,-1,cov(,)i t i t Y ε∆∆显然不会等于0,因为两者都有,1i t ε-这一项。

通常所用的固定效应模型实际上就是对(1)式差分,得到类似于(4)式的差分回归方程,然后做OLS 。对于现在的情况,由于,1i t Y -∆和it ε∆之间的相关性,再用OLS 只会得到有偏误的回归系数。所以传统的统计方法无法实现对此类方程的估计,需要用GMM 方法。

需要注意的是(2)的模型(包含滞后项的OLS )和(3)的模型(不包含滞后项的FE ,固定效应)尽管都有偏误,但好处是一个偏大,一个偏小(具体哪个大,哪个小要看变量之间的关系),所以这两个估计系数应该界定了真实参数的范围(Angrist and Pischke ,2009:246页;Roodman ,2009)。也就是说,你最后用GMM 方法估计出来的参数应该落到这个区间。

(二) 什么是GMM 方法

通常所用的OLS 等方法,基本逻辑是从计量模型对数据拟合的角度分析,得出最好的估计参数。GMM 方法,又称为广义矩方法(Generalized Moment Method ),该方法所用的思路与传统思路完全不同。任何计量模型都有一定的适用性,即数据要满足一定的要求。GMM 方法的思路是,从计量模型对数据的要求出发,得出一系列矩条件,再根据这些矩条件,求解满足条件的系数。对于大多数计量模型,GMM 方法和传统的方法“殊途同归”,得出的回归系数相差不会太远。

1、 线性回归中的GMM 方法

以OLS 为例,对于回归方程:

=+Y X βε

传统OLS 模型中,β的估计量1

OLS ˆ=(')(')-βX X X Y 。注意到,如果使用OLS 模型,数据有要求,就是自变量X 和误差项ε要独立,也就是说:

(')0E =X ε

这个就是所谓的“矩条件”。把=-εY βX 带入,得到('())0E -=X Y X β,即:

(')(')E E =X Y X X β

1[(')](')E E -=βX X X Y

为了得到β的估计量,可以把(')E X X 和(')E X Y 的估计量分别带入,即

1ˆ(')'E N =X X X X ,1ˆ(')'E N

=X Y X Y 得到1

GMM ˆ(')'-=βX X X Y ,这是和传统的OLS 一样的估计量。 2、 工具变量的GMM 方法

工具变量方法也可以用矩估计的思路实现。由于过程略复杂,此处仅给出简要步骤,详细的推导可以参考(Roodman ,2009)。需要回归的方程为:

=+Y X βε

其中,Z 是工具变量,(|)0E =εZ 。()=12k X x ,x ...x ,是k 个自变量向量,()=12j Z z ,z ...z 是j 个工具变量向量。相应的,待估计的系数β是k 维向量。定义

=-E Y X β为误差向量,对于任意估计出来的参数ˆβ

,残差项为ˆˆ=-E Y X β。 根据工具变量的含义,它应该和误差项ε独立:(')0E =Z ε,这就是我们需要的矩条件。计算的时候,理论上应该利用1ˆ(')0N E N

=Z εZ'E 求解,注意到,我们有j 个工具

相关文档
最新文档