使用GMM方法分析动态面板数据.

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对外经济贸易大学金融学院张海洋 S EN ( Z ' ε ( z ' z 1 1 ˆ ˆ E'Z( Z'Z

1 Z'E N

2 j k 然而,该统计量有时候是不一致的,如果在命令中要求报告稳健的Sargan统计量,软件ˆ ;再根会做两阶段GMM估计(先找任意合理的H,令 A=( Z'HZ ,估计出第一步参数β 1 1 ˆ ˆ ,令 A=( Z'ˆ ˆ Z ,估计出第二部参数β ˆ ,计算出残差项的方差-协方差矩阵ˆ )据β 1 2 ,β β 1 1 1 根据第二步的参数结果,默默报告出Hansen统计量。整体上说,Hansen统计量好像更靠谱一点,所以报告的时候,更多关注Hansen统计量。(三)动态面板数据现在回到我们的动态面板数据,对数据和模型有如下假定: 1 2

3

4 动态。模型中包含了因变量的滞后项;有个体的固定效应;可以有一些自变量是内生的;除了固定效应之外的误差项 it 可以异方差,可以序列相关;

5 不同个体之间的误差项 it 和 jt 不会相关。

6

7 可以有前定的(Predetermined)但不是完全外生的变量。“大N,小T” ,即个体数量要足够多,但时间不用太长。如果时间足够长的话,动态面板误差不会太大,用固定效应即可。从上述要求可以看出,GMM方法特别适合宏观的面板数据分析,因为宏观变量中,很难找出绝对外生的变量,变量之间多少会互相影响。而GMM方法可以“有一些自变量是内生的” ,这可能也是GMM

方法在文献中这么常用的原因。此前已经说过,不能用传统的OLS方法或者固定效应模型进行动态面板数据的分析,那样会得到有偏的估计量。先要对数据进行一定的变换,然后根据不同的矩条件设定开展矩估计。其中数据变换有两种方法,矩条件的设定也有两种方法。 6

对外经济贸易大学金融学院张海洋 1、数据的变换方法:一阶差分还是垂直离差为了消除动态面板数据中的固定效应,通常用的有两种方法:一阶差分 (first difference和垂直离差(orthogonal deviations。一阶差分之前已经介绍过了,这种方法是difference GMM 中默认的方法。缺点是如果数据中有缺失值,那么最终的估计会缺失很多样本,原始数据缺一行往往会导致差分后的数据缺两行。一种替代的方案是用垂直离差(xtabond2 命令中用 orthogonal 选项实现),每个变量减去该变量未来所有观测值的平均值,即: wi ,t 1 cit ( wi ,t 1 Tit w s t is 式子中, cit Tit / (Tit 1 为调整权重变量, Tit 是从t 期开始以后观测值的数量。对于非平衡面板,和数据有缺失的面板,这种方法避免了因缺失数据带来的样本损失,因为调整的时候只是把未来的平均值减去,样本数不会因缺失未来个别观测值而受损。然而,对于平衡面板数据,一阶差分和垂直离差估计出来的结果会完全一样。 2、 Different GMM 还是 System GMM 令数据变换之后的回归方程变为 Yi ,t * Yi ,t 1 * X it * it (5)这种变换可以是一阶差分,也可以是垂直离差。Different GMM的逻辑是,如果是垂直离差变换,用 Yi ,t 2 作为 Yi ,t 1 * 的工具变量;如果是一阶差分变换,用Yi ,t 2 作为 Yi ,t 1 * 的工具变量,此时 Yi ,t 1*=Yi ,t 1 。 X it * 对应的工具变量也类似,如果是垂直离差,就用滞后一阶的,如果是差分就用滞后一阶的差分作为工具变量。在实现的时候,为了提高估计的有效性,通常还会加入更高阶的滞后项(滞后差分)作为工具变量。这些变量的加入利用了更多的信息,然而也会带来麻烦,让工具变量的数量随T平方成比例增加。为了控制工具变量的数量,一个选择就是采用collapse选项把这些工具变量变成一列。如果因变量的变化过程接近随机游走,那么Difference GMM的估计量会有较大偏差。 7

对外经济贸易大学金融学院张海洋 System GMM的方法和Different GMM完全不同,它不需要对自变量和因变量进行数据变换。它假定工具变量的差分,即wit =wit wi ,t 1 ,应该外生于固定效应: E ( wit ui =0 。如果 w 是内生的,wi ,t -1 就可以作为工具变量,更高阶的差分也可以做工具变量。如果 w 是前定的但不是完全外生的,wi ,t 可以作为工具变量,更高阶的差分也可以做工具变量。当然,更高阶差分加入后,还是会增加工具变量数量,需要在具体计算时想办法控制。(四)使用 GMM 方法的注意事项可以尝试先做(2)式的OLS,再做(3)式的固定效应。当然这两个估计都是有偏误的,然而这两个估计的系数应该是真实系数的上限和下限,可以给最后的 GMM 估计限定参考范围。“大 N,小T” ,如果 N 太小了,则估计出来的标准差可能不太靠谱。实际上如果用省际面板去做的话,不满足“大N”这个条件,但中文文献中充斥着这样的研究。如果样本的 N 较小,但还可以接受(比如 N=70),然而又想用此方法,那么加上 small 选项。解释变量中,放入时间虚拟变量。比如,数据有 10 年,则放入 9 个虚拟变量。加入后,可以让“误差项 it 和 jt 不会相关”这个条件更容易满足。如果数据中间有间隙,尽量利用垂直离差(对于每个变量,包括自变量和因变量,wit 减去它未来值的平均值,就是加上 orthogonal 选项,见Roodman(2009)),这会减少样本量的损失。因为数据中间缺一行,一阶差分( wit wi ,t 1 )后就会缺两行数据。但对平衡面板数据,两种数据变换方法结果一样。通常,每个自变量都要出现两次(除了系统外的工具变量)。先作为自变量出现在在 xtabond2 命令中逗号的左边,再以某种形式作为工具变量出现在逗号右边。如果变量 w 是完全外生的,那么放到 ivstyle(w(表示直接作为工具变量);如果 w 是前定的,但不是完全外生的,则放到 gmmstyle(w (表示从滞后一期开始都作为工具变量) ; 如果 w 是内生的,则放到 gmmstyle(L.w(表示从滞后两期开始都作为工具变量)。报告工具变量的数量。如果按照上一条的做法,工具变量的数量会很多。这样会导致 overidentification test 不准确,【一个标志就是 Hansen 统计量的 p 值变为 1,Hansen test 的 p 值在(0.1,0.25)之外都要小心,太小表明拒绝工具变量有效的假设,太大表明选的工具变量太多, hansen 检验变弱了】。通常,需要限制工具变量数量,可以用 collapse 选项,也可以用

相关文档
最新文档