伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第14章 高级的面板数据方法【圣才出品】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第14章高级的面板数据方法
14.1复习笔记
一、固定效应估计法
1.固定效应变换
固定效应变换又称组内变换,考虑仅有一个解释变量的模型:对每个i,有
1 1
2 it it i it y x a u t T
β=++=,,,…,对每个i 求方程在时间上的平均,便得到
1i i i i
y x a u β=++其中,11T it t y T y
-==∑(关于时间的均值)。因为a i 在不同时间固定不变,故它会在原模型和均值模型中都出现,如果对于每个t,两式相减,便得到()1 1 2 it i it i it i y y x x u u t T
β-=-+-=,,,…,或
1 1
2 it it it y x u t T
β=+= ,,,…,其中,it it i y y y =- 是y 的除时间均值数据;对it x
和it u 的解释也类似。方程的要点在于,非观测效应a i 已随之消失,从而可以使用混合OLS 去估计式1 1 2 it it it y x u t T β=+= ,,,…,。
上式的混合OLS 估计量被称为固定效应估计量或组内估计量。组间估计量可以从1i i i i y x a u β=++的OLS 估计量而得到,即同时使用y 和x 的时间平均值做一个横截面回归。如果a i 与i x 相关,估计量是有偏误的。而如果认为a i 与x it 无关,则使用随机效应估计量要更好。组间估计量忽视了变量如何随着时间而变化。
2.原始的非观测效应模型
1122 1 2 it it it k itk i it y x x x a u t T
βββ=++⋅⋅⋅+++=,,,…,只需对每个解释变量(包括诸如时期虚拟变量)都除去其时间均值,然后利用全部除时间均值后的变量做混合OLS 回归即可。
在解释变量的严格外生性假定下,固定效用估计量是无偏的:粗略地说,特异误差u it 应与所有时期的每个解释变量都无关。固定效应估计量如一阶差分估计量一样,容许a i 与任何时期的解释变量任意相关,因为在时间上恒定的解释变量都必定随固定效应变换而消失。
3.固定效应估计量自由度的决定
用混合OLS 估计除时间均值的方程时,总共有NT 个观测值和k 个自变量(截距被固定效应变换消去了),而对于每一个横截面,在时间上取均值都会损失一个自由度,故N 个个体要损失N 个自由度,正确的自由度是
()1df NT N k N T k
=--=--4.衡量拟合优度
根据组内变换计算的R 2,应把它解释为y it 的时间变异被解释变量的时间变异所解释的部分。
5.虚拟变量回归
对每个i 估计一个截距,连同解释变量一起给每一个横截面观测(单位)安排一个虚拟
变量(也许还给每个时期安排有虚拟变量)。这一方法常被称为虚拟变量回归。
虚拟变量法的特点:
①即使N 还不是很大时,使用此法都会导致产生许多解释变量,以致在大多数情况下,解释变量多到无法进行回归的程度。因此,虚拟变量法对含有许多横截面观测(单位)的面板数据集来说不是很现实。
②它所给出的j β估计值与用除均值数据所做回归得到的估计值恰好一样,而且标准误和其他主要统计量也一样。因此,固定效应估计量可以由虚拟变量回归得到。
③可以直接算出恰当的自由度。
④从虚拟变量回归算出的R 2通常都比较高。这是因为对每一横截面都包含一个虚拟变量,以至于能解释数据中的大部分变异。
⑤从虚拟变量回归得到的R 2,可按通常方法用于计算F 检验。
ˆi a 的计算:11ˆˆˆ....12i ik i k
i a y x x i N ββ=---= ,,,,6.是固定效应(FE)还是一阶差分(FD)
估计非观测效应模型的两种方法:一种是取数据的差分,一种是除时间均值。
两种方法的选择:
(1)当T=2时,FE 和FD 的估计值及其全部检验统计量完全一样,故可随便选用一种。这种等价是建立在估计相同的模型,因此为了使FE 估计与包含截距的FD 估计完全相同,必须在FE 估计中包含表示第二个时期的虚拟变量。在T=2时,取一阶差分有一个好处:几乎无论用什么计量经济学软件包,一阶差分法都直截了当地实施,而且在FD 估计之后,还很容易计算异方差—稳健的统计量。
(2)当T≥3时,FE和FD估计量便不相同。在混合OLS假定成立的条件下,二者都是无偏与一致的,对于较大的N和较小的T,FE和FD之间的选择关键在其估计量的相对效率,而这将由特异误差u it中的序列相关性决定。
①当u it无序列相关时,固定效应法比一阶差分更有效,并且得自固定效应的标准误是确当的。因为固定效应模型的特异误差是序列无关的。
②如果u it遵循一个随机游走(就是说有一个很强的正的序列相关),那么差分
u 便序
it
列无关,这时一阶差分法便更好。但在许多情形中,u it表现出某种正的序列相关,却未必达到一个随机游走的程度,这时要比较FE和FD估计量的效率就不那么容易。
一个重要的理论事实是,FD估计量中的偏误不取决于T,而FE估计量中的偏误则以速度1/T趋于零。当FE和FD给出明显不同的结果时,通常在两者之间作出取舍就很困难。应同时报告两组结果并试图判断差异的原因所在。
7.非平衡面板数据的固定效应法
在一些面板数据集中,样本缺少了某些横截面单位的某些年份数据,称数据集为非平衡面板数据。设T i为横截面单位i的时期数,只需用T i个观测去做除时间均值的运算。观测总数将是T1+T2+…+T N。
与平衡面板数据的情形一样,对每一个观测横截面,都因除时间均值运算而失去一个自由度。任何一个做固定效应的回归软件包都会做出适当的自由度损失调整。虚拟变量回归也和平衡面板数据情形完全一样,但要适当地调整自由度。
二、随机效应模型
1.随机效应模型