伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解(第13~15章)【圣才出品】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解
第13章跨时横截面的混合:简单面板数据方法
13.1复习笔记
一、数据集的种类
1.独立混合横截面数据
它是在不同时点(经常但并不一定是不同年份)从一个大总体里进行随机抽样的结果。
重要特点:它们都是由独立抽取的观测所构成。
主要性质:保持其他条件不变,它排除了不同观测误差项的相关。
一个独立混合横截面和单独一个随机样本的差异在于,在不同时点上对总体进行抽样很可能导致观测点(即观测结果)不是同分布的情形(因为随着时间的变化,总体的分布可能已经发生变化)。
2.面板数据集
它虽然兼有横截面和时间序列维度,但在一些重要方面却不同于独立混合横截面,有时又称纵列数据。面板数据是在不同时间跟踪相同的一些个人、家庭、企业、城市、州或者其他单位,从这些跟踪的对象中收集的数据,在同一个时点上有多个个体的观测值,同时每一个个体又有几个不同时期的观测值。
二、跨时独立横截面的混合
1.使用独立混合横截面的理由
每个时期都抽取一个随机样本,然后把所得到的随机样本合并起来作为一个大的样本就是一个独立混合横截面。
使用独立混合横截面的一个理由是要加大样本容量,把不同时点从同一总体中抽取的多个随机样本混合起来使用,可以获取更精密的估计量和更具功效的检验统计量,仅当因变量和某些自变量保持着不随时间而变化的关系时,混合才是有用的。
使用混合截面只会带来少量的统计复杂性,因为总体在不同时期可能会有不同的分布,为了反映这种情况需要允许截距在不同时期有不同的值,因此通过引入年度虚拟变量就可以解决这个问题。
2.对跨时结构性变化的邹至庄检验
(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别
①检验的一种形式是,把混合估计的残差平方和看作约束SSR;无约束的SSR则是对两个时期分别估计而得的两个SSR之和,然后按照邹至庄检验的步骤计算F统计量。
②检验的另一种方法:先将每一变量对两个年度虚拟变量之一形成交互作用,再检验这个年度虚拟变量和全部交互项是否联合显著。由于回归模型中的截距常随时间而变,邹至庄检验便能识破是否存在这种变化。若时期很多,而且解释变量也不少,则构造一套完整的交互项可能十分繁琐。
(2)对多个时期计算邹至庄检验统计量的办法
①使用所有时期虚拟变量与一个或几个或所有解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。
。然后,
②做一个容许不同时期有不同截距的混合回归来估计约束模型,从而得到SSR
r
对T 个时期中的每个时期都做一个回归,并分别得到残差平方和。无约束残差平方和便是
12SSR SSR SSR SST ur T
=+++ 若有k 个解释变量(不包括截距和时期虚拟变量)和T 个时期,便需要检验(T-1)k 个约束。而无约束模型中有T+Tk 个待估计参数。所以,若n 为总观测次数,则F 检验的df 为(T-1)k 和n-T-Tk。
F 统计量:
()()()SSR SSR /SSR /1r ur ur n T Tk T k ----⎡⎤⎡⎤⎣⎦⎣⎦
但这个检验不能对异方差性保持稳健,为了得到—个异方差—稳健的检验,必须构造交互项并做一个混合回归。
三、利用混合横截面作政策分析
1.自然实验与真实实验
当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。一个自然实验总有一个不受政策变化影响的对照组和一个被认为受政策变化影响的处理组。在自然实验中,对照组和处理组均来自某个具体的政策变化,一个在政策改变以前,一个在政策改变以后。
在真实实验中,处理组和对照组是随机而明确地抽取的。
把对照组称为C,处理组称为T,并令处理组T 中观测的dT 等于1,否则等于0。再令d2为第2个时期的虚拟变量,模型方程为
001122y d dT d dT βδβδ=+++⋅+其他因素
其中,y 是我们关注的结果变量。δ1度量了政策效应。若回归中没有其他因素,1ˆδ就是倍差估计量:
()()
1 2 2 1 1 ˆ=T C T C y y y y δ---,,,,2.平均处理效应及其估计方法
δ1因度量对y 的平均结果的“处理”或政策效应,有时也被称为平均处理效应。δ1两种估计方法:
(1)在每个时期都计算处理组与控制组的平均值之差,然后再将不同时期的上述差值进行差分;(2)分别计算处理组和控制组不同时期的平均值变化,然后将这些变化进行差分,这就意味着是求()()
1 2 1 2 1 ˆT T C C y y y y δ=---,,,,从结果可知估计值1ˆδ不会依赖于差分的方式。
四、两时期面板数据分析
1.固定效应模型
简单的回归方程很可能遇到遗漏变量的问题。利用面板数据的方法,把影响因变量的无法观测因素分为两类:一类是恒常不变的,另一类则随时间而变。令i 表示横截面单位,t 表示时期,可将含有单个可观测解释变量的模型写成
0012 1 2
it t it i it y d x a u t βδβ=++++=,,变量d2t 是一个在t=1时取值为零而在t=2时取值为1的虚拟变量,它不随i 而变化。变量a i 概括了影响着y it 但又不随着时间而变化的所有无法观测的因素,一般都被称为非观测效应,在应用研究中也常常被称为固定效应,a i 在时间上是固定的,因此模型被称为非观
测效应模型或固定效应模型。a i 又称为非观测异质性。
误差u it 常被称为特异误差或时变误差,因为它代表因时而变且影响着y it 的那些无法观测的因素。
2.估计1β的方法
例如,给定两年的面板数据,估计参数1β的方法是:直接把两年的数据混合起来,然后用OLS。这种方法有两个缺点,最重要的一点是,为了使混合的OLS 得到1β的一个一致估计量,就必须假定非观测效应a i 与x it 无关。将模型写成:
0012,1,2
βδβ=+++=it t it it y d x v t 其中,v it =a i +u it 常被称为复合误差。即使假定特异误差u it 与x it 无关,如果a i 与x it 相关,混合OLS 估计就是偏误且不一致的。由此造成的偏误有时又被称为异质性偏误,这是由于遗漏了一个不随时间而变化的变量所导致的。
3.一阶差分方程
在大多应用中,收集面板数据主要是为了考虑非观测效应a i 与解释变量相关。因为a i 是不随着时间而变化的常数,所以可以取两个年份的数据之差。对横截面的第i 个观测值,把两年的方程分别写为:
()()
()
2001221011 1 2 1i i i i i i i i y x a u t y x a u t βδβββ=++++==+++=如果将第一个方程减去第二个方程,便得到
()()
21012121i i i i i i y y x x u u δβ-=+-+-或