潘省初计量经济学第3版ets9.pptx

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章 面板数据模型
第一节 面板数据和面板数据模型
混合数据(pooled data)是将横截面数据和时间 序列数据结合在一起的数据。
我们在第一章中曾介绍,横截面数据模型使用同一 时点不同个体(entity)的观测值,数据可来自不同地 区、公司、人员或其它个体;时间序列数据则是跨越 不同时期的同一地区、同一公司、同一个人或其它同 一个体的数据。
产业1:钢铁; 产业2:橡胶、塑料; 产业3:石制品、陶瓷制品和玻璃制品; 产业4:纺织
模型中用到的变量是:
Yit = i产业第t年出口额,单位:百万美元,不变价
EMPit = i产业第t年就业人数,单位:千人
OTMit = i产业第t年平均每周加班小时数
我们收集了上述4个产业这3个变量1980-2000各 年的数据。事实上,对于这3个变量中的每一个,都 有84个观测值(4个产业乘以21年)。由于在每个时 期(每一年)都是这4个产业,因此这些混合数据是 面板数据,如表9-1所示。
我们将基于面板数据的回归模型称为面板数据模 型(panel data model)。面板数据模型正在得到日 益广泛的应用,文献也很多。限于篇幅,我们在这 里只能做一个入门性的介绍。需要深入研究的读者, 请参阅有关参考文献。
Baltagi, B. H.(2001),Econometric Analysis of Panel data, (Wiley: Chichester)
在表面不相关回归中,各个回归之间实际上确实
有关联。表面不相关回归容许各个回归方程的扰动 项之间存在跨方程相关,如上面四个方程中的诸u在 任何一个时期中不必相互独立,即不同方程的扰动 项之间可以存在同期相关。这样,SUR估计程序就 可以使用扰动项的相关来改善估计值。
具体来说,在SUR模型中,各个方程的扰动项在 时间上是独立的,但在横截面个体间相关,即
Hsiao C. (2003), Analysis of Panel Data, 2nd Edition, (Cambridge University Press) 影印版由北京大学出版社出版,2005
本章中,我们将用一个贯穿始终的例子来说明估计 面板数据模型的各种方法。我们的数据来自以下4个产 业:
因此,采用模型(9.5)是不合适的,我们下面 讨论可用于面板数据模型的其它估计方法。
*第二节 表面不相关回归
泽尔纳(Zellner)提出的表面不相关回归 (Seemingly unrelated regression,SUR)是一种 可供选择的分析面板数据的方法。
表面不相关回归是一组似乎不相关但实际上相关 的回归方程。表面不相关回归方程看上去不相关是 因为它们类似于方程(9.1)- (9.4)。在前面说到可 以分别对它们运行四个回归时,我们事实上有一个 冒失而错误的假设:各产业互不相干,因而我们可 以分别估计每一个回归方程。
我们可以通过分别运行4个回归来分析这些数据, 每个产业一个回归:
Y1t 0 1EMP1t 2OTM1t u1t Y2t 3 4EMP2t 5OTM 2t u2t Y3t 6 7 EMP3t 8OTM3t u3t Y4t 9 10EMP4t 11OTM 4t u4t
(9.1) (9.2) (9.3) (9.4)
如果我们能够将4个产业的数据结合在一起,我们 的样本规模就会增大,从而可以使用所有可获得的信 息估计系数。
因此,我们需要讨论那些允许我们使用混合数据 的全部信息的估计技术,将跨时间跨空间的数据结合 在一起,而不是分别进行时间序列和横截面数据的回 归。
要做到这一点,最简单的方法是,假定截距和斜率 对于所有产业和所有时期都是一样的,进行下面的回 归:
使用表9-1的数据估计(9.1)-(9.4),由于每 个产业有21年的数据,因此每个回归中观测值个数都 是21。
这种分别对4个产业进行回归的缺点在于可能错失 包含在混合数据集中的那种一个产业影响另一个产业 的信息。换句话说,一个产业的数据中可能包含有对 于估计其它某个产业的回归系数有价值的信息,而这 种分别估计每个产业方程的做法无法利用这些信息, 这意味着估计值不够准确。
Yit 0 1EMPit 2OTM it uit
i 1, 2,3, 4
(9.5)
t 1980,1981,......2000
这里每个变量的观测值个数都是84。我们用表9 -1中全部数据估计此方程,结果如下:
Yˆit 14, 040.10 86.74EMPit 3168.47OTMit
横截面时间序列混合数据则包含不同横截面个体不 同时期的数据,或者说,混合数据包含既跨越时间又 跨越空间的数据。
如果混合数据包含的观测值来自同一批地区、公 司、人员或其它横截面个体的不同时期数据,则此 类混合数据称为面板数据(panel data)。
面板数据通常比非面板混合数据更有用,这是因 为面板数据中的地区、公司、人员等横截面个体在 各时期中一直保持不变,这使得我们更易于对随着 时间的推移所发生的变动进行比较。
回到方程(9.1)- (9.4):
Y1t 0 1EMP1t 2OTM1t u1t Y2t 3 4EMP2t 5OTM 2t u2t Y3t 6 7 EMP3t 8OTM3t u3t Y4t 9 10EMP4t 11OTM 4t u4t
(9.1) (9.2) (9.3) (9.4)
ห้องสมุดไป่ตู้
cov(uit
,
u
js
)
0
ij , t ,t
s s
各个回归之间任何的相关都是有价值的信息,它可
能是告诉我们某时期中发生了某些不止影响一个产业 的变化或事件,这一变化并没有被任何一个自变量捕 捉到,而只能反映在扰动项中。SUR程序用此信息来 改善系数估计值。事实上,GLS法被应用来利用这种 扰动项中跨横截面个体的相关。
t : (4.34) (39.87)
(4.33)
R2 0.95
e2 2, 675, 700, 466
这种方法的致命缺陷是,估计出来的系数只有在 我们前面关于截距和斜率对于所有产业和所有时期 都是同样的值的假设成立的情况下才有用,实际情 况当然不是如此,比如说,很难想象每个时期中每 个产业的就业人数与其出口额之间的关系都相同, 增加1000名工人对不同产业出口额的影响应当是不 同的。
相关文档
最新文档