计量经济学第三版潘省初第9章面板数据模型ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
初看上去,这些结果似乎是分别回归的结果, 但它们不是。跨产业扰动项协方差的估计值被SUR 程序用来改善估计值,如前面所说的那样,这是为 什么说表面不相关回归实际上是由相关的回归组成。 在我们的例子中,SUR结果与四个方程的OLS结果 差不多。然而,在很多情况下,表面不相关回归显 著改善用最小二乘法得到得估计值。
大多数计量经济分析软件都有运行SUR的命令,表 面不相关回归步骤如下:
1.用OLS法分别估计每个方程,计算和保存回归中 得到的残差; 2.用这些残差来估计扰动项方差和不同回归方程扰 动项之间的协方差; 3.上一步估计的扰动项方差和协方差被用于执行广 义最小二乘法,得到各方程系数的估计值。
表面不相关回归得到的估计值是一致估计值。 用SUR方法和表9-1中的数据估计方程(9.1)- (9.4),结果如下:
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
Yˆ1t 5367.2427.45EMP1t 477.13OTM1t
t: (3.76) (5.97)
(1.62)
R20.66 et218,664,338
Yˆ2t 51,963.17142.87EMP2t1704.48OTM2t
t: (17.33) (24.43)
(1.77)
R20.99 et243,356,773
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
这里每个变量的观测值个数都是84。我们用表9 -1中全部数据估计此方程,结果如下:
Yˆit 14,040.1086.74EMPit 3168.47OTMit t: (4.34) (39.87) (4.33)
R20.95
e22,675,700,466
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
第一节 面板数据和面板数据模型
混合数据(pooled data)是将横截面数据和时间 序列数据结合在一起的数据。
我们在第一章中曾介绍,横截面数据模型使用同一 时点不同个体(entity)的观测值,数据可来自不同地 区、公司、人员或其它个体;时间序列数据则是跨越 不同时期的同一地区、同一公司、同一个人或其它同 一个体的数据。
在固定影响模型的假定下,面板数据中所有横截面 数据和时间序列数据都可用于同一个回归。固定影响 模型类似于上一节中所有数据简单结合在一起的混合 模型(9.5)式,不同的是,这里横截面中每一个体有 它自己的截距:
Y it0 i 1 E M P it 2 O T M it u it
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
使用表9-1的数据估计(9.1)-(9.4),由于每 个产业有21年的数据,因此每个回归中观测值个数都 是21。
这种分别对4个产业进行回归的缺点在于可能错失 包含在混合数据集中的那种一个产业影响另一个产业 的信息。换句话说,一个产业的数据中可能包含有对 于估计其它某个产业的回归系数有价值的信息,而这 种分别估计每个产业方程的做法无法利用这些信息, 这意味着估计值不够准确。
本章中,我们将用一个贯穿始终的例子来说明估计 面板数据模型的各种方法。我们的数据来自以下4个产 业:
产业1:钢铁; 产业2:橡胶、塑料; 产业3:石制品、陶瓷制品和玻璃制品; 产业4:纺织
模型中用到的变量是:
Yit = i产业第t年出口额,单位:百万美元,不变价
EMPit = i产业第t年就业人数,单位:千人
横截面时间序列混合数据则包含不同横截面个体不 同时期的数据,或者说,混合数据包含既跨越时间又 跨越空间的数据。
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
如果混合数据包含的观测值来自同一批地区、公 司、人员或其它横截面个体的不同时期数据,则此 类混合数据称为面板数据(panel data)。
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
第三节 固定影响模型
固定影响模型(Fixed effects model)将横截面个 体之间的差异解释为截距不同,而斜率系数相同。它 处理地区、公司、人员或其它横截面个体之间差异的 思路是允许截距变动,不同的横截面个体(如我们例 子中的不同产业)的截距是不同的,但每个产业的截 距在各个时期则保持不变。
要做到这一点,最简单的方法是,假定截距和斜率 对于所有产业和所有时期都是一样的,进行下面的回 归:
Yit 01EMPit 2OTMit uit
i1,2,3,4 t1980,1981,......2000
(9.5)
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
我们可以通过分别运行4个回归来分析这些数据, 每个产业一个回归:
Y1t 01EMP1t 2OTM1t u1t Y2t 34EMP2t 5OTM2t u2t Y3t 67EMP3t 8OTM3t u3t Y4t 910EMP4t 11OTM4t u4t
(9.1) (9.2) (9.3) (9.4)
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
能是告诉我们某时期中发生了某些不止影响一个产业 的变化或事件,这一变化并没有被任何一个自变量捕 捉到,而只能反映在扰动项中。SUR程序用此信息来 改善系数估计值。事实上,GLS法被应用来利用这种 扰动项中跨横截面个体的相关。
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
固定影响模型通过使用虚拟变量的方法来解决截距
变动问题。对于我们的例子,有4个产业部门,我们 应当设3个虚拟变量,因为设3个就可以区分4个产业 的截距,并且,如果设4个虚拟变量的话,我们会掉 进所谓“虚拟变量陷阱”,而造成完全的多重共线性。
在固定影响模型中,我们有另一种避开虚拟变量
陷阱的方法,就是在模型中去掉常数项
如果我们能够将4个产业的数据结合在一起,我们 的样本规模就会增大,从而可以使用所有可获得的信 息估计系数。
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
因此,我们需要讨论那些允许我们使用混合数据 的全部信息的估计技术,将跨时间跨空间的数据结合 在一起,而不是分别进行时间序列和横截面数据的回 归。
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
Baltagi, B. H.(2001),Econometric Analysis of Panel data, (Wiley: Chichester)
Hsiao C. (2003), Analysis of Panel Data, 2nd Edition, (Cambridge University Press) 影印版由北京大学出版社出版,2005
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
OTMit = i产业第t年平均每周加班小时数
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
我们收集了上述4个产业这3个变量1980-2000各 年的数据。事实上,对于这3个变量中的每一个,都 有84个观测值(4个产业乘以21年)。由于在每个时 期(每一年)都是这4个产业,因此这些混合数据是 面板数据,如表9-1所示。
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
具体来说,在SUR模型中,各个方程的扰动项在 时间上是独立的,但在横截面个体间相关,即
cov(uit,ujs)
ij,t s
0 ,t s
各个回归之间任何的相关都是有价值的信息,它可
(9.1) (9.2) (9.3) (9.4)
在表面不相关回归中,各个回归之间实际上确实
有关联。表面不相关回归容许各个回归方程的扰动 项之间存在跨方程相关,如上面四个方程中的诸u在 任何一个时期中不必相互独立,即不同方程的扰动 项之间可以存在同期相关。这样,SUR估计程序就 可以使用扰动项的相关来改善估计值。
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
Y1t 01EMP1t 2OTM1t u1t Y2t 34EMP2t 5OTM2t u2t Y3t 67EMP3t 8OTM3t u3t Y4t 910EMP4t 11OTM4t u4t
Yˆ3t 4479.7769.05EMP3t 2976.12OTM3t
t: (0.40) (3.80)
(3.81)
R20.64 et21.85108
Yˆ4t 3596.0052.05EMP4t 3140.84OTM4t
t: (0.74) (11.18)
(5.77)
R20.835 et231,122,367
每个产业设一个虚拟变量:
0
,然后为
面板数据通常比非面板混合数据更有用,这是因 为面板数据中的地区、公司、人员等横截面个体在 各时期中一直保持不变,这使得我们更易于对随着 时间的推移所发生的变动进行比较。
我们将基于面板数据的回归模型称为面板数据模 型(panel data model)。面。限于篇幅,我们在这 里只能做一个入门性的介绍。需要深入研究的读者, 请参阅有关参考文献。
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
*第二节 表面不相关回归
泽尔纳(Zellner)提出的表面不相关回归 (Seemingly unrelated regression,SUR)是一种 可供选择的分析面板数据的方法。
表面不相关回归是一组似乎不相关但实际上相关 的回归方程。表面不相关回归方程看上去不相关是 因为它们类似于方程(9.1)- (9.4)。在前面说到可 以分别对它们运行四个回归时,我们事实上有一个 冒失而错误的假设:各产业互不相干,因而我们可 以分别估计每一个回归方程。
回到方程(9.1)- (9.4):
这种方法的致命缺陷是,估计出来的系数只有在 我们前面关于截距和斜率对于所有产业和所有时期 都是同样的值的假设成立的情况下才有用,实际情 况当然不是如此,比如说,很难想象每个时期中每 个产业的就业人数与其出口额之间的关系都相同, 增加1000名工人对不同产业出口额的影响应当是不 同的。
因此,采用模型(9.5)是不合适的,我们下面 讨论可用于面板数据模型的其它估计方法。
相关文档
最新文档