计量经济学第九章 面板数据模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
各个回归之间任何的相关都是有价值的信息,它可 能是告诉我们某时期中发生了某些不止影响一个产业 的变化或事件,这一变化并没有被任何一个自变量捕 捉到,而只能反映在扰动项中。SUR程序用此信息来 改善系数估计值。
大多数计量经济分析软件都有运行SUR的命令,表面 不相关回归步骤如下:
1.用OLS法分别估计每个方程,计算和保存回归中 得到的残差; 2.用这些残差来估计扰动项方差和不同回归方程扰 动项之间的协方差; 3.上一步估计的扰动项方差和协方差被用于执行广 义最小二乘法,得到各方程系数的估计值。
我们将基于面板数据的回归模型称为面板数据模 型(panel data model)。面板数据模型正在得到日 益广泛的应用,文献也很多。限于篇幅,我们在这 里只能做一个入门性的介绍。需要深入研究的读者, 请参阅有关参考文献。
我们收集了上述4个产业这3个变量1980-2000各 年的数据。事实上,对于这3个变量中的每一个,都 有84个观测值(4个产业乘以21年)。由于在每个时 期(每一年)都是这4个产业,因此这些混合数据是 面板数据,如表9-1所示。
表面不相关回归得到的估计值是一致估计值。在 下面两种情况下,表面不相关回归与分别运行OLS回 归结果相同:
(1)若各方程的扰动项之间的协方差都等于0;(2) 若各方程的自变量都相同,并且每个自变量的每个观 测值亦相同。例如,在方程(9.1)- (9.4)中都加上 一个自变量-货币供给,该变量在任何一年的观测值 都相同,与所研究是哪个产业无关。如果所有的自变 量都是如此,表面不相关回归与普通最小二乘回归结 果相同。
这种分别对4个产业进行回归的缺点在于可能错失 包含在混合数据集中的那种一个产业影响另一个产业 的信息。换句话说,一个产业的数据中可能包含有对 于估计其它某个产业的回归系数有价值的信息,而这 种分别估计每个产业方程的做法无法利用这些信息, 这意味着估计值不够准确。
如果我们能够将4个产业的数据结合在一起,我们 的样本规模就会增大,从而可以使用所有可获得的信 息估计系数。
我们可以通过分别运行4个回归来分析这些数据, 每个产业一个回归:
Y1t 01EMP1t 2OTM1t u1t Y2t 34EMP2t 5OTM2t u2t Y3t 67EMP3t 8OTM3t u3t Y4t 910EMP4t 11OTM4t u4t
(9.1) (9.2) (9.3) (9.4)
使用表9-1的数据估计(9.1)-(9.4),由于每 个产业有21年的数据,因此每个回归中观测值个数都 是21。
计量经济学第九章 面板数据模型
第一节 面板数据和面板数据模型
混合数据(pooled data)是将横截面数据和时间序 列数据结合在一起的数据。
我们在第一章中曾介绍,横截面数据模型使用同一 时点不同个体(entity)的观测值,数据可来自不同地 区、公司、人员或其它个体;时间序列数据则是跨越 不同时期的同一地区、同一公司、同一个人或其它同 一个体的数据。
(9.5)
这里每个变量的观测值个数都是84。我们用表9 -1中全部数据估计此方程,结果如下:
Yˆit 14,040.1086.74EMPit 3168.47OTMit t: (4.34) (39.87) (4.33)
R20.95 e22,6Baidu Nhomakorabea5,700,466
这种方法的致命缺陷是,估计出来的系数只有在 我们前面关于截距和斜率对于所有产业和所有时期 都是同样的值的假设成立的情况下才有用,实际情 况当然不是如此,比如说,很难想象每个时期中每 个产业的就业人数与其出口额之间的关系都相同, 增加1000名工人对不同产业出口额的影响应当是不 同的。
Y1t 01EMP1t 2OTM1t u1t Y2t 34EMP2t 5OTM2t u2t Y3t 67EMP3t 8OTM3t u3t Y4t 910EMP4t 11OTM4t u4t
(9.1) (9.2) (9.3) (9.4)
在表面不相关回归中,各个回归之间实际上确实 有关联。表面不相关回归容许各个回归方程的扰动 项之间存在跨方程相关,如上面四个方程中的诸u在 任何一个时期中不必相互独立,即不同方程的扰动 项之间可以存在同期相关。这样,SUR估计程序就 可以使用扰动项的相关来改善估计值。
横截面时间序列混合数据则包含不同横截面个体不 同时期的数据,或者说,混合数据包含既跨越时间又 跨越空间的数据。
如果混合数据包含的观测值来自同一批地区、公 司、人员或其它横截面个体的不同时期数据,则此 类混合数据称为面板数据(panel data)。
面板数据通常比非面板混合数据更有用,这是因 为面板数据中的地区、公司、人员等横截面个体在 各时期中一直保持不变,这使得我们更易于对随着 时间的推移所发生的变动进行比较。
用SUR方法和表9-1中的数据估计方程(9.1)- (9.4),结果如下:
Yˆ1t 5367.2427.45EMP1t 477.13OTM1t
t: (3.76) (5.97)
(1.62)
R20.66 et218,664,338
因此,我们需要讨论那些允许我们使用混合数据 的全部信息的估计技术,将跨时间跨空间的数据结合 在一起,而不是分别进行时间序列和横截面数据的回 归。
要做到这一点,最简单的方法是,假定截距和斜率 对于所有产业和所有时期都是一样的,进行下面的回 归:
Yit 01EMPit 2OTMit uit
i1,2,3,4 t1980,1981,......2000
因此,采用模型(9.5)是不合适的,我们下面 讨论可用于面板数据模型的其它估计方法。
第二节 表面不相关回归
表面不相关回归(Seemingly unrelated regression,SUR)
是一组似乎不相关但实际上相关的回归方程。表面 不相关回归方程看上去不相关是因为它们类似于方 程(9.1)- (9.4)。在前面说到可以分别对它们运行 四个回归时,我们事实上有一个冒失而错误的假设: 各产业互不相干,因而我们可以分别估计每一个回 归方程。回到方程(9.1)- (9.4):
大多数计量经济分析软件都有运行SUR的命令,表面 不相关回归步骤如下:
1.用OLS法分别估计每个方程,计算和保存回归中 得到的残差; 2.用这些残差来估计扰动项方差和不同回归方程扰 动项之间的协方差; 3.上一步估计的扰动项方差和协方差被用于执行广 义最小二乘法,得到各方程系数的估计值。
我们将基于面板数据的回归模型称为面板数据模 型(panel data model)。面板数据模型正在得到日 益广泛的应用,文献也很多。限于篇幅,我们在这 里只能做一个入门性的介绍。需要深入研究的读者, 请参阅有关参考文献。
我们收集了上述4个产业这3个变量1980-2000各 年的数据。事实上,对于这3个变量中的每一个,都 有84个观测值(4个产业乘以21年)。由于在每个时 期(每一年)都是这4个产业,因此这些混合数据是 面板数据,如表9-1所示。
表面不相关回归得到的估计值是一致估计值。在 下面两种情况下,表面不相关回归与分别运行OLS回 归结果相同:
(1)若各方程的扰动项之间的协方差都等于0;(2) 若各方程的自变量都相同,并且每个自变量的每个观 测值亦相同。例如,在方程(9.1)- (9.4)中都加上 一个自变量-货币供给,该变量在任何一年的观测值 都相同,与所研究是哪个产业无关。如果所有的自变 量都是如此,表面不相关回归与普通最小二乘回归结 果相同。
这种分别对4个产业进行回归的缺点在于可能错失 包含在混合数据集中的那种一个产业影响另一个产业 的信息。换句话说,一个产业的数据中可能包含有对 于估计其它某个产业的回归系数有价值的信息,而这 种分别估计每个产业方程的做法无法利用这些信息, 这意味着估计值不够准确。
如果我们能够将4个产业的数据结合在一起,我们 的样本规模就会增大,从而可以使用所有可获得的信 息估计系数。
我们可以通过分别运行4个回归来分析这些数据, 每个产业一个回归:
Y1t 01EMP1t 2OTM1t u1t Y2t 34EMP2t 5OTM2t u2t Y3t 67EMP3t 8OTM3t u3t Y4t 910EMP4t 11OTM4t u4t
(9.1) (9.2) (9.3) (9.4)
使用表9-1的数据估计(9.1)-(9.4),由于每 个产业有21年的数据,因此每个回归中观测值个数都 是21。
计量经济学第九章 面板数据模型
第一节 面板数据和面板数据模型
混合数据(pooled data)是将横截面数据和时间序 列数据结合在一起的数据。
我们在第一章中曾介绍,横截面数据模型使用同一 时点不同个体(entity)的观测值,数据可来自不同地 区、公司、人员或其它个体;时间序列数据则是跨越 不同时期的同一地区、同一公司、同一个人或其它同 一个体的数据。
(9.5)
这里每个变量的观测值个数都是84。我们用表9 -1中全部数据估计此方程,结果如下:
Yˆit 14,040.1086.74EMPit 3168.47OTMit t: (4.34) (39.87) (4.33)
R20.95 e22,6Baidu Nhomakorabea5,700,466
这种方法的致命缺陷是,估计出来的系数只有在 我们前面关于截距和斜率对于所有产业和所有时期 都是同样的值的假设成立的情况下才有用,实际情 况当然不是如此,比如说,很难想象每个时期中每 个产业的就业人数与其出口额之间的关系都相同, 增加1000名工人对不同产业出口额的影响应当是不 同的。
Y1t 01EMP1t 2OTM1t u1t Y2t 34EMP2t 5OTM2t u2t Y3t 67EMP3t 8OTM3t u3t Y4t 910EMP4t 11OTM4t u4t
(9.1) (9.2) (9.3) (9.4)
在表面不相关回归中,各个回归之间实际上确实 有关联。表面不相关回归容许各个回归方程的扰动 项之间存在跨方程相关,如上面四个方程中的诸u在 任何一个时期中不必相互独立,即不同方程的扰动 项之间可以存在同期相关。这样,SUR估计程序就 可以使用扰动项的相关来改善估计值。
横截面时间序列混合数据则包含不同横截面个体不 同时期的数据,或者说,混合数据包含既跨越时间又 跨越空间的数据。
如果混合数据包含的观测值来自同一批地区、公 司、人员或其它横截面个体的不同时期数据,则此 类混合数据称为面板数据(panel data)。
面板数据通常比非面板混合数据更有用,这是因 为面板数据中的地区、公司、人员等横截面个体在 各时期中一直保持不变,这使得我们更易于对随着 时间的推移所发生的变动进行比较。
用SUR方法和表9-1中的数据估计方程(9.1)- (9.4),结果如下:
Yˆ1t 5367.2427.45EMP1t 477.13OTM1t
t: (3.76) (5.97)
(1.62)
R20.66 et218,664,338
因此,我们需要讨论那些允许我们使用混合数据 的全部信息的估计技术,将跨时间跨空间的数据结合 在一起,而不是分别进行时间序列和横截面数据的回 归。
要做到这一点,最简单的方法是,假定截距和斜率 对于所有产业和所有时期都是一样的,进行下面的回 归:
Yit 01EMPit 2OTMit uit
i1,2,3,4 t1980,1981,......2000
因此,采用模型(9.5)是不合适的,我们下面 讨论可用于面板数据模型的其它估计方法。
第二节 表面不相关回归
表面不相关回归(Seemingly unrelated regression,SUR)
是一组似乎不相关但实际上相关的回归方程。表面 不相关回归方程看上去不相关是因为它们类似于方 程(9.1)- (9.4)。在前面说到可以分别对它们运行 四个回归时,我们事实上有一个冒失而错误的假设: 各产业互不相干,因而我们可以分别估计每一个回 归方程。回到方程(9.1)- (9.4):