第七章 面板数据模型的分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中 D 是一个有虚拟变量组成的矩阵。 因此固定效应模型也 被 称 为 最 小 二 乘 虚 拟 变 量 模 型 ( least squares dummy variable(LSDV) model) ,或简单称为虚拟变量模型。
二、固定效应模型的估计和检验 固定效应模型中有 N 个虚拟变量系数和 K 个解释 变量系数需要估计,因此总共有 N+K 个参数需要估计。 当 N 不是很大时,可直接采用普通最小二乘法进行估 计。但是当 N 很大时,直接使用 OLS 方法的计算量就 变得非常大,甚至有可能超过计算机的存储容量。 一个解决问题的办法就是分成两步来对面板数据 模型进行回归分析。由这种方法导出的估计量常被称为
其中对应的i 是横截面 i 和时间 t 时随机误差项。再记
y1 X1 1 y2 X2 2 y ; X ; ; y X N N N
表个体的随机效应。由于模型的误差项为二种随机误差之和,所以也称该 模型为误差构成模型(error component model) 。还假定:
(1) i 和x it 不相关; (2) E ( it ) E ( i ) 0 ; (3) E ( it j ) 0, i , j , t ; (5) E ( i j ) 0, i j
二、一般面板数据模型介绍 符号介绍:yit ——因变量在横截面 i 和时间 t 上的数值;
j it ——第 j 个解释变量在横截面 i 和时间 t 上的数值;
x
假设:有 K 个解释变量,即 j
1,2,, K ; 有 N 个横截面,即 i 1,2,, N ; 时间指标 t 1,2,, T 。
研究和分析面板数据的模型被称为面板数据模型 (panel data model) 它的变量取值都带有时间序列和横 。 截面的两重性。一般的线性模型只单独处理横截面数据 或时间序列数据,而不能同时分析和对比它们。面板数 据模型,相对于一般的线性回归模型,其长处在于它既 考虑到了横截面数据存在的共性,又能分析模型中横截 面因素的个体特殊效应。当然,我们也可以将横截面数 据简单地堆积起来用回归模型来处理,但这样做就丧失 了分析个体特殊效应的机会。
ˆ B ( X PD X ) 1 X PD y
它其实是下列模型的 OLS 估计量:
yi xi i
因而可以被看作利用不同的个体均值信息所作出的估计。中间 估计量一般而言是一致估计量,但不是有效的。因为它只是利 用了个体均值的信息。内部估计量在这个意义上与中间估计量 是相对的,因为内部估计量利用的正是被中间估计量所“抛弃” 的部分信息。 固定效应模型的优点:能够确定地反映个体之间的差距及 个截距系数)和存在对个体差异的限制性假设(即个体间差异 为固定的) 。
例 1 表 1 中展示的数据就是一个面板数据的例子。 表 1 华东地区各省市 GDP 历史数据 1995 1996 1997 1998 上海 江苏 浙江 安徽 福建 江西 2462.57 5155.25 3524.79 2003.66 2191.27 1244.04 2902.20 6004.21 4146.06 2339.25 2583.83 1517.26 3360.21 6680.34 4638.24 2669.95 3000.36 1715.18 3688.20 7199.95 4987.50 2805.45 3286.56 1851.98
2 2 ( RU R R ) /( N 1) F ( N 1, NT N K ) 2 (1 RU ) /( NT N K ) 2 R 2 , R R 为有约束回归模型的R 2 , 其中 R 代表无约束回归模型 而
2 U
约束条件即为原假设。
相对于内部估计量,另外还有一种估计量称为中间估计量 (between estimator) 。定义为:
2 2 E ( it ), i , t ; (6) 2 E ( i2 ), i
(4) E ( it js ) 0, i j或 t s ;
(7)
。
给定这些假设,随机效应面板数据模型也可同样写为: y=Xβ +μ 其中 ( I n i ) ,α 的向量形式与以前相同。 是 Kronecker 乘法符号。 例 2 Kronecker 乘法:
面板数据模型的分析
第一节 面板数据模型简介 第二节 固定效应模型及其估计方法 第三节 随机效应模型及其估计方法 第四节 模型设定的检验 第五节 面板数据模型应用实例 第六节 面板数据模型扩展Ⅰ:HausmanTalor模型
第一节 面板数据模型简介
一、面板数据和模型概述
在经济学研究和实际应用中,我们经常需要同 时分析和比较横截面观察值和时间序列观察值结合 起来的数据,即:数据集中的变量同时含有横截面 和时间序列的信息。这种数据被称为面板数据 (panel data),它与我们以前分析过的纯粹的横截面 数据和时间序列数据有着不同的特点。简单地讲, 面板数据因同时含有时间序列数据和截面数据,所 以其统计性质既带有时间序列的性质,又包含一定 的横截面特点。因而,以往采用的计量模型和估计 方法就需要有所调整。
2
N T K
1 2 K
但是由于面板数据中含有横截面数据, 有时需要考虑个体可能存在 的特殊效应及对模型估计方法的影响。 例如在不同个体误差项存在不同 分布的情况下,OLS 估计量虽然是一致的,但不再是有效估计量,因此 往往需要采用 GLS。 it 一般为了分析每个个体的特殊效应,对随机误差项 的设定是
第二步,估计参数α 。由于已经得到了β 的估计值,所以α 的估 计就变得比较简单。
ˆ ˆ ( D D ) 1 D (Y X w )
ˆ ˆ 其实就是用自变量和解释变量的个体均值和 w 按下列模型计
算出的误差项:
ˆ ˆ i yi X i w
ˆ w 和 ˆ 的方差估计: 估计量 ˆ2 ˆ s 2 ( X PD X ) 1
N T 1
这样,y 是一个 的向量;X 是一个 的矩阵;而μ 是一 N T 1 个 的向量。针对这样的数据, 有以下以矩阵形式表达的面板数据 模型: y X (1) 方程(1)代表一个最基本的面板数据模型。基于对系数β 和随机误 差项μ 的不同假设,从这个基本模型可以衍生出各种不同的面板数据模 型。最简单的模型就是忽略数据中每个横截面个体所可能有的特殊效应, 如假设 ~ iid (0, ) ,而简单地将模型视为横截面数据堆积的模型。
的单位向量。
进一步定义:
D d 1
d2
d i 为 TN 1 向量,是一个虚拟变量(dummy variable) 。模
型可以再写为:
i 0 0 0 i 0 dN 0 0 i
y D x
第三节 随机效应模型及其估计方法
一、随机效应模型的形式 类似固定效应模型,随机效应模型也假定:
it i it it 但与固定效应模型不同的是,随机效应模型假定 i 与
随机效应模型可以表达如下: 同为随机变量 (18)
yi X i i i i
其中 yi 和 i 均为 T 1 向量;X i 是T K 矩阵; i 是一个随机变量,代
ˆ w 。 内部估计量(within estimator) ,有时也记为
第一步,剔除虚拟变量在模型中的影响,然后再对参数β 进 行估计。 剔除虚拟变量 D 影响的办法就是利用下列矩阵对所有变 量进行“过滤” 。
PD D ( D D ) 1 D ,其中 D 的定义与方程前所述。设 设 M D I PD , 用 M D 转 变 模 型 y D x 。 显 然
记第 i 个横截面的数据为
y i1 yi 2 yi ; y iT
xi11 1 xi 2 Xi x1 iT
xi2 xiK i1 1 1 2 K xi 2 xi 2 i 2 ; i 2 K xiT xiT iT
M D D 0 ,则有
M D y M D X M D
ˆ w ( X M D X ) 1 X M D y 用 OLS 得到β 的估计:
内部估计量与对下列方程的 OLS 估计量是等同的。
y it y i ( X it X i ) +随机误差项
其中, y i 和 X i 代表各自变量个体的均值。 上式中,OLS 估计量主要利用的是个体变量对其均值偏离的信 息,随机误差项也仅反映对其个体均值的偏离波动,这是该估计 量被称为内部估计量的原因。
w
ˆ2 ˆ
i
s2 ˆ X i ˆ X i w T
s 2 是对误差项方差的估计量: 其中
s2
ˆ ˆ ( y it i x it w ) 2
i t
NT N K
注意:在对误差项方差的估计量中,分母(NT-N-K)反映了整个
模型的自由度。有了这些方差的估计量,就可以用传统的 t-统计量 对估计系数的显著性进行检验。 同时, 还可以运用下列 F-统计量对 i j , i j 的原假设进行检验:
单位:亿元 1999 4034.96 7697.82 5364.89 2908.59 3550.24 1962.98
4996.87 5960.42 6650.02 7162.20 7662.10 山东 数据来源:中国统计年鉴 1996-2000。 其他类似的例子还有:历次人口普查中有关不同年龄段的受教育状况;同行业 不同公司在不同时间节点上的产值等。 这里, 不同的年龄段和公司代表不同的截面, 而不同时间节点数据反映了数据的时间序列性。
it i it
其中 i 代表个体的特殊效应,它反映了不同个体之间的差别。
(2)
最常见的两种面板数据模型是建立在 i 的不同假设基础之上。一种假 设假定 i 是固定的常数,这种模型被称为固定效应模型(fixed effect model) ,另一种假设假定 i 不是固定的,而是随机的,这种模型被称 为随机效应模型(random effect model) 。
y1 i y2 0 y 0 N
0 0 1 x1 1 i 0 2 x2 2 0 i N xN N
I 2 i 21
i 21 0 0 i 21
第二节 固定效应模型及其估计方法
一、固定效应模型的形式 在固定效应模型中假定 其中 i 是对每一个个体是固定的常数,代表个体的特殊效应,也反映 了个体间的差异。
it i it
yit i xit it
整个固定效应模型可以用矩阵形式表示为:
其中 i 为
T 1