第九章_面板数据模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这就是固定影响模型。从模型的设定可知,固定影响 模型假设横截面个体之间的差异为截距不同,而斜率系数 相同,即允许不同的横截面个体的截距是不同的,但每一 个体的截距在各个不同时期则保持不变。换句话说,固定 影响模型假定不同横截面个体的差异可用不同的常数项 i 来描述,在此模型中, i 被作为要估计的未知参数。
若 Z i中仅包含常数项,则模型形式如下:
yit x it β uit
(9.2)
这类模型假设所有的横截面个体在各个不同时期的斜 率和截距都是相同的,这样就可以直接把面板数据混合在 一起,用OLS估计参数,得到一致和有效估计量。 由于混合回归模型假设解释变量对被解释变量的影响 与横截面个体无关,这在现实中是很难成立的,所以应用 不广。
自不同的常数项。注意,这里使用的“固定”一词是表明 ci 和 x it 的相关,并不表明 ci 是非随机的。
固定影响模型可分为三类,即个体固定影响
模型(Entity fixed effects model )、时点固
定影响模型(Time fixed effects model )和个
体时点固定影响模型(Entity and time fixed
第九章 面板数据模型
第一节 第二节 第三节 第四节 第五节 第六节
面板数据与面板数据模型 固定影响模型 随机影响模型 SUR模型 随机系数模型 动态面板数据模型
关于Panel Data Model
独立的计量经济学分支
比较多地用于宏观经济分析——统计数据 也可以用于微观经济分析——调查数据
几种翻译
yit x it β h( Xi ) uit [ci h( Xi )] x it β i uit [ci h( Xi )]
括号项可通过构造使其与 Xi不相关,因而可将其吸收到 扰动项中,模型可写为
yit x it β i uit
(9.7)
一、固定影响模型的设定
上一节给出了分析面板数据的一般模型
yit x it β ci uit
固定影响模型源于一般模型中被遗漏的影响 ci 与包括的变 量 xit相关的假设,此假设的一般形式是:
E[ci Xi ] h(Xi )
(9.6)
由于上式中的条件均值在所有时期中都相同,我们可将模 型写成:
1 u1 u 2 2 ... ... n u n
或
β y X d1 d 2 ... d n u α
(9.9)
这里 di是第i个单元为1其它单元为0的虚拟变量。设 nT n
即当期扰动项与过去、现在和未来的每一期中的自变量都 无关。
模型关注的重要方面是异质性,这方面特别方便的一个 假设是所谓的均值独立(mean independence):
E[ci xi1 , xi 2 ,...]
如果该假设成立,即不可观测的变量与包括在模型中的 变量无关,那么下面将看到,可以将它们包括在模型的扰 动项中,这正是随机影响模型的基础假设。可是,这是一 个很强的假设,很多情况下无法满足。弱一些的假设是:
矩阵 D d1 , d2 ,, dn ,则将所有 nT 行组合在一起,有
y Xβ Dα u
此模型通常称为最小二乘虚拟变量模型(least squares dummy variable model,LSDVM)。此模型是一个 经典线性回归模型。如果n足够小,模型就可用OLS法估计, y对X中K个解释变量和D中的n列回归,共 k n 个参数。
如果混合数据包含的观测值来自从一个大总体中随机抽样 的主体不同时期的数据,则此类混合数据称为非面板混合数据。 例如,我们每年对北京市固定的一万户家庭消费的观测记
录所得到的数据集就是面板数据;而我们每年对北京市居民家
庭随机抽样一万户家庭消费的观测记录所得到的数据集就是非 面板混合数据。在实践中,面板数据通常比非面板混合数据更 有用,这是因为面板数据中的地区、公司、人员等横截面个体 在各时期中一直保持不变,这使得我们更易于对这类个体随着
effects model)。在本章中,我们只介绍个体固
定影响模型。
3.随机影响(random effects)
如果未观测到的个体异质性可以被假定与包括在模型 中的变量无关,则模型可设定为
yit x it β E[ z i α ] {z i α E[ z i α ]} uit x it β i uit
随机影响模型可看成是一个带有随机常数项的回归模
型。如果数据集足够丰富,我们可以将此思路扩展到其它
系数也随着个体随机变动的模型,从而得到随机系数模型:
yit x it (β hi ) ( i ) uit
(9.5)
其中 hi 是一个引起参数跨个体变动的随机向量。
第二节 固定影响模型
Z i 包含一个常数项和一组体现横 影响 由 z i α 表示,其中
截面个体影响但不随时间变化的变量,例如可观测的种族、
性别等,或无法观测的家庭特征、偏好等,所有这些变量 都只体现横截面个体特征,而不随时间变化。如果所有横 截面个体的 Z 都可以观测到,那么整个模型可被视为一个 i 普通线性模型,并可用最小二乘法来拟合。但在大多数应
xi
xi yit yi
2
yit yi
i
再令 Wxx Wxxi , Wxy Wxyi , Wyy Wyyi
(9.4)
这是一个带复合扰动项的线性回归模型。可用OLS法估计, 得到一致但非有效的估计量。(9.4)称为随机影响模型。 这里 i 是一个反映横截面个体影响的随机元素。 固定影响模型和随机影响模型的关键区别是未观测到的 个体影响是否包含与模型中解释变量相关的元素,而不在于 这些影响是否随机。
4. 随机系数(random coefficients )
(9.12)
这样在模型(9.12)中,常数项就被去掉了。令
y yit yi , X X it X i , u uit ui
则模型转换为*
yit X u
* it
* it
(9.13)
对模型(9.13)运用OLS进行回归,就得到 的OLS估计值。
2. 组内估计法
为表达方便起见,先考虑双变量模型
时间的推移所发生的变动进行比较和分析。
相应地,我们将基于面板数据的回归模型称为面板数据 模型(panel data model)。面板数据模型可以分为单方程 面板数据模型和联立方程面板数据模型;也可以分为线性面 板数据模型和非线性面板数据模型(如离散被解释变量面板
数据模型、受限被解释变量面板数据模型)。
其中
(9.1)
t 1, 2,3,..., T
β ( 1 , 2 ,..., k ) α (1 , 2 ,..., m )
xit ( x1it , x2it ,..., xkit ) z i ( z1i , z2i ,..., zmi )
xit 中有k个解释变量,不包括常数项。异质性或个体
如果进一步假设 Var (ci Xi ) 为常数,则在此假设下, (9.7)变成经典线性回归模型。
二、固定影响模型的参数估计
固定影响模型参数的估计方法有两种,一种
是最小二乘虚拟变量(LSDV)估计法,另一种是 组内估计(Within Estimator)或称协方差估计 (The Analysis of Covariance Estimation , ANCOVA)。下面介绍这两种参数估计方法。
E[ci xi1 , xi 2 ,...] h(xi1 , xi 2 ,...) h ( Xi )
假设条件放宽了,模型的适应面也宽了,但复杂性也大 大增加了,因为需要有关函数性质的假设。
四、模型结构
我们将研究分析面板数据的各类模型,它们大致可分为 如下几种类型:
1.混合回归(pooled regression)
Intercepts)
第一节 面板数据与面板数据模型
一、面板数据
混合数据(pooled data)是指将横截面数据和时间
序列数据结合在一起的数据。
混合数据包含不同横截面个体不同时期的数据,或者
说,混合数据包含既跨越时间又跨越空间的数据。 如果混合数据包含的观测值来自同一批地区、公司、 人员或其它横截面个体的不同时期数据,则此类混合数据 称为面板数据(panel data)。
yi i xit uit
1 y 定义 i T
,假定 uit ~ IN (0, 2 ) 。
y
t 1
T
it
,xi 1 T
x
t 1
2
T
it
,
yi,xi
称为组内均值。组内平方和及交叉乘积和为:
Wxxi Wxyi Wyyi
xit x
t t t it
实际应用中,n 通常很大,数以千计,模型很可能超出 任何计算机的存储容量。可考虑使用分块回归技术以减少计 算量。有关分块回归技术的详细讨论参见Greene(2008)。 另一方面,运用LSDV估计固定影响模型,需要加入n个 虚拟变量,当模型中的虚拟变量的个数n很大时,回归中会 损失大量的自由度。解决这个问题的思路是对模型进行变换, 消去常数项 i ,再用变换后的模型回归。 为表达方便起见,不失一般性,我们用双变量模型来 说明。在这种情况下,模型(9.7)简化成:
用中, ci不可观测,处理起来就要复杂得多。
分析的主要目标是偏效应(partial effects)的一致和有 效估计:
β E[ yit xit ]/ xit
是否能达到这个目标取决于有关不可观测的影响的假 设。我们以自变量的严格外生性假设作为起点, 该假设为:
E[uit xi1 , xi 2 ,...] 0
yit X it i uit
我们对第i个横截面个体在时间上求均值,则有
(9.10)
yi X i i ui
i 1, 2,3,..., n
(9.11)
(9.10)-(9.11),得
yit yi ( X it X i ) uit ui
* it * it * it
二、面板数据模型的优点 1.利用面板数据进行的经济分析更全面 2.利用面板数据能够改进估计的有效性
三、分析面板数据的一般模型框架
分析面板数据的基本框架是形如下式的回归模型:
yit x it β z i α uit xit β ci uit i 1, 2,3,..., n
2.固定影响(fixed ewk.baidu.comfects) 如果 z i 不可观测,但与 xit相关,则由于遗漏了有关变量, β
的OLS估计量是有偏和不一致的。可是在这种情况下,模型
yit x it β i uit
均值。这就是固定影响模型。
(9.3)
包含了所有可观测的影响,并且设定了一个可估计的条件 其中 i z i α 。固定影响模型将 i视为回归模型中每一个体各
1. LSDV估计法
设 y i和 Xi 为第i个横截面单元的T个观测值, i 是一个 元素全为1的 T 1 列向量, ui 为相应的扰动项 T 1 列向
量,则:
y i Xi β + ii + ui
(9.8)
将全部i个单元汇集在一起,给出
y1 y 2 ... y n
X1 i 0 ... 0 X 0 i ... 0 2β ... ... X 0 0 ... i n
面板数据模型 综列数据模型 平行数据模型
本课程包括内容 变截矩模型(Variable-Intercept Models)
固定影响(Fixed-Effects) 随机影响(Random-Effects)
变系数模型(Variable-Coefficient Models) 动态变截矩模型(Dynamic Models with Variable