面板数据模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
面板数Βιβλιοθήκη Baidu模型
4.4.1面板数据简介 所谓面板数据,是指同一截面单元数据集上 对不同时间段上的重复观测值(repeated observations on the same set of cross section unit`s) 。 时间序列数据或截面数据都是一维数据。例 如时间序列数据是变量按时间得到的数据; 截面数据是变量在截面空间上的数据。 面板数据(panel data)也称时间序列截面数 据(time series and cross section data)或 混合数据(pool data)。 面板数据是同时在时间和截面空间上取得的 二维数据。
随着对误差项成分的进一步分解,又可将面 板数据模型分解为单项误差成分模型(one way error component regression model) 和 二项误差成分模型(two - way error component regression model) ,下面仅讨论 单项误差成分模型的设定和估计。 单项误差成分模型(one - way error component regression model)模型设定为: yit = α +βXit +μi + vit (i = 1 ,…,N t = 1 ,…,T) 此处μi代表随个体变化的不可观测的异质性, 不随时间变化。vit代表随时间和个体变化的 剩余扰动项。
• 最常见的面板数据有以下几类: • 平衡面板数据:这种数据结构的个体在所 有的时间段上都是相同的; • 不平衡面板数据:在每一个时间段上,都 有旧的个体退出,新的个体进入,即每一 个时间段上个体的数目都不相同; • 旋转面板数据:每一个时间段上更新相同 数目的样本; • 伪面板数据。
4.4.2传统面板数据模型及其估计
面板数据一个明显的特点是:可以从模型中反映出个 体异质性。 yit =αi +βXit + uit (i = 1 ,…,N t= 1 ,…,T) 其中,N 为截面个数(或个体个数) ,T为每一个体对应 的时间长度,uit 为误差成分。随着个体的不同,αi也 不相同,称为个体的异质性(通常是不可观测的)。β对 所有的N都是一致的,为保证估计的一致性和有效性, 对模型作如下设定:
• 这种数据具有如下优点: • (1)面板数据可以很好地容纳、控制不可观 测的个体单元集之间的异质性、动态性。 • (2)面板数据充分利用了时间段和截面单元 的信息,给出了更多的变量、数据信息、 自由度,从而减少了变量之间多重共线性 的产生,使估计结果更加有效、稳定、可 靠。
(3)面板数据可以将不同时间点上的经历和行 为联系起来,表明不同个体的截面数据是如 何随时间的变化而变化的,能够更好地研究 数据的动态矫正。 截面变量和时间变量的结合信息能够显著地 减少缺省变量所带来的问题。一般地,截面 参数随时间变化的方式可能不能由时间序列 解释变量的选择反映出来。或者个体在截面 上的重要变化方式不由截面变量的选择所反 映。
• 线性单变量模型类型有下面几种: • (1)固定效应和固定系数模型(Fixed Effect Models and Fixed Coefficient Models):通常采用OLS估计。固定效应包括时间效应以 及时间和个体效应,并可以进一步放宽条件,允许在有异方差、自相关 性和等相关矩阵块情况下,用GLS估计。 • (2)误差成分模型(Error Components Models):最常用的Panel Data模型。针对不同情况,通常可以用OLS估计、GLS估计、内部估计 (Within Estimator)和FGLS估计,并检验误差成分中的个体效应以及 个体和时间效应,同时将自相关和异方差情况也纳入该模型框架。 • (3)随机系数模型(Random Coefficient Models):即模型自变量的 系数可能包含时间效应或个体效应,再加上一个随机数,系数通常用抽 样方法或者贝叶斯方法来估计。 • (4)带有随机自变量的线性模型(Linear models with random regressiors):通常用工具变量估计(IV估计)和GMM估计。同时,利 用工具变量可以对相关的特定效应模型(the Correlated Specific Effect Models)估计,并对随机变量与特定效应之间的相关性进行检验。 • (5)动态线性模型(Dynamic linear Models),该模型同样又包含 固定效应自回归模型(通常用LSDV估计、Within估计、IV估计法估计 参数)、动态误差成分模型(λ-类估计、IV估计、GMM估计、极大似 然估计( IMLE) 以及似然不相关分析方法( SUR) 等方法估计参数)以及 带有异方差的动态线性模型(联合估计、组均值估计和截面估计等方法 估计参数,并检验异方差性),成为近来Panel Data单位根和协整理论 发展的基础。
• 对μi设定的不同又将模型区分为固定效 应模型和随机效应模型两大类。 • 在固定效应模型中,假设μi是待估的固 定参数,直接采用最小二乘哑元变量的 回归会造成估计结果的不一致性,根本 原因就在于,模型中包含了随个体变化 而变化的偶然参数。因此可以考虑先对 模型进行变换,消去偶然参数,即采用 组内回归(within regression) 方法估计。 • 随机效应模型中,μi、vit都是随机变量。
固定效应模型的组内回归结果具有如下特点: (1) T → ∞,固定效应的估计是一致的。 (2) T 固定及T → ∞组内回归的β是一致的。只有当T 较大时,组内回归的αi 才是一致的。 固定效应模型与Pooled Model相比,充分利用了面 板数据的信息,它的弱点在于: ①若是在个体或(和)时间上有过多的虚拟变量,模型 会损失大量的自由度,导致检验的势过弱的困境。 ②随着变量的增多可能带来多重共线性问题。 ③随着标准差的增大,会减少参数检验的势。 ④不可避免地会出现异方差和自相关。 ⑤随偶然参数的增多,模型结果会不一致。 ⑥无法直接估计时不变的变量。
(1) 同均值:E( ei) = 0 (2) 外生性:Corr ( ei ,x i) = 0 (3) 同方差性:Var ( ei) = s2 = 常数 (4) 序列不相关性:Corr ( ei ,ej) = 0 ,i ≠ j
在小样本的情况下还要保证随机扰动项的正态性。
• 若直接用普通最小二乘法估计会存在如下 的问题:αi是偶然参数,它的数目随着N 的 增大而增大,而且参数的个数N + K 数目将 会很大。为此可以考虑将偶然参数αi 的异 质性剔除,将异质性归并到误差项中,即 令模型为: • yit = α +βXit + uit (i = 1 ,…,N t = 1 ,…,T) • uit = μi + vit • 此处μi 代表不可观测的异质性,vit 代表剩 余扰动项。
• (4)面板数据可以研究不断变化的个体类型。 • (5)面板数据模型可以构造和检验比纯时间 序列和截面数据更为复杂的行为模型,如 技术的有效性。面板数据集可以区分出单 用截面数据或时间序列数据都不能得到的 经济作用。
(6)面板数据使我们能够研究每个样本随时 间的变化,以及每个样本在某时间点上的 不同。面板数据模型可以给出较纯时间序 列和截面数据更好的预测。因此,面板数 据的使用使得模型的确认变得更加困难; 面板数据的干扰可能包含了时间序列干扰、 截面干扰,以及时间序列和截面的混合干 扰。
相关文档
最新文档