第2章 面板数据模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2.3.5)
35.0807 0.0000 2.1178 0.0351 0.6352 0.5258
12
表2.3.1 个体效应的估计结果
地 区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 个体效应 -0.1652 -0.1154 -0.0572 -0.0177 -0.0150 0.0218 0.0689 地 区 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 个体效应 0.1699 -0.0700 0.0546 0.2140 0.0537 0.3129 0.1703 地 区 山 东 河 南 湖 北 湖 南 广 东 广 西 四 川 个体效应 -0.0614 -0.0325 0.0955 0.0740 0.3291 0.2091 -0.0712 地 区 贵 州 云 南 陕 西 甘 肃 青 海 宁 夏 新 疆 个体效应 0.0457 -0.0892 -0.3129 -0.1588 -0.1545 -0.1481 -0.3504
(2.1.3)
it i t uit
i 1,2, N
t 1,2,T
PIC表示中国28个省份的1995年至2005年的农村人均纯 收入;CSC表示农村人均资本存量;RLT表示非农产业 从业人数与农产业从业人数之比;RCI表示农村集体投 资与个人投资的比率。 面板数据:多个观测对象的时间序列数据所组成的样 本数据。
工具变量选择的方法: 对模型(2.4.2)取一阶差分:
(2.4.5) Yit Yi ,t 1 it 因为 it uit ui ,t 1已经剔除了个体效应 i ,同时对 于uit 和 ui ,t 1 , 都是前定变量,都可以作 Y , Y ,, Y
为模型(2.4.5)中 Yi,t 1 的工具变量。
9
§2.3 静态面板数据模型的估计
一、固定效应估计法
OLS估计量:有偏的,非一致的。 本质问题:个体效应(或时间效应)的内生性。 其BLUE是最小二乘虚拟变量(LSDV)法。 1、LSDV估计方法
基本思想:通过虚拟变量把个体效应(和时间效应)从误 差项中分离出来,使分离后剩余的误差项与解释变量不相 关,以便进行OLS估计。 估计步骤:如对 Yit 0 1 X it it it i uit i 1,2,, N (2.3.1)
(2.2.1)
it i t uit i 1,2,, N t 1,2,, T
E(i ) 0 E(t ) 0 E(i uit ) 0
E(t uit ) 0
固定效应:如果个体效应或时间效应与模型中的解 释变量相关。 随机效应:如果个体效应或时间效应与模型中的解 释变量不相关。 静态面板数据模型:解释变量中不含被解释变量 滞后项的模型。例如(2.2.1)。
F
若随机效应为真时,豪斯曼检验统计量:
H ~ 2 (K )
(2.3.11)
自由度K为模型中解释变量(不包括截距项)的个数。 对模型(2.1.3)进行豪斯曼检验,结果为: H=4.1777, p值=0.2429。接受随机效应的原假设。
17
§2.4 动态面板数据模型简介
动态面板模型:解释变量中包含被解释变量的滞后 项。 一般表述形式为:
一、动态面板数据模型的内生性问题
动态面板数据模型:存在固有的内生性。 GLS估计和LSDV估计:有偏的非一致的。 1. GLS估计的有偏和非一致性 (1)解释变量 Yi,t 1与误差项 it 都包含个体效应 i 。
Yi,t 1 Yi,t 1 Yi,t 2与 it uit ui,t 1 ,都包 (2)进行差分变换, 含共同因素ui ,t 1 ,无法消除解释变量的内生性问题。
为解决虚拟变量的完全多重共线性,可直接估计模型:
* * Yit 1 D1 N DN 1 X it uit
(2.3.3)
如果 uit 是经典误差项,可以直接对(2.3.3)进行OLS估计。 并且
ˆ 1 0 N ˆ
i 1 N * i
1 ˆi ˆ N
Yit 0 1 X 1it K X Kit Yi,t 1 it
(2.4.1)
以下分析基于模型(2.4.1)的简化设定形式:
Yit Yi ,t 1 it
(2.4.2)
E (i uit ) 0
18
it i uit
其中: uit 为经典误差, E(i ) 0
1 T it it T t 1
* it
* Y 显然, i,t 1和
i*,t 是相关的,都包含误差 i,t 1 。
20
二、动态面板模型的广义矩估计方法(GMM)
对动态面板数据模型(2.4.2): Yit Yi ,t 1 it
it i uit
时 间 序 列 数 据
横 截 面 数 据
图2.1.1 变量X的面板数据结构
5
面板数据的优势:
1.扩大信息量,增加估计和检验统计量的自由度。 2.有助于提供动态分析的可靠性。 3.有助于反映经济结构、经济制度的渐进性变化。
4.面板数据模型有助于反映经济体的结构性特征。
6
三、面板数据模型的混合估计
其中: uit 为经典误差项
E(i ) 0
E(i uit ) 0
LSDV、GLS估计:有偏并且非一致的。
要得到 的一致估计量:需为 Yi,t 1 寻找适当的工 具变量。
21
工具变量选择的条件: (1)Yi,t 1工具变量必须与 it 不相关,
(2)而 Yi,t 1 与相关。 思考:Yi1, Yi 2 ,, Yi,t 2 能作为 Yi,t 1 工具变量使用吗?
ˆ ˆ u it 1 it it
含义:变量Y的个体内离差对变量X的个体内离差进 行回归,并进行OLS估计。
14
二、静态面板数据模型的随机效应估计
OLS估计量:无偏的,但估计量有较大的方差。 本质问题:个体(或时间)效应导致了误差项自相关。 其线性无偏最优的估计方法是广义最小二乘法(GLS)。 举例:对模型(2.1.3)进行GLS估计,估计结果为:
Cit 0 1Yit it
(2.1.1) (2.1.2)
it i t uit
其中:
和 Yit 分别表示消费和收入。 i 1, 2 表示两个观测个体。 uit 为经典误差项。
Cit
3
例2. 农村居民收入分析
ln(PICit ) 0+1ln(CSCit ) 2 RLTit 3 RCI it it
t 1,2,, T
10
引入虚拟变量, Di , i 1, 2,, N 。其中: Di 1 表示第i个观测 Di 0表示不是第i个观测个体。 个体, 则模型(2.3.1)可表述为:
Yit 0 1 D1 N DN 1 X it uit
(2.3.2)
19
2. LSDV估计的有偏和非一致性
模型(2.4.2)可以表示为:
Yit 1 D1 N DN Yi ,t 1 uit
* * * Y Y i ,t 1 it 等价于模型: i,t
(2.4.3)
(2.4.4)
其中: Y
* i ,t 1
1 T Yi ,t 1 Yi ,t T t 1
i 反映不随时间变化的个体上的差异性,被称为个体效应
t 反映不随个体变化的时间上的差异性,被称为时间效应。 4
二、面板数据的特征及优势
面板数据的基本特征:其数据结构的二维性。
t \i 1 2 T 1 X 11 X 12 X 1T 2 N X 21 X N 1 X 22 X N 2 X 2T X NT
22
i1
i2
i ,t 2
IV估计量求解:如果只选择 Yi ,t 2 作为 Yi,t 1 的 工具变量,正交的约束条件: E(Yi ,t 2 it ) 0 (2.4.6)
基于一个给定的样本,通过求解
1 NT
i t
ˆit Yi ,t 2
第2章 面板数据模型
前言
什么是面板数据(Panel Data)? 面板数据的特征与优势? 面板数据模型的分类:静态与动态。 静态、动态面板数据模型如何进行估计?以及 估计量性质如何?
2
§2.1 面板数据模型
一、面板数据模型
例1. 居民消费行为分析 将城镇居民和农村居民的时间序列数据组成面 板数据,那么模型可以表述为:
l n(PICit ) 7.9436 +0.41601ln(CSCit ) 0.0750Rቤተ መጻሕፍቲ ባይዱTit+0.0007RCI it (2.3.9)
t统计值 202.1297 35.3193 2.4289 0.4921 p值 0.0000 0.0000 0.0157 0.6230 思考: 比较GLS(2.3.9)和LSDV(2.3.5)的估计结果? 为什么在固定效应估计时没有考虑自相关问题?
u 为经典误差项
缺陷:假定个体间和不同时点的经济关系是同质的。
7
举例:基于中国28个省市自治区1995~2005年的 面板数据,估计的结果为:
l n(PICit ) 7.8158 +0.35911 ln(CSCit ) 0.2523 RLTit-0.0104RCI it
(2.1.6)
面板混合OLS估计:直接把各时间序列或各横截面 数据混合起来进行估计。 对于模型(2.1.3),假定个体效应和时间效应为0, 则模型为:
ln(PIC) 0+1ln(CSC) 2 RLT 3 RCI u
PIC (PIC11 其中:
(2.1.5)
PIC1T PICit PICN1 PICNT ) '
' ˆ 1 ˆ ˆ ˆ ˆ) ˆ H (F R ) ( F R ) (F R
(2.3.10)
16
ˆ 分别为回归系数的LSDV估计向量,GLS估计 ˆ , 其中: F R 向量; ˆ ,ˆ R 分别为LSDV估计系数,GLS估计系数的协方差 矩阵估计量。
* i
ˆ
i 1
N
* i
(2.3.4)
11
举例:对模型(2.1.3)进行LSDV估计,估计结果 为:
ˆi u ˆit ln(PICit ) 7.9488 +0.41781ln(CSCit ) 0.0681 RLTit+0.0009RCI it
t统计值 310.5582 p值 0.0000
15
三、豪斯曼检验
固定效应模型:LSDV估计量无偏;GLS估计量有偏。 随机效应模型:LSDV和GLS估计量都无偏,但LSDV估计量有较 大方差;。 固定效应模型:两种估计量的结果就有较大的差异。 随机效应模型:LSDV估计量和GLS估计量的估计结果就比较接 近。
豪斯曼检验假设: 原假设(H0):随机效应;备选假设(HA): 固定效应 检验统计量为:
13
2. LSDV估计方法的直观含义 对模型(2.3.3),另一种等价的估计方法步骤:
(1)分别估计方程(2.3.6)和(2.3.7) (2)估计方程(2.3.8)
Yit 1 D1 N DN it
X it 1 D1 N DN it
(2.3.6) (2.3.7) (2.3.8)
t统计值 202.2730 p值 0.0000
R 2 0.8409
17.2520
5.7464
-3.1736
0.0000
0.0000
0.0017
R 2 0.8393
8
§2.2 固定效应与随机效应
面板数据模型的一般形式:
Yit 0 1 X 1it K X Kit it