第七讲 面板数据模型(Fixed Effect, Random Effect)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 11 12 13 14
地 区 全 国 北 京 上 海 浙 江 天 津 重 庆 海 南 广 东 湖 北 内蒙古 贵 州 甘 肃 青 海 西 藏 全 国 北 京 上 海 浙 江 天 津 重 庆 海 南 广 东 湖 北 内蒙古 贵 州 甘 肃 青 海 西 藏
第八章 面板数据模型(Panel Data )
• 问题和动机
– 遗漏重要变量或有明确的非观测效应 – 动态效应
• 原理
– 离差消除不可观测效应 – 综合利用截面和时间序列信息
• 方法 • 例子
一.面板数据定义
面板数据是同时在时间和截面空间上取得的二维数据。 面板数据从横截面上看,是由若干个体在某一时刻构 成的截面观测值,从纵剖面上看是一个时间序列。 面板数据用双下标变量表示。
② 分块估计 (3)设定检验 (不含截距项)
H : ... 2 3... T
0 1 2 n
0
若接受,则选基本模型
说明:用模型(2)比较少。因为引进变量太多, 参数估计太多,自由度减少。一般刻画时间上的 差异时直接引进 t。
三. 随机效应模型(Random Effect) 1. 模型
b (S
w
)
1
S
w XY
其中 S
S
ˆ
2
w XX

(X
it
it
X i.)( X it X i.)
i. it i.
w XY

(X

X )( X Y
)



nT n k
(eit e i.)2
2. 分解(续) (2)单位间估计 用 Y it

)( X it )(Y it

X
)
)
it
Y
X
11 nT i
it
11 nT i
Y
t
it
2. 分解 (1)单位内估计 用 Y it
w XX

X u
it it
i
Y
(X
i.

X
i.
i.
ui
Y Y
it
i.
it X i.
) ( it i.)
当 E (Y X it
it
i
X
it
it
对模型(1)
X时
*
*
X 从不同的个体来看 E (Y
) i
) k kt
X
*
E (Y
it
) E (Y kt ) i k
不同个体的差异与 t 无关
对同一个个体:
E (Y
it
) E (Y is ) i i 0
-----------------------------------------------------------------------------c | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------y | .7618886 .041664 18.29 0.000 .676247 .8475302 _cons | -97.14473 142.288 -0.68 0.501 -389.6219 195.3325 ------------------------------------------------------------------------------
支出合计 C 1741.09 3552.07 4753.23 3479.17 2050.89 1475.16 1357.43 2703.36 1649.18 1554.59 1098.39 1127.37 1330.45 1123.71 1943.3 4147.3 5669.57 4285.13 2319.52 1583.31 1644.79 2927.35 1801.63 1770.56 1185.17 1336.85 1563.15 1030.13
it

X
it
it
i 1,...n; t 1,...T
固定效应模型 (Fixed Effect或 LSDV)
Y
it
由截距项体现个体差异 模型 (1)截距项 i 模型 (2) i t i, t非随机的
i
X
it
it
随机效应模型(Random Effect)
E (Y
it
it
) E (Y is)
t
s
同一个体在不同时期有差异。
对不同个体不同时期:
) E (Y ks ) ( k ) ( )
i t s
不同个体不同时期有差异。
1. 关于

E ( ) 0 Cov ( ,
it it
it
V ar (
ks
Y X 截距项 , 随机的 模型可以改写为: Y X W 其中 W
it i it it i i it it it i it
it
2. 假定
E ( ) 0 Var ( ) Cov ( , ) E ( 与回归量X 无关
线性约束检验(有n-1个约束方程)
F
-ee / n 1 e e =
ee / nt (n 1)



若 F F (n 1, nt n 1), 拒 H 若 F F (n 1, nt n 1), 接 H
0 0
不选基本模型 不拒基本模型
注:对含截距项模型,设定时引进n-1个虚拟变量。
X u
it it
i
Y
i.

X
i.
i.
ui
b (S
b
b XX
)
1
S
b XY
其中 S S
ˆ
2
b XX

i
T (X
i.
i.

X )( X
i.
i.

X
)
)
b XY

i
*
T (X

X )(Y Y
e e nk
*

(3)单位内估计和单位间估计的关系
S
t
t XX
例如 Yi t , i = 1, 2, …, n; t = 1, 2, …, T n 表示面板数据中含有n个个体。T 表示时间序列的 最大长度。若固定t不变,Yi . , ( i = 1, 2, …, n) 是横 截面上的n个随机变量;若固定i不变,Y. t 是纵剖面 上的一个时间序列。
基本模型
Y
OLS
D1
D2 … Dn X
② 分块估计(克服n 太大) 思路:先估计
Y Y
it
it
i
X
it
it
i
X
it
it
Y Y
it
it
( X it X it ) ( it )
it

( X X )(Y Y ˆ (X X )
3. 模型结果展示:
reg c y Source | SS df MS -------------+-----------------------------Model | 39023851.2 1 39023851.2 Residual | 3034192.72 26 116699.72 -------------+-----------------------------Total | 42058043.9 27 1557705.33 Number of obs F( 1, 26) Prob > F R-squared Adj R-squared Root MSE = = = = = = 28 334.40 0.0000 0.9279 0.9251 341.61
纯收入 Y 2366.4 5025.5 5870.87 4582.34 3947.72 1971.18 2226.47 3769.79 2352.16 1973.37 1411.73 1508.61 1557.32 1404.01 2622.24 5601.55 6653.92 5389.04 4566.01 2214.55 2588.06 4054.58 2566.76 2267.65 1564.66 1673.05 1794.13 1690.76
yit xit it
yit i xit it
yit ui xit it
二、 样本 选自中国农业统计年鉴。
调用数据库 Panel data
各地区农村居民平均每人年生活消费支出及纯收入
t 2001 2001 2001 2001 2001 2001 2001 2001 2001 2001 2001 2001 2001 2001 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003
Y
it

+ D
2
it 2
... n D itn
X
it
it
3. 对固定效应的模型(2)设定和估计
Y
it
i
t
X
it
it
(1)设定(不含截距项,引进n+T-1个虚拟变量)
Y
it
1 D it1 ... n D itn
2
H
its
i t it i. it 2 i t it i.
i.
)
再估计

i
i i. i.
ˆX ˆ Y
方差的估计量为:
ˆ
2



i t
(e it e i.)2
nt (n 1)
1 2 n
(3)设定检验
H : ... H : 至少有一个不等
0 1
基本模型 固定影响模型
it 2
...
T
H
itT

X
it
it
D
itk

1 ik 0 ik
H

1 ts 0 ts

含截距项,引进n+T-2个虚拟变量: Y it 2 D it 2 ... n D itn
H
2
it 2
...

T
H
itT
X
it
it
(2)估计 ① OLS, ML 估计(只要满足古典假设)
同一个体在不同时期没有差异。
对模型(2)
当 X时 E (Y ) X 从不同的个体来看 E (Y
* it i t
X it
*
) k kt
t
X
*
E (Y
it
) E (Y kt ) i k
不同个体的差异与 t 无关
对同一个体不同时期:
E (Y
S XX S XX
w w b b
W
b
S
t XY
S XY S XY
w b
W
b
b F b F b
F
F
w w
b w
(F F
b 1
I
)
( S XX S XX )
( S XX S XX )
b
S
b
w XX
1
S
XX
例:
一 、模型设定
被解释变量: 消费支出y 单位:元 解释变量: 纯收入x 单位:元 模型形式:
3. 估计方法
OLS, GLS, FGLS, ML等
下面利用OLS介绍单位间估计和单位内估计
Between estimator和within estimator
1. OLS估计量
b (S
t XX t XY

t XX
)
1
S
t XY
其中 S S

(X (X
X
t
it

X X
Y
it
)
2
)0 ik
t s
2. 对固定效应的模型(1)设定和估计
Y
Y
it
i
X
it
it
(1)设定(不含截距项,引进n个虚拟变量)
it
1 D it1 ... n D itn
X
it
it
D
itk

1 ik 0 ik
(2)估计 ① OLS, ML 估计(只要满足古典假设) Y
E (w ) 0 2 ( ) Var w E ( wit )
it 2 it
2
Cov ( w , w Cov ( w is )
2
) E ( w it w ks ) 0 i k
不同个体无自相关;同一个个体有自相关。
i 2 i i k i i
k
)0
E ( ) 0 Var ( ) i k Cov ( , ) E ( ) 0 与回归量X 无关
i 2 it it ks it ks it
ik
ks
, 无关 Cov ( ,
i it i
it
)0
关于wit的假定:
it i it it i i
Y X 截距项 , 随机的 模型可以改写为: Y X W 其中 W
it it it i it
it
混合影响
横截面对Y的干扰
二. 固定效应模型
Y
it
模型 (1)截距项 i 模型 (2) i t i, t非随机的
相关文档
最新文档