计量经济学-第16章 面板数据回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果截距写成1it , 就是时变的(time variant)。
10
FEM还假定回归元的系数不随个体或时间变化而变化 FEM 中截距的变化可以用虚拟变量方法来刻画: (16.3.2) 变为 :
Yit 1 2D2i 3D3i 4D4i 2 X 2it 3 X3it uit
E[(εi
uit )(εi uis )]
σ
2 ε
σu2
Eεi2 σε2 σu2
σ
2 ε
σ
2 ε
σu2
可见(16.4.3)式中
w
是自相关的。
it
OLS 是低效的,适合的估计方法是 GLS(generalized least squares)。
10.1.2 面板数据分类
来自:《计量经济分析方法与建模:EViews应用及 实例》,高铁梅,清华大学出版社,2006年
2
16.1 为什么使用面板数据?
面板数据的优势: 1、可以研究个体差异性; 2、变量之间增加了多边性,减少了共线性,
并且提高了自由度和有效性; 3、适于动态研究;
3
4、具有独特的优势(与单独使用时间序列数 据,或单独使用横截面数据相比);
5、可以研究复杂的行为,如规模变化,技术 变动等;
6、减少偏差。当我们把不同类型的数据(如 不同省份或不同年代的数据)混合在一起 时,就会产生偏差(bias)。
(16.3.3)
返回
11
其中, 1
D2i 0
1 D3i 0
1 D4i 0
如果观测值属于GM(通用电气) 不属于
如果观测值属于US (美国钢铁) 不属于
观测值属于WEST(西屋电气) 不属于
代表GE(通用电气)的截距
12
见P643(16.3.4)式的回归结果。 四个公司的截距值具有统计上的差异性: GE: -245.7924 GM: -84.220 (=-245.7924+161.5722) US: 93.8774 (=-245.7924+339.6328) WEST: -59.2258 (=-245.7924+186.5666) 这些截距上的差异用来反映公司独特的性质。
注:这里假定不存在单独的时间序列误差成分。
27
ECM 在计量上还表示 error correction model,
这里尽量不用ECM 。
REM假定:
εi ~ N (0, σε2 )
uit
~
N
(0,
σ
2 u
)
E(εiuit ) 0 E(εiε j ) 0
(i j)
(16.4.5)
E(uituis ) E(uitu jt ) E(εitu js ) 0 (i j,t s)
ε
这是假定 4 个公司是从一个大样本总体中抽出来的样本。
这些公司的截距的均值都相等,为 β1 ,公司的差异反映在
误差项 εi上。
26
(16.4.2) 代入 (16.4.1),得 :
Yit β1 β2 X 2it β3 X 3it εi uit
= β1 β2 X 2it β3 X 3it wit
t 1, 2,..., 20
(16.2.1)
Y = 实际总投资
X2 = 企业实际价值 X3 = 实际资本存量 假定:
X非随机
uit ~ N(0, σ2 ).
6
16.3 面板数据模型的估计:固定效 应方法
对(16.2.1)式的估计取决于我们对截 距、斜率和误差项的假定。有以下几种 可能: 1.假定截距和斜率不随时间和空间(个体) 变化,误差项在时间和个体上存在差异。
9
假定截距随每个公司变化但斜率系数不变,(16.2.1) 变为 :
Yit = β1i + β2X2it + β3X3it + uit
(16.3.2)
这就是固定效应模型(fixed effects model,FEM).
固定效应的含义是:个体的截距不随时间变化,
即非时变的(time invariant)
(16.4.3)
其中 wit εi uit
(16.4.4)
wit 称为合成误差项(composite error term),
εi 为个体误差成分 (individual-specific error component,
or cross-section error component),
uit 是时间序列和横截面混合的误差成分( the combined time series and cross-section error component.)
(1)无个体影响的不变系数模型的单方程回归形式:
yit α xit β uit t=1,2,…,T i=1,2,…,N
(10.1.6)
假设在个体成员上既无个体影响也没有结构变化(β的
变化)。混合所有数据,用OLS法可以求出α 和 β 。
∴该模型也叫混合回归模型(pooled regression model)
4
16.2 一个例子 P638
4个公司的20年的数据
原则上可以进行4个时间序列回归,或20 个横截面回归。 如果80个观测值可以混合,则可以写出 the Grunfield investment function :
5
Yit 1 2 X 2it 3 X 3it uit
i 1, 2,3, 4
17
对于这个例子,结论是:存在个别公司 效应,无时间效应。
X 2, X3 的系数都显著。
18
4.所有系数都随个体而变化 这里假定所有个体(或横截面单元)的截距
和斜率系数是各不相同的。 对于例子就是,四个公司的投资函数都不相
同。
19
可以用如下带有变量交互作用的模型来证明:
Yit 1 D2i D3i D4i X 2it X 3it
37
用于检验上述假设的F统计量的计算方法:.
7
2.斜率不变而截距随个体而变化。 3.斜率不变而截距随时间和个体而变化。 4.所有系数(包括截距和斜率)均随个体而
变化。 5.截距和斜率随个体和时间而变化。
8
1.所有系数都不随时间和个体而变化 可以将80个观测值混合,用OLS法估计参 数,见P641(16.3.1)式。
2.斜率系数不变而截距随个体而变化: 固定效应或最小二乘虚拟变量(LSDV)回 归模型。
16
3.斜率系数不变而截距随个体和时间而变化 将(16.3.4)和(16.3.6)的截距合并即可:
Yit DGMi DUSi DWESTi DUM 35 ...... DUM 53 X 2i X 3i Uit (16.3.7)
(极差斜率系数)。 表示differential
intercepts (极差截距 )。
20
在统计上不为零,证明该斜率系数与基准
(通用电气)不同。 问: 和 在统计上显著的经济意义?
21
答: 代表通用汽车的 X 2 的斜率值, 这说明对于通用汽车, 的X斜2 率与通用 电气这个比较公司是有显著差异的。
3.在FEM中可以引入性别、肤色和种族这 些变量。但这些变量是时间恒定的,所 以,不能分解出他们的影响(贡献)。
4.必须谨慎地处理误差项 是否异方差, 自相关等。
uit
16.4 面板数据回归模型的估计:随机 效应方法
随机效应模型(REM random effects model)
也叫误差成分模型ECM error components model
32
(2)变截距模型的单方程回归形式:
yit αi xit β uit t=1,2,…,T i=1,2,…,N
(10.1.7)
假设在个体成员上存在个体影响而无结构变化,并且
个体影响可以用截距项的差别来说明。
(3)变系数模型的单方程回归形式
yit i xit i uit
13
(16.3.3)就是LSDV模型( least-squares dummy variable model)。
相比之下,(16.3.1)(P641)可以看成受约束 回归,约束为:
11 12 13 14
∴约束=3个 可以做F检验。
14
时间效应:对于20年的年度数据,可以引入19个 虚拟变量,以捕捉时间效应:
(D2i X 2it ) (D2i X 3it ) (D3i X 2it ) (D3i X 3it ) (D4i X 2it ) (D4i X 3it )
(16.3.8)
其中,Uit 表示differential slope coefficients
t=1,2,…,T i=1,2,…,N
(10.1.8)
假设在个体成员上既存在个体影响,又存在结构
变化,即i和i都随个体成员而不同。所以该模型叫
变系数模型或无约束模型(unrestricted model)。
34
10.2 模型形式设定检验
The Panel Data Regression Model 分为不同的类型, 因此,回归分析的第一步便是检验我们所分析的数据属于 哪一种模型类型,即检验被解释变量 yit的参数αi 和 βi 是否对所有个体样本点和时间都是常数,从而避免模型 设定偏差,保证参数估计的有效性。
Yit 1DUM 35 DUM 36
DUM 53 X 2it X 3it Uit
(16.3.6)
如果观测来自1935年,DUM35=1,否则为0,依次 类推。1954年为基准年,它的截距为 。
15
对于这个例子的数据,0直到 19 都不显著, 说明时间效应不显著。 即:投资函数并没有随时间发生很大的变 化。
个体的差异表现在截距的随机项的差异上。
前面讲过:
Yit 1i 2 X 2it 3 X 3it uit
(16.3.2) (16.4.1)
其中1i随个体而不同
25
现在假定:
β1i β1 εi i=1,2,……,N (16.4.2)
其中,εi
是均值为
0, 方差为
σ
2的随机误差项。
问:所有级差截距和级差斜率系数都显 著的经济含义?
22
答:GM(通用汽车)、US(美国钢铁)、 WEST(西屋电气)的投资函数与GE (通用电气)有显著差异。
可以建立四个完全不同的回归函数。
23
使用FEM或LSDV model的注意事项:
1.引入过多虚拟变量可能导致自由度太低。
2.引入过多虚拟变量可能导致多重共线性。
28
即个体的误差成分是不相关的,而且在横截面上和
时间序列上都不存在自相关
注:εi是不可观测的,为潜在的变量。 由 (16.4.5)可以推出:
E(wit )=0
var(w it
)
=σ
2 ε
σu2
(16.4.6) (16.4.7)
29
可见 wit是同方差的。 但是,同一横截面单元在不同时点上是相关的,
第十六章
1
面板数据回归模型:是研究经历一段时间的相同的 横截面单元(个体)的模型。
面板数据具有空间和时间两种特性。也称为:
pooled data(混合数据) combination of time series and cross-section data micropanel data lingitudinal data(纵列数据) event history analysis cohort analysis(群队分析)等等。
相关系数为:
corr(wit ,
w is
)
σ
2 ε
σε2 σu2
问:证明上式。
(16.4.8)
30
答: corr(wit , wis )
cov(wit , wis ) E[(wit 0)(wis 0)]
var(wit ) var(wis )
σ
2 ε
σu2
σ
2 ε
σu2
35
常用的检验是协方差分析检验,主要检验如下两 个假设:
H1 : 1 2 N H2 : 1 2 N
1 2 N
36
如果接受 H2 , 则可以认为样本数据符号模型(10.1.6), 无需进行进一步的检验。 接受H2 ,则必然接受H1。 如果拒绝假设H 2,则需要检验H1。 如果拒绝假设 H1 , 则认为样本符合模型 (10.1.8); 如果接受H1, 则认为样本数据符合模型(10.1.7)。