面板数据
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
yit D it
j
ˆy y
1
7 © School of Management and Economics
0
处理组为1, 对照组为0
第十讲 自然实验和面板数据
第三种方案
同时收集事件发生前后处理组和对照组的数据
yit Dt D Dt D it
© School of Management and Economics
第十讲 自然实验和面板数据
随机效应
REM的基本思路
Yit 1i 2 X 2it 3 X 3it uit E ( 1i ) i 2 X 2it 3 X 3it uit 1 2 X 2it 3 X 3it wit
1 代表GE的截距项,而 2 ,3 ,4 就能够说明其
它3家公司的截距项相对于GE的截距项有多大的不同, 即级差截距系数。
由于我们使用虚拟变量来刻画固定效应,并使用 OLS来估计,因此上述模型也被称为最小二乘虚拟 变量模型(LSDV)
这些截距上的差异 可能由每个公司独 特的性质引起。
那个模型更好呢?
© School of Management and Economics
第十讲 自然实验和面板数据
混合回归(PLS)
所有系数都不随时间和个体的变化而变化
Yit 1 2 X 2it 3 X 3it uit
直接用OLS估计(混合回归)
© School of Management and Economics
主要内容
随机分配实验和自然实验 面板数据(Panel data) 固定效应 随机效应 固定效应和随机效应模型的比较
© School of Management and Economics
第十讲 自然实验和面板数据
经济学中的实验方法
随机分配实验
处理组(treatment group):参与实验人员 对照组(comparison group)或控制组(control group):没有参与实验的人员
© School of Management and Economics
例子:投资理论研究
为研究实际总投资(I)对实际资本存量(CAP)和企业 实际价值(PL)的关系,收集了4个公司,即通用电气 (GE)、通用汽车(GM)、美国钢铁(US)和西屋 (WEST),20年(1935-1954)的数据,共80个观测值 (data_panel)。
你能设计一个实证检验方案吗?
收集成都市在改革前后的相关数据,进行纵向对比检验? 在某一个时间上收集成都市与其它非试点城市的相关数据, 进行横向比较? 同时收集成都市与其它非试点城市的相关数据,进行比较?
© School of Management and Economicsห้องสมุดไป่ตู้
第十讲 自然实验和面板数据
ˆ ˆ ˆi 1i 1
© School of Management and Economics
随机效应
(1)
i
(2) 1i 1 i (3) E ( i ) 0
固定效应 虽然两个模型估计结果相似,但随机效应模型更 简洁:方法只引进了一个参数就能够刻画面板数 据的个体差异。
第十讲 自然实验和面板数据
模型选择
研究者经常面临的选择:FEM还是REM? 若扰动εi项与X不相关,那么选REM。
若扰动εi项与X相关,那么选FEM。 REM的基本假设:εi 是一个非常大的总体 中提取的随机变量。
© School of Management and Economics
第十讲 自然实验和面板数据
模型扩展
加入其它控制变量
yit Dt D Dt D Xθ it
j j
9 © School of Management and Economics
第十讲 自然实验和面板数据
面板数据
常用的经济数据类型
横截面数据:空间 时间序列数据:时间 面板数据(混合数据、综列数据)
现在的问题是,1i 是不可观测的,怎样实现 模型的估计?
由于4个公司的截距项不同,一种直观的考虑是以其中一 个公司的截距项作为标准,其余3个公司的截距项在此基 础上作比较,而这通过虚拟变量可以很容易地实现:
Yit 1 2 D2i 3 D3i 4 D4i 2 X 2it 3 X 3it uit
2 i~N (0, 2 ), uit~N (0, u ) wit i uit
© School of Management and Economics
第十讲 自然实验和面板数据
随机效应
个体的截距项表示为 1i E( 1i ) i ,即这些个 体都来自于同一个大样本,具有相同的均值和方 差,并且每个个体的截距项的差异反映在误差项 i 中。 模型总的误差项是一个合成误差项,它由两个部 分的误差组成 wit i uit ,前者是特定个体横截 面误差部分,后者是时间序列和横截面混合误差 部分。
计算出Wald统计量,查表,若显著则说明采用固定 效应模型较好。
© School of Management and Economics
Eviews6.0能直接实现Hausman检验
不显著,表示 应该选择REM
双击
单击
考虑如下模型:
I 1 2CAP 3 PL u
关键是选取那些数据进行回归?
可对4个公司的时间序列数据分别做回归(4次) 也可在每一年都做一次横截面回归(20次) 同时利用4个公司20年的数据做1次回归
Yit 1 2 X 2it 3 X 3it uit i 1, 2, 3, 4 uit~N (0, 2 ) t 1, 2,..., 20
引进过多的虚拟变量会损失大量自由度。 大量解释变量不可避免地会带来多重共线性问题 误差项服从经典假设的正态分布很值得商榷。
© School of Management and Economics
第十讲 自然实验和面板数据
随机效应
如果虚拟变量确实代表了对于(真实)模型知识 的一种缺乏,那么为什么不通过干扰项来表达这 种无知呢? 基于干扰项的面板数据建模方法叫做随机效应模型 (Random Effect Model, REM )或误差组成模型 (ECM)。
模型选择
Hausman 检验 由Hausman(1978)提出,构造的统计量是Wald统计量
ˆ ] ˆ ] ~ 2 (k ) ˆ 1[b W [b
ˆ ) var( ˆ) var( b b) var(
ˆ 是随机效应估计的结果。 其中b是固定效应的估计结果;
第十讲 自然实验和面板数据
计 量 经 济 学
Econometrics
© School of Management and Economics
第十讲 自然实验和面板数据
第十讲 自然实验和面板数据
(教材16章)
© School of Management and Economics
第十讲 自然实验和面板数据
第一种方案
收集处理组在事件发生前后的数据
事件之前为0, 事件之后为1
yit Dt it
ˆ y y y 1 0
6 © School of Management and Economics
第十讲 自然实验和面板数据
第二种方案
收集事件发生后处理组和对照组的数据
从输出结果各项指标来看,LSDV较好。
也可从F检验的角度来比较。事实上,OLS是 LSDV的约束模型。
H0:D2=D3=D4
显著拒绝原假设。
第十讲 自然实验和面板数据
固定效应
放宽的假设2:斜率系数不变而截距随时间变化
Yit 0 1DUM35 ... 19 DUM53 2 X 2it 3 X 3it uit
Yit 1 2 X 2it 3 X 3it vi uit
虽然截距随个体变化,但不随时间变化,即在时间 上4个公司的截距项是固定不变的,因此称该模型 为固定效应模型(Fixed Effect Model, FEM)
© School of Management and Economics
第十讲 自然实验和面板数据
面板数据回归
面板数据回归模型的估计
由于同时考虑时间和个体上的数据,对面板数据模型 的估计方法取决于对截距、斜率和误差项在时间和个 体上的假设: 所有系数不随时间和个体的变化而变化 斜率不变而截距随个体变化而变化 斜率不变而截距随时间和个体变化而变化 斜率和截距随个体变化而变化 斜率和截距随个体和时间变化而变化 ……
© School of Management and Economics
在Eviews中可以通过菜单直接估计固定效应模型。
单击
第十讲 自然实验和面板数据
固定效应
双因素固定效应模型
Yit 1 2 X 2it 3 X 3it vi t uit
使用固定效应模型注意事项
第十讲 自然实验和面板数据
面板数据
为什么使用面板数据?
既能体现横截面上不同个体的差异性,又能反映出某 一个体的历史信息。 可以提供“更有价值的数据,变量之间增加了多变性 而减少了共线性,并且提高了自由度和估计的有效 性”。 更好地检测和度量单纯使用横截面数据或时间序列数 据无法观测到的影响。 通过使数据适用于多个单元,面板数据能够将累加数 据所引起的偏差降到最低。
自然实验(natural experiment)
观测值自然产生,由外生事件引起 自然事件、政策变动
© School of Management and Economics
第十讲 自然实验和面板数据
思考题
成都市在全国率先试点城乡一体化综合配套改革。 十年过去了,你想检验一下改革的成效。
© School of Management and Economics
第十讲 自然实验和面板数据
随机效应
注意:
FEM中,每个横截面单元都有各自的固定截距值,N 个横截面单元就有N个这样的值。 REM中,截距 1 代表所有横截面截距的均值,而误差 部分 i 则表示单个截距对这个平均值的随机偏离,如 果得到 i 的估计值,就可以得到个体截距的估计值
其中 DUM35,DUM36,...,DUM35 表示时间虚拟变量, 0 表示将1954年的截距项作为基准。 由于考虑了回归模型随时间的改变,因此称为时间效 应模型(固定效应模型)
Yit 1t 2 X 2it 3 X 3it uit Yit 1 2 X 2it 3 X 3it t uit
存在的问题:假设4家不同的公司的截距项和斜率系数 都完全相同,这是相当严格的假设,很可能扭曲了4个 公司Y和X之间关系的真实情况
第十讲 自然实验和面板数据
固定效应
放宽的假设1:斜率系数不变但截距随个体而变化
Yit 1i 2 X 2it 3 X 3it uit
下标i 加到截距项上,表明4个公司的截距是不相同的, 这种差异可能是由于每个公司的特性所引起的。
© School of Management and Economics
第十讲 自然实验和面板数据
面板数据的类型
微观面板:个体数N较大,而时期数T较短
个体(家庭或企业)调查数据
宏观面板:个体数N适度,时期数T较长
宏观经济数据
© School of Management and Economics
j j
ˆ y1 y 0 ( y1 y1 ) ( y 0 y 0 ) 0 0 1 0 1 0
处理组在事件 之后的变化情况
8 © School of Management and Economics
Difference-in-difference
第十讲 自然实验和面板数据