伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第14章 高级的面板数据方法【圣才出品】
《计量经济学导论》考研伍德里奇考研复习笔记二
《计量经济学导论》考研伍德里奇考研复习笔记二第1章计量经济学的性质与经济数据1.1 复习笔记一、什么是计量经济学计量经济学是以一定的经济理论为基础,运用数学与统计学的方法,通过建立计量经济模型,定量分析经济变量之间的关系。
在进行计量分析时,首先需要利用经济数据估计出模型中的未知参数,然后对模型进行检验,在模型通过检验后还可以利用计量模型来进行预测。
在进行计量分析时获得的数据有两种形式,实验数据与非实验数据:(1)非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的数据。
非实验数据有时被称为观测数据或回顾数据,以强调研究者只是被动的数据搜集者这一事实。
(2)实验数据通常是通过实验所获得的数据,但社会实验要么行不通要么实验代价高昂,所以在社会科学中要得到这些实验数据则困难得多。
二、经验经济分析的步骤经验分析就是利用数据来检验某个理论或估计某种关系。
1.对所关心问题的详细阐述问题可能涉及到对一个经济理论某特定方面的检验,或者对政府政策效果的检验。
2构造经济模型经济模型是描述各种经济关系的数理方程。
3经济模型变成计量模型先了解一下计量模型和经济模型有何关系。
与经济分析不同,在进行计量经济分析之前,必须明确函数的形式,并且计量经济模型通常都带有不确定的误差项。
通过设定一个特定的计量经济模型,我们就知道经济变量之间具体的数学关系,这样就解决了经济模型中内在的不确定性。
在多数情况下,计量经济分析是从对一个计量经济模型的设定开始的,而没有考虑模型构造的细节。
一旦设定了一个计量模型,所关心的各种假设便可用未知参数来表述。
4搜集相关变量的数据5用计量方法来估计计量模型中的参数,并规范地检验所关心的假设在某些情况下,计量模型还用于对理论的检验或对政策影响的研究。
三、经济数据的结构1横截面数据(1)横截面数据集,是指在给定时点对个人、家庭、企业、城市、州、国家或一系列其他单位采集的样本所构成的数据集。
伍德里奇计量经济学课件 (14)
Introductory Econometrics 15 of 54
证明一致性
Because as n , n 1 xi1 x1 ui 0 n
1
xi1 x1
2
does not converge to zero,
2
ˆ b plimb 1 1
Introductory Econometrics
17 of 54
一个更弱的假定
n n n
要获得估计量的无偏性,我们假定零条件期望 – E(u|x1, x2,…,xk) = 0 而要获得估计量的一致性,我们可以使用更弱的假定: 零期望和零相关性假定。 如果这个较弱的假定也不成立,OLS将是有偏而且不一 致的。
Introductory Econometrics
18 of 54
推导不一致性
n
b , 并考虑下面 定义渐近偏差为:plimb 1 1 的真实模型和待估计模型。
True model: y b 0 b1 x1 b 2 x2 v u b 2 x2 v and then, b b plimb
n
Introductory Econometrics
5 of 54
为什么考虑一致性
n
由于在很多情形下误差项可能呈现非正态 分布,了解OLS 估计量和检验统计量的渐 近性,即当样本容量任意大时的特性就是 重要的问题。
Introductory Econometrics
6 of 54
什么是一致性
令 W n 是基于样本 y1 , y2 ,..., yn 的关于 的估计量。 如果对于任何 >0 ,当 n 时 Pr(|Wn | ) 0
伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】
y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台
对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM
不
χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。
古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解
1.78
1.83
5.37
3.36
1996
2.95
1.59
0.08
2.02
1.50
3.87
2.46
1997
2.29
1.63
1.84
1.19
1.70
1.75
3.12
1998
1.56
6
0.58
0.65
0.94
3.15
3.46
1999
2.21
1.71
-0.33
0.52
0.65
1.66
1.52
4.教材图1-5背后的M1货币供给数据由表1-4给出。你能给出货币供给在表中所示时期上升的原因吗?
表1-4经季节调整的M1供给:1959年1月~1999年7月(单位:十亿美元)
资料来源:Board of Governors,Federal Reserve Bank,USA.
答:随着GDP的增加,自然而然就需要更多的货币为增加的产出提供资金支持。美国GDP是逐年增加的,因此货币供给量也相应地逐年增长。
d.哪个国家的通货膨胀率波动最大?你能给出什么样的解释呢?
答:a.通货膨胀率等于当年的CPI减去上一年度的CPI,再除以上一年度的CPI,然后乘以100。因此这些国家的通货膨胀率(%)如表1-2所示,它们是从1981年开始的年度数据。
表1-2
年份
美国
加拿大
日本
法国
德国
意大利
英国
1981
10.32
12.48
(2)横截面数据:横截面数据指对一个或多个变量在同一时间点上收集的数据。当统计分析包含有异质的单位时,必须考虑尺度或规模效应以避免造成混乱。
计量经济学伍德里奇第五版中文版)答案
第1章解决问题的办法1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。
也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。
对于原因,我们将看到在第2章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束)。
(二)呈负相关关系意味着,较大的一类大小是与较低的性能。
因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。
然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。
例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。
另一种可能性是,在学校,校长可能分配更好的学生,以小班授课。
或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。
(三)鉴于潜在的混杂因素 - 其中一些是第(ii)上市 - 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。
在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。
1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B 公司的不同?(二)公司很可能取决于工人的特点选择在职培训。
一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。
企业甚至可能歧视根据年龄,性别或种族。
也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。
此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。
(iii)该金额的资金和技术工人也将影响输出。
所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。
管理者的素质也有效果。
(iv)无,除非训练量是随机分配。
许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。
伍德里奇《计量经济学导论》 第 版 笔记和课后习题详解 章
使用普通最小二乘法,此时最小化的残差平方和为()211niii y x β=-∑利用一元微积分可以证明,1β必须满足一阶条件()110niiii x y x β=-=∑从而解出1β为:1121ni ii nii x yxβ===∑∑当且仅当0x =时,这两个估计值才是相同的。
2.2 课后习题详解一、习题1.在简单线性回归模型01y x u ββ=++中,假定()0E u ≠。
令()0E u α=,证明:这个模型总可以改写为另一种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。
证明:在方程右边加上()0E u α=,则0010y x u αββα=+++-令新的误差项为0e u α=-,因此()0E e =。
新的截距项为00αβ+,斜率不变为1β。
2(Ⅰ)利用OLS 估计GPA 和ACT 的关系;也就是说,求出如下方程中的截距和斜率估计值01ˆˆGPA ACT ββ=+^评价这个关系的方向。
这里的截距有没有一个有用的解释?请说明。
如果ACT 分数提高5分,预期GPA 会提高多少?(Ⅱ)计算每次观测的拟合值和残差,并验证残差和(近似)为零。
(Ⅲ)当20ACT =时,GPA 的预测值为多少?(Ⅳ)对这8个学生来说,GPA 的变异中,有多少能由ACT 解释?试说明。
答:(Ⅰ)变量的均值为: 3.2125GPA =,25.875ACT =。
()()15.8125niii GPA GPA ACT ACT =--=∑根据公式2.19可得:1ˆ 5.8125/56.8750.1022β==。
根据公式2.17可知:0ˆ 3.21250.102225.8750.5681β=-⨯=。
因此0.56810.1022GPA ACT =+^。
此处截距没有一个很好的解释,因为对样本而言,ACT 并不接近0。
如果ACT 分数提高5分,预期GPA 会提高0.1022×5=0.511。
(Ⅱ)每次观测的拟合值和残差表如表2-3所示:根据表可知,残差和为-0.002,忽略固有的舍入误差,残差和近似为零。
伍德里奇《计量经济学导论》笔记和课后习题详解(简单回归模型)【圣才出品】
β1 就是斜率参数。
②给定零条件均值假定 E(u|x)=0,把斱程中的 y 看成两个部分是比较有用的。一
部分是表示 E(y|x)的 β0+β1一个
部分是被称为非系统部分的 u,即丌能由 x 觋释的那一部分。
二、普通最小二乘法的推导
1.最小二乘估计值
表 2-1 简单回归的术语
3.零条件均值假定 (1)零条件均值 u 的平均值不 x 值无关。可以把它写作:E(u|x)=E(u)。当斱程成立时,就说 u 的均值独立亍 x。 (2)零条件均值假定的意义 ①零条件均值假定给出 β1 的另一种非常有用的觋释。以 x 为条件叏期望值,幵利用 E
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 2 章 简单回归模型
2.1 复习笔记
一、简单回归模型的定义 1.双发量线性回归模型 一个简单的斱程是:y=β0+β1x+u。 假定斱程在所关注的总体中成立,它便定义了一个简单线性回归模型。因为它把两个发 量 x 和 y 联系起来,所以又把它称为两发量戒者双发量线性回归模型。 2.回归术语
E x y β0 β1x 0
得到
1 n
n i1
yi βˆ0 βˆ1xi
0
和
2 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
1
n
n i 1
xi
yi βˆ0 βˆ1xi
0
这两个斱程可用来觋出 βˆ0 和 βˆ1 , y βˆ0 βˆ1x ,则 βˆ0 y βˆ1x 。
量了 yi 的样本发异,SSR 度量了 ui 的样本发异。y 的总发异总能表示成觋释了的发异和未
觋释的发异 SSR 乊和。因此,SST=SSE+SSR。
伍德里奇《计量经济学导论》笔记和课后习题详解(高深的面板数据方法)【圣才出品】
二、随机敁应模型
1.随机敁应模型
仍同一个非观测敁应模型开始,
yit β0 β1xit1 β2 xit2
βk xitk αi uit
(1)
明确引入一个截距项,假定非观测敁应 αi 有零均值,且不每一个解释变量都无关:Cov
(xitj,αi)=0,t=1,2,…,T;j=1,2,…,k,则斱程(1)就成为一个随机敁应模型。
2 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
板数据集来说丌是徆现实。 ②它所给出的 βj 估计值不用除均值数据所做回弻得到的估计值恰好一样,而且标准误
和其他主要统计量也一样。因此,固定敁应估计量可以由虚拟变量回弻得到。 ③可以直接算出恰弼的自由度。 ④仍虚拟变量回弻算出的 R2 通常都比较高。 ⑤仍虚拟变量回弻得到的 R2,可按通常斱法用亍计算 F 检验。 3.是固定敁应(FE)还是一阶差分(FD) 估计非观测敁应模型的两种斱法:一种是叏数据的差分,一种是除时间均值。 两种斱法的选择: (1)弼 T=2 时,FE 和 FD 的估计值及其全部检验统计量完全一样,敀可随便选用一
一个重要的理论事实是,FD 估计量中的偏误丌叏决亍 T,而 FE 估计量中的偏误则以速 度 1/T 趋亍零。弼 FE 和 FD 给出明显丌同的结果时,通常在两者乊间作出叏舍就徆困难。
3 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
同时报告两组结果幵试图判断差异的原因所在。 4.非平衡面板数据的固定敁应法 在一些面板数据集中,样本缺少了某些横截面单位的某些年仹数据,称数据集为非平衡
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 14 章 高定敁应估计法
计量经济学伍德里奇第五版中文版答案
第1章解决问题的办法1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。
也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。
对于原因,我们将看到在第2章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束)。
(二)呈负相关关系意味着,较大的一类大小是与较低的性能。
因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。
然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。
例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。
另一种可能性是,在学校,校长可能分配更好的学生,以小班授课。
或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。
(三)鉴于潜在的混杂因素 - 其中一些是第(ii)上市 - 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。
在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。
1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B公司的不同?(二)公司很可能取决于工人的特点选择在职培训。
一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。
企业甚至可能歧视根据年龄,性别或种族。
也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。
此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。
(iii)该金额的资金和技术工人也将影响输出。
所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。
管理者的素质也有效果。
(iv)无,除非训练量是随机分配。
许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。
伍德里奇计量经济学导论第5版笔记和课后习题详解
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解目录第1章计量经济学的性质与经济数据1.1复习笔记1.2课后习题详解第一篇横截面数据的回归分析第2章简单回归模型2.1复习笔记2.2课后习题详解第3章多元回归分析:估计3.1复习笔记3.2课后习题详解第4章多元回归分析:推断4.1复习笔记4.2课后习题详解第5章多元回归分析:OLS的渐近性5.1复习笔记5.2课后习题详解第6章多元回归分析:深入专题6.1复习笔记6.2课后习题详解第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记7.2课后习题详解第8章异方差性8.1复习笔记8.2课后习题详解第9章模型设定和数据问题的深入探讨9.1复习笔记9.2课后习题详解第二篇时间序列数据的回归分析第10章时间序列数据的基本回归分析10.1复习笔记10.2课后习题详解第11章OLS用于时间序列数据的其他问题11.1复习笔记11.2课后习题详解第12章时间序列回归中的序列相关和异方差性12.1复习笔记12.2课后习题详解第三篇高级专题讨论第13章跨时横截面的混合:简单面板数据方法13.1复习笔记13.2课后习题详解第14章高级的面板数据方法14.2课后习题详解第15章工具变量估计与两阶段最小二乘法15.1复习笔记15.2课后习题详解第16章联立方程模型16.1复习笔记16.2课后习题详解第17章限值因变量模型和样本选择纠正17.1复习笔记17.2课后习题详解第18章时间序列高级专题18.1复习笔记18.2课后习题详解第19章一个经验项目的实施19.2课后习题详解本书是伍德里奇《计量经济学导论》(第5版)教材的学习辅导书,主要包括以下内容:(1)整理名校笔记,浓缩内容精华。
每章的复习笔记以伍德里奇所著的《计量经济学导论》(第5版)为主,并结合国内外其他计量经济学经典教材对各章的重难点进行了整理,因此,本书的内容几乎浓缩了经典教材的知识精华。
(2)解析课后习题,提供详尽答案。
计量经济学(伍德里奇第五版中文版)答案
计量经济学(伍德里奇第五版中文版)答案(三)鉴于潜在的混杂因素- 其中一些是第(ii)上市- 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。
在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。
1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B公司的不同?(二)公司很可能取决于工人的特点选择在职培训。
一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。
企业甚至可能歧视根据年龄,性别或种族。
也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。
此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。
(iii)该金额的资金和技术工人也将影响输出。
所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。
管理者的素质也有效果。
(iv)无,除非训练量是随机分配。
许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。
1.3没有任何意义,提出这个问题的因果关系。
经济学家会认为学生选择的混合学习和工作(和其他活动,如上课,休闲,睡觉)的基础上的理性行为,如效用最大化的约束,在一个星期只有168小时。
然后我们可以使用统计方法来衡量之间的关联学习和工作,包括回归分析,我们覆盖第2章开始。
但我们不会声称一个变量“使”等。
他们都选择学生的变量。
第2章解决问题的办法2.1(I)的收入,年龄,家庭背景(如兄弟姐妹的人数)仅仅是几个可能性。
似乎每个可以与这些年的教育。
(收入和教育可能是正相关,可能是负相关,年龄和受教育,因为在最近的同伙有妇女,平均而言,更多的教育和兄弟姐妹和教育的人数可能呈负相关)。
(ii)不会(i)部分中列出的因素,我们与EDUC。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解(第4~6章)【圣才出品】
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解第4章多元回归分析:推断4.1复习笔记一、OLS 估计量的抽样分布1.假定MLR.6(正态性)总体误差u 独立于解释变量12 k x x x ,,…,,而且服从均值为零和方差为2σ的正态分布:()2Normal 0 u σ~,。
2.经典线性模型就横截面回归中的应用而言,从假定MLR.1~MLR.6这六个假定被称为经典线性模型假定。
将这六个假定下的模型称为经典线性模型(CLM)。
在CLM 假定下,OLS 估计量01ˆˆˆ kβββ,,…,比在高斯—马尔可夫假定下具有更强的效率性质。
可以证明,OLS 估计量是最小方差无偏估计,即在所有的无偏估计中,OLS 具有最小的方差。
总结CLM 总体假定的一种简洁方法是:()201122|Normal k k y x x x x ββββσ++++~…,误差项的正态性导致OLS 估计量的正态抽样分布。
3.用中心极限定理去推导u 的分布的缺陷(1)虽然u 是影响y 而又观测不到的众多因素之和,且各因素可能各有极为不同的总体分布,但中心极限定理(CLT)在这些情形下仍成立。
正态近似的效果取决于u 中有多少因素,以及u 中包含因素分布的差异。
(2)更严重的问题是,正态近似假定所有不可观测因素都以独立而可加的方式影响着Y。
因此如果u 是不可观测因素的一个复杂函数,那么CLT 论证并不真正适用。
4.误差项的正态性导致OLS 估计量的正态抽样分布定理4.1:正态抽样分布在CLM 假定MLR.1~MLR.6下,以自变量的样本值为条件,有:()ˆˆ~Normal Var j j j βββ⎡⎤⎣⎦,因此()()()ˆˆ/sd ~Normal 0 1j j j βββ-,注:除ˆj β服从正态分布外,01ˆˆˆ k βββ,,…,的任何线性组合也都是正态分布,而且ˆjβ的任何一个子集也都具有一个联合正态分布。
二、检验对单个总体参数的假设:t 检验1.总体回归函数总体模型可写作:11o k k y x x uβββ=++⋯++假定它满足CLM 假定,OLS 得到j β的无偏估计量。
计量经济学导论伍德里奇课后答案中文
2.10(iii) From (2.57), Var(1ˆβ) = σ2/21()n i i x x =⎛⎫- ⎪⎝⎭∑. 由提示:: 21n ii x =∑ ≥ 21()n i i x x =-∑, and so Var(1β) ≤ Var(1ˆβ). A more direct way to see this is to write(一个更直接的方式看到这是编写) 21()ni i x x =-∑ = 221()n i i x n x =-∑, which is less than21n i i x=∑unless x = 0.(iv)给定的c 2i x 但随着x 的增加, 1ˆβ的方差与Var(1β)的相关性也增加.0β小时1β的偏差也小.因此, 在均方误差的基础上不管我们选择0β还是1β要取决于0β,x ,和n 的大小 (除了 21n i i x=∑的大小).3.7We can use Table 3.2. By definition, 2β > 0, and by assumption, Corr(x 1,x 2) < 0. Therefore, there is a negative bias in 1β: E(1β) < 1β. This means that, on average across different random samples, the simpleregression estimator underestimates the effect of the training program. It is even possible that E(1β) isnegative even though 1β > 0. 我们可以使用表3.2。
根据定义,> 0,由假设,科尔(X1,X2)<0。
因此,有一个负偏压为:E ()<。
这意味着,平均在不同的随机抽样,简单的回归估计低估的培训计划的效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第14章高级的面板数据方法
14.1复习笔记
一、固定效应估计法
1.固定效应变换
固定效应变换又称组内变换,考虑仅有一个解释变量的模型:对每个i,有
1 1
2 it it i it y x a u t T
β=++=,,,…,对每个i 求方程在时间上的平均,便得到
1i i i i
y x a u β=++其中,11T it t y T y
-==∑(关于时间的均值)。
因为a i 在不同时间固定不变,故它会在原模型和均值模型中都出现,如果对于每个t,两式相减,便得到()1 1 2 it i it i it i y y x x u u t T
β-=-+-=,,,…,或
1 1
2 it it it y x u t T
β=+= ,,,…,其中,it it i y y y =- 是y 的除时间均值数据;对it x
和it u 的解释也类似。
方程的要点在于,非观测效应a i 已随之消失,从而可以使用混合OLS 去估计式1 1 2 it it it y x u t T β=+= ,,,…,。
上式的混合OLS 估计量被称为固定效应估计量或组内估计量。
组间估计量可以从1i i i i y x a u β=++的OLS 估计量而得到,即同时使用y 和x 的时间平均值做一个横截面回归。
如果a i 与i x 相关,估计量是有偏误的。
而如果认为a i 与x it 无关,则使用随机效应估计量要更好。
组间估计量忽视了变量如何随着时间而变化。
2.原始的非观测效应模型
1122 1 2 it it it k itk i it y x x x a u t T
βββ=++⋅⋅⋅+++=,,,…,只需对每个解释变量(包括诸如时期虚拟变量)都除去其时间均值,然后利用全部除时间均值后的变量做混合OLS 回归即可。
在解释变量的严格外生性假定下,固定效用估计量是无偏的:粗略地说,特异误差u it 应与所有时期的每个解释变量都无关。
固定效应估计量如一阶差分估计量一样,容许a i 与任何时期的解释变量任意相关,因为在时间上恒定的解释变量都必定随固定效应变换而消失。
3.固定效应估计量自由度的决定
用混合OLS 估计除时间均值的方程时,总共有NT 个观测值和k 个自变量(截距被固定效应变换消去了),而对于每一个横截面,在时间上取均值都会损失一个自由度,故N 个个体要损失N 个自由度,正确的自由度是
()1df NT N k N T k
=--=--4.衡量拟合优度
根据组内变换计算的R 2,应把它解释为y it 的时间变异被解释变量的时间变异所解释的部分。
5.虚拟变量回归
对每个i 估计一个截距,连同解释变量一起给每一个横截面观测(单位)安排一个虚拟
变量(也许还给每个时期安排有虚拟变量)。
这一方法常被称为虚拟变量回归。
虚拟变量法的特点:
①即使N 还不是很大时,使用此法都会导致产生许多解释变量,以致在大多数情况下,解释变量多到无法进行回归的程度。
因此,虚拟变量法对含有许多横截面观测(单位)的面板数据集来说不是很现实。
②它所给出的j β估计值与用除均值数据所做回归得到的估计值恰好一样,而且标准误和其他主要统计量也一样。
因此,固定效应估计量可以由虚拟变量回归得到。
③可以直接算出恰当的自由度。
④从虚拟变量回归算出的R 2通常都比较高。
这是因为对每一横截面都包含一个虚拟变量,以至于能解释数据中的大部分变异。
⑤从虚拟变量回归得到的R 2,可按通常方法用于计算F 检验。
ˆi a 的计算:11ˆˆˆ....12i ik i k
i a y x x i N ββ=---= ,,,,6.是固定效应(FE)还是一阶差分(FD)
估计非观测效应模型的两种方法:一种是取数据的差分,一种是除时间均值。
两种方法的选择:
(1)当T=2时,FE 和FD 的估计值及其全部检验统计量完全一样,故可随便选用一种。
这种等价是建立在估计相同的模型,因此为了使FE 估计与包含截距的FD 估计完全相同,必须在FE 估计中包含表示第二个时期的虚拟变量。
在T=2时,取一阶差分有一个好处:几乎无论用什么计量经济学软件包,一阶差分法都直截了当地实施,而且在FD 估计之后,还很容易计算异方差—稳健的统计量。
(2)当T≥3时,FE和FD估计量便不相同。
在混合OLS假定成立的条件下,二者都是无偏与一致的,对于较大的N和较小的T,FE和FD之间的选择关键在其估计量的相对效率,而这将由特异误差u it中的序列相关性决定。
①当u it无序列相关时,固定效应法比一阶差分更有效,并且得自固定效应的标准误是确当的。
因为固定效应模型的特异误差是序列无关的。
②如果u it遵循一个随机游走(就是说有一个很强的正的序列相关),那么差分
u 便序
it
列无关,这时一阶差分法便更好。
但在许多情形中,u it表现出某种正的序列相关,却未必达到一个随机游走的程度,这时要比较FE和FD估计量的效率就不那么容易。
一个重要的理论事实是,FD估计量中的偏误不取决于T,而FE估计量中的偏误则以速度1/T趋于零。
当FE和FD给出明显不同的结果时,通常在两者之间作出取舍就很困难。
应同时报告两组结果并试图判断差异的原因所在。
7.非平衡面板数据的固定效应法
在一些面板数据集中,样本缺少了某些横截面单位的某些年份数据,称数据集为非平衡面板数据。
设T i为横截面单位i的时期数,只需用T i个观测去做除时间均值的运算。
观测总数将是T1+T2+…+T N。
与平衡面板数据的情形一样,对每一个观测横截面,都因除时间均值运算而失去一个自由度。
任何一个做固定效应的回归软件包都会做出适当的自由度损失调整。
虚拟变量回归也和平衡面板数据情形完全一样,但要适当地调整自由度。
二、随机效应模型
1.随机效应模型
对于一个非观测效应模型:
01122it it it k itk i it
y x x x a u ββββ=+++⋅⋅⋅+++(1)
引入一个截距项,假定非观测效应a i 有零均值,且与每一个解释变量都无关:()Cov 0 1 2 1 2 itj i x a t T j k
===,,,,…,;,,…,则方程(1)就成为一个随机效应模型。
理想的随机效应假定包括全部固定效应假定,再加上a i 独立于所有时期中每一个解释变量的假定。
如果非观测效应a i 会与任何一个解释变量相关,那么就是固定效应模型,应该对固定效应做一阶差分或者求组内均值。
2.参数的估计
a i 与解释变量无关,可以用单个横截面一致的估计j β,但是只用单个横截面去估计就忽视了其他时期的许多有用信息。
此外,利用混合OLS 将y it 对解释变量也许还加上时间虚拟变量做OLS 回归,在随机效应假定下,也能得到j β的一致估计量,但误差项存在序列相关,如果定义复合误差项为
it i it
v a u =+则式(1)可写为:
01122it it it k itk it
y x x x v ββββ=+++⋅⋅⋅++由于a i 在每个时期都是复合误差的一部分,所以不同时期的v it 应该序列相关。
在随机效应假定下:
()()222Corr / it is a a u v v t s
σσσ=+≠,,其中,()()22Var Var a i u it a u σσ==,。
误差项中这种(必然是)正的序列相关可
能很大:由于通常的混合OLS 标准误忽视了这种相关,所以不正确,从而通常用的检验统计量也不正确。
(1)用GLS 解决序列相关性问题
假定有足够大的N 和相对较小的T,面板为平衡面板。
定义()1/22221/u u a λσσσ⎡⎤=-+⎣⎦它介于0与1之间。
(由GLS 求得的,参见Wooldridge(2002,Chapter10))。
于是,变换后的方程是:()()()()
01111it i it i k itk ik it i y y x x x x v v λβλβλβλλ-=-+-+⋅⋅⋅+-+-它使用每个变量的准除均值数据。
固定效应估计量从相应变量中减去其时间均值,而随机效应变换只减去其时间均值的一个比例,这个比例取决于2u σ、2a σ和时期数T。
GLS 估计量就是变换后的方程的混合OLS 估计量,变换方程容许考虑不随时间而变化的解释变量,与固定效应或一阶差分模型相比,这是随机效应(RE)模型的一个优点。
(2)随机效应估计量
要得到随机效应估计量,必须先知道λ,实际上,参数λ是未知的,但又总是可以估计的,有很多种估计的方法。
利用混合OLS 或固定效应做出估计:
(){}1/2
22ˆˆˆ11/1/a u T λσσ⎡⎤=-+⎣⎦其中2ˆa σ是2a σ的一个一致估计量,而2ˆu σ是2u σ的一个一致估计量。
这些估计量是根据混合OLS 残差或固定效应残差计算的,一种可能性是:
()()112121ˆˆˆ1/21N T T a it is
i t S t NT T k v
v σ--===+=--+⎡⎤⎣⎦∑∑∑其中ˆit v
是用混合OLS 估计式01122it it it k itk it
y x x x v ββββ=+++⋅⋅⋅++的残差。