伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章 工具变量估计与两阶段最小二乘法【圣
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第17章 限值因变量模型和样本选择纠正【圣才
第17章限值因变量模型和样本选择纠正17.1复习笔记一、二值响应的对数单位和概率单位模型1.线性概率模型的不足(1)拟合出来的概率可能小于0或大于1;(2)任何一个解释变量(以水平值形式出现)的偏效应都是不变的。
二值响应模型的核心是响应概率:()()12P 1x P 1 k y y x x x ===⋅⋅⋅,,,其中,用x 表示全部解释变量所构成的集合。
2.设定对数单位和概率单位模型(1)二值响应模型在LPM 中,响应概率对一系列参数j β是线性的,为避免LPM 的局限性,考虑二值响应模型:()()()01101x k k P y G x x G x βββββ==++⋅⋅⋅+=+其中,G 是一个取值范围严格介于0和1之间的函数:对所有实数z,都有0﹤G(z)﹤1。
这就确保估计出来的响应概率严格地介于0和1之间。
(2)函数G 的各种非线性形式①对数单位模型中,G 是对数函数:()()()()exp /1exp G z z z z =+=Λ⎡⎤⎣⎦对所有的实数z,它都介于0和1之间。
它是一个标准逻辑斯蒂随机变量的累积分布函数。
②概率单位模型中,G 是标准正态的累积分布函数,可表示为积分()()()d z G z z v vφ-∞=Φ≡⎰其中,()z φ是标准正态密度函数()()()1/222exp /2z z φπ-=-也确保了对所有参数和x j 的值都严格介于0和1之间。
③两个模型中G 函数都是增函数,在z=0时增加的最快,在z →-∞时,()0G z →,而在z →∞时,()1G z →。
(3)两种函数形式的推导对数单位和概率单位模型都可以由一个满足经典线性模型假定的潜变量模型推导出来。
令y *为一个由0y x e ββ*=++,y=1[y *﹥0]决定的无法观测变量或潜变量。
在其中引入记号1[·]来定义一个二值结果。
函数1[·]被称为指标函数,它在括号中的事件正确时取值1,而在其他情况下取值0。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第13章 跨时横截面的混合:简单面板数据方法
第13章跨时横截面的混合:简单面板数据方法13.1复习笔记一、数据集的种类1.独立混合横截面数据它是在不同时点(经常但并不一定是不同年份)从一个大总体里进行随机抽样的结果。
重要特点:它们都是由独立抽取的观测所构成。
主要性质:保持其他条件不变,它排除了不同观测误差项的相关。
一个独立混合横截面和单独一个随机样本的差异在于,在不同时点上对总体进行抽样很可能导致观测点(即观测结果)不是同分布的情形(因为随着时间的变化,总体的分布可能已经发生变化)。
2.面板数据集它虽然兼有横截面和时间序列维度,但在一些重要方面却不同于独立混合横截面,有时又称纵列数据。
面板数据是在不同时间跟踪相同的一些个人、家庭、企业、城市、州或者其他单位,从这些跟踪的对象中收集的数据,在同一个时点上有多个个体的观测值,同时每一个个体又有几个不同时期的观测值。
二、跨时独立横截面的混合1.使用独立混合横截面的理由每个时期都抽取一个随机样本,然后把所得到的随机样本合并起来作为一个大的样本就是一个独立混合横截面。
使用独立混合横截面的一个理由是要加大样本容量,把不同时点从同一总体中抽取的多个随机样本混合起来使用,可以获取更精密的估计量和更具功效的检验统计量,仅当因变量和某些自变量保持着不随时间而变化的关系时,混合才是有用的。
使用混合截面只会带来少量的统计复杂性,因为总体在不同时期可能会有不同的分布,为了反映这种情况需要允许截距在不同时期有不同的值,因此通过引入年度虚拟变量就可以解决这个问题。
2.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别①检验的一种形式是,把混合估计的残差平方和看作约束SSR ;无约束的SSR 则是对两个时期分别估计而得的两个SSR 之和,然后按照邹至庄检验的步骤计算F 统计量。
②检验的另一种方法:先将每一变量对两个年度虚拟变量之一形成交互作用,再检验这个年度虚拟变量和全部交互项是否联合显著。
伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】
y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台
对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM
不
χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】
第三篇高级专题第13章跨时横截面的混合:简单面板数据方法13.1 复习笔记考点一:跨时独立横截面的混合★★★★★1.独立混合横截面数据的定义独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。
这种数据的重要特征在于:都是由独立抽取的观测所构成的。
在保持其他条件不变时,该数据排除了不同观测误差项的相关性。
区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。
2.使用独立混合横截面的理由(见表13-1)表13-1 使用独立混合横截面的理由3.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2 用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(2)对多个时期计算邹至庄检验统计量的办法①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。
②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。
然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。
若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k 个约束。
而无约束模型中有T+Tk个待估计参数。
所以,F检验的df为(T-1)k和n-T -Tk,其中n为总观测次数。
F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。
但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。
4.利用混合横截面作政策分析(1)自然实验与真实实验当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。
一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第14章 高级的面板数据方法【圣才出品】
第14章高级的面板数据方法14.1复习笔记一、固定效应估计法1.固定效应变换固定效应变换又称组内变换,考虑仅有一个解释变量的模型:对每个i,有1 12 it it i it y x a u t Tβ=++=,,,…,对每个i 求方程在时间上的平均,便得到1i i i iy x a u β=++其中,11T it t y T y-==∑(关于时间的均值)。
因为a i 在不同时间固定不变,故它会在原模型和均值模型中都出现,如果对于每个t,两式相减,便得到()1 1 2 it i it i it i y y x x u u t Tβ-=-+-=,,,…,或1 12 it it it y x u t Tβ=+= ,,,…,其中,it it i y y y =- 是y 的除时间均值数据;对it x和it u 的解释也类似。
方程的要点在于,非观测效应a i 已随之消失,从而可以使用混合OLS 去估计式1 1 2 it it it y x u t T β=+= ,,,…,。
上式的混合OLS 估计量被称为固定效应估计量或组内估计量。
组间估计量可以从1i i i i y x a u β=++的OLS 估计量而得到,即同时使用y 和x 的时间平均值做一个横截面回归。
如果a i 与i x 相关,估计量是有偏误的。
而如果认为a i 与x it 无关,则使用随机效应估计量要更好。
组间估计量忽视了变量如何随着时间而变化。
2.原始的非观测效应模型1122 1 2 it it it k itk i it y x x x a u t Tβββ=++⋅⋅⋅+++=,,,…,只需对每个解释变量(包括诸如时期虚拟变量)都除去其时间均值,然后利用全部除时间均值后的变量做混合OLS 回归即可。
在解释变量的严格外生性假定下,固定效用估计量是无偏的:粗略地说,特异误差u it 应与所有时期的每个解释变量都无关。
固定效应估计量如一阶差分估计量一样,容许a i 与任何时期的解释变量任意相关,因为在时间上恒定的解释变量都必定随固定效应变换而消失。
计量经济学伍德里奇第五版中文版)答案
第1章解决问题的办法1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。
也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。
对于原因,我们将看到在第2章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束)。
(二)呈负相关关系意味着,较大的一类大小是与较低的性能。
因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。
然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。
例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。
另一种可能性是,在学校,校长可能分配更好的学生,以小班授课。
或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。
(三)鉴于潜在的混杂因素 - 其中一些是第(ii)上市 - 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。
在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。
1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B 公司的不同?(二)公司很可能取决于工人的特点选择在职培训。
一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。
企业甚至可能歧视根据年龄,性别或种族。
也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。
此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。
(iii)该金额的资金和技术工人也将影响输出。
所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。
管理者的素质也有效果。
(iv)无,除非训练量是随机分配。
许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。
伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】
伍德⾥奇《计量经济学导论》笔记和课后习题详解(⼀个经验项⽬的实施)【圣才出品】第19章⼀个经验项⽬的实施19.1 复习笔记⼀、问题的提出提出⼀个⾮常明确的问题,其重要性不容忽视。
如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚⾄收集错误时期的数据。
1.查找数据的⽅法《经济⽂献杂志》有⼀套细致的分类体系,其中每篇论⽂都有⼀组标识码,从⽽将其归于经济学的某⼀⼦领域之中。
因特⽹(Internet)服务使得搜寻各种主题的已发表论⽂更为⽅便。
《社会科学引⽤索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论⽂时⾮常有⽤,包括那些时常被其他著作引⽤的热门论⽂。
⽹络搜索引擎“⾕歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。
2.构思题⽬时⾸先应明确的⼏个问题(1)要使⼀个问题引起⼈们的兴趣,并不需要它具有⼴泛的政策含义;相反地,它可以只有局部意义。
(2)利⽤美国经济的标准宏观经济总量数据来进⾏真正原创性的研究⾮常困难,尤其对于⼀篇要在半个或⼀个学期之内完成的论⽂来说更是如此。
然⽽,这并不意味着应该回避对宏观或经验⾦融模型的估计,因为仅增加⼀些更新的数据便对争论具有建设性。
⼆、数据的收集1.确定适当的数据集⾸先必须确定⽤以回答所提问题的数据类型。
最常见的类型是横截⾯、时间序列、混合横截⾯和⾯板数据集。
有些问题可以⽤任何⼀种数据结构进⾏分析。
确定收集何种数据通常取决于分析的性质。
关键是要考虑能够获得⼀个⾜够丰富的数据集,以进⾏在其他条件不变下的分析。
同⼀横截⾯单位两个或多个不同时期的数据,能够控制那些不随时间⽽改变的⾮观测效应,⽽这些效应通常使得单个横截⾯上的回归失效。
2.输⼊并储存数据⼀旦你确定了数据类型并找到了数据来源,就必须把数据转变为可⽤格式。
通常,数据应该具备表格形式,每次观测占⼀⾏;⽽数据集的每⼀列则代表不同的变量。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第12章 时间序列回归中的序列相关和异方差性
第12章时间序列回归中的序列相关和异方差性12.1复习笔记一、含序列相关误差时OLS 的性质1.无偏性和一致性在时间序列回归的前3个高斯—马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。
特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆjβ都是无偏的。
这类似于误差中的异方差不会造成ˆjβ产生偏误。
把严格外生性假定放松到()|0t t E u X =,并证明了当数据是弱相关的时候,ˆj β仍然是一致的(但不一定无偏)。
这一结论不以对误差中序列相关的假定为转移。
2.效率和推断高斯—马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。
通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。
假定误差存在序列相关,1,1,2,...,ρ-=+=tt t u u e t n ,1ρ<。
其中e t 是均值为0方差为2e σ满足经典假定的误差,对于简单回归模型:01ββ=++t t ty x u 假定x t 的样本均值为零,于是1111ˆn x t t i SST x u ββ-==+∑其中21n x t i SST x ==∑,计算1ˆβ的方差,()()22221111ˆ/2/n n n t j x t t x x t t j i i j Var SST Var x u SST SST x x βσσρ--+===⎛⎫==+ ⎪⎝⎭∑∑∑其中()2σ=t Var u 由1ˆβ的方差表达形式可知,第一项为2/xSST σ,为经典假定条件下的简单回归模型中参数的方差,所以当模型中的误差项存在序列相关时,按照OLS 估计的方差是有偏的。
在出现序列相关的时候,使用通常的OLS 标准误就不再准确。
因此,检验单个假设的t 统计量也不再正确。
因为较小的标准误意味着较大的t 统计量,所以当ρ﹥0时,通常的t 统计量常常过大。
用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第16章 联立方程模型【圣才出品】
第16章联立方程模型16.1复习笔记解释变量另一种重要的内生性形式是联立性。
当一个或多个解释变量与因变量联合被决定时,就出现联立性问题。
一、联立方程模型的性质联立方程组中的每个方程都具有其他条件不变的因果性解释。
SEM(联立方程模型)的经典例子是某个商品或要素投入的供给和需求方程:劳动供给函数与需求函数是从经济理论推导出来并具有因果性解释的事实,是结构方程。
这两个方程一起构成了一个联立方程模型。
联立方程模型的重要特征:①给定z i1、z i2、u i1和u i2,这两个方程就决定了h i和w i。
h i和w i是这个SEM中的内生变量。
z i1和z i2由于在模型外决定,是外生变量。
②从统计观点来看,关于z i1和z i2的关键假定是,它们都与u i1和u i2无关。
由于这些误差出现在结构方程中,所以它们是结构误差。
③SEM中的每个方程自身都应该有一个行为上的其他条件不变解释。
二、OLS中的联立性偏误在一个简单模型中,与因变量同时决定的解释变量一般都与误差项相关,这就导致OLS中存在偏误和不一致性。
1.约简型方程考虑两个方程的结构模型:112111y y z u αβ=++221222y y z u αβ=++专门估计第一个方程。
变量z 1和z 2都是外生的,所以每个都与u 1和u 2无关。
如果将式112111y y z u αβ=++的右边作为y 1代入式221222y y z u αβ=++中,得到()212211222121y z z u u αααββα-=+++为了解出y 2,需对参数做一个假定:211αα≠这个假定是否具有限制性则取决于应用。
如果上式的条件成立,y 2可写成22112222y z z v ππ=++其中,()212121/1παβαα=-、()22221/1πβαα=-和()()221221/1v u u ααα=+-,用外生变量和误差项表示y 2的方程22112222y z z v ππ=++是y 2的约简型。
伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】
第19章一个经验项目的实施19.1 复习笔记一、问题的提出提出一个非常明确的问题,其重要性不容忽视。
如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚至收集错误时期的数据。
1.查找数据的方法《经济文献杂志》有一套细致的分类体系,其中每篇论文都有一组标识码,从而将其归于经济学的某一子领域之中。
因特网(Internet)服务使得搜寻各种主题的已发表论文更为方便。
《社会科学引用索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论文时非常有用,包括那些时常被其他著作引用的热门论文。
网络搜索引擎“谷歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。
2.构思题目时首先应明确的几个问题(1)要使一个问题引起人们的兴趣,并不需要它具有广泛的政策含义;相反地,它可以只有局部意义。
(2)利用美国经济的标准宏观经济总量数据来进行真正原创性的研究非常困难,尤其对于一篇要在半个或一个学期之内完成的论文来说更是如此。
然而,这并不意味着应该回避对宏观或经验金融模型的估计,因为仅增加一些更新的数据便对争论具有建设性。
二、数据的收集1.确定适当的数据集首先必须确定用以回答所提问题的数据类型。
最常见的类型是横截面、时间序列、混合横截面和面板数据集。
有些问题可以用任何一种数据结构进行分析。
确定收集何种数据通常取决于分析的性质。
关键是要考虑能够获得一个足够丰富的数据集,以进行在其他条件不变下的分析。
同一横截面单位两个或多个不同时期的数据,能够控制那些不随时间而改变的非观测效应,而这些效应通常使得单个横截面上的回归失效。
2.输入并储存数据一旦你确定了数据类型并找到了数据来源,就必须把数据转变为可用格式。
通常,数据应该具备表格形式,每次观测占一行;而数据集的每一列则代表不同的变量。
(1)不同类型数据的输入要求①对时间序列数据集来说,只有一种合理的方式来进行数据的输入和存储:即以时间为序,最早的时期列为第一次观测,最近的时期列为最后一次观测。
伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)
GPA GPA Ai
ˆ 5.8125 / 56.875 0.1022 。 根据公式 2.19 可得: 1
ˆ 3.2125 0.1022 25.875 0.5681 。 根据公式 2.17 可知: 0
????2222211112222221111varvarvar?nnnniiiiiiiiiinnniiiiiixxuxxuxxx??????????????????????????????????????????????????????????????????根据公式257????2211?varniixx????????????对任何数据样本??2211nniiiixxx??????除非0x?
7.利用 Kiel and McClain(1995)有关 1988 年马萨诸塞州安德沃市的房屋出售数据,如下方程给出了房屋 价格( price )和距离一个新修垃圾焚化炉的距离( dist )之间的关系:
log price 9.40 0.312log dist n 135 , R 2 0.162
因此 GPA 0.5681 0.1022 ACT 。 此处截距没有一个很好的解释, 因为对样本而言,ACT 并不接近 0。 如果 ACT 分数提高 5 分,预期 GPA 会提高 0.1022× 5=0.511。 (Ⅱ)每次观测的拟合值和残差表如表 2-3 所示: 表 2-3
i
GPA
GPA
^
^
ˆ u
1 2 3 4 5 6 7 8
^
2.8 3.4 3.0 3.5 3.6 3.0 2.7 3.7
2.7143 3.0209 3.2253 3.3275 3.5319 3.1231 3.1231 3.6341
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第11章OLS用于时间序列数据的其他问题【
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第11章OLS用于时间序列数据的其他问题【第11章OLS 用于时间序列数据的其他问题11.1复习笔记一、平稳和弱相关时间序列1.平稳和非平稳时间序列平稳时间序列过程,就是概率分布在如下意义上跨时期稳定的时间序列过程:如果从这个序列中任取一个随机变量集,并把这个序列向前移动h 个时期,那么其联合概率分布仍然保持不变。
(1)平稳随机过程对于随机过程{ 1 2 }t x t =:,,…,如果对于每一个时间指标集121m t t t ≤<<12 m t h t h t h x x x +++,,,的联合分布相同,那么这个随机过程就是平稳的。
这种平稳经常称为严平稳,它是从概率分布的角度去定义的。
其含义之一是(取m=1和t 1=1):对所有t=2,3,…,x 1与x t 都有相同的分布。
序列{ 1 2 }t x t =:,,…是同分布的。
不平稳的随机过程称为非平稳过程。
因为平稳性是潜在随机过程而非其某单个实现的性质,所以很难判断所搜集到的数据是否由一个平稳过程生成。
但是,要指出某些序列不是平稳的却很容易。
(2)协方差平稳过程(宽平稳,弱平稳)对于一个具有有限二阶矩()2t E x ??∞??<的随机过程{ 1 2 }t x t =:,,…,若:(i)E(x t )为常数;(ii)Var(x t )为常数;(iii)对任何t,h≥1,Cov(x t ,x t+h )仅取决于h,而不取决于t,那它就是协方差平稳的。
协方差平稳只考虑随机过程的前两阶矩:这个过程的均值和方差不随着时间而变化,而且,x t 和x t+h 的协方差只取决于这两项之间的距离h,与起始时期t 的位置无关。
由此立即可知x t 与x t+h 之间的相关性也只取决于h。
如果一个平稳过程具有有限二阶矩,那么它一定是协方差平稳的,但反过来未必正确。
由于严平稳的条件比较苛刻,在实际中从概率分布的角度去验证是无法实现的,所以在实际运用中所指的平稳都是指宽平稳,即协方差平稳。
伍德里奇《计量经济学导论》笔记和课后习题详解(高深的面板数据方法)【圣才出品】
二、随机敁应模型
1.随机敁应模型
仍同一个非观测敁应模型开始,
yit β0 β1xit1 β2 xit2
βk xitk αi uit
(1)
明确引入一个截距项,假定非观测敁应 αi 有零均值,且不每一个解释变量都无关:Cov
(xitj,αi)=0,t=1,2,…,T;j=1,2,…,k,则斱程(1)就成为一个随机敁应模型。
2 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
板数据集来说丌是徆现实。 ②它所给出的 βj 估计值不用除均值数据所做回弻得到的估计值恰好一样,而且标准误
和其他主要统计量也一样。因此,固定敁应估计量可以由虚拟变量回弻得到。 ③可以直接算出恰弼的自由度。 ④仍虚拟变量回弻算出的 R2 通常都比较高。 ⑤仍虚拟变量回弻得到的 R2,可按通常斱法用亍计算 F 检验。 3.是固定敁应(FE)还是一阶差分(FD) 估计非观测敁应模型的两种斱法:一种是叏数据的差分,一种是除时间均值。 两种斱法的选择: (1)弼 T=2 时,FE 和 FD 的估计值及其全部检验统计量完全一样,敀可随便选用一
一个重要的理论事实是,FD 估计量中的偏误丌叏决亍 T,而 FE 估计量中的偏误则以速 度 1/T 趋亍零。弼 FE 和 FD 给出明显丌同的结果时,通常在两者乊间作出叏舍就徆困难。
3 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
同时报告两组结果幵试图判断差异的原因所在。 4.非平衡面板数据的固定敁应法 在一些面板数据集中,样本缺少了某些横截面单位的某些年仹数据,称数据集为非平衡
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 14 章 高定敁应估计法
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣第15章工具变量估计与两阶段最小二乘法15.1复习笔记一、动机:简单回归模型中的遗漏变量1.面对可能发生的遗漏变量偏误(或无法观测异质性)的四种选择(1)忽略遗漏变量问题,承受有偏而又不一致估计量,若能把估计值与关键参数的偏误方向一同给出,则该方法便令人满意。
(2)试图为无法观测变量寻找并使用一个适宜的代理变量,该方法试图通过用代理变量取代无法观测变量来解决遗漏变量的问题,但并不是总可以找到一个好的代理。
(3)假定遗漏变量不随时间变化,运用固定效应或一阶差分方法。
(4)将无法观测变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法,工具变量法。
2.工具变量法简单回归模型01y x uββ=++其中x 与u 相关:()Cov 0,x u ≠(1)为了在x 和u 相关时得到0β和1β的一致估计量,需要有一个可观测到的变量z,z 满足两个假定:①z 与u 不相关,即Cov(z,u)=0;②z 与x 相关,即Cov(z,x)≠0。
满足这两个条件,则z 称为x 的工具变量,简称为x 的工具。
z 满足①式称为工具外生性条件,工具外生性意味着,z 应当对y 无偏效应(一旦x 和u 中的遗漏变量被控制),也不应当与其他影响y 的无法观测因素相关。
z 满足②式意味着z 必然与内生解释变量x 有着或正或负的关系。
这个条件被称为工具相关性。
(2)工具变量的两个要求之间的差别①Cov(z,u)是z 与无法观测误差u 的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。
②给定一个来自总体的随机样本,z 与x(在总体中)相关的条件则可加以检验。
最容易的方法是估计一个x 与z 之间的简单回归。
在总体中,有01x z vππ=++从而,由于()()1Cov /ar V ,x z z π=所以式Cov(z,x)≠0中的假定当且仅当10π≠时成立。
伍德里奇计量经济学导论第5版笔记和课后习题详解
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解目录第1章计量经济学的性质与经济数据1.1复习笔记1.2课后习题详解第一篇横截面数据的回归分析第2章简单回归模型2.1复习笔记2.2课后习题详解第3章多元回归分析:估计3.1复习笔记3.2课后习题详解第4章多元回归分析:推断4.1复习笔记4.2课后习题详解第5章多元回归分析:OLS的渐近性5.1复习笔记5.2课后习题详解第6章多元回归分析:深入专题6.1复习笔记6.2课后习题详解第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记7.2课后习题详解第8章异方差性8.1复习笔记8.2课后习题详解第9章模型设定和数据问题的深入探讨9.1复习笔记9.2课后习题详解第二篇时间序列数据的回归分析第10章时间序列数据的基本回归分析10.1复习笔记10.2课后习题详解第11章OLS用于时间序列数据的其他问题11.1复习笔记11.2课后习题详解第12章时间序列回归中的序列相关和异方差性12.1复习笔记12.2课后习题详解第三篇高级专题讨论第13章跨时横截面的混合:简单面板数据方法13.1复习笔记13.2课后习题详解第14章高级的面板数据方法14.2课后习题详解第15章工具变量估计与两阶段最小二乘法15.1复习笔记15.2课后习题详解第16章联立方程模型16.1复习笔记16.2课后习题详解第17章限值因变量模型和样本选择纠正17.1复习笔记17.2课后习题详解第18章时间序列高级专题18.1复习笔记18.2课后习题详解第19章一个经验项目的实施19.2课后习题详解本书是伍德里奇《计量经济学导论》(第5版)教材的学习辅导书,主要包括以下内容:(1)整理名校笔记,浓缩内容精华。
每章的复习笔记以伍德里奇所著的《计量经济学导论》(第5版)为主,并结合国内外其他计量经济学经典教材对各章的重难点进行了整理,因此,本书的内容几乎浓缩了经典教材的知识精华。
(2)解析课后习题,提供详尽答案。
计量经济学导论伍德里奇课后答案中文
2.10(iii) From (2.57), Var(1ˆβ) = σ2/21()n i i x x =⎛⎫- ⎪⎝⎭∑. 由提示:: 21n ii x =∑ ≥ 21()n i i x x =-∑, and so Var(1β) ≤ Var(1ˆβ). A more direct way to see this is to write(一个更直接的方式看到这是编写) 21()ni i x x =-∑ = 221()n i i x n x =-∑, which is less than21n i i x=∑unless x = 0.(iv)给定的c 2i x 但随着x 的增加, 1ˆβ的方差与Var(1β)的相关性也增加.0β小时1β的偏差也小.因此, 在均方误差的基础上不管我们选择0β还是1β要取决于0β,x ,和n 的大小 (除了 21n i i x=∑的大小).3.7We can use Table 3.2. By definition, 2β > 0, and by assumption, Corr(x 1,x 2) < 0. Therefore, there is a negative bias in 1β: E(1β) < 1β. This means that, on average across different random samples, the simpleregression estimator underestimates the effect of the training program. It is even possible that E(1β) isnegative even though 1β > 0. 我们可以使用表3.2。
根据定义,> 0,由假设,科尔(X1,X2)<0。
因此,有一个负偏压为:E ()<。
这意味着,平均在不同的随机抽样,简单的回归估计低估的培训计划的效果。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第1章及第一篇(第2~3章)【圣才出品】
品数(output)方面的信息。 (i)仔细陈述这个政策问题背后其他情况不变的思维试验。 (ii)一个企业培训其员工的决策看起来有可能独立于工人特征吗?工人可观测与不可
观测的特征各有哪些? (iii)除工人特征之外,再列出一个影响工人生产力的因素。 (iv)你若发现 training 和 output 之间成正相关关系,你令人信服地证明了工作培训
2.工作培训项目的理由之一是能提高工人的生产力。假设要求你评估更多的工作培训 是否使工人更有生产力。不过,你没有工人的个人数据,而是有俄亥俄州制造企业的数据。 具体而言,对每个企业,你都有人均工作培训小时数(training)和单位工时生产的合格产
4 / 91
圣才电子书 十万种考研考证电子书、题库视频学习平台
十万种考研考证电子书、题库视频学习平台
表 1-1 经济数据的结构
2.面板数据与混合横截面数据的比较(见表 1-2) 表 1-2 面板数据与混合横截面数据的比较
2 / 91
圣才电子书 十万种考研考证电子书、题库视频学习平台
考点三:因果关系和其他条件不变 ★★
1.因果关系 因果关系是指一个变量的变动将引起另一个变量的变动,这是经济分析中的重要目标之 一。计量分析虽然能发现变量之间的相关关系,但是如果想要解释因果关系,还要排除模型 本身存在因果互逆的可能,否则很难让人信服。
答:讲不通。因为找出每周学习小时数(study)和每周工作小时数(work)之间的关 系,是说每周学习小时数(study)和每周工作小时数(work)之间有关系,但没有说是因 果关系,每周学习小时数可能与其他因素有关或每周工作小时数与其他因素有关。
4.对税收有控制权的州或省份有时候会减少税收来刺激经济增长。假设你被某州政府 雇佣来估计公司税率的影响,比如说对每单位州生产总值增长的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第15章
工具变量估计与两阶段最小二乘法15.1复习笔记
一、动机:简单回归模型中的遗漏变量
1.面对可能发生的遗漏变量偏误(或无法观测异质性)的四种选择
(1)忽略遗漏变量问题,承受有偏而又不一致估计量,若能把估计值与关键参数的偏误方向一同给出,则该方法便令人满意。
(2)试图为无法观测变量寻找并使用一个适宜的代理变量,该方法试图通过用代理变量取代无法观测变量来解决遗漏变量的问题,但并不是总可以找到一个好的代理。
(3)假定遗漏变量不随时间变化,运用固定效应或一阶差分方法。
(4)将无法观测变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法,工具变量法。
2.工具变量法
简单回归模型
01y x u
ββ=++其中x 与u 相关:
()Cov 0
,x u ≠(1)为了在x 和u 相关时得到0β和1β的一致估计量,需要有一个可观测到的变量z,z 满足两个假定:
①z 与u 不相关,即Cov(z,u)=0;
②z 与x 相关,即Cov(z,x)≠0。
满足这两个条件,则z 称为x 的工具变量,简称为x 的工具。
z 满足①式称为工具外生性条件,工具外生性意味着,z 应当对y 无偏效应(一旦x 和u 中的遗漏变量被控制),也不应当与其他影响y 的无法观测因素相关。
z 满足②式意味着z 必然与内生解释变量x 有着或正或负的关系。
这个条件被称为工具相关性。
(2)工具变量的两个要求之间的差别
①Cov(z,u)是z 与无法观测误差u 的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。
②给定一个来自总体的随机样本,z 与x(在总体中)相关的条件则可加以检验。
最容易的方法是估计一个x 与z 之间的简单回归。
在总体中,有
01x z v
ππ=++从而,由于
()()
1Cov /ar V ,x z z π=所以式Cov(z,x)≠0中的假定当且仅当10π≠时成立。
因而就能够在充分小的显著水平上,相对双侧对立假设110H π≠:而拒绝虚拟假设010H π=:。
就能相当有把握地肯定工具z 与x 是相关的。
3.工具变量估计量
(1)参数的工具变量(IV)估计量
参数的识别意味着可以根据总体矩写出1β,而总体矩可用样本数据进行估计。
为了根据总体协方差写出1β,利用简单回归方程可得z 与y 之间的协方差为:
()()()
1Cov Cov Cov ,,,z y z x z u β=+在Cov(z,u)=0与Cov(z,x)≠0的假定下,可以解出1β为:
()()
1Cov Cov ,,z y z x β=1β是z 和y 之间的总体协方差除以z 和x 之间的总体协方差,说明1β被识别了。
给定一个随机样本,用对应样本量来估计总体量。
在分子和分母中约去样本容量后,得到1β的工具变量(IV)估计量:()()()()111ˆn i i i n
i
i i z z y y z z x x β==--=--∑∑0β的IV 估计量就为:
01
ˆˆy x ββ=-(2)工具变量估计量的一致性和无偏性
大数定律表明,若满足工具变量的两个假定,1β的IV 估计量便具有一致性:
()
11
ˆplim ββ=若任一假定不成立,IV 估计量都将不是一致性的
IV 估计量的一个特点是:当x 与u 相关时,它绝不是无偏的。
在小样本中,这意味着IV 估计量可能有相当大的偏误。
因此在使用工具变量法时,需要大的样本容量。
4.用IV 估计量做统计推断
(1)1β的渐进方差
在大样本容量的情况下,IV 估计量近似服从正态分布。
为了对1β进行推断,需要一个可用于计算t 统计量和置信区间的标准误,通常的方法是增加一个同方差性假定但同方差的假定是以工具变量z 为条件的,即
()()
22|Var E u z u σ==则1
ˆβ的渐近方差为:2
22,x x z
n σ
σρ其中,2x σ是x 的总体方差,2σ是u 的总体方差,2,x z ρ是x 与z 之总体相关系数的平方,它反映了总体中z 与x 的相关性有多大。
(2)渐进方差的意义
①提供了一种求IV 估计量标准误的方法。
渐进误差中的所有量都可以在给定的随机样本下一致估计,为估计2x σ,简单地计算出
x i 的样本方差;为估计2,x z ρ,可以做x i 对z i 的回归来获得R 2,即2
,x z R 。
最后,为估计2σ,可以运用IV 残差,
01ˆˆˆ 1 2 i i i u y x i n ββ=--=,,
,…,其中,0ˆβ与1
ˆβ是IV 估计量。
2σ的一致估计量为:2
211ˆˆ2n i i u n σ==-∑1
ˆβ的渐近标准误是所估计的渐进方差的平方根,这个方差为:
22,ˆSST x x z
R σ
⋅其中,SST x 是x i 的总平方和。
(x i 的样本方差是SST x /n)所得到的标准误可用于构造t 统计量,以检验关于1β的假设,或者是得到1β的置信区间。
②比较IV 和OLS 估计量(当x 与u 不相关时)的渐近方差。
在高斯—马尔可夫假定下,OLS 估计量的方差为2SST x σ/,而IV 估计量的计算式为()22,/SST x x z R σ⋅;两者的区别仅在于IV 方差的分母中出现了2,x z R 。
由于R 2总是小于1,所以这个IV 的方差总是大于OLS 方差。
若x 与z 只是轻度相关,则2
,x z R 便很小,而这将转化为IV 估计量的一个非常大的抽样方差。
z 与x 越高度相关,2,x z R 便越接近于1,IV 估计量的方差就越小。
在z=x 的情况下,2,1x z R =,得到OLS 的方差。
当x 与u 不相关时进行IV 估计的一个重要代价:IV 估计量的渐近方差总是大于(有时远大于)OLS 估计量的渐近方差。
5.低劣工具变量条件下IV 的性质
当z 和u 不相关,而z 与x 存在着或正或负的相关时,IV 估计量是一致的,但当z 与x 只是弱相关时,IV 估计值的标准误可能很大。
z 与x 之间的弱相关可能产生更加严重的后果:即使z 与u 只是适度相关,IV 估计量的渐近偏误也可能很大。
(1)IV 估计量的概率极限
当z 与u 可能相关时,利用总体相关和标准差,可以推出:
()()1 IV 1Corr ˆplim Corr u x
z u z x σββσ=+⋅,,,其中,u σ和x σ分别代表总体中u 和x 的标准差。
它表明,即使Corr(z,x)很小,如果Corr(z,u)也很小,那么IV 估计量的不一致性也可能非常大。
即使只考虑一致性,若z 与u 之间的相关系数小于x 与u 之间的相关系数,则使用IV 也不一定比OLS 更好。
(2)OLS 估计量的概率极限
由于
()()()
Cov Corr / ,,x u x u x u σσ=可以将OLS 估计量的概率极限( 1 OLS ,β)写为()1OLS 1ˆplim Corr u x
x u σββσ=+⋅,,
(3)IV 估计量与OLS 估计量的渐近偏误比较渐近偏误的方向对IV 和OLS 估计量而言可能是不同的。
假设当Corr(x,u)﹥0,Corr(z,x)﹥0,而Corr(z,u)﹤0。
IV 估计量便存在一个向下的偏误,而OLS 估计量具有向上的(渐近)偏误。
假设z 与x 都与u 正相关,而且Corr(z,x)﹥0。
那么,只有在Corr(z,u)/Corr (z,x)﹤Corr(x,u)时,IV 估计量才比OLS 估计量的渐近偏误更小。
如果Corr(z,x)很小,那么z 与u 之间看似很小的相关性就可能被放大,就算仅考虑偏误,IV 也不如OLS 好。
(4)弱工具问题
当工具相关条件Corr(z,x)≠0不成立时,就出现了弱工具问题。
弱工具问题大致定义为z 和x 之间的相关度“很低”(但不为零)的问题。
出现弱工具问题时,基于通常的t。