伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第10~12章【圣才出品】
《计量经济学导论》考研伍德里奇考研复习笔记二
《计量经济学导论》考研伍德里奇考研复习笔记二第1章计量经济学的性质与经济数据1.1 复习笔记一、什么是计量经济学计量经济学是以一定的经济理论为基础,运用数学与统计学的方法,通过建立计量经济模型,定量分析经济变量之间的关系。
在进行计量分析时,首先需要利用经济数据估计出模型中的未知参数,然后对模型进行检验,在模型通过检验后还可以利用计量模型来进行预测。
在进行计量分析时获得的数据有两种形式,实验数据与非实验数据:(1)非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的数据。
非实验数据有时被称为观测数据或回顾数据,以强调研究者只是被动的数据搜集者这一事实。
(2)实验数据通常是通过实验所获得的数据,但社会实验要么行不通要么实验代价高昂,所以在社会科学中要得到这些实验数据则困难得多。
二、经验经济分析的步骤经验分析就是利用数据来检验某个理论或估计某种关系。
1.对所关心问题的详细阐述问题可能涉及到对一个经济理论某特定方面的检验,或者对政府政策效果的检验。
2构造经济模型经济模型是描述各种经济关系的数理方程。
3经济模型变成计量模型先了解一下计量模型和经济模型有何关系。
与经济分析不同,在进行计量经济分析之前,必须明确函数的形式,并且计量经济模型通常都带有不确定的误差项。
通过设定一个特定的计量经济模型,我们就知道经济变量之间具体的数学关系,这样就解决了经济模型中内在的不确定性。
在多数情况下,计量经济分析是从对一个计量经济模型的设定开始的,而没有考虑模型构造的细节。
一旦设定了一个计量模型,所关心的各种假设便可用未知参数来表述。
4搜集相关变量的数据5用计量方法来估计计量模型中的参数,并规范地检验所关心的假设在某些情况下,计量模型还用于对理论的检验或对政策影响的研究。
三、经济数据的结构1横截面数据(1)横截面数据集,是指在给定时点对个人、家庭、企业、城市、州、国家或一系列其他单位采集的样本所构成的数据集。
伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】
y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台
对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM
不
χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。
伍德里奇《计量经济学导论》笔记和课后习题详解(异方差性)【圣才出品】
(4)在丌包括截距癿情况下将 1 对 r1u, r2u, , rqu 做回归。异斱差-稳健癿 LM 统计
χ 量就是 n-SSR1,其中 SSR1 是最后这个回归通常癿残差平斱和。在 H0 下 LM 渐近服从
2 q
分布。
4 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台
变量乊类癿情况出现则具有这种影响。
2.异斱差性对拟合优度癿影响
对拟合优度指标 R2 和 R2 癿解释丌受异斱差性癿影响。通常癿 R2 和调整 R2 都是估计总
体
R2
癿丌同斱法,而总体
R2 无非就是1 σu2
/
σ
2 y
,其中
σu2
是总体误差斱差,
σ
2 y
则是
y
癿总体斱差。关键是,由亍总体 R2 中这两个斱差都是无条件斱差,所以总体 R2 丌受
十万种考研考证电子书、题库视频学习平台
令 uˆi 表示原来 y 对 x 做回归所得到癿 OLS 残差。那么,对亍仸何形式癿异斱差(包括
同斱差),Var βˆ j 癿一个确当估计量都是
n
xi x 2 uˆi2
i 1
SSTx2
可以证明,将斱程乘以样本容量
n
后,会依概率收敛亍
在没有同斱差假定癿情况下,估计量癿斱差是有偏癿。由亍 OLS 标准误直接以这些斱
差为基础,所以它们都丌能用来构造置信区间和 t 统计量。
4.对统计检验癿影响
1 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台
在出现异斱差性癿情况下,在高斯-马尔可夫假定下用来检验假设癿统计量都丌再成立。 (1)在出现异斱差性时,通常普通最小二乘法癿 t 统计量就丌具有 t 分布,使用大样 本容量也丌能解决这个问题。 (2)F 统计量也丌再是 F 分布。 (3)LM 统计量也丌服从渐近 χ2 分布。
伍德里奇《计量经济学导论》笔记和课后习题详解(时间序列回归中的序列相关和异方差)【圣才出品】
第12章 时间序列回归中的序列相关和异方差12.1 复习笔记一、含序列相关误差时OLS 的性质 1.无偏性和一致性在时间序列回归的前3个高斯-马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。
特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆj β都是无偏的。
这类似于误差中的异方差不会造成ˆjβ产生偏误。
把严格外生性假定放松到()0t t E u X =,并证明了当数据是弱相关的时候,ˆjβ仍然是一致的(但不一定无偏)。
这一结论不以对误差中序列相关的假定为转移。
2.效率和推断高斯-马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。
通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。
在序列相关的时候,通常的方差估计量都是()1ˆVar β的有偏估计。
因为ˆj β的标准误是ˆjβ的标准差的估计值,所以在出现序列相关的时候,使用通常的OLS 标准误就不再确当。
因此,检验单个假设的t 统计量也不再确当。
因为较小的标准误意味着较大的t 统计量,所以当ρ>0时,通常的统计量常常过大。
用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。
3.拟合优度t时间序列回归模型中的误差若存在序列相关,通常的拟合优度指标R 2和调整R 2便会失效,但只要数据是平稳和弱相关的,拟合优度指标依然有效。
在横截面背景中将总体R 2定义为221/u y σσ-。
在使用平稳而又弱相关数据的时间序列回归背景中,这个定义依然确当:误差和因变量的方差都不随时间而变化。
根据大数定律,R 2和调整R 2都是总体R 2的一致估计。
拟合优度指标仍是总体参数的一致估计量。
若{y t }是一个I (1)过程,则因为Var (y t )随着t 而递增,所以就无法通过重新定义R 2为221/uy σσ-来证明;此时的拟合优度便没有什么意义。
4.出现滞后因变量时的序列相关回归中出现滞后因变量时,误差有序列相关的危险。
伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第1~4章【圣才出品】
Байду номын сангаас
2.假设让你进行一项研究,以确定较小的班级规模是否会提高四年级学生的成绩。
4 / 119
圣才电子书 十万种考研考证电子书、题库视频学习平台
(i)如果你能设定你想做的任何实验,你想做些什么?请具体说明。 (ii)更现实地,假设你能搜集到某个州几千名四年级学生的观测数据。你能得到他们 四年级班级规模和四年级末的标准化考试分数。你为什么预计班级规模与考试成绩存在负相 关关系? (iii)负相关关系一定意味着较小的班级规模会导致更好的成绩吗?请解释。 答:(i)假定能够随机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如 能力和家庭背景等特征的前提下,每个学生被随机的分配到不同的班级。因此可以看到班级 规模(在伦理考量和资源约束条件下的主体)的显著差异。 (ii)负相关关系意味着更大的班级规模与更差的考试成绩是有直接联系的,因此可以 发现班级规模越大,导致考试成绩越差。 通过数据可知,两者之间的负相关关系还有其他的原因。例如,富裕家庭的孩子在学校 可能更多的加入小班,而且他们的成绩优于平均水平。 另外一个可能性是:学校的原则是将成绩较好的学生分配到小班。或者部分父母可能坚 持让自己的孩子进入更小的班级,而同样这些父母也更多的参与子女的教育。 (iii)鉴于潜在的其他混杂因素(如 ii 所列举),负相关关系并不一定意味着较小的班 级规模会导致更好的成绩。控制混杂因素的方法是必要的,而这正是多重回归分析的主题。
伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】
伍德⾥奇《计量经济学导论》笔记和课后习题详解(⼀个经验项⽬的实施)【圣才出品】第19章⼀个经验项⽬的实施19.1 复习笔记⼀、问题的提出提出⼀个⾮常明确的问题,其重要性不容忽视。
如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚⾄收集错误时期的数据。
1.查找数据的⽅法《经济⽂献杂志》有⼀套细致的分类体系,其中每篇论⽂都有⼀组标识码,从⽽将其归于经济学的某⼀⼦领域之中。
因特⽹(Internet)服务使得搜寻各种主题的已发表论⽂更为⽅便。
《社会科学引⽤索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论⽂时⾮常有⽤,包括那些时常被其他著作引⽤的热门论⽂。
⽹络搜索引擎“⾕歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。
2.构思题⽬时⾸先应明确的⼏个问题(1)要使⼀个问题引起⼈们的兴趣,并不需要它具有⼴泛的政策含义;相反地,它可以只有局部意义。
(2)利⽤美国经济的标准宏观经济总量数据来进⾏真正原创性的研究⾮常困难,尤其对于⼀篇要在半个或⼀个学期之内完成的论⽂来说更是如此。
然⽽,这并不意味着应该回避对宏观或经验⾦融模型的估计,因为仅增加⼀些更新的数据便对争论具有建设性。
⼆、数据的收集1.确定适当的数据集⾸先必须确定⽤以回答所提问题的数据类型。
最常见的类型是横截⾯、时间序列、混合横截⾯和⾯板数据集。
有些问题可以⽤任何⼀种数据结构进⾏分析。
确定收集何种数据通常取决于分析的性质。
关键是要考虑能够获得⼀个⾜够丰富的数据集,以进⾏在其他条件不变下的分析。
同⼀横截⾯单位两个或多个不同时期的数据,能够控制那些不随时间⽽改变的⾮观测效应,⽽这些效应通常使得单个横截⾯上的回归失效。
2.输⼊并储存数据⼀旦你确定了数据类型并找到了数据来源,就必须把数据转变为可⽤格式。
通常,数据应该具备表格形式,每次观测占⼀⾏;⽽数据集的每⼀列则代表不同的变量。
伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】
第19章一个经验项目的实施19.1 复习笔记一、问题的提出提出一个非常明确的问题,其重要性不容忽视。
如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚至收集错误时期的数据。
1.查找数据的方法《经济文献杂志》有一套细致的分类体系,其中每篇论文都有一组标识码,从而将其归于经济学的某一子领域之中。
因特网(Internet)服务使得搜寻各种主题的已发表论文更为方便。
《社会科学引用索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论文时非常有用,包括那些时常被其他著作引用的热门论文。
网络搜索引擎“谷歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。
2.构思题目时首先应明确的几个问题(1)要使一个问题引起人们的兴趣,并不需要它具有广泛的政策含义;相反地,它可以只有局部意义。
(2)利用美国经济的标准宏观经济总量数据来进行真正原创性的研究非常困难,尤其对于一篇要在半个或一个学期之内完成的论文来说更是如此。
然而,这并不意味着应该回避对宏观或经验金融模型的估计,因为仅增加一些更新的数据便对争论具有建设性。
二、数据的收集1.确定适当的数据集首先必须确定用以回答所提问题的数据类型。
最常见的类型是横截面、时间序列、混合横截面和面板数据集。
有些问题可以用任何一种数据结构进行分析。
确定收集何种数据通常取决于分析的性质。
关键是要考虑能够获得一个足够丰富的数据集,以进行在其他条件不变下的分析。
同一横截面单位两个或多个不同时期的数据,能够控制那些不随时间而改变的非观测效应,而这些效应通常使得单个横截面上的回归失效。
2.输入并储存数据一旦你确定了数据类型并找到了数据来源,就必须把数据转变为可用格式。
通常,数据应该具备表格形式,每次观测占一行;而数据集的每一列则代表不同的变量。
(1)不同类型数据的输入要求①对时间序列数据集来说,只有一种合理的方式来进行数据的输入和存储:即以时间为序,最早的时期列为第一次观测,最近的时期列为最后一次观测。
伍德里奇《计量经济学导论》笔记和课后习题详解(联立方程模型)【圣才出品】
第16章联立方程模型16.1 复习笔记解释变量另一种重要的内生性形式是联立性。
当一个或多个解释变量与因变量联合被决定时,就出现了这个问题。
估计联立方程模型的主要方法是工具变量法。
一、联立方程模型的性质联立方程组中的每个方程都具有其他条件不变的因果性解释。
因为只观察到均衡结果,所以在构造联立方程模型中的方程时,使用违反现存事实的逻辑。
SEM的经典例子是某个商品或要素投入的供给和需求方程:h i=α1w i+β1z i1+u i1h i=α2w i+β2z i2+u i2联立方程模型的重要特征:首先,给定z i1、z i2、u i1和u i2,这两个方程就决定了h i和w i。
h i和w i是这个SEM中的内生变量。
z i1和z i2由于在模型外决定,是外生变量。
其次,从统计观点来看,关于z i1和z i2的关键假定是,它们都与u i1和u i2无关。
由于这些误差出现在结构方程中,所以它们是结构误差的例子。
最后,SEM中的每个方程自身都应该有一个行为上的其他条件不变解释。
二、OLS中的联立性偏误在一个简单模型中,与因变量同时决定的解释变量一般都与误差项相关,这就导致OLS中存在偏误和不一致性。
1.约简型方程考虑两个方程的结构模型:y1=α1y2+β1z1+u1y2=α2y1+β2z2+u2并专门估计第一个方程。
变量z1和z2都是外生的,所以每个都与u1和u2无关。
如果将式y1=α1y2+β1z1+u1的右边作为y1代入式y2=α2y1+β2z2+u2中,得到(1-α2α1)y2=α2β1z1+β2z2+α2u1+u2为了解出y2,需对参数做一个假定:α2α1≠1。
这个假定是否具有限制性则取决于应用。
y2可写成y2=π21z1+π22z2+v2其中,π21=α2β1/(1-α2α1)、π22=β2/(1-α2α1)和v2=(α2u1+u2)/(1-α2α1)。
用外生变量和误差项表示y2的方程(16.14)是y2的约简型方程。
伍德里奇《计量经济学导论》笔记和课后习题详解(时间序列高深专题)【圣才出品】
第18章时间序列高深专题18.1 复习笔记一、无限分布滞后模型1.无限分布滞后模型令{(y t,z t):t=…,-2,-1,0,1,2,…}代表一个双变量时间序列过程。
将y t 与z的当期和所有过去值相联系的一个无限分布滞后模型(IDL)为:y t=α+δ0z t+δ1z t-1+δ2z t-2+…+u t其中,z的滞后可以一直追溯到无限过去。
与有限分布滞后模型不同的是,IDL模型不要求在某个特定时刻截断滞后。
随着j趋于无穷大,滞后系数δj必须趋于0。
z t-1对y t的影响必须随着j无限递增而最终变得很小。
在大多数实际应用中,它也有相应的经济含义:遥远过去的z对y的解释能力不如新近过去的z。
不能估计无限分布滞后的原因:只能观察到数据的有限历史。
(1)无限分布滞后模型的短期倾向y t=α+δ0z t+δ1z t-1+δ2z t-2+…+u t的短期倾向就是δ0。
假设s<0时,z s=0;s>0时z s=1,z1=0。
也就是说,z在t=0时期暂时性地增加一个单位,然后又回到它的初始值0。
对所有h≥0,都有y h=α+δh+u h,所以有E(y h)=α+δh。
给定z在0时期的一个单位的暂时变化,δh就是E(y h)的改变值。
z的一个暂时变化对y的期望值没有长期影响:随着h→∞,E(y h)=α+δh→α。
滞后分布显示了给定z 暂时增加一个单位,未来的y 所服从的期望路径。
(2)无限分布滞后模型的长期倾向长期倾向等于所有滞后系数之和:LRP =δ0+δ1+δ2+δ3+…给定z 一个单位的永久性增加,LRP 度量了y 的期望值的长期变化。
(3)严格外生性假定假定任何时期z 的变化都不会对u t 的期望值有影响。
这就是严格外生性假定的无限分布滞后型。
规范的表述是它使得u t 的期望值不依赖于任何时期的z 。
更弱一点的假定是:在该假定下,误差与现在和过去的z 都不相关,但它有可能与将来的z 相关;这就容许z t 所服从的政策规则能够取决于过去的y 。
伍德里奇《计量经济学导论》复习笔记和课后习题详解-含有定性信息的多元回归分析:二值变量
伍德里奇《计量经济学导论》复习笔记和课后习题详解-含有定性信息的多元回归分析:二值变量第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记考点一:带有虚拟自变量的回归★★★★★1.对定性信息的描述定性信息是指通常以二值信息(0-1)的形式出现的信息,如性别、是否结婚等。
在计量经济学中,二值变量又称为虚拟变量。
2.只有一个虚拟自变量(1)只有一个虚拟自变量的简单模型考虑决定小时工资的简单模型:wage=β0+δ0female+β1educ +u。
根据多元回归的解释方式,δ0表示控制educ不变时,female 变化1单位给wage带来的变化。
假定零条件均值假定E(u|female,educ)=0成立,那么:δ0=E(wage|female=1,educ)-E (wage|female=0,educ),其中female=1表示女性,female =0表示男性。
可以发现,在任意教育水平下,男性与女性的工资差异是固定的,女性工资比男性工资多δ0。
除了β0之外,模型中只需要引入一个虚拟变量。
因为female+male=1,所以引入两个虚拟变量会导致完全多重共线性,即虚拟变量陷阱。
(2)当因变量为log(y)时,对虚拟解释变量系数的解释当变量中有一个或多个虚拟变量,且因变量以对数的形式存在时,虚拟变量的系数可以理解为百分比的变化。
将虚拟变量的系数乘以100,表示的是在保持所有其他因素不变时y 的百分数差异,精确的百分数差异为:100·[exp(∧β1)-1]。
其中∧β1是一个虚拟变量的系数。
3.使用多类别虚拟变量(1)在方程中包括虚拟变量的一般原则如果回归模型具有g 组或g 类不同截距,一种方法是在模型中包含g-1个虚拟变量和一个截距。
基组的截距是模型的总截距,某一组的虚拟变量系数表示该组与基组在截距上的估计差异。
如果在模型中引入g 个虚拟变量和一个截距,将会导致虚拟变量陷阱。
另一种方法是只包括g 个虚拟变量,而没有总截距。
伍德里奇《计量经济学导论》笔记和课后习题详解(简单回归模型)【圣才出品】
β1 就是斜率参数。
②给定零条件均值假定 E(u|x)=0,把斱程中的 y 看成两个部分是比较有用的。一
部分是表示 E(y|x)的 β0+β1一个
部分是被称为非系统部分的 u,即丌能由 x 觋释的那一部分。
二、普通最小二乘法的推导
1.最小二乘估计值
表 2-1 简单回归的术语
3.零条件均值假定 (1)零条件均值 u 的平均值不 x 值无关。可以把它写作:E(u|x)=E(u)。当斱程成立时,就说 u 的均值独立亍 x。 (2)零条件均值假定的意义 ①零条件均值假定给出 β1 的另一种非常有用的觋释。以 x 为条件叏期望值,幵利用 E
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 2 章 简单回归模型
2.1 复习笔记
一、简单回归模型的定义 1.双发量线性回归模型 一个简单的斱程是:y=β0+β1x+u。 假定斱程在所关注的总体中成立,它便定义了一个简单线性回归模型。因为它把两个发 量 x 和 y 联系起来,所以又把它称为两发量戒者双发量线性回归模型。 2.回归术语
E x y β0 β1x 0
得到
1 n
n i1
yi βˆ0 βˆ1xi
0
和
2 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
1
n
n i 1
xi
yi βˆ0 βˆ1xi
0
这两个斱程可用来觋出 βˆ0 和 βˆ1 , y βˆ0 βˆ1x ,则 βˆ0 y βˆ1x 。
量了 yi 的样本发异,SSR 度量了 ui 的样本发异。y 的总发异总能表示成觋释了的发异和未
觋释的发异 SSR 乊和。因此,SST=SSE+SSR。
伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)
GPA GPA Ai
ˆ 5.8125 / 56.875 0.1022 。 根据公式 2.19 可得: 1
ˆ 3.2125 0.1022 25.875 0.5681 。 根据公式 2.17 可知: 0
????2222211112222221111varvarvar?nnnniiiiiiiiiinnniiiiiixxuxxuxxx??????????????????????????????????????????????????????????????????根据公式257????2211?varniixx????????????对任何数据样本??2211nniiiixxx??????除非0x?
7.利用 Kiel and McClain(1995)有关 1988 年马萨诸塞州安德沃市的房屋出售数据,如下方程给出了房屋 价格( price )和距离一个新修垃圾焚化炉的距离( dist )之间的关系:
log price 9.40 0.312log dist n 135 , R 2 0.162
因此 GPA 0.5681 0.1022 ACT 。 此处截距没有一个很好的解释, 因为对样本而言,ACT 并不接近 0。 如果 ACT 分数提高 5 分,预期 GPA 会提高 0.1022× 5=0.511。 (Ⅱ)每次观测的拟合值和残差表如表 2-3 所示: 表 2-3
i
GPA
GPA
^
^
ˆ u
1 2 3 4 5 6 7 8
^
2.8 3.4 3.0 3.5 3.6 3.0 2.7 3.7
2.7143 3.0209 3.2253 3.3275 3.5319 3.1231 3.1231 3.6341
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-自相关:如果误差项相关会有什么结果(圣才出品
量对其滞后一期的回归。
(2)德宾-沃森 d 统计量的定义
n
( ) et − et−1 2
d = t=2 n
et 2
t =1
5 / 28
(10-3)
圣才电子书 十万种考研考证电子书、题库视频学习平台
即残差递差的平方和与残差平方和的比值。注意:在计算 d 统计量分子时,其样本容量
1 / 28
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 10-1 自相关的模式 3.自相关产生的原因 (1)惯性 大多数经济时间序列的一个显著特征就是惯性或者说是迟滞性,即各经济变量的观测值 在时间前后存在着关联性。因此,在涉及时间序列数据的回归方程中,连续的观察值之间很 可能是互相依赖或是相关的。 (2)模型设定误差 不正确的模型设定是指本应纳入模型的重要变量未纳入模型或是模型选择了错误的函 数形式,如果发生这样的模型设定误差,得到的残差则会呈现出系统模式。一个简单的检验 方法是将遗漏变量纳入模型,判定残差是否仍然呈现系统模式。如果不存在系统模式,则序
可见,自相关的后果与异方差相似,也是严重的。因此,与异方差情形相同,在实际应 用中必须确定是否存在自相关问题。
三、自相关的诊断 1.图形法 与异方差情形相同,通过直接观察 OLS 残差 e 来判断误差项 u 中是否存在自相关。有 多种不同的残差图形的检验方法。 (1)残差 e 对时间的散点图 可以用残差对时间作图,如果随着时间的变化,残差呈现出某种有规律的趋势,则可能 存在着自相关。图 10-2 是回归的残差关于时间的时序图,从图可以看出:残差 e 并不是随 机分布的,而是呈现出明显的变动模式——开始是正的,接着变成负的,然后是正的,再然 后是负的,最后又是正的。图形展示了这样一种趋势:残差的递差之间正相关,表明序列存 在着正的自相关。
伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:深入专题)【圣才出品】
第6章 多元回归分析:深入专题6.1 复习笔记一、数据的测度单位对OLS 统计量的影响 1.数据的测度单位对OLS 统计量无实质性影响当对变量重新测度时,系数、标准误、置信区间、t 统计量和F 统计量改变的方式,都不影响所有被测度的影响和检验结果。
怎样度量数据通常只起到非实质性的作用,比如说,减少所估计系数中小数点后零的个数等。
通过对度量单位明智的选择,可以在不做任何本质改变的情况下,改进所估计方程的形象。
对任何一个x i ,当它在回归中以log (x i )出现时,改变其度量单位也只能影响到截距。
这与对百分比变化和(特别是)弹性的了解相对应:它们不会随着y 或x i 度量单位的变化而变化。
2.β系数 原始方程:01122ˆˆˆˆˆi i i k iki y ββx βx βx u =+++++ 减去平均方程,就可以得到:()()()111222ˆˆˆˆi i i k ik ki y y βx x βx x βx x u -=-+-++-+ 令ˆy σ为因变量的样本标准差,1ˆσ为x 1的样本标准差,2ˆσ为x 2的样本标准差,等等。
然后经过简单的运算就可以得到方程:()()()()()()11111ˆˆˆˆˆˆˆˆˆˆˆ//////i y y i k y k ik k y i y y y σσσβx x σσσβx x σuσ⎡⎤⎡⎤-=-++-+⎣⎦⎣⎦每个变量都用其z 得分而被标准化,这就得到一些新的斜率参数。
截距项则完全消失:11ˆˆy k kz b z b z =+++误差 新的系数是:()ˆˆˆˆ/,1,,jj y b j k ==σσβ传统上称这些ˆjb 为标准化系数或β系数。
以标准差为单位,由于它使得回归元的度量单位无关紧要,所以这个方程把所有解释变量都放到相同的地位上。
在一个标准的OLS 方程中,不可能只看不同系数的大小,也不可能断定具有最大系数的解释变量就“最重要”。
通过改变x i 的度量单位,可以任意改变系数的大小。
《计量经济学导论》伍德里奇-第四版-笔记和习题答案(2-8章)
inc e inc incE e inc 0 。
inc e inc
inc
2
Var e inc inc e2 。
(Ⅲ)低收入家庭支出的灵活性较低,因为低收入家庭必须首先支付衣食住行等必需品。而高收入家庭具有 较高的灵活性,部分选择更多的消费,而另一部分家庭选择更多的储蓄。这种较高的灵活性暗示高收入家庭中储 蓄的变动幅度更大。
(Ⅲ)在(Ⅱ)的方程中,如果备考课程有效,那么 1 的符号应该是什么? (Ⅳ)在(Ⅱ)的方程中, 0 该如何解释? 答: (Ⅰ)构建实验时,首先随机分配准备课程的小时数,以保证准备课程的时间与其他影响 SAT 的因素是
houri :i 1 , , n , n 表示试验中所包括的学 独立的。然后收集实验中每个学生 SAT 的数据,建立样本 sati ,
因此 GPA 0.5681 0.1022 ACT 。 此处截距没有一个很好的解释, 因为对样本而言,ACT 并不接近 0。 如果 ACT 分数提高 5 分,预期 GPA 会提高 0.1022× 5=0.511。 (Ⅱ)每次观测的拟合值和残差表如表 2-3 所示: 表 2-3
i
GPA
GPA^^源自 7.利用 Kiel and McClain(1995)有关 1988 年马萨诸塞州安德沃市的房屋出售数据,如下方程给出了房屋 价格( price )和距离一个新修垃圾焚化炉的距离( dist )之间的关系:
log price 9.40 0.312log dist n 135 , R 2 0.162
y 0 0 1 x u 0
令新的误差项为 e u 0 ,因此 E e 0 。 新的截距项为 0 0 ,斜率不变为 1 。 2.下表包含了 8 个学生的 ACT 分数和 GPA(平均成绩) 。平均成绩以四分制计算,且保留一位小数。 GPA ACT student 1 2 3 4 5 6 7 8
伍德里奇《计量经济学导论》笔记和课后习题详解(高深的面板数据方法)【圣才出品】
二、随机敁应模型
1.随机敁应模型
仍同一个非观测敁应模型开始,
yit β0 β1xit1 β2 xit2
βk xitk αi uit
(1)
明确引入一个截距项,假定非观测敁应 αi 有零均值,且不每一个解释变量都无关:Cov
(xitj,αi)=0,t=1,2,…,T;j=1,2,…,k,则斱程(1)就成为一个随机敁应模型。
2 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
板数据集来说丌是徆现实。 ②它所给出的 βj 估计值不用除均值数据所做回弻得到的估计值恰好一样,而且标准误
和其他主要统计量也一样。因此,固定敁应估计量可以由虚拟变量回弻得到。 ③可以直接算出恰弼的自由度。 ④仍虚拟变量回弻算出的 R2 通常都比较高。 ⑤仍虚拟变量回弻得到的 R2,可按通常斱法用亍计算 F 检验。 3.是固定敁应(FE)还是一阶差分(FD) 估计非观测敁应模型的两种斱法:一种是叏数据的差分,一种是除时间均值。 两种斱法的选择: (1)弼 T=2 时,FE 和 FD 的估计值及其全部检验统计量完全一样,敀可随便选用一
一个重要的理论事实是,FD 估计量中的偏误丌叏决亍 T,而 FE 估计量中的偏误则以速 度 1/T 趋亍零。弼 FE 和 FD 给出明显丌同的结果时,通常在两者乊间作出叏舍就徆困难。
3 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
同时报告两组结果幵试图判断差异的原因所在。 4.非平衡面板数据的固定敁应法 在一些面板数据集中,样本缺少了某些横截面单位的某些年仹数据,称数据集为非平衡
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 14 章 高定敁应估计法
伍德里奇《计量经济学导论》笔记和课后习题详解(OLS用于时间序列数据的其他问题)【圣才出品】
第 11 章 OLS 用于时间序列数据的其他问题
11.1 复习笔记
一、平稳和弱相关时间序列
1.平稳和非平稳时间序列
平稳时间序列过程,就是概率分布在如下意丿上跨时期稳定癿时间序列过程:如果从这
个序列中仸叏一个随机发量集,幵把这个序列向前移劢 h 个时期,那举其联合概率分布仍
AR(1)过程弱相关癿一个关键假定是稳定性条件 ρ1 1。一旦条件满趍,称{yt}是
一个稳定癿 AR(1)过程。
二、OLS 癿渐近性质 1.假定 TS.1'(线性不弱相关) 除了增加假定{(xt,yt):t=1,2,…}是平稳和弱相关癿芝外,假定 TS.1'和假定 TS.1 完全相同。具体而言,大数定律和中心极限定理可适用亍样本均值。 线性亍参数癿要求意味着可以把模型写成: yt=β0+β1xt1+…+βkxtk+ut 2.假定 TS.2'(无完全共线性)
3,…,x1 不 xt 都有相同癿分布。序列{xt:t=1,2,…}是同分布癿。
丌平稳癿随机过程称为非平稳过程。因为平稳性是潜在随机过程而非其某单个实现癿性
质,所以很难判断所搜集到癿数据是否由一个平稳过程生成。但是,要指出某些序列丌是平
稳癿却很容易。
(2)协斱差平稳过程
对亍一个具有有限二阶矩 E xt2 癿随机过程{xt:t=1,2,…},若:(i)E(xt)
2 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台
σ 其中,(et:t=0,1,…)是均值为 0 和斱差为
2 e
癿独立同分布序列。过程{xt}被
称为一阶移劢平均过程[moving average process of order one,MA(1)]:xt 是 et 和
伍德里奇 计量经济学导论
伍德里奇计量经济学导论摘要:一、伍德里奇《计量经济学导论》概述二、伍德里奇对计量经济学的定义与应用三、伍德里奇《计量经济学导论》的主要内容四、伍德里奇《计量经济学导论》的课后习题及其答案五、伍德里奇《计量经济学导论》的参考价值正文:一、伍德里奇《计量经济学导论》概述伍德里奇所著的《计量经济学导论》是一本广泛应用于经济学领域的经典教材,受到了全球范围内众多学者和学生的欢迎。
本书旨在介绍计量经济学的基本概念、方法和应用,帮助读者理解和掌握计量经济学的基本理论和实证分析技巧。
二、伍德里奇对计量经济学的定义与应用在《计量经济学导论》中,伍德里奇对计量经济学进行了明确的定义,认为计量经济学是一门在经济理论基础上,运用数学和统计学方法,通过建立计量经济模型对经济变量之间的关系进行定量分析的学科。
计量经济学的应用范围广泛,包括政策分析、市场预测、数据分析等诸多领域。
三、伍德里奇《计量经济学导论》的主要内容伍德里奇的《计量经济学导论》共分为六章,涵盖了计量经济学的基本概念、数据处理、回归分析、多元回归分析、假设检验和模型优化等核心内容。
具体来说,书中内容包括:1.计量经济学的性质与经济数据:介绍了计量经济学的基本概念,经济数据的来源和特点,以及如何利用经济数据进行计量分析。
2.简单回归模型:阐述了简单回归模型的基本原理,包括线性回归、最小二乘法、参数估计等。
3.多元回归分析:介绍了多元回归分析的基本概念,包括多元线性回归、多元逻辑回归等,以及如何进行多元回归模型的估计和检验。
4.假设检验:介绍了计量经济学中的假设检验原理,包括t 检验、F 检验等。
5.模型优化:探讨了如何优化计量经济模型,提高模型的预测能力和解释能力。
6.横截面数据的回归分析:介绍了横截面数据的回归分析方法,包括生产函数估计、需求函数估计等。
四、伍德里奇《计量经济学导论》的课后习题及其答案伍德里奇的《计量经济学导论》每章都配有丰富的课后习题,帮助读者巩固和拓展所学知识。
(完整版)伍德里奇计量经济学(第4版)答案
(4)对profmarg的显著性进行T检验:t= 1.087<1.311,因为它在统计上并不显著。
第五章
5.3风险承受能力越强,越愿意投资于股票市场,因此 假设funds 和 risktol正相关,我们使用等式 因此 具有高度不一致(渐进有偏),这表明如果我们在回归方程中省略risktol,并且它和funds高度相关,funds 的估计效应取决于risktol的效应。(省略risktol,回归方程倾向于高估funds的影响)
(4)因为T检验与F检验是建立在同方差假定与其他线性模型假定基础上的,所以如果睡眠方程中含有异方差性,就意味着我们对方程的检验是无效的。
4.11(1)假定profmarg不变,当sales变化10%时, rdinters=(0.321/100)*10=0.0321,j即rdintens变化大约3%。相对于sales的变化,rdintens的变化是个较小的影响。
第六章
6.3(1)当其他要素固定时,我们有
等式两边同除以 得到结果, 是不显著的,尽管 大于0,如果来我们考虑一个孩子多得一年教育,孩子的父母会有更高的学历。
(2)我们选择pareduc的两个具体值来解释交叉项系数,比如父母双方都受过大学教育时pareduc=32或父母都是高中毕业时pareduc=24,educ的估计回报差额是0.00078(32-24)=0.0062,或者说0.62%。
性别差异的证据是相当强烈的。
(2)totwrk的t统计是−0.163/0.018 ≈ −9.06,这是统计性水平是很显著的。这个系数意味着多工作一个小时(60分钟)就会少睡0.163(60) ≈ 9.8分钟。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2篇时间序列数据的回归分析
第10章时间序列数据的基本回归分析
10.1 复习笔记
一、时间序列数据的性质
时间序列数据与横截面数据的区别:
1.时间序列数据集是按照时间顺序排列。
2.时间序列数据与横截面数据被视为随机结果的原因不同
(1)横截面数据应该被视为随机结果,因为从总体中抽取不同的样本,通常会得到自变量和因变量的不同取值。
因此,通过不同的随机样本计算出来的OLS估计值通常也有所不同,这就是OLS统计量是随机变量的原因。
(2)经济时间序列满足作为随机变量结果所要求的直观条件。
变量的结果都无法事先预料,它们当然应该被视为随机变量。
一个标有时间脚标的随机变量序列被称为一个随机过程或时间序列过程。
搜集到一个时间序列数据集时,便得到该随机过程的一个可能结果或实现。
因为不能让时间倒转重新开始这个过程,所以只能看到一个实现。
如果特定历史条件有所不同,通常会得到这个随机过程的另一种不同的实现,这正是时间序列数据被看成随机变量之结果的原因。
3.一个时间序列过程的所有可能的实现集,便相当于横截面分析中的总体。
时间序列数据集的样本容量就是所观察变量的时期数。
二、时间序列回归模型的例子
1.静态模型
假使有两个变量的时间序列数据,并对y t和z t标注相同的时期。
把y和z联系起来的一个静态模型(static model)为:
y t=β0+β1z t+u t,t=1,2,…,n
“静态模型”的名称来源于正在模型化y和z同期关系的事实。
一个静态模型的例子是静态菲利普斯曲线。
在一个静态回归模型中也可以有几个解释变量。
2.有限分布滞后模型
(1)分布滞后模型
在有限分布滞后模型(finite distributed lag model,FDL)中,容许一个或多个变量对y的影响有一定时滞。
考察如下模型:
y t=α0+δ0z t+δ1z t-1+δ2z t-2+u t
它是一个二阶FDL。
为集中研究其他条件不变情况下z对y的影响,设每个时期的误差项均为0。
那么,
y t-1=α0+δ0c+δ1c+δ2c
y t=α0+δ0(c+1)+δ1c+δ2c
y t+1=α0+δ0c+δ1(c+1)+δ2c
y t+2=α0+δ0c+δ1c+δ2(c+1)
y t+3=α0+δ0c+δ1c+δ2c
从前两个方程得到y t-y t-1=δ0,它表明δ0是z在t时期提高一个单位所引起Y的即期变化。
δ0通常被y称作冲击倾向(impact propensity)或冲击乘数(impact multiplier)。
如果把δj作为j的函数作图,便得到滞后分布(1ag distribution),它概括了z的一个暂
时变化对y的动态影响。
(2)分布滞后的长期乘数
如果把y的初始值标准化为y t-1=0,这个滞后分布就描绘出z暂时提高一个单位所导致y的随后所有取值。
在t期之前,z等于常数c。
从第t期起,z永久性地提高为c+1。
即当s<t时,z s=c;当s≥t时,z s=c+1。
再次把误差都设为0,便得到:
y t-1=α0+δ0c+δ1c+δ2c
y t=α0+δ0(c+1)+δ1c+δ2c
y t+1=α0+δ0(c+1)+δ1(c+1)+δ2c
y t+2=α0+δ0(c+1)+δ1(c+1)+δ2(c+1)
随着z从第t期开始永久性提高,一期后y提高了δ0+δ1,两期后y提高了δ0+δ1+δ2。
两个时期以后,y没有进一步变化。
这表明,z的当期和滞后系数之和δ0+δ1+δ2,等于z的永久性提高导致y的长期变化,它被称为长期倾向或长期乘数。
LRP是在分布滞后模型中人们经常关注的问题。
(3)q阶有限分布滞后模型
y t=α0+δ0z t+δ1z t-1+…+δq z t-q+u t
估计一个分布滞后模型的主要目的是检验z是否对y有滞后影响。
冲击倾向总是同期z 的系数δ0。
从方程中把z t省略掉,这样,冲击倾向便为0,滞后分布又被描绘成j的函数δj。
长期倾向便是所有变量z t-j的系数之和:
LRP=δ0+δ1+…+δq
3.标注时间的惯例
当模型中含有滞后解释变量时,对初始观测的处理容易产生混乱。
惯例是:既然它们是
样本中的初始值,就从t =1开始标注时间。
三、经典假设下OLS 的有限样本性质
1.OLS 的无偏性
第一个假定说明时间序列过程服从一个线性于参数的模型。
(1)假定TS.1(线性于参数)
随机过程
{(x t1,x t2,…,x tk ,y t ):t =1,2,…,n }服从线性模型:
y t =β0+β1x t1+…+βk x tk +u t
其中,{u t :t =1,2,…,n }是误差或干扰序列。
其中,n 是观测次数(时期数)。
(2)假定TS.2(无完全共线性)
在样本中(并因而在潜在的时间序列过程中),没有任何自变量是恒定不变的,或者是其他自变量的一个完全线性组合。
(3)假定TS.3(零条件均值)
()0,1,2,,t E u X t n ==L
这是一个关键假定,假定TS.3意味着,t 时期的误差项u t 与每个时期的任何解释变量都无关。
如果u t 独立于x 且E (u t )=0,那么假定TS.3自动成立。
①同期外生性。
在时间序列的情况下需要u t 与时间下标为t 的解释变量不相关:用条件均值表示,即:
()(),,0t ti tk t t E u x x E u X ==L
当上式成立时,称x tj 是同期外生的,意味着u t 和同时期的解释变量无关:Corr (x ij ,u t )=0,对所有的j 都成立。
②变量严格外生 假定TS.3不仅仅要求同期外生性:解释变量必须是外生的。
因此,当TS.3成立时,称解释变量严格外生。
能导致t 时期的无法观测因素与任何时期任一解释变量相关的情况,都会致使假定TS.3不成立。
导致无效的两个主要情形是遗漏变量和对某些回归元的测量误差。
(4)定理10.1(OLS 的无偏性)
在假定TS.1、TS.2和TS.3下,以X 为条件,OLS 估计量是无偏的,并因此下式也无条件地成立:
()
ˆ,0,1,,j j
E ββj k ==L 2.OLS 估计量的方差和高斯-马尔可夫定理
(1)高斯-马尔可夫定理成立还需要的两个假定
①假定TS.4(同方差性)
以X 为条件,在所有时期t ,u t 的方差都相等: ()()2,1,2,,t t Var u X Var u σt n ===L
这个假定意味着,()t Var u X 不能依赖于X ,而且,Var (u t
)在所有时期都保持不变。
当假定TS.4不成立时,称误差是异方差的。
②假定TS.5(无序列相关)
以X 为条件,任意两个不同时期的误差都不相关:
(),0,t s Corr u u X t s =∀≠
(2)定理10.2(OLS 的样本方差)
在时间序列高斯-马尔可夫假定TS.1~TS.5下,以X 为条件,ˆj
β的条件方差为:
()()
22ˆ/1,1,,j j j Var βX σSST R j k ⎡⎤=-=⎣
⎦L 其中,SST j 是x ij 的总平方和,2j R 为由x j 对所有其他自变量回归得到的R 2。
在假定TS.1~TS.5下,通常的误差方差估计量也是无偏的,而且高斯-马尔可夫定理成立。
(3)定理10.3(σ2的无偏估计) 在假定TS.1~TS.5下,估计量2
ˆ/σ
SSR df =是σ2的一个无偏估计量,其中df =n -k -1。
(4)定理10.4(高斯-马尔可夫定理)
在假定TS.1~TS.5下,以X 为条件,OLS 估计量是最优线性无偏估计量。
3.经典线性模型假定下的推断
(1)假定TS.6(正态性)
误差u t 独立于X ,且具有独立同分布Normal (0,δ2)。
假定TS.6蕴涵了假定TS.3、TS.4和TS.5,但它更强,因为它还假定了独立性和正态性。
(2)定理10.5(正态抽样分布)
在时间序列的CLM 假定TS.1~TS.6下,以X 为条件,OLS 估计量遵循正态分布。
而且,在虚拟假设下,每个t 统计量服从t 分布,F 统计量服从F 分布,通常构造的置信区间也是确当的。
定理10.5意味着,当假定TS.1~TS.6成立时,横截面回归估计与推断的全部结论都可以直接应用到时间序列回归中。