伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第13章 跨时横截面的混合:简单面板数据方法

合集下载

伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】

y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台

对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM

χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解
伍德里奇《计量经济学导论》(第5 版)笔记和课后习题详解
读书笔记模板
01 思维导图
03 目录分析 05 读书笔记
目录
02 内容摘要 04 作者介绍 06 精彩摘录
思维导图
本书关键字分析思维导图
第版
计量经济 学
时间
习题
序列
经典
变量
笔记
教材
笔记 复习
模型
导论
笔记
第章
习题
分析
数据
回归
内容摘要
本书是伍德里奇《计量经济学导论》(第5版)教材的配套电子书,主要包括以下内容:(1)整理名校笔记, 浓缩内容精华。每章的复习笔记以伍德里奇所著的《计量经济学导论》(第5版)为主,并结合国内外其他计量经 济学经典教材对各章的重难点进行了整理,因此,本书的内容几乎浓缩了经典教材的知识精华。(2)解析课后习 题,提供详尽答案。本书参考国外教材的英文答案和相关资料对每章的课后习题进行了详细的分析和解答。(3) 补充相关要点,强化专业知识。一般来说,国外英文教材的中译本不太符合中国学生的思维习惯,有些语言的表 述不清或条理性不强而给学习带来了不便,因此,对每章复习笔记的一些重要知识点和一些习题的解答,我们在 不违背原书原意的基础上结合其他相关经典教材进行了必要的整理和分析。本书特别适用于参加研究生入学考试 指定考研考博参考书目为伍德里奇所著的《计量经济学导论》的考生,也可供各大院校学习计量经济学的师生参 考。

2.1复习笔记 2.2课后习题详解
3.1复习笔记 3.2课后习题详解
4.1复习笔记 4.2课后习题详解
5.1复习笔记 5.2课后习题详解
6.1复习笔记 6.2课后习题详解
7.1复习笔记 7.2课后习题详解

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第2章 简单回归模型【圣才出品】

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第2章 简单回归模型【圣才出品】

第2章简单回归模型2.1复习笔记一、简单回归模型的定义1.简单线性回归模型一个简单的方程是:01y x uββ=++假定方程在所关注的总体中成立,它便定义了一个简单线性回归模型。

因为它把两个变量x 和y 联系起来,所以又把它称为两变量或者双变量线性回归模型。

变量u 称为误差项或者干扰项,表示除x 之外其他影响y 的因素。

1β就是y 与x 的关系式中的斜率参数,表示在其他条件不变的情况下,x 变化一个单位y 平均变化。

0β被称为截距参数,在一般的模型中除非有很强的理论依据说明模型没有截距项,否则一般情况下都要带上截距项。

2.回归术语表2-1简单回归的术语3.零条件均值假定(1)零条件均值u 的平均值与x 值无关。

可以把它写作:()()|E u x E u =当方程成立时,就说u 的均值独立于x。

(2)零条件均值假定的意义①零条件均值假定给出1β的另一种非常有用的解释。

以x 为条件取期望值,并利用()|0E u x =,便得到:()01|E y x xββ=+方程表明,总体回归函数(PRF)()|E y x 是x 的一个线性函数,线性意味着x 变化一个单位,将使y 的期望值改变1β。

对任何给定的x 值,y 的分布都以()|E y x 为中心。

1β就是斜率参数。

②给定零条件均值假定()|0E u x =,把方程中的y 看成两个部分是比较有用的。

一部分是表示()|E y x 的01x ββ+,被称为y 的系统部分,即由x 解释的那一部分,另一个部分是被称为非系统部分的u,即不能由x 解释的那一部分。

二、普通最小二乘法的推导1.最小二乘估计值从总体中找一个样本。

令(){} 1 i i x y i n =,:,…,表示从总体中抽取的一个容量为n 的随机样本。

01i i iy x u ββ=++在总体中,u 与x 不相关。

因此有:()()()0cov 0E u x u E xu ===,和用可观测变量x 和y 以及未知参数0β和1β表示为:()010E y x ββ--=()010E x y x ββ--=⎡⎤⎣⎦得到()0111ˆˆ0ni ii y x n ββ=--=∑和()0111ˆˆ0ni i ii x y x n ββ=--=∑这两个方程可用来解出0ˆβ和1ˆβ01ˆˆy x ββ=+则01ˆˆy x ββ=-一旦得到斜率估计值1ˆβ,则有:()111ˆˆ0niiii x y y x x ββ=⎡⎤---=⎣⎦∑整理后便得到:()()111ˆnniii i i i x yy x x x β==-=-∑∑根据求和运算的基本性质,有:()()211n ni i i i i x x x x x ==-=-∑∑()()()11nniii i i i x yy x x y y==-=--∑∑因此,只要有()21nii x x =->∑估计的斜率就为:()()()1121ˆnii i ni i xx y yx x β==--=-∑∑所给出的估计值称为0β和1β的普通最小二乘(OLS)估计值。

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】

第三篇高级专题第13章跨时横截面的混合:简单面板数据方法13.1 复习笔记考点一:跨时独立横截面的混合★★★★★1.独立混合横截面数据的定义独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。

这种数据的重要特征在于:都是由独立抽取的观测所构成的。

在保持其他条件不变时,该数据排除了不同观测误差项的相关性。

区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。

2.使用独立混合横截面的理由(见表13-1)表13-1 使用独立混合横截面的理由3.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2 用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(2)对多个时期计算邹至庄检验统计量的办法①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。

②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。

然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。

若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k 个约束。

而无约束模型中有T+Tk个待估计参数。

所以,F检验的df为(T-1)k和n-T -Tk,其中n为总观测次数。

F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。

但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。

4.利用混合横截面作政策分析(1)自然实验与真实实验当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。

一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。

伍德里奇《计量经济学导论》笔记和课后习题详解(时间序列回归中的序列相关和异方差)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(时间序列回归中的序列相关和异方差)【圣才出品】

第12章 时间序列回归中的序列相关和异方差12.1 复习笔记一、含序列相关误差时OLS 的性质 1.无偏性和一致性在时间序列回归的前3个高斯-马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。

特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆj β都是无偏的。

这类似于误差中的异方差不会造成ˆjβ产生偏误。

把严格外生性假定放松到()0t t E u X =,并证明了当数据是弱相关的时候,ˆjβ仍然是一致的(但不一定无偏)。

这一结论不以对误差中序列相关的假定为转移。

2.效率和推断高斯-马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。

通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。

在序列相关的时候,通常的方差估计量都是()1ˆVar β的有偏估计。

因为ˆj β的标准误是ˆjβ的标准差的估计值,所以在出现序列相关的时候,使用通常的OLS 标准误就不再确当。

因此,检验单个假设的t 统计量也不再确当。

因为较小的标准误意味着较大的t 统计量,所以当ρ>0时,通常的统计量常常过大。

用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。

3.拟合优度t时间序列回归模型中的误差若存在序列相关,通常的拟合优度指标R 2和调整R 2便会失效,但只要数据是平稳和弱相关的,拟合优度指标依然有效。

在横截面背景中将总体R 2定义为221/u y σσ-。

在使用平稳而又弱相关数据的时间序列回归背景中,这个定义依然确当:误差和因变量的方差都不随时间而变化。

根据大数定律,R 2和调整R 2都是总体R 2的一致估计。

拟合优度指标仍是总体参数的一致估计量。

若{y t }是一个I (1)过程,则因为Var (y t )随着t 而递增,所以就无法通过重新定义R 2为221/uy σσ-来证明;此时的拟合优度便没有什么意义。

4.出现滞后因变量时的序列相关回归中出现滞后因变量时,误差有序列相关的危险。

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德⾥奇《计量经济学导论》笔记和课后习题详解(⼀个经验项⽬的实施)【圣才出品】第19章⼀个经验项⽬的实施19.1 复习笔记⼀、问题的提出提出⼀个⾮常明确的问题,其重要性不容忽视。

如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚⾄收集错误时期的数据。

1.查找数据的⽅法《经济⽂献杂志》有⼀套细致的分类体系,其中每篇论⽂都有⼀组标识码,从⽽将其归于经济学的某⼀⼦领域之中。

因特⽹(Internet)服务使得搜寻各种主题的已发表论⽂更为⽅便。

《社会科学引⽤索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论⽂时⾮常有⽤,包括那些时常被其他著作引⽤的热门论⽂。

⽹络搜索引擎“⾕歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。

2.构思题⽬时⾸先应明确的⼏个问题(1)要使⼀个问题引起⼈们的兴趣,并不需要它具有⼴泛的政策含义;相反地,它可以只有局部意义。

(2)利⽤美国经济的标准宏观经济总量数据来进⾏真正原创性的研究⾮常困难,尤其对于⼀篇要在半个或⼀个学期之内完成的论⽂来说更是如此。

然⽽,这并不意味着应该回避对宏观或经验⾦融模型的估计,因为仅增加⼀些更新的数据便对争论具有建设性。

⼆、数据的收集1.确定适当的数据集⾸先必须确定⽤以回答所提问题的数据类型。

最常见的类型是横截⾯、时间序列、混合横截⾯和⾯板数据集。

有些问题可以⽤任何⼀种数据结构进⾏分析。

确定收集何种数据通常取决于分析的性质。

关键是要考虑能够获得⼀个⾜够丰富的数据集,以进⾏在其他条件不变下的分析。

同⼀横截⾯单位两个或多个不同时期的数据,能够控制那些不随时间⽽改变的⾮观测效应,⽽这些效应通常使得单个横截⾯上的回归失效。

2.输⼊并储存数据⼀旦你确定了数据类型并找到了数据来源,就必须把数据转变为可⽤格式。

通常,数据应该具备表格形式,每次观测占⼀⾏;⽽数据集的每⼀列则代表不同的变量。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第12章 时间序列回归中的序列相关和异方差性

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第12章 时间序列回归中的序列相关和异方差性

第12章时间序列回归中的序列相关和异方差性12.1复习笔记一、含序列相关误差时OLS 的性质1.无偏性和一致性在时间序列回归的前3个高斯—马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。

特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆjβ都是无偏的。

这类似于误差中的异方差不会造成ˆjβ产生偏误。

把严格外生性假定放松到()|0t t E u X =,并证明了当数据是弱相关的时候,ˆj β仍然是一致的(但不一定无偏)。

这一结论不以对误差中序列相关的假定为转移。

2.效率和推断高斯—马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。

通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。

假定误差存在序列相关,1,1,2,...,ρ-=+=tt t u u e t n ,1ρ<。

其中e t 是均值为0方差为2e σ满足经典假定的误差,对于简单回归模型:01ββ=++t t ty x u 假定x t 的样本均值为零,于是1111ˆn x t t i SST x u ββ-==+∑其中21n x t i SST x ==∑,计算1ˆβ的方差,()()22221111ˆ/2/n n n t j x t t x x t t j i i j Var SST Var x u SST SST x x βσσρ--+===⎛⎫==+ ⎪⎝⎭∑∑∑其中()2σ=t Var u 由1ˆβ的方差表达形式可知,第一项为2/xSST σ,为经典假定条件下的简单回归模型中参数的方差,所以当模型中的误差项存在序列相关时,按照OLS 估计的方差是有偏的。

在出现序列相关的时候,使用通常的OLS 标准误就不再准确。

因此,检验单个假设的t 统计量也不再正确。

因为较小的标准误意味着较大的t 统计量,所以当ρ﹥0时,通常的t 统计量常常过大。

用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

第19章一个经验项目的实施19.1 复习笔记一、问题的提出提出一个非常明确的问题,其重要性不容忽视。

如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚至收集错误时期的数据。

1.查找数据的方法《经济文献杂志》有一套细致的分类体系,其中每篇论文都有一组标识码,从而将其归于经济学的某一子领域之中。

因特网(Internet)服务使得搜寻各种主题的已发表论文更为方便。

《社会科学引用索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论文时非常有用,包括那些时常被其他著作引用的热门论文。

网络搜索引擎“谷歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。

2.构思题目时首先应明确的几个问题(1)要使一个问题引起人们的兴趣,并不需要它具有广泛的政策含义;相反地,它可以只有局部意义。

(2)利用美国经济的标准宏观经济总量数据来进行真正原创性的研究非常困难,尤其对于一篇要在半个或一个学期之内完成的论文来说更是如此。

然而,这并不意味着应该回避对宏观或经验金融模型的估计,因为仅增加一些更新的数据便对争论具有建设性。

二、数据的收集1.确定适当的数据集首先必须确定用以回答所提问题的数据类型。

最常见的类型是横截面、时间序列、混合横截面和面板数据集。

有些问题可以用任何一种数据结构进行分析。

确定收集何种数据通常取决于分析的性质。

关键是要考虑能够获得一个足够丰富的数据集,以进行在其他条件不变下的分析。

同一横截面单位两个或多个不同时期的数据,能够控制那些不随时间而改变的非观测效应,而这些效应通常使得单个横截面上的回归失效。

2.输入并储存数据一旦你确定了数据类型并找到了数据来源,就必须把数据转变为可用格式。

通常,数据应该具备表格形式,每次观测占一行;而数据集的每一列则代表不同的变量。

(1)不同类型数据的输入要求①对时间序列数据集来说,只有一种合理的方式来进行数据的输入和存储:即以时间为序,最早的时期列为第一次观测,最近的时期列为最后一次观测。

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-高级面板数据方法【圣才出品】

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-高级面板数据方法【圣才出品】

第14章高级面板数据方法14.1复习笔记考点一:固定效应估计法★★★★★1.固定效应变换固定效应变换又称组内变换,考虑仅有一个解释变量的模型:对每个i,有y it =β1x it +a i +u it ,t=1,2,…,T对每个i 求方程在时间上的平均,便得到_y i =β1_x i +a i +_u i 其中,11T it t y T y-==∑(关于时间的均值)。

因为a i 在不同时间固定不变,故它会在原模型和均值模型中都出现,如果对于每个t,两式相减,便得到y it -_y i =β1(x it -_x i )+u it -_u i ,t=1,2,…,T或1 12it it it y x u ,t ,,,T=+=&&&&&&L β其中,it it i y y y =-&&是y 的除时间均值数据;对it x &&和it u &&的解释也类似。

方程的要点在于,非观测效应a i 已随之消失,从而可以使用混合OLS 去估计式1 12it it it y x u ,t ,,,T =+=&&&&&&L β。

上式的混合OLS 估计量被称为固定效应估计量或组内估计量。

组间估计量可以从横截面方程_y i =β1_x i +a i +_u i 的OLS 估计量而得到,即同时使用y 和x的时间平均值做一个横截面回归。

如果a i与_x i相关,估计量是有偏误的。

而如果认为a i 与x it无关,则使用随机效应估计量要更好。

组间估计量忽视了变量如何随着时间而变化。

在方程中添加更多解释变量不会引起什么变化。

2.固定效应模型(1)无偏性原始的非固定效应模型,只要让每一个变量都减去时间均值数据,即可得到固定效应模型。

固定效应模型的无偏性是建立在严格外生性的假定下的,所以FE模型需要假定特异误差u it应与所有时期的每个解释变量都无关。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第11章OLS用于时间序列数据的其他问题【

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第11章OLS用于时间序列数据的其他问题【

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第11章OLS用于时间序列数据的其他问题【第11章OLS 用于时间序列数据的其他问题11.1复习笔记一、平稳和弱相关时间序列1.平稳和非平稳时间序列平稳时间序列过程,就是概率分布在如下意义上跨时期稳定的时间序列过程:如果从这个序列中任取一个随机变量集,并把这个序列向前移动h 个时期,那么其联合概率分布仍然保持不变。

(1)平稳随机过程对于随机过程{ 1 2 }t x t =:,,…,如果对于每一个时间指标集121m t t t ≤<<12 m t h t h t h x x x +++,,,的联合分布相同,那么这个随机过程就是平稳的。

这种平稳经常称为严平稳,它是从概率分布的角度去定义的。

其含义之一是(取m=1和t 1=1):对所有t=2,3,…,x 1与x t 都有相同的分布。

序列{ 1 2 }t x t =:,,…是同分布的。

不平稳的随机过程称为非平稳过程。

因为平稳性是潜在随机过程而非其某单个实现的性质,所以很难判断所搜集到的数据是否由一个平稳过程生成。

但是,要指出某些序列不是平稳的却很容易。

(2)协方差平稳过程(宽平稳,弱平稳)对于一个具有有限二阶矩()2t E x ??∞??<的随机过程{ 1 2 }t x t =:,,…,若:(i)E(x t )为常数;(ii)Var(x t )为常数;(iii)对任何t,h≥1,Cov(x t ,x t+h )仅取决于h,而不取决于t,那它就是协方差平稳的。

协方差平稳只考虑随机过程的前两阶矩:这个过程的均值和方差不随着时间而变化,而且,x t 和x t+h 的协方差只取决于这两项之间的距离h,与起始时期t 的位置无关。

由此立即可知x t 与x t+h 之间的相关性也只取决于h。

如果一个平稳过程具有有限二阶矩,那么它一定是协方差平稳的,但反过来未必正确。

由于严平稳的条件比较苛刻,在实际中从概率分布的角度去验证是无法实现的,所以在实际运用中所指的平稳都是指宽平稳,即协方差平稳。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第10章 时间序列数据的基本回归分析【圣才出

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第10章 时间序列数据的基本回归分析【圣才出

第10章时间序列数据的基本回归分析10.1复习笔记一、时间序列数据的性质时间序列数据与横截面数据的区别:(1)时间序列数据集是按照时间顺序排列。

(2)时间序列数据与横截面数据被视为随机结果的原因不同。

①横截面数据应该被视为随机结果,因为从总体中抽取不同的样本,通常会得到自变量和因变量的不同取值。

因此,通过不同的随机样本计算出来的OLS估计值通常也有所不同,这就是OLS统计量是随机变量的原因。

②经济时间序列满足作为随机变量是因为其结果无法事先预知,因此可以被视为随机变量。

一个标有时间脚标的随机变量序列被称为一个随机过程或时间序列过程。

搜集到一个时间序列数据集时,便得到该随机过程的一个可能结果或实现。

因为不能让时间倒转重新开始这个过程,所以只能看到一个实现。

如果特定历史条件有所不同,通常会得到这个随机过程的另一种不同的实现,这正是时间序列数据被看成随机变量之结果的原因。

(3)一个时间序列过程的所有可能的实现集,便相当于横截面分析中的总体。

时间序列数据集的样本容量就是所观察变量的时期数。

二、时间序列回归模型的例子1.静态模型假使有两个变量的时间序列数据,并对y t和z t标注相同的时期。

把y和z联系起来的一个静态模型(staticmodel)为:10 1 2 t t t y z u t nββ=++=⋯,,,,“静态模型”的名称来源于正在模型化y 和z 同期关系的事实。

若认为z 在时间t 的一个变化对y 有影响,即1t t y z β∆=∆,那么可以将y 和z 设定为一个静态模型。

一个静态模型的例子是静态菲利普斯曲线。

在一个静态回归模型中也可以有几个解释变量。

2.有限分布滞后模型(1)有限分布滞后模型有限分布滞后模型(finitedistributedlagmodel,FDL)是指一个或多个变量对y 的影响有一定时滞的模型。

考察如下模型:001122t t t t ty z z z u αδδδ--=++++它是一个二阶FDL。

计量经济学导论伍德里奇数据集

计量经济学导论伍德里奇数据集

计量经济学导论伍德里奇数据集全文共四篇示例,供读者参考第一篇示例:计量经济学导论伍德里奇数据集是一个广泛使用的经济学数据集,它收集了来自不同国家和地区的大量经济数据,包括国内生产总值(GDP)、人口、失业率、通货膨胀率等指标。

这些数据被广泛用于经济学研究和实证分析,帮助经济学家们了解和预测经济现象。

伍德里奇数据集由经济学家Robert S. Pindyck和Daniel L. Rubinfeld于1991年编撰而成,现已成为许多大学和研究机构的经济学教学和研究工具。

该数据集包含了大量的时间序列和横截面数据,涵盖了从1960年至今的多个国家和地区。

在伍德里奇数据集中,经济指标按照国家和地区进行分类,每个国家或地区都有各种经济指标的时间序列数据。

这些数据不仅涵盖了宏观经济指标,如GDP、人口、通货膨胀率等,还包括了一些特定领域的数据,如能源消耗、就业情况、教育水平等。

研究人员可以使用伍德里奇数据集进行各种经济学研究,例如分析不同国家和地区的经济增长趋势、比较不同国家之间的经济表现、评估各种经济政策的效果等。

通过对数据集的分析,经济学家们可以更好地理解和解释经济现象,为政策制定和经济预测提供依据。

除了为经济学研究提供数据支持外,伍德里奇数据集还可以帮助经济学教学。

许多经济学课程都会使用这个数据集进行案例分析和实证研究,让学生们更直观地理解经济理论,并将理论应用到实际问题中去。

通过实际数据的分析,学生们可以培养独立思考和解决问题的能力,提高他们的经济学研究水平。

要正确使用伍德里奇数据集进行经济学研究和教学,研究人员和教师们需要对数据集的结构和特点有深入的了解。

他们需要了解数据集中各个变量的定义和计量单位,以确保数据分析的准确性。

他们需要熟悉数据集的时间跨度和覆盖范围,以便选择合适的时间段和国家样本进行研究。

他们还需要掌握数据处理和分析的方法,如时间序列分析、横截面分析等,以确保研究结论的可靠性和科学性。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣第15章工具变量估计与两阶段最小二乘法15.1复习笔记一、动机:简单回归模型中的遗漏变量1.面对可能发生的遗漏变量偏误(或无法观测异质性)的四种选择(1)忽略遗漏变量问题,承受有偏而又不一致估计量,若能把估计值与关键参数的偏误方向一同给出,则该方法便令人满意。

(2)试图为无法观测变量寻找并使用一个适宜的代理变量,该方法试图通过用代理变量取代无法观测变量来解决遗漏变量的问题,但并不是总可以找到一个好的代理。

(3)假定遗漏变量不随时间变化,运用固定效应或一阶差分方法。

(4)将无法观测变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法,工具变量法。

2.工具变量法简单回归模型01y x uββ=++其中x 与u 相关:()Cov 0,x u ≠(1)为了在x 和u 相关时得到0β和1β的一致估计量,需要有一个可观测到的变量z,z 满足两个假定:①z 与u 不相关,即Cov(z,u)=0;②z 与x 相关,即Cov(z,x)≠0。

满足这两个条件,则z 称为x 的工具变量,简称为x 的工具。

z 满足①式称为工具外生性条件,工具外生性意味着,z 应当对y 无偏效应(一旦x 和u 中的遗漏变量被控制),也不应当与其他影响y 的无法观测因素相关。

z 满足②式意味着z 必然与内生解释变量x 有着或正或负的关系。

这个条件被称为工具相关性。

(2)工具变量的两个要求之间的差别①Cov(z,u)是z 与无法观测误差u 的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。

②给定一个来自总体的随机样本,z 与x(在总体中)相关的条件则可加以检验。

最容易的方法是估计一个x 与z 之间的简单回归。

在总体中,有01x z vππ=++从而,由于()()1Cov /ar V ,x z z π=所以式Cov(z,x)≠0中的假定当且仅当10π≠时成立。

伍德里奇《计量经济学导论》笔记和课后习题详解(OLS用于时间序列数据的其他问题)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(OLS用于时间序列数据的其他问题)【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 11 章 OLS 用于时间序列数据的其他问题
11.1 复习笔记
一、平稳和弱相关时间序列
1.平稳和非平稳时间序列
平稳时间序列过程,就是概率分布在如下意丿上跨时期稳定癿时间序列过程:如果从这
个序列中仸叏一个随机发量集,幵把这个序列向前移劢 h 个时期,那举其联合概率分布仍
AR(1)过程弱相关癿一个关键假定是稳定性条件 ρ1 1。一旦条件满趍,称{yt}是
一个稳定癿 AR(1)过程。
二、OLS 癿渐近性质 1.假定 TS.1'(线性不弱相关) 除了增加假定{(xt,yt):t=1,2,…}是平稳和弱相关癿芝外,假定 TS.1'和假定 TS.1 完全相同。具体而言,大数定律和中心极限定理可适用亍样本均值。 线性亍参数癿要求意味着可以把模型写成: yt=β0+β1xt1+…+βkxtk+ut 2.假定 TS.2'(无完全共线性)
3,…,x1 不 xt 都有相同癿分布。序列{xt:t=1,2,…}是同分布癿。
丌平稳癿随机过程称为非平稳过程。因为平稳性是潜在随机过程而非其某单个实现癿性
质,所以很难判断所搜集到癿数据是否由一个平稳过程生成。但是,要指出某些序列丌是平
稳癿却很容易。
(2)协斱差平稳过程
对亍一个具有有限二阶矩 E xt2 癿随机过程{xt:t=1,2,…},若:(i)E(xt)
2 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台

σ 其中,(et:t=0,1,…)是均值为 0 和斱差为
2 e
癿独立同分布序列。过程{xt}被
称为一阶移劢平均过程[moving average process of order one,MA(1)]:xt 是 et 和

计量经济学(伍德里奇第五版中文版)答案

计量经济学(伍德里奇第五版中文版)答案

计量经济学(伍德里奇第五版中文版)答案(三)鉴于潜在的混杂因素- 其中一些是第(ii)上市- 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。

在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。

1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B公司的不同?(二)公司很可能取决于工人的特点选择在职培训。

一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。

企业甚至可能歧视根据年龄,性别或种族。

也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。

此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。

(iii)该金额的资金和技术工人也将影响输出。

所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。

管理者的素质也有效果。

(iv)无,除非训练量是随机分配。

许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。

1.3没有任何意义,提出这个问题的因果关系。

经济学家会认为学生选择的混合学习和工作(和其他活动,如上课,休闲,睡觉)的基础上的理性行为,如效用最大化的约束,在一个星期只有168小时。

然后我们可以使用统计方法来衡量之间的关联学习和工作,包括回归分析,我们覆盖第2章开始。

但我们不会声称一个变量“使”等。

他们都选择学生的变量。

第2章解决问题的办法2.1(I)的收入,年龄,家庭背景(如兄弟姐妹的人数)仅仅是几个可能性。

似乎每个可以与这些年的教育。

(收入和教育可能是正相关,可能是负相关,年龄和受教育,因为在最近的同伙有妇女,平均而言,更多的教育和兄弟姐妹和教育的人数可能呈负相关)。

(ii)不会(i)部分中列出的因素,我们与EDUC。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解(第4~6章)【圣才出品】

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解(第4~6章)【圣才出品】

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解第4章多元回归分析:推断4.1复习笔记一、OLS 估计量的抽样分布1.假定MLR.6(正态性)总体误差u 独立于解释变量12 k x x x ,,…,,而且服从均值为零和方差为2σ的正态分布:()2Normal 0 u σ~,。

2.经典线性模型就横截面回归中的应用而言,从假定MLR.1~MLR.6这六个假定被称为经典线性模型假定。

将这六个假定下的模型称为经典线性模型(CLM)。

在CLM 假定下,OLS 估计量01ˆˆˆ kβββ,,…,比在高斯—马尔可夫假定下具有更强的效率性质。

可以证明,OLS 估计量是最小方差无偏估计,即在所有的无偏估计中,OLS 具有最小的方差。

总结CLM 总体假定的一种简洁方法是:()201122|Normal k k y x x x x ββββσ++++~…,误差项的正态性导致OLS 估计量的正态抽样分布。

3.用中心极限定理去推导u 的分布的缺陷(1)虽然u 是影响y 而又观测不到的众多因素之和,且各因素可能各有极为不同的总体分布,但中心极限定理(CLT)在这些情形下仍成立。

正态近似的效果取决于u 中有多少因素,以及u 中包含因素分布的差异。

(2)更严重的问题是,正态近似假定所有不可观测因素都以独立而可加的方式影响着Y。

因此如果u 是不可观测因素的一个复杂函数,那么CLT 论证并不真正适用。

4.误差项的正态性导致OLS 估计量的正态抽样分布定理4.1:正态抽样分布在CLM 假定MLR.1~MLR.6下,以自变量的样本值为条件,有:()ˆˆ~Normal Var j j j βββ⎡⎤⎣⎦,因此()()()ˆˆ/sd ~Normal 0 1j j j βββ-,注:除ˆj β服从正态分布外,01ˆˆˆ k βββ,,…,的任何线性组合也都是正态分布,而且ˆjβ的任何一个子集也都具有一个联合正态分布。

二、检验对单个总体参数的假设:t 检验1.总体回归函数总体模型可写作:11o k k y x x uβββ=++⋯++假定它满足CLM 假定,OLS 得到j β的无偏估计量。

伍德里奇《计量经济学导论》 第 版 笔记和课后习题详解 章

伍德里奇《计量经济学导论》 第 版 笔记和课后习题详解 章

使用普通最小二乘法,此时最小化的残差平方和为()211niii y x β=-∑利用一元微积分可以证明,1β必须满足一阶条件()110niiii x y x β=-=∑从而解出1β为:1121ni ii nii x yxβ===∑∑当且仅当0x =时,这两个估计值才是相同的。

2.2 课后习题详解一、习题1.在简单线性回归模型01y x u ββ=++中,假定()0E u ≠。

令()0E u α=,证明:这个模型总可以改写为另一种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。

证明:在方程右边加上()0E u α=,则0010y x u αββα=+++-令新的误差项为0e u α=-,因此()0E e =。

新的截距项为00αβ+,斜率不变为1β。

2(Ⅰ)利用OLS 估计GPA 和ACT 的关系;也就是说,求出如下方程中的截距和斜率估计值01ˆˆGPA ACT ββ=+^评价这个关系的方向。

这里的截距有没有一个有用的解释?请说明。

如果ACT 分数提高5分,预期GPA 会提高多少?(Ⅱ)计算每次观测的拟合值和残差,并验证残差和(近似)为零。

(Ⅲ)当20ACT =时,GPA 的预测值为多少?(Ⅳ)对这8个学生来说,GPA 的变异中,有多少能由ACT 解释?试说明。

答:(Ⅰ)变量的均值为: 3.2125GPA =,25.875ACT =。

()()15.8125niii GPA GPA ACT ACT =--=∑根据公式2.19可得:1ˆ 5.8125/56.8750.1022β==。

根据公式2.17可知:0ˆ 3.21250.102225.8750.5681β=-⨯=。

因此0.56810.1022GPA ACT =+^。

此处截距没有一个很好的解释,因为对样本而言,ACT 并不接近0。

如果ACT 分数提高5分,预期GPA 会提高0.1022×5=0.511。

(Ⅱ)每次观测的拟合值和残差表如表2-3所示:根据表可知,残差和为-0.002,忽略固有的舍入误差,残差和近似为零。

计量经济学导论伍德里奇课后答案中文

计量经济学导论伍德里奇课后答案中文

2.10(iii) From (2.57), Var(1ˆβ) = σ2/21()n i i x x =⎛⎫- ⎪⎝⎭∑. 由提示:: 21n ii x =∑ ≥ 21()n i i x x =-∑, and so Var(1β) ≤ Var(1ˆβ). A more direct way to see this is to write(一个更直接的方式看到这是编写) 21()ni i x x =-∑ = 221()n i i x n x =-∑, which is less than21n i i x=∑unless x = 0.(iv)给定的c 2i x 但随着x 的增加, 1ˆβ的方差与Var(1β)的相关性也增加.0β小时1β的偏差也小.因此, 在均方误差的基础上不管我们选择0β还是1β要取决于0β,x ,和n 的大小 (除了 21n i i x=∑的大小).3.7We can use Table 3.2. By definition, 2β > 0, and by assumption, Corr(x 1,x 2) < 0. Therefore, there is a negative bias in 1β: E(1β) < 1β. This means that, on average across different random samples, the simpleregression estimator underestimates the effect of the training program. It is even possible that E(1β) isnegative even though 1β > 0. 我们可以使用表3.2。

根据定义,> 0,由假设,科尔(X1,X2)<0。

因此,有一个负偏压为:E ()<。

这意味着,平均在不同的随机抽样,简单的回归估计低估的培训计划的效果。

计量经济学伍德里奇第五版中文版)答案

计量经济学伍德里奇第五版中文版)答案

第1章解决问题的办法1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。

也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。

对于原因,我们将看到在第2章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束)。

(二)呈负相关关系意味着,较大的一类大小是与较低的性能。

因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。

然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。

例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。

另一种可能性是,在学校,校长可能分配更好的学生,以小班授课。

或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。

(三)鉴于潜在的混杂因素 - 其中一些是第(ii)上市 - 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。

在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。

1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B 公司的不同?(二)公司很可能取决于工人的特点选择在职培训。

一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。

企业甚至可能歧视根据年龄,性别或种族。

也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。

此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。

(iii)该金额的资金和技术工人也将影响输出。

所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。

管理者的素质也有效果。

(iv)无,除非训练量是随机分配。

许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第13章跨时横截面的混合:简单面板数据方法
13.1复习笔记
一、数据集的种类
1.独立混合横截面数据
它是在不同时点(经常但并不一定是不同年份)从一个大总体里进行随机抽样的结果。

重要特点:它们都是由独立抽取的观测所构成。

主要性质:保持其他条件不变,它排除了不同观测误差项的相关。

一个独立混合横截面和单独一个随机样本的差异在于,在不同时点上对总体进行抽样很可能导致观测点(即观测结果)不是同分布的情形(因为随着时间的变化,总体的分布可能已经发生变化)。

2.面板数据集
它虽然兼有横截面和时间序列维度,但在一些重要方面却不同于独立混合横截面,有时又称纵列数据。

面板数据是在不同时间跟踪相同的一些个人、家庭、企业、城市、州或者其他单位,从这些跟踪的对象中收集的数据,在同一个时点上有多个个体的观测值,同时每一个个体又有几个不同时期的观测值。

二、跨时独立横截面的混合
1.使用独立混合横截面的理由
每个时期都抽取一个随机样本,然后把所得到的随机样本合并起来作为一个大的样本就
是一个独立混合横截面。

使用独立混合横截面的一个理由是要加大样本容量,把不同时点从同一总体中抽取的多个随机样本混合起来使用,可以获取更精密的估计量和更具功效的检验统计量,仅当因变量和某些自变量保持着不随时间而变化的关系时,混合才是有用的。

使用混合截面只会带来少量的统计复杂性,因为总体在不同时期可能会有不同的分布,为了反映这种情况需要允许截距在不同时期有不同的值,因此通过引入年度虚拟变量就可以解决这个问题。

2.对跨时结构性变化的邹至庄检验
(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别
①检验的一种形式是,把混合估计的残差平方和看作约束SSR ;无约束的SSR 则是对两个时期分别估计而得的两个SSR 之和,然后按照邹至庄检验的步骤计算F 统计量。

②检验的另一种方法:先将每一变量对两个年度虚拟变量之一形成交互作用,再检验这个年度虚拟变量和全部交互项是否联合显著。

由于回归模型中的截距常随时间而变,邹至庄检验便能识破是否存在这种变化。

若时期很多,而且解释变量也不少,则构造一套完整的交互项可能十分繁琐。

(2)对多个时期计算邹至庄检验统计量的办法
①使用所有时期虚拟变量与一个或几个或所有解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。

②做一个容许不同时期有不同截距的混合回归来估计约束模型,从而得到SSR r 。

然后,对T 个时期中的每个时期都做一个回归,并分别得到残差平方和。

无约束残差平方和便是
12SSR SSR SSR SST ur T
=+++
若有k 个解释变量(不包括截距和时期虚拟变量)和T 个时期,便需要检验(T-1)k 个约束。

而无约束模型中有T+Tk 个待估计参数。

所以,若n 为总观测次数,则F 检验的df 为(T-1)k 和n-T-Tk。

F 统计量:
()()()SSR SSR /SSR /1r ur ur n T Tk T k ----⎡⎤⎡⎤⎣⎦⎣⎦
但这个检验不能对异方差性保持稳健,为了得到—个异方差—稳健的检验,必须构造交互项并做一个混合回归。

三、利用混合横截面作政策分析
1.自然实验与真实实验
当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。

一个自然实验总有一个不受政策变化影响的对照组和一个被认为受政策变化影响的处理组。

在自然实验中,对照组和处理组均来自某个具体的政策变化,一个在政策改变以前,一个在政策改变以后。

在真实实验中,处理组和对照组是随机而明确地抽取的。

把对照组称为C,处理组称为T,并令处理组T 中观测的dT 等于1,否则等于0。

再令d2为第2个时期的虚拟变量,模型方程为
001122y d dT d dT βδβδ=+++⋅+其他因素
其中,y 是我们关注的结果变量。

δ1度量了政策效应。

若回归中没有其他因素,1ˆδ就是倍差估计量:()()
1 2 2 1 1 ˆ=T C T C y y y y δ---,,,,
2.平均处理效应及其估计方法
δ1因度量对y 的平均结果的“处理”或政策效应,有时也被称为平均处理效应。

δ1两种估计方法:
(1)在每个时期都计算处理组与控制组的平均值之差,然后再将不同时期的上述差值进行差分;(2)分别计算处理组和控制组不同时期的平均值变化,然后将这些变化进行差分,这就意味着是求()()
1 2 1 2 1 ˆT T C C y y y y δ=---,,,,从结果可知估计值1ˆδ不会依赖于差分的方式。

四、两时期面板数据分析
1.固定效应模型
简单的回归方程很可能遇到遗漏变量的问题。

利用面板数据的方法,把影响因变量的无法观测因素分为两类:一类是恒常不变的,另一类则随时间而变。

令i 表示横截面单位,t 表示时期,可将含有单个可观测解释变量的模型写成
0012 1 2
it t it i it y d x a u t βδβ=++++=,,变量d2t 是一个在t=1时取值为零而在t=2时取值为1的虚拟变量,它不随i 而变化。

变量a i 概括了影响着y it 但又不随着时间而变化的所有无法观测的因素,一般都被称为非观测效应,在应用研究中也常常被称为固定效应,a i 在时间上是固定的,因此模型被称为非观测效应模型或固定效应模型。

a i 又称为非观测异质性。

误差u it 常被称为特异误差或时变误差,因为它代表因时而变且影响着y it 的那些无法观测的因素。

2.估计1β的方法
例如,给定两年的面板数据,估计参数1β的方法是:直接把两年的数据混合起来,然后用OLS。

这种方法有两个缺点,最重要的一点是,为了使混合的OLS 得到1β的一个一致估计量,就必须假定非观测效应a i 与x it 无关。

将模型写成:
0012,1,2
βδβ=+++=it t it it y d x v t 其中,v it =a i +u it 常被称为复合误差。

即使假定特异误差u it 与x it 无关,如果a i 与x it 相关,混合OLS 估计就是偏误且不一致的。

由此造成的偏误有时又被称为异质性偏误,这是由于遗漏了一个不随时间而变化的变量所导致的。

3.一阶差分方程
在大多应用中,收集面板数据主要是为了考虑非观测效应a i 与解释变量相关。

因为a i 是不随着时间而变化的常数,所以可以取两个年份的数据之差。

对横截面的第i 个观测值,把两年的方程分别写为:
()()
()
2001221011 1 2 1i i i i i i i i y x a u t y x a u t βδβββ=++++==+++=如果将第一个方程减去第二个方程,便得到
()()
21012121i i i i i i y y x x u u δβ-=+-+-或
01i i i
y x u δβ∆=+∆+∆
非观测效应a i 被“差分掉”了,该式称为一阶差分方程,它是由单个横截面方程对每个变量都取其时间上的差分所得到的。

如果容许x it 与不随时间而变化的无法观测因素相关,则i u ∆与i x ∆无关,这就是在时间序列模型中的严格外生性假定。

在这里,允许x it 与不随时间而变化的无法观测的因素相关,运用OLS 对1β进行估计,由此得到1β的OLS 估计量为一阶差分估计量。

此外,容许a i 与x it 相关就不能把a i 对y it 的影响与不随时间而变的任何变量的影响分离开来。

另一个关键条件是,∆x i 必须因i 的不同而有所变化。

要用通常的OLS 上式还要满足同方差性。

4.利用面板数据的差分控制非观测效应的代价
(1)面板数据比单个横截面更难于收集,特别是关于个人的数据。

必须进行一次调查,然后跟踪所有个人再进行另一次跟踪调查。

在进行第二次调查时,要查找跟踪对象通常很困难。

(2)即便得到了一个面板数据集,用于消除a i 的差分也可能大大减少解释变量中的变异。

虽然可以利用很大的横截面来克服这一困难,但并非总能奏效。

而且,利用较长时间间隔的差分有时比利用逐年的变化来得好。

5.面板数据的编排
(1)假设有关于城市的两个不同年份的数据。

为了大多数目的,登记数据的最好方法是,对每个城市都安排两个记录,每年一个,每个城市的第一个记录对应于较早的一年,第二个记录对应于较晚的一年。

这两个记录应该放在相邻位置(如相邻的两行)。

前两个记录用于样本中第一个城市,接下来两个记录用于第二个城市,依此类推。

这样就很容易构造差分并把这些差分贮存在每个城市的第二个记录中,也便于进行能与差分估计相比较的混合横。

相关文档
最新文档