伍德里奇 第十章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定理:在上述三个假定成立的条件下,OLSE 是总体参数的线性无偏估计量。 〔解释变量的严格外生假定(假定 3)是一个关键假定,若假定 3 不成立,就不能 保证 OLSE 的无偏性。 〕
二、OLSE 方差和 Gauss-Markov 定理
OLSE 有效性是指在所有的线性无偏估计量中,OLSE 具有最小的方差。即对于参
§ 2.时间序列回归模型的例子
一、静态模型
静态模型表示同一时期变量之间的关系。一般形式如下:
yt 0 1 x1t 2 x2t ... k xkt ut
在静态模型中,被解释变量的值只取决于各解释变量和随机干扰项的当期值。
二、有限分布滞后模型(PDL)
如果模型中包含了解释变量的有限期滞后项,则称为有限分布滞后模型:
ln yt 0.1 0.4 ln xt
ln xt
三、指数
物价指数用于对经济数据(金额)的调整(平减) 。
指数=报告期水平/基期水平 注意区分定基指数和环比指数(以 ip、cpi 为例) 。 实际值=名义值/价格指数。 (如实际工资=名义工资/cpi)
§ 5.趋势和季节性
一、 描述有趋势的时间序列 1.线性趋势模型: yt 0 1t ut
假定 5.无序列相关假定 给定 X ,任何两个不同时期随机误差项 u t 和 u s 不相关:
cov (ut,us |X ) E (ut us | X ) 0, t s
理解这个假定的简单方法是忽略它是以 X 为条件的,假定 5 变为:
cov (ut,us )=0, t s
(在经典的横截面数据模型条件下的, cov(ut , us ) 0(t s ) 自然成立,故没有这 个假定) 在假定 1-假定 5 成立的条件下,OLSE 的条件方差为
各期的环比增长速度大体相同(即 yt / yt 1 ln yt ln yt 1 基本为常数)
二、在回归分析中使用趋势变量
时间序列中确定性趋势导致的非平稳性,是伪回归产生的原因之一,这种伪回归称 为第一种类型的伪回归。如果作为时间序列中包含了确定性的时间趋势,为了避免第一 种类型的伪回归,有等价的两种处理方法。 (一)在模型中引入时间变量 如果 x、y 中含有确定性趋势,如果直接将 y 对 x 进行回归,相当于遗漏了重要变 量 t,所以,应该在模型中将其作为独立的自变量引入进来。这样 x 的回归系数才反映 在时间 t 固定(保持不变)条件下,x 对 y 的“纯净”影响,避免伪回归。 例如,x 代表某地人均寿命(岁) ,y 是该地区稻米产量(千克/亩) ,t 是时间变量
回归系数向量 的最小二乘估计量
或
ˆ ( X'X )-1 X'y
对于给定的样本容量 T,我们希望在时间序列条件下,OLSE 这个线性估计量也具 有无偏性、有效性和正态性的有限样本性质(即横截面数据中的正态 BLUE) 。
一、OLSE 的无偏性
ˆ是 OLSE 的无偏性是指,对于给定的样本容量(即长度)T 的不同的样本, ˆ 是 的无偏估计量,即 ˆ 。 一个随机变量,但对于所有可能的样本,
或 E ( yt | t ) 0 1t 时间序列的逐期增长量(即一阶一次差分 yt yt yt 1 )大体相同
2 k 2.曲线趋势模型: yt 0 1t 2t k t ut
0 1 t t22 k t k 或 E ( yt |t )
四、时间标注
下标 t,如 y t , xt 。 (横截面数据中一般用 i,如 y i , xi ) 。 一般从 t= 1 开始标注。
§ 3.经典假设下 OLSE 的有限样本性质
一般化的时间序列回归模型形式如下:
yt 0 1 x1t 2 x2t ... k xkt ut yt X t +ut
二、随机过程
确定型过程:用关于时间 t 的函数描述的过程。如自由落体:s=1/2gt2
随机过程:即非确定型过程,不能用一个(或几个)关于时间 t 的确定性函数描述 的过程。对同一事物的变化过程独立、重复地进行多次观测而得到的结果是不相同的。
客流量随机过程:
{x1,
1
x2, …,
1
x364,
1
x365, } x365 取值的样本空间 x2 取值的样本空间
yt 0 xt 1 xt 1 2 xt 2 … s xt s ut
或
yt = + X + ut , X = x ,t( x ,x 1 t , ... t
s
)
其中, xt j 称为解释变量的滞后变量或滞后项; u t 为满足古典假定的随机误差项。 回归参数(系数)体现了解释变量的各个滞后值对被解释变量的不同影响程度,即 经济学中通常所说的“乘数效应”,所以,这些系数称为“乘数”(Multiplier):
的对 y 总的影响。
4.中期乘数(局部累计乘数) :
( m<s )称为中期乘数,表示 x 变动一个单位,到第 m 期对 y 的累计效应。
i 0 i
m
三、静态模型是有限滞后模型的特例
yt 0 xt 1 xt 1 2 xt 2 … s xt s ut 中 1= 2=. . . . = s=0
第 1 年客运记录:{x1 , x2 , …, x364 , x3651 } 第 2 年客运记录:{x12, x22, …, x3642, x3652 } s 第 n 年客运记录:{x1 , x2s, …, x364s, x365s }
随机过程是时间序列的数据生成过程(Data Generating Process,DGP)。 时间序列数据是某个特定随机过程的一个实现。 (类似于截面数据“总体-样本”之间的关系)
ˆ |X )=(X'X )1 2 var ( j jj
其中,SSTj
2
SST j (1 R 2 j)
=
2
SSR j
,
j 0,1, 2,..., k
( x
j
ˆ j )2 。 2 是误差项的条件方差;R 2 x j )2 ;SSRj ( x j x j
是如下样本回归方程的拟合优度:
2
等统计量。这些统计量都与正态分布相关,所以需要参数的 OLSE 服从正态分布。假 定 6 保证了这些统计量服从对应的 t、F、 分布。
2
在假定 1-假定 6 下,OLS 可以直接用于时间序列数据的回归。
四、总结
时间序列回归与截面回归一样, 统计推断方法的优劣取决于隐含于其后的假定的成 立与否。 经典线性模型用于时间序列数据的建模, 比在横截面数据条件下受到更多限制,
ˆ0 ˆ1 x1t ˆ2 x2t ˆ j 1 x( j 1) t ˆ j 1 x( j 1) t ˆk xkt ˆ jt x
随机项的条件方差 的无偏估计是:
2
SSR ei ˆ df n k 1
2 2
Gauss-Markov 定理: 在假定 1-假定 5 成立的条件下,OLSE 是最佳线性无偏估计量(BLUE) 。 即截面数据的 Gauss-Markov 定理在时间序列回归中也成立, 从而得到一个非常重 要的结论: 在假定 1-假定 5 下,OLS 同样适用于时间序列回归。 但假定条件比横截面下严格: 1.x 严格外生 2.误差项无序列相关
(如何对此进行乘数效应分析?)
二、虚拟变量
可以将特殊时期(如战争、灾荒)与正常时期区别开来,反映特定时件是否有 显著影响。
ˆt 0.2 0.1Dt 0.4ln xt 0.1ln xt Dt ln y ( y : GDP; x : 投资;Dt 1, 经济危机年份)
ln yt ln yt 0.3 0.5ln xt
第一,随机项的条件均值 E (ut | X ) 等于随机项的无条件均值 E (ut ) ,自变量严格 外生。排除 u(实际上是 y)对任意一期的 X 的反馈效应。 〔 (一般、宽)外生性只要求 E (ut | X t ) =0〕 当年粮食产量 y=f(当年降水量 x,当年化肥投入 z)+随机干扰项 u 假设是线性关系: yt= + xt zt ut 该模型自变量满足哪一种外生性? 第二, E (ut | X ) = E (ut ) =0 , 即由yt X t +ut 可以推导出E ( yt | X t ) X t 。 表明模型函数形式设定正确,即没有模型设定偏误。而且没有变量遗漏问题,解释变量 也不存在系统的测量误差。
尤其是严格外生性假定和无序列相关假定经常都不得满足。尽管如此,经典线性模型方 法对于许多建模实践而言是一个合理的起点。
§ 4. 函数形式、虚拟变量和指数
一、 函数形式
自然对数应用最多。模型系数表示(半)弹性。可以计算即期弹性、长期弹性 等。如政府支出-总产出函数:
ˆ yt 0.13 0.5ln xt 0.3ln xt 1 0.2 ln xt 2 0.1ln xt 3 ln
2 逐期增长量的逐期增长量(二阶一次差分 yt yt yt 1 )大致相同
三次方以上高次的曲线趋势比较少用。
t 3.指数曲线: yt 01 e
ut
或者E ( yt | t ) 01t
即 ln E ( yt |t ) 0 1t
Байду номын сангаас或者
ln E ( yt |t ) ln( 0 ) ln( 1 )t
三、经典线性模型假定下的推断
假定 6.正态性假定 随机误差项 u t 均值独立于 X,且独立同分布(i.i.d)于 N (0, ) 。
2
假定 6 包含了假定 2(零均值) 、假定 4(同方差)和假定 5(无序列相关) ,但更 为严格,因为除此之外,它还假定了 u t 之间的独立性同分布和正态性。 与横截面模型类似,在参数检验和置信区间构造中,需要用到 t、F、 (LM)
为了保证 OLSE 的无偏性,我们需要如下三个假定: 假定 1.参数线性(变量可以非线性)
yt 0 1 x1t 2 x2t ... k xkt ut
这个假定与横截面回归的第一个假定本质上相同。 假定 2.无多重共线性假定
Rank( X ) Rank(1, x1t , x2t , ..., xkt ) k 1<T
第二篇 时间序列数据的回归分析
第十章 时间序列数据的基本回归分析
§ 1.时间序列数据的性质
一、时间序列
一个随机变量在特定时间上的观测值排列而成的数据集称为时间序列数据( Time Series Data) 。时间序列用{xt}或 xt 表示。在不致引起混淆的情况下,xt 还用来表示随 机变量,也用来表示这个随机变量在时刻 t 的观测数据。 (注意:数据有先后顺序,截面数据没有顺序,所以横截面数据的{3,4,8}与 {8,3,4}是相同的,而时间序列则是不同的)
%,有 数 任意的线性无偏估计量
ˆ ≤var( % var(
要保证 OLSE 有效性,需要在前三个假定的基础上,再增加: 假定 4. 同方差假定 给定 X ,随机误差项 u t 的条件方差在所有的 t 上都相等:
var (ut |X )= var (ut )= 2 , t 1, 2 , T
1.即期乘数(或短期乘数)
E ( yt | x ) 0 xt
2. 延迟乘数(或动态乘数)
E ( yt j | x) E ( yt | x) j 或 j xt xt j
3. 长期乘数(全部累计乘数) :
( j 1, 2,, s )
i 0
s
i
称为总分布乘数或长期乘数,表示 x 变动一个单位时,包括滞后效应而形成
与横截面回归的假定是一致的。 假定 3. u 零条件均值假定(x 严格外生假定) 当所有时期的解释变量给定时,每一期的随机干扰项均值都为 0。即
E (ut | X )=E (ut | X t-i ,X t ,X t+i )=E (ut )=0,
这一个假定隐含了以下两个假定
t 1, 2,..., n