第10章 时间序列数据的基本回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* 2 xt 1 x x xt 2 t t 1
yt x ut
* t
代入回归方程形成了无限分布滞后模型
10.2 时间序列回归模型的例子
• 自回归分布滞后模型(ARDL): y y z u 如利用季度数据建立的消费函数:
第二篇时间序列数据的回归分析
目前大部分教科书将时间序列数据与横截面数据的 分析混在一起,本书将两者分开讨论,更能突出时 间序列数据不同于横截面数据的特点及分析方法的 差异,但限于篇幅的限制,本书在时间序列方面只 讨论基本的内容,详细的细节需参考专门的时间序 列计量分析的书籍。第十章讨论时间序列数据的特 点和相应的经典线性模型的假定,以及在此框架下 一些分析工具。第十一章讨论在违背经典线性模型 假定下大样本分析方法,其中有二个重要概念被讨 论:平稳性和遍历性。第十二章讨论时间序列数据 中最常遇到的序列相关现象,此现象类似于截面数 据中的异方差。为了内容的连续性,高级专题中的 第十八章提到此部分,着重讨论非平稳时间序列的 分析方法:单位根检验、协整和误差修正模型,这 部分是时间序列分析现代方法,应用比较普遍。
p q t i 1 i t i j 0 j t j t
ct i ct i j incomet j ut
i 1 j 0
3
4
此类模型中自变量对因变量的影响的分析比 较复杂,需利用滞后算子工具。
10.3 经典假设下OLS的有限样本性质
对时间序列数据的回归,要使OLS具有良好 的有限样本性质,需要怎样的假定?与截 面数据相比,时间序列数据不满足随机抽 样的假定,因此其他的假定需有一定加强 OLS的无偏性: 假定TS.1(参数的线性性):随机过程 x , x ,, x , y : t 1, 2,, n 服从线性模型:
10.5 趋势和季节性
时间序列趋势的描述:许多经济时间序列 均表现出随时间而上升的共同趋势,如何 描述这种时间上的趋势?通常将趋势分成 两类:确定性趋势和随机趋势。本节讨论 确定性趋势,而随机趋势在第十八章讨论 确定性趋势是指其趋势可用一个时间t的函数 来表示,其判别方法是从时间序列中去除 一个时间t的函数后,剩余部分是平稳的。 线性时间趋势、二次时间趋势和指数趋势
E ut xt1 , xt 2 , , xtk
0
为什么在截面数据回归的假定MLR.3中没有要 求对不同的观测i成立?因为在随机抽样的假定 u i自动独立于其他观测中的解释变量。 下,
10.3 经典假设下OLS的有限样本性质
在社会科学中许多解释变量明显违背严外生假定, 除了第九章里讨论的各种违背外生性的情形外, 对时间序列数据,严外生性排除了误差项的即期 变化可能导致自变量未来变化的可能性,也就是 排除了因变量y对自变量x的反馈作用,而这种反 馈作用在许多现象中均存在。如在农产量的回归 模型中,农民可能根据上一年的产量来调整劳动 投入。政策变量,如货币供给的增长、福利开支、 高速公路的限速等经常受结果变量过去情况的影 响。同期外生性可能更合理,但OLS的无偏性需 要严外生性的假定。
10.4 函数形式与虚拟变量
事件研究法(event study)广泛在会计学、 金融学等学科的实证研究中使用,其目的 是研究某个特定事件对资本市场上股票价 格的影响,以说明事件的影响结果或信息 的作用。此方法需要将样本期分为二个时 期:事件发生前与事件发生后,或者分为 三个时期,无消息期、消息可能泄露期和 信息公布期。虚拟变量被用来表示不同的 时期。例10.5 中befile6、affile6、afdec6
10.1时间序列数据的性质
时间序列数据区别于横截面数据的特点: • 时间序列数据是按时间顺序排列的,这意 味不同时间上的数据是相互影响的,即过 去会影响未来,而截面数据的随机抽样的 观点意味着不同个体数据之间是独立的, 因此数据排序是无意义的。 • 时间序列数据的随机性从事先不能完全确 定来理解,而截面数据的随机性是从随机 抽样的角度来理解。
gfrt 0 pet 1 pet 1 2 pet 2 ut
10.2 时间序列回归模型的例子
• 无限分布滞后模型: yt i zt i t 0 如预期的经济模型:
ut
其中 xt*为变量x的预期,预期的形成机制为: xt* xt*1 1 xt 根据此形成机制可得:
E ut X
0,
x11 , x12 , , x1k X xt1 , xt 2 , , xtk x , x , , x n2 nk n1
10.3 经典假设下OLS的有限样本性质
TS.3是关键假定,需给予更深的理解。 直观上,TS.3意味着t期的误差项 u t 与所有时期 的任何解释变量不相关,这被称为严格外生性 (strictly exogenous)。比此假定弱的假定是 同期外生性:
10.2 时间序列回归模型的例子
静态模型:没有跨期影响 一般形式: yt 0 1z1t k zkt ut , t 1,2,, n 如静态Phillips曲线:
inft 0 1unemt ut
谋杀案发生率静态模型:
mrdrtet 0 1convrte 2unemt 3 yngmlet ut
10.3 经典假设下OLS的有限样本性质
定理(OLS的无偏性):在假定TS.1-TS.3下, 以X为条件OLS估计量是无偏的:
ˆ X E j
j
, j 0,1, 2, , k
高斯-马尔可夫定理: 假定TS.4(同方差性):
var ut X
2
, t 1, 2, , n
10.3 经典假设下OLS的有限样本性质
经典线性模型假定下的推断 为了使用t统计量和F统计量进行统计推断,需要增 加一个假定。 2 假定TS.6(正态性): ut X Normal 0, 定理(OLS估计量的正态分布):在假定TS.1-TS.6 下,以X为条件,OLS估计量服从正态分布。 时间序列数据的经典线性模型假定,比横截面数据 的假定更强,特别是严外生性和无序列相关的假 定不太现实,需要发展更一般假定下的理论。尽 管如此,CLM框架仍是许多应用一个很好起点。
此类静态模型中系数的解释与截面回归模型 类似。
10.2 时间序列回归模型的例子
动态模型:存在跨期影响 • 有限分布滞后模型(FDL) q yt i zt i ut 一般形式: t 0 如对生育妇女所得税减免对生育率的影响:
对动态模型,自变量对因变量的影响需分两方面讨论:即期 影响和长期影响 同期z的系数 0 表示z在t期提高一个单位所引起的y的即期 变化,被称为冲击倾向(impact propensity)或即期倾向。 Z的当前和滞后项的系数之和 q ,表示z的永久性提高导 i 致y的长期变化,被称为长期倾向( long-run propensity, i 0 LRP)或长期乘数。
10.5 趋势和季节性
与截面数据的回归相比,时间序列数据回归中的 拟合优度 R 2 通常很大,这并不意味着拟合效果更 好,可能是数据的特点不同:一方面时间序列数 据经常是以总量形式出现,而总量数据通常比个 人、家庭或企业数据容易解释,另一方面,当因 变量含有趋势时,时间序列回归中的拟合优度可 能人为地变大。 季节性:当使用月度或季度数据时,数据中往往 存在季节性的变化,即一年内的周期性变化,这 时需要进行季度调整。我们可以在模型中加入一 组季节虚拟变量来反映季节性。
第十章时间序列数据的基本回归分析
本章讨论时间序列数据的特点和使用经典线 性模型来分析时间序列数据的相关问题: 假定、可能违背假定的情形、应用中经常 遇到的问题及相应的解决方法。 10.1 时间序列数据的特点 10.2 时间序列回归模型的例子 10.3 经典假设下OLS的有限样本性质 10.4 函数形式、虚拟变量 10.5 趋势和季节性
t1 t2 tk t
yt 0 1 xt1 k xtk ut
此假定等同于假定MLR.1
10.3 经典假设下OLS的有限样本性质
假定TS.2(不存在完全共线性):在样本中 (并在潜在的时间序列过程中)没有任何 自变量是恒定不变的,或者是其他自变量 的一个完全线性组合。 此假定等同于MLR.4假定。 假定TS.3(零条件均值):对每个t,给定所 有时期的解释变量,误差项 u t 的期望为0
10.1时间序列数据的性质
时间序列数据随机性的刻画:随机过程 既然不能用截面数据的随机抽样的观点来看待时间 序列数据,如何刻画时间序列数据的随机性?这 需要使用随机过程的工具,即采用一个带有时间 下标的随机变量序列来刻画,又称时间序列过程。
: t 1 , 2, 对收集到的时间序列数据集,被看成是该随机过程 的一个可能结果,也称一个实现(realization), 此随机过程有时称为数据生成过程(datagenerating process,DGP)。
假定TS.5(无序列相关):
corr ut , us X 0, t s
10.3 经典假设下OLS的有限样本性质
定理(OLS估计量的方差):在假定TS.12 TS.5下 ˆ
var j X
SST j 1 R
2 j
, j 1, , k
定理( 2的无偏估计):在假定TS.1-TS.5下 ˆ 2 SSR / n k 1 是 2 的无偏估计。 估计量 定理(高斯-马尔可夫定理):在假定TS.1TS.5下,以X为条件,OLS估计量是最佳线 性无偏估计量(BLUE)。
ຫໍສະໝຸດ Baidu
xt
10.1时间序列数据的性质
例:表10.1给出了1948-2003年美国的通胀率时间 序列数据: 8.1%, 1.2%,1.3%,7.9%,,2.8%,1.6%,2.3% 此时间序列数据可看出一个数据生成过程(DGP): inflationt : t 1948,, 2003 的一个实现。可以设想如果经济形势和政策不同的 话,则会得到另一个不同的实现。 在实际应用中,我们通常只能得到DGP的唯一一个 实现,这给分析带来了困难,由此需要引入一些 新的概念,如平稳性和遍历性。
10.5 趋势和季节性
使用存在趋势变量的回归分析:在回归分 析中如果直接使用存在趋势的变量,可能 产生谬误回归问题(spurious regression problem),即回归发现的变量间的关系可 能只是其趋势因素带来的,而变量间没有 实质的关系。 对于具有确定性趋势的变量,为了避免谬误 回归问题,可采用两种方法。一是在回归 中加入时间变量t,一是在回归前对每个具 有趋势的变量进行除趋势,然后在回归。 这两种方法的效果是相同的
10.4 函数形式与虚拟变量
在截面数据模型中使用的所有函数形式都可 以在时间序列回归中应用,最重要的是自 然对数。对数模型中更经常被用来估计短 期弹性和长期弹性。 虚拟变量在时间序列模型中也相当有用,特 别是表示某特定事件在每个时期是否发生 的虚拟变量。如例10.4美国生育率模型中的 虚拟变量ww2和pill,表示二战时期和避孕 药使用的时期。
yt x ut
* t
代入回归方程形成了无限分布滞后模型
10.2 时间序列回归模型的例子
• 自回归分布滞后模型(ARDL): y y z u 如利用季度数据建立的消费函数:
第二篇时间序列数据的回归分析
目前大部分教科书将时间序列数据与横截面数据的 分析混在一起,本书将两者分开讨论,更能突出时 间序列数据不同于横截面数据的特点及分析方法的 差异,但限于篇幅的限制,本书在时间序列方面只 讨论基本的内容,详细的细节需参考专门的时间序 列计量分析的书籍。第十章讨论时间序列数据的特 点和相应的经典线性模型的假定,以及在此框架下 一些分析工具。第十一章讨论在违背经典线性模型 假定下大样本分析方法,其中有二个重要概念被讨 论:平稳性和遍历性。第十二章讨论时间序列数据 中最常遇到的序列相关现象,此现象类似于截面数 据中的异方差。为了内容的连续性,高级专题中的 第十八章提到此部分,着重讨论非平稳时间序列的 分析方法:单位根检验、协整和误差修正模型,这 部分是时间序列分析现代方法,应用比较普遍。
p q t i 1 i t i j 0 j t j t
ct i ct i j incomet j ut
i 1 j 0
3
4
此类模型中自变量对因变量的影响的分析比 较复杂,需利用滞后算子工具。
10.3 经典假设下OLS的有限样本性质
对时间序列数据的回归,要使OLS具有良好 的有限样本性质,需要怎样的假定?与截 面数据相比,时间序列数据不满足随机抽 样的假定,因此其他的假定需有一定加强 OLS的无偏性: 假定TS.1(参数的线性性):随机过程 x , x ,, x , y : t 1, 2,, n 服从线性模型:
10.5 趋势和季节性
时间序列趋势的描述:许多经济时间序列 均表现出随时间而上升的共同趋势,如何 描述这种时间上的趋势?通常将趋势分成 两类:确定性趋势和随机趋势。本节讨论 确定性趋势,而随机趋势在第十八章讨论 确定性趋势是指其趋势可用一个时间t的函数 来表示,其判别方法是从时间序列中去除 一个时间t的函数后,剩余部分是平稳的。 线性时间趋势、二次时间趋势和指数趋势
E ut xt1 , xt 2 , , xtk
0
为什么在截面数据回归的假定MLR.3中没有要 求对不同的观测i成立?因为在随机抽样的假定 u i自动独立于其他观测中的解释变量。 下,
10.3 经典假设下OLS的有限样本性质
在社会科学中许多解释变量明显违背严外生假定, 除了第九章里讨论的各种违背外生性的情形外, 对时间序列数据,严外生性排除了误差项的即期 变化可能导致自变量未来变化的可能性,也就是 排除了因变量y对自变量x的反馈作用,而这种反 馈作用在许多现象中均存在。如在农产量的回归 模型中,农民可能根据上一年的产量来调整劳动 投入。政策变量,如货币供给的增长、福利开支、 高速公路的限速等经常受结果变量过去情况的影 响。同期外生性可能更合理,但OLS的无偏性需 要严外生性的假定。
10.4 函数形式与虚拟变量
事件研究法(event study)广泛在会计学、 金融学等学科的实证研究中使用,其目的 是研究某个特定事件对资本市场上股票价 格的影响,以说明事件的影响结果或信息 的作用。此方法需要将样本期分为二个时 期:事件发生前与事件发生后,或者分为 三个时期,无消息期、消息可能泄露期和 信息公布期。虚拟变量被用来表示不同的 时期。例10.5 中befile6、affile6、afdec6
10.1时间序列数据的性质
时间序列数据区别于横截面数据的特点: • 时间序列数据是按时间顺序排列的,这意 味不同时间上的数据是相互影响的,即过 去会影响未来,而截面数据的随机抽样的 观点意味着不同个体数据之间是独立的, 因此数据排序是无意义的。 • 时间序列数据的随机性从事先不能完全确 定来理解,而截面数据的随机性是从随机 抽样的角度来理解。
gfrt 0 pet 1 pet 1 2 pet 2 ut
10.2 时间序列回归模型的例子
• 无限分布滞后模型: yt i zt i t 0 如预期的经济模型:
ut
其中 xt*为变量x的预期,预期的形成机制为: xt* xt*1 1 xt 根据此形成机制可得:
E ut X
0,
x11 , x12 , , x1k X xt1 , xt 2 , , xtk x , x , , x n2 nk n1
10.3 经典假设下OLS的有限样本性质
TS.3是关键假定,需给予更深的理解。 直观上,TS.3意味着t期的误差项 u t 与所有时期 的任何解释变量不相关,这被称为严格外生性 (strictly exogenous)。比此假定弱的假定是 同期外生性:
10.2 时间序列回归模型的例子
静态模型:没有跨期影响 一般形式: yt 0 1z1t k zkt ut , t 1,2,, n 如静态Phillips曲线:
inft 0 1unemt ut
谋杀案发生率静态模型:
mrdrtet 0 1convrte 2unemt 3 yngmlet ut
10.3 经典假设下OLS的有限样本性质
定理(OLS的无偏性):在假定TS.1-TS.3下, 以X为条件OLS估计量是无偏的:
ˆ X E j
j
, j 0,1, 2, , k
高斯-马尔可夫定理: 假定TS.4(同方差性):
var ut X
2
, t 1, 2, , n
10.3 经典假设下OLS的有限样本性质
经典线性模型假定下的推断 为了使用t统计量和F统计量进行统计推断,需要增 加一个假定。 2 假定TS.6(正态性): ut X Normal 0, 定理(OLS估计量的正态分布):在假定TS.1-TS.6 下,以X为条件,OLS估计量服从正态分布。 时间序列数据的经典线性模型假定,比横截面数据 的假定更强,特别是严外生性和无序列相关的假 定不太现实,需要发展更一般假定下的理论。尽 管如此,CLM框架仍是许多应用一个很好起点。
此类静态模型中系数的解释与截面回归模型 类似。
10.2 时间序列回归模型的例子
动态模型:存在跨期影响 • 有限分布滞后模型(FDL) q yt i zt i ut 一般形式: t 0 如对生育妇女所得税减免对生育率的影响:
对动态模型,自变量对因变量的影响需分两方面讨论:即期 影响和长期影响 同期z的系数 0 表示z在t期提高一个单位所引起的y的即期 变化,被称为冲击倾向(impact propensity)或即期倾向。 Z的当前和滞后项的系数之和 q ,表示z的永久性提高导 i 致y的长期变化,被称为长期倾向( long-run propensity, i 0 LRP)或长期乘数。
10.5 趋势和季节性
与截面数据的回归相比,时间序列数据回归中的 拟合优度 R 2 通常很大,这并不意味着拟合效果更 好,可能是数据的特点不同:一方面时间序列数 据经常是以总量形式出现,而总量数据通常比个 人、家庭或企业数据容易解释,另一方面,当因 变量含有趋势时,时间序列回归中的拟合优度可 能人为地变大。 季节性:当使用月度或季度数据时,数据中往往 存在季节性的变化,即一年内的周期性变化,这 时需要进行季度调整。我们可以在模型中加入一 组季节虚拟变量来反映季节性。
第十章时间序列数据的基本回归分析
本章讨论时间序列数据的特点和使用经典线 性模型来分析时间序列数据的相关问题: 假定、可能违背假定的情形、应用中经常 遇到的问题及相应的解决方法。 10.1 时间序列数据的特点 10.2 时间序列回归模型的例子 10.3 经典假设下OLS的有限样本性质 10.4 函数形式、虚拟变量 10.5 趋势和季节性
t1 t2 tk t
yt 0 1 xt1 k xtk ut
此假定等同于假定MLR.1
10.3 经典假设下OLS的有限样本性质
假定TS.2(不存在完全共线性):在样本中 (并在潜在的时间序列过程中)没有任何 自变量是恒定不变的,或者是其他自变量 的一个完全线性组合。 此假定等同于MLR.4假定。 假定TS.3(零条件均值):对每个t,给定所 有时期的解释变量,误差项 u t 的期望为0
10.1时间序列数据的性质
时间序列数据随机性的刻画:随机过程 既然不能用截面数据的随机抽样的观点来看待时间 序列数据,如何刻画时间序列数据的随机性?这 需要使用随机过程的工具,即采用一个带有时间 下标的随机变量序列来刻画,又称时间序列过程。
: t 1 , 2, 对收集到的时间序列数据集,被看成是该随机过程 的一个可能结果,也称一个实现(realization), 此随机过程有时称为数据生成过程(datagenerating process,DGP)。
假定TS.5(无序列相关):
corr ut , us X 0, t s
10.3 经典假设下OLS的有限样本性质
定理(OLS估计量的方差):在假定TS.12 TS.5下 ˆ
var j X
SST j 1 R
2 j
, j 1, , k
定理( 2的无偏估计):在假定TS.1-TS.5下 ˆ 2 SSR / n k 1 是 2 的无偏估计。 估计量 定理(高斯-马尔可夫定理):在假定TS.1TS.5下,以X为条件,OLS估计量是最佳线 性无偏估计量(BLUE)。
ຫໍສະໝຸດ Baidu
xt
10.1时间序列数据的性质
例:表10.1给出了1948-2003年美国的通胀率时间 序列数据: 8.1%, 1.2%,1.3%,7.9%,,2.8%,1.6%,2.3% 此时间序列数据可看出一个数据生成过程(DGP): inflationt : t 1948,, 2003 的一个实现。可以设想如果经济形势和政策不同的 话,则会得到另一个不同的实现。 在实际应用中,我们通常只能得到DGP的唯一一个 实现,这给分析带来了困难,由此需要引入一些 新的概念,如平稳性和遍历性。
10.5 趋势和季节性
使用存在趋势变量的回归分析:在回归分 析中如果直接使用存在趋势的变量,可能 产生谬误回归问题(spurious regression problem),即回归发现的变量间的关系可 能只是其趋势因素带来的,而变量间没有 实质的关系。 对于具有确定性趋势的变量,为了避免谬误 回归问题,可采用两种方法。一是在回归 中加入时间变量t,一是在回归前对每个具 有趋势的变量进行除趋势,然后在回归。 这两种方法的效果是相同的
10.4 函数形式与虚拟变量
在截面数据模型中使用的所有函数形式都可 以在时间序列回归中应用,最重要的是自 然对数。对数模型中更经常被用来估计短 期弹性和长期弹性。 虚拟变量在时间序列模型中也相当有用,特 别是表示某特定事件在每个时期是否发生 的虚拟变量。如例10.4美国生育率模型中的 虚拟变量ww2和pill,表示二战时期和避孕 药使用的时期。