第二节 时间序列平稳性检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
33
检验 显著性的方法是先用最小二乘法估计 再计算相应的t 统计量值,再根据样本容量等t 分布临界值,并判断 的显著性。 值得注意的问题是,如果时间序列确实是非平 稳的单位根过程,那么上述回归分析得到的t 统 计量是不服从t 分布的,因此不能用t 分布表的 临界值判断 的显著性。 为此迪基和富勒通过蒙特卡罗模拟方法构造了 专门的统计分布表,给出包括10%、5%、1% 几个显著性水平的临界值,称为DF 临界值表。
34
为了区别起见,把上述模型回归分析计算的t 统计量改称为 统计量。 把上述回归模型计算到的 统计量与DF 临界值 时拒绝 0 表中查到的临界值 比较, 的假设,认为 具有显著性,时间序列不服从 上述单位根过程,时间序列是平稳的。 反之则认为 不显著,认为时间序列服从上述 单位根过程,时间序列是非平稳的。 上述单位根检验方法就称为“迪基-富勒检验”, 简称“DF 检验”。 35
18
Granger和Newbold提出了判断伪回归的 2 R 一个经验法则:若回归分析结果 >DW 就可能存在伪回归问题。 判断伪回归比较可靠的方法是从导致伪 回归的根源,也就是时间序列的非平稳 性问题出发,通过检验时间序列是否平 稳序列加以判断。
19
第二节 时间序列平稳性检验
一、图形检验
二、自相关图检验 三、单位根检验
10
严平稳性隐含任意时刻随机变量的概率分布相 同,意味着各个时点随机变量均值和方差(存 在且有限时)都相同,即 E(Yt ) 和 Var (Yt ) 2 都与t无关,两个随机变量的协方差: Cov(Yt , Yt k ) E[(Yt )(Yt k )] k
32
首先检验时间序列是否属于最基本的单位根过 程,也称为随机游走过程 Yt Yt 1 t ,其中 t 为白噪声过程。 如果自回归模型 Yt Yt 1 t 中 1,或者变换 成的回归模型 Yt Yt 1 t中的 0 ,那么 时间序列{ Yt }就是最基本的单位根过程——随 机游走过程,肯定是非平稳的。 因此上述差分模型中 的显著性检验,就是检 验时间序列是否存在上述单位根问题。
12
严平稳性一般情况下强于弱平稳性,但也不一 定隐含弱平稳,因为严平稳过程各随机变量的 一、二阶矩并不一定存在。 平稳的时间序列有稳定的趋势(期望)、波动 性(方差)和横向联系(协方差),可以用时 间序列的样本均值和方差推断各时点随机变量 的分布特征。 因此运用平稳时间序列数据的经典回归分析是 有效的,以往时间序列数据的计量回归分析实 际上隐含假设数据是平稳的。
13
三、时间序列非平稳和伪回归
时间序列的平稳性并不总是有保证的,许多常 用的经济时间序列,如GDP、物价指数、股票 价格等,都有非平稳的特性。 例如下面图10.1中INVGM和GER两个时间序列 数据的连线图,就是经济时间序列的典型图形。 根据这两个图形很容易看出,这两个时间序列 都不符合平稳时间序列要求的稳定均值的特征, GER的图形也不满足稳定方差的基本特征,因 此这两个时间序列都是非平稳的。
21
如图10.2 ,该时间序列数据基本上是平稳的。
4
2
0
-2
-4 200 400 600 Z2 800 1000
22
多数经济时间序列有上升或下降的趋势性,而 不是围绕不变水平波动。 例如图10.3中的时间序列数据CAPAR就是有明 显的上升趋势的时间序列数据。 不符合平稳性定义,但围绕稳定上升趋势的形 态与平稳数据是相似的,预测作用也相似。把 这种数据排除在平稳序列之外,平稳序列的应 用价值必然受到很大限制。
t
因此 Yt 的方差 Var(Yt ) t 2 也不是与t 无关的常 数,所以单位根过程不符合平稳性的定义,是 非平稳的随机过程。
31
i 1
事实上,大多数经济时间序列非平稳性 的原因都是因为包含单位根过程。因此 现代计量经济分析主要通过检验是否存 在单位根,检验时间序列的平稳性。 检验单位根最常用的方法是迪基-富勒检 验和扩展迪基-富勒检验。 我们先介绍基本的迪基-富勒检验方法。
16
如果把非平稳的时间序列当作平稳序列, 事实上会破坏古典线性回归模型的基本 假设,用这样的模型进行回归,得到的 统计量都是失效的,分析、检验和预测 结果都是无效的,对计量回归分析的有 效性有很大的影响。
17
非平稳时间序列的另一个问题是,虽然 这种时间序列事实上会破坏经典回归分 析的基础和有效性,但根据分析结果并 不一定能发现问题。 事实上,有时即使时间序列严重非平稳, R2 分析结果完全无效,t、F、 等指标却 仍然很正常,模型的显著性和拟合程度 看起来都很好。这种问题通常称为“伪 回归” 问题。
23
图10.3 趋势平稳时间序列
1000
800
600
400
200
0 36 38 40 42 44 46 48 50 52 54
C APAR
24
这个问题可以通过对平稳性概念的扩展解决。 方法是把数据的趋势部分看成先分离出来,然 后根据分离趋势后的纯随机部分判定平稳性。 例如一个时间序列t 时刻的随机变量可以表示 为 Yt t t ,其中 t 是一个平稳序列, 那么该序列去掉时间趋势 t 之后的部分就 是平稳的,称为“趋势平稳” 。 趋势平稳时间序列中的时间趋势既可以是线性, 也可以是非线性的。
第十章 伪回归和单位根
1
本章结构
第一节 时间序列及其平稳性 第二节 时间序列平稳性检验 第三节 时间序列的单积和协积
2
第一节 时间序列及其平稳性
一、时间序列数据和随机过程
二、经典计量分析和时间序列的平稳性 三、时间序列非平稳和伪回归
3
一、时间序列数据和随机过程
计量经济分析中的截面数据是在同一时点抽样 统计得到的,可以理解为一个随机变量反复抽 样的结果。 时间序列数据则是在不同时间观测或统计的数 据,不能看作同一个随机变量生成的,不能看 作与截面数据一样的同一个随机变量的反复抽 样,而应该看作不同随机变量生成的,看作是 一个随机过程的一个实现。
8
其实并不是以时间序列数据为基础的计 量分析都会存在问题。 只要所使用的时间序列数据是平稳的, 以时间序列数据为基础的计量经济分析 就是有效的。 所谓平稳时间序列数据就是由平稳随机 过程生成的时间序列数据。
9
随机过程的平稳性包括严平稳和弱平稳两种情 况。 严平稳即随机过程{Yt , t 0, 1, 2,}在任意时 点概率分布的特性不受时间原点改变的影响, 可以用任意m个时刻 t1 , t2 ,, tm 观测值Yt1 ,Yt2 ,,Ytm 的联合概率分布,与 t1 k , t2 k ,, tm k 时刻 观测值Yt1 k ,Yt 2 k ,,Yt m k 的联合概率分布相同 P(Yt1 ,Yt 2 ,,Yt m ) = P(Yt k , Yt k ,, Yt k ) 表示。 1数据是时间序列数据时,情 况就会有所不同。 因为时间序列并不是一个随机变量的反复抽样, 而是随机过程的一个实现,每个数据都是特定 时间随机变量的唯一实现值,时间序列样本均 值和方差的含义与截面数据也不同,这样以随 机变量总体均值和方差的推断为基础的计量经 济分析的基础就会出现问题。
27
自相关函数最好的估计方法是样本自相关函数: ˆk ˆk ˆ0 其中:
ˆk
(Y Y )(Y
t 1 t
n
tk
Y )
n
2 ( Y Y ) t t 1 n
ˆ0
n
28
ˆ k的值 对不同的k分别计算出样本自相关函数 ˆ k 的分布图形, 以后,可以描绘出对应不同k的 根据图形的特征判断时间序列是否平稳。 当样本自相关函数的值(对不同k)有许多落 在临界值范围外时,初步判断有非平稳性。 常用计量分析软件都有给出序列相关图的功能, 因此运用相关图检验时间序列的平稳性非常方 便。
4
所谓随机过程就是一系列具有顺序性和内在联 系的随机变量的集合。 随机过程一般定义为随机变量族 X (t ),t T , 其中T 是给定的实数集,对应每个t T 的 X (t ) 是随机变量。 当进一步明确参数t代表时间,T 是整数集合时, X (t ),t 0,1,称为“时间 2, 离散型随机过程 序列”。
与时间t无关,只与时间间隔k有关。
对可能存在的高阶矩也同样。 严平稳性要求是相当高的,比较难满足和证明。
11
现实应用中常采用另一种相对较弱的,使用 比较方便,比较符合计量经济分析要求的弱 平稳性或协方差平稳性。 弱平稳性即满足下列三条要求: (1)E(Yt ) ; 2 2 (2) Var(Yt ) E(Yt ) ; (3)Cov(Yt , Yt k ) E[(Yt )(Yt k )] k。
30
在给定 Yt 1 的前提下 Yt 的条件期望 E(Yt Yt 1) Yt 1 不是与t 无关的常数,而且因为
Yt t Yt 1 t t 1 2 Yt 2
t t 1 t Y0
Y0 t i
25
二、自相关图检验
原理:平稳时间序列过程的自协方差,或由协 方差计算的自相关函数,应该很小、很快趋向 于0,具有截尾或拖尾特征 。这些特征正是判 断时间序列平稳性的重要依据。 由于自相关是相对量指标,方便横向比较和建 立一般标准,因此通常利用自相关函数进行判 断。
利用自相关函数判断时间序列平稳性的首要问 题是计算自相关函数。
29
三、单位根检验
定义:如果随机过程中随机变量满足关系式: Yt Yt 1 t 或Yt t 。其中 是服从 t 是常数,则称该随机 白噪声过程的修正项, 过程为一个“单位根过程” 。 上述单位根过程只是单位根过程的基本形式, 单位根过程还可以扩展到包含时间趋势项等的 多种情况。
14
图10.1 非平稳时间序列数据连线图
1600 1400 1200 1000 800 600 400 200 36 38 40 42 44 46 48 50 52 54
IN VGM
15
4.0 3.5 3.0 2.5 2.0 1.5 1.0 1000 2000 3000 GER 4000 5000 6000
20
一、图形检验
平稳随机过程的均值和方差函数是常数,意味 着平稳时间序列的取值必然围绕一个水平的中 心趋势,以相同的发散程度分布。 根据这一点,可以从数据分布图形直接对数据 是否平稳进行判断。 例如当时间序列数据的连线图形出现类似图 10.1的情况时,就肯定不是平稳时间序列,因 为这两种图形表明时间序列数据都没有不变的 中心趋势,或者说中心趋势是变化的,而且也 没有稳定的方差。
5
因为时间序列数据每个时点的观测统计 值,都相当于该时点生成变量水平的一 个随机变量的一个实现值,因此整个时 间序列数据就是由各个时点的随机变量 构成的随机过程的“一个实现”。
6
二、经典计量分析和时间序列的平稳性
计量经济回归分析的参数估计及相关推断检验, 都是建立在随机变量总体均值、方差推断基础 上的。 如果使用的是截面数据,那么因为截面数据是 一个随机变量的抽样结果,因此根据中心极限 定理等,可以用截面数据的样本均值和方差推 断随机变量的总体均值和方差,以此为基础的 计量回归分析和预测是有效的。
26
自相关函数是以协方差函数为基础定义 的 k k / 0 ,其中 k Cov(Yt ,Yt k ) 和 0 Var (Yt ) 分别为协方差和方差函数。 因为只有时间序列的一个实现,因此不可能根 据随机变量协方差、方差的定义计算,只能用 样本,也就是时间序列观测值的时间平均代替 总体平均,时间矩代替总体矩,得到自相关函 数的估计。
检验 显著性的方法是先用最小二乘法估计 再计算相应的t 统计量值,再根据样本容量等t 分布临界值,并判断 的显著性。 值得注意的问题是,如果时间序列确实是非平 稳的单位根过程,那么上述回归分析得到的t 统 计量是不服从t 分布的,因此不能用t 分布表的 临界值判断 的显著性。 为此迪基和富勒通过蒙特卡罗模拟方法构造了 专门的统计分布表,给出包括10%、5%、1% 几个显著性水平的临界值,称为DF 临界值表。
34
为了区别起见,把上述模型回归分析计算的t 统计量改称为 统计量。 把上述回归模型计算到的 统计量与DF 临界值 时拒绝 0 表中查到的临界值 比较, 的假设,认为 具有显著性,时间序列不服从 上述单位根过程,时间序列是平稳的。 反之则认为 不显著,认为时间序列服从上述 单位根过程,时间序列是非平稳的。 上述单位根检验方法就称为“迪基-富勒检验”, 简称“DF 检验”。 35
18
Granger和Newbold提出了判断伪回归的 2 R 一个经验法则:若回归分析结果 >DW 就可能存在伪回归问题。 判断伪回归比较可靠的方法是从导致伪 回归的根源,也就是时间序列的非平稳 性问题出发,通过检验时间序列是否平 稳序列加以判断。
19
第二节 时间序列平稳性检验
一、图形检验
二、自相关图检验 三、单位根检验
10
严平稳性隐含任意时刻随机变量的概率分布相 同,意味着各个时点随机变量均值和方差(存 在且有限时)都相同,即 E(Yt ) 和 Var (Yt ) 2 都与t无关,两个随机变量的协方差: Cov(Yt , Yt k ) E[(Yt )(Yt k )] k
32
首先检验时间序列是否属于最基本的单位根过 程,也称为随机游走过程 Yt Yt 1 t ,其中 t 为白噪声过程。 如果自回归模型 Yt Yt 1 t 中 1,或者变换 成的回归模型 Yt Yt 1 t中的 0 ,那么 时间序列{ Yt }就是最基本的单位根过程——随 机游走过程,肯定是非平稳的。 因此上述差分模型中 的显著性检验,就是检 验时间序列是否存在上述单位根问题。
12
严平稳性一般情况下强于弱平稳性,但也不一 定隐含弱平稳,因为严平稳过程各随机变量的 一、二阶矩并不一定存在。 平稳的时间序列有稳定的趋势(期望)、波动 性(方差)和横向联系(协方差),可以用时 间序列的样本均值和方差推断各时点随机变量 的分布特征。 因此运用平稳时间序列数据的经典回归分析是 有效的,以往时间序列数据的计量回归分析实 际上隐含假设数据是平稳的。
13
三、时间序列非平稳和伪回归
时间序列的平稳性并不总是有保证的,许多常 用的经济时间序列,如GDP、物价指数、股票 价格等,都有非平稳的特性。 例如下面图10.1中INVGM和GER两个时间序列 数据的连线图,就是经济时间序列的典型图形。 根据这两个图形很容易看出,这两个时间序列 都不符合平稳时间序列要求的稳定均值的特征, GER的图形也不满足稳定方差的基本特征,因 此这两个时间序列都是非平稳的。
21
如图10.2 ,该时间序列数据基本上是平稳的。
4
2
0
-2
-4 200 400 600 Z2 800 1000
22
多数经济时间序列有上升或下降的趋势性,而 不是围绕不变水平波动。 例如图10.3中的时间序列数据CAPAR就是有明 显的上升趋势的时间序列数据。 不符合平稳性定义,但围绕稳定上升趋势的形 态与平稳数据是相似的,预测作用也相似。把 这种数据排除在平稳序列之外,平稳序列的应 用价值必然受到很大限制。
t
因此 Yt 的方差 Var(Yt ) t 2 也不是与t 无关的常 数,所以单位根过程不符合平稳性的定义,是 非平稳的随机过程。
31
i 1
事实上,大多数经济时间序列非平稳性 的原因都是因为包含单位根过程。因此 现代计量经济分析主要通过检验是否存 在单位根,检验时间序列的平稳性。 检验单位根最常用的方法是迪基-富勒检 验和扩展迪基-富勒检验。 我们先介绍基本的迪基-富勒检验方法。
16
如果把非平稳的时间序列当作平稳序列, 事实上会破坏古典线性回归模型的基本 假设,用这样的模型进行回归,得到的 统计量都是失效的,分析、检验和预测 结果都是无效的,对计量回归分析的有 效性有很大的影响。
17
非平稳时间序列的另一个问题是,虽然 这种时间序列事实上会破坏经典回归分 析的基础和有效性,但根据分析结果并 不一定能发现问题。 事实上,有时即使时间序列严重非平稳, R2 分析结果完全无效,t、F、 等指标却 仍然很正常,模型的显著性和拟合程度 看起来都很好。这种问题通常称为“伪 回归” 问题。
23
图10.3 趋势平稳时间序列
1000
800
600
400
200
0 36 38 40 42 44 46 48 50 52 54
C APAR
24
这个问题可以通过对平稳性概念的扩展解决。 方法是把数据的趋势部分看成先分离出来,然 后根据分离趋势后的纯随机部分判定平稳性。 例如一个时间序列t 时刻的随机变量可以表示 为 Yt t t ,其中 t 是一个平稳序列, 那么该序列去掉时间趋势 t 之后的部分就 是平稳的,称为“趋势平稳” 。 趋势平稳时间序列中的时间趋势既可以是线性, 也可以是非线性的。
第十章 伪回归和单位根
1
本章结构
第一节 时间序列及其平稳性 第二节 时间序列平稳性检验 第三节 时间序列的单积和协积
2
第一节 时间序列及其平稳性
一、时间序列数据和随机过程
二、经典计量分析和时间序列的平稳性 三、时间序列非平稳和伪回归
3
一、时间序列数据和随机过程
计量经济分析中的截面数据是在同一时点抽样 统计得到的,可以理解为一个随机变量反复抽 样的结果。 时间序列数据则是在不同时间观测或统计的数 据,不能看作同一个随机变量生成的,不能看 作与截面数据一样的同一个随机变量的反复抽 样,而应该看作不同随机变量生成的,看作是 一个随机过程的一个实现。
8
其实并不是以时间序列数据为基础的计 量分析都会存在问题。 只要所使用的时间序列数据是平稳的, 以时间序列数据为基础的计量经济分析 就是有效的。 所谓平稳时间序列数据就是由平稳随机 过程生成的时间序列数据。
9
随机过程的平稳性包括严平稳和弱平稳两种情 况。 严平稳即随机过程{Yt , t 0, 1, 2,}在任意时 点概率分布的特性不受时间原点改变的影响, 可以用任意m个时刻 t1 , t2 ,, tm 观测值Yt1 ,Yt2 ,,Ytm 的联合概率分布,与 t1 k , t2 k ,, tm k 时刻 观测值Yt1 k ,Yt 2 k ,,Yt m k 的联合概率分布相同 P(Yt1 ,Yt 2 ,,Yt m ) = P(Yt k , Yt k ,, Yt k ) 表示。 1数据是时间序列数据时,情 况就会有所不同。 因为时间序列并不是一个随机变量的反复抽样, 而是随机过程的一个实现,每个数据都是特定 时间随机变量的唯一实现值,时间序列样本均 值和方差的含义与截面数据也不同,这样以随 机变量总体均值和方差的推断为基础的计量经 济分析的基础就会出现问题。
27
自相关函数最好的估计方法是样本自相关函数: ˆk ˆk ˆ0 其中:
ˆk
(Y Y )(Y
t 1 t
n
tk
Y )
n
2 ( Y Y ) t t 1 n
ˆ0
n
28
ˆ k的值 对不同的k分别计算出样本自相关函数 ˆ k 的分布图形, 以后,可以描绘出对应不同k的 根据图形的特征判断时间序列是否平稳。 当样本自相关函数的值(对不同k)有许多落 在临界值范围外时,初步判断有非平稳性。 常用计量分析软件都有给出序列相关图的功能, 因此运用相关图检验时间序列的平稳性非常方 便。
4
所谓随机过程就是一系列具有顺序性和内在联 系的随机变量的集合。 随机过程一般定义为随机变量族 X (t ),t T , 其中T 是给定的实数集,对应每个t T 的 X (t ) 是随机变量。 当进一步明确参数t代表时间,T 是整数集合时, X (t ),t 0,1,称为“时间 2, 离散型随机过程 序列”。
与时间t无关,只与时间间隔k有关。
对可能存在的高阶矩也同样。 严平稳性要求是相当高的,比较难满足和证明。
11
现实应用中常采用另一种相对较弱的,使用 比较方便,比较符合计量经济分析要求的弱 平稳性或协方差平稳性。 弱平稳性即满足下列三条要求: (1)E(Yt ) ; 2 2 (2) Var(Yt ) E(Yt ) ; (3)Cov(Yt , Yt k ) E[(Yt )(Yt k )] k。
30
在给定 Yt 1 的前提下 Yt 的条件期望 E(Yt Yt 1) Yt 1 不是与t 无关的常数,而且因为
Yt t Yt 1 t t 1 2 Yt 2
t t 1 t Y0
Y0 t i
25
二、自相关图检验
原理:平稳时间序列过程的自协方差,或由协 方差计算的自相关函数,应该很小、很快趋向 于0,具有截尾或拖尾特征 。这些特征正是判 断时间序列平稳性的重要依据。 由于自相关是相对量指标,方便横向比较和建 立一般标准,因此通常利用自相关函数进行判 断。
利用自相关函数判断时间序列平稳性的首要问 题是计算自相关函数。
29
三、单位根检验
定义:如果随机过程中随机变量满足关系式: Yt Yt 1 t 或Yt t 。其中 是服从 t 是常数,则称该随机 白噪声过程的修正项, 过程为一个“单位根过程” 。 上述单位根过程只是单位根过程的基本形式, 单位根过程还可以扩展到包含时间趋势项等的 多种情况。
14
图10.1 非平稳时间序列数据连线图
1600 1400 1200 1000 800 600 400 200 36 38 40 42 44 46 48 50 52 54
IN VGM
15
4.0 3.5 3.0 2.5 2.0 1.5 1.0 1000 2000 3000 GER 4000 5000 6000
20
一、图形检验
平稳随机过程的均值和方差函数是常数,意味 着平稳时间序列的取值必然围绕一个水平的中 心趋势,以相同的发散程度分布。 根据这一点,可以从数据分布图形直接对数据 是否平稳进行判断。 例如当时间序列数据的连线图形出现类似图 10.1的情况时,就肯定不是平稳时间序列,因 为这两种图形表明时间序列数据都没有不变的 中心趋势,或者说中心趋势是变化的,而且也 没有稳定的方差。
5
因为时间序列数据每个时点的观测统计 值,都相当于该时点生成变量水平的一 个随机变量的一个实现值,因此整个时 间序列数据就是由各个时点的随机变量 构成的随机过程的“一个实现”。
6
二、经典计量分析和时间序列的平稳性
计量经济回归分析的参数估计及相关推断检验, 都是建立在随机变量总体均值、方差推断基础 上的。 如果使用的是截面数据,那么因为截面数据是 一个随机变量的抽样结果,因此根据中心极限 定理等,可以用截面数据的样本均值和方差推 断随机变量的总体均值和方差,以此为基础的 计量回归分析和预测是有效的。
26
自相关函数是以协方差函数为基础定义 的 k k / 0 ,其中 k Cov(Yt ,Yt k ) 和 0 Var (Yt ) 分别为协方差和方差函数。 因为只有时间序列的一个实现,因此不可能根 据随机变量协方差、方差的定义计算,只能用 样本,也就是时间序列观测值的时间平均代替 总体平均,时间矩代替总体矩,得到自相关函 数的估计。