时间序列平稳性检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
因为时间序列数据每个时点的观测统计 值,都相当于该时点生成变量水平的一 个随机变量的一个实现值,因此整个时 间序列数据就是由各个时点的随机变量 构成的随机过程的“一个实现”。
6
二、经典计量分析和时间序列的平稳性
计量经济回归分析的参数估计及相关推断检验, 都是建立在随机变量总体均值、方差推断基础 上的。 如果使用的是截面数据,那么因为截面数据是 一个随机变量的抽样结果,因此根据中心极限 定理等,可以用截面数据的样本均值和方差推 断随机变量的总体均值和方差,以此为基础的 计量回归分析和预测是有效的。
4
所谓随机过程就是一系列具有顺序性和内在联 系的随机变量的集合。 随机过程一般定义为随机变量族 X (t ),t T , 其中T 是给定的实数集,对应每个t T 的 X (t ) 是随机变量。 当进一步明确参数t代表时间,T 是整数集合时, X (t ),t 0,1,称为“时间 2, 离散型随机过程 序列”。
8
其实并不是以时间序列数据为基础的计 量分析都会存在问题。 只要所使用的时间序列数据是平稳的, 以时间序列数据为基础的计量经济分析 就是有效的。 所谓平稳时间序列数据就是由平稳随机 过程生成的时间序列数据。
9
随机过程的平稳性包括严平稳和弱平稳两种情 况。 严平稳即随机过程{Yt , t 0, 1, 2, }在任意时 点概率分布的特性不受时间原点改变的影响, 可以用任意m个时刻 t1 , t2 ,, tm 观测值Yt1 ,Yt2 ,,Ytm 的联合概率分布,与 t1 k , t2 k ,, tm k 时刻 观测值Yt1 k ,Yt 2 k ,,Yt m k 的联合概率分布相同 P(Yt1 ,Yt 2 ,,Yt m ) = P(Yt k , Yt k ,, Yt k ) 表示。 1 2 m
7
当计量分析使用的数据是时间序列数据时,情 况就会有所不同。 因为时间序列并不是一个随机变量的反复抽样, 而是随机过程的一个实现,每个数据都是特定 时间随机变量的唯一实现值,时间序列样本均 值和方差的含义与截面数据也不同,这样以随 机变量总体均值和方差的推断为基础的计量经 济分析的基础就会出现问题。
12
严平稳性一般情况下强于弱平稳性,但也不一 定隐含弱平稳,因为严平稳过程各随机变量的 一、二阶矩并不一定存在。 平稳的时间序列有稳定的趋势(期望)、波动 性(方差)和横向联系(协方差),可以用时 间序列的样本均值和方差推断各时点随机变量 的分布特征。 因此运用平稳时间序列数据的经典回归分析是 有效的,以往时间序列数据的计量回归分析实 际上隐含假设数据是平稳的。
第十章 伪回归和单位根
1
本章结构
第一节 时间序列及其平稳性 第二节 时间序列平稳性检验 第三节 时间序列的单积和协积
2
第一节 时间序列及其平稳性
一、时间序列数据和随机过程
二、经典计量分析和时间序列的平稳性 三、时间序列非平稳和伪回归
3
一、时间序列数据和随机过程
计量经济分析中的截面数据是在同一时点抽样 统计得到的,可以理解为一个随机变量反复抽 样的结果。 时间序列数据则是在不同时间观测或统计的数 据,不能看作同一个随机变量生成的,不能看 作与截面数据一样的同一个随机变量的反复抽 样,而应该看作不同随机变量生成的,看作是 一个随机过程的一个实现。
18
Granger和Newbold提出了判断伪回归的 2 R 一个经验法则:若回归分析结果 >DW 就可能存在伪回归问题。 判断伪回归比较可靠的方法是从导致伪 回归的根源,也就是时间序列的非平稳 性问题出发,通过检验时间序列是否平 稳序列加以判断。
14
图10.1 非平稳时间序列数据连线图
1600 1400 1200 1000 800 600 400 200 36 38 40 42 44 46 48 50 52 54
IN VGM
15
4.0 3.5 3.0 2.5 2.0 1.5 1.0 1000 2000 3000 GER 4000 5000 6000
与时间t无关,只与时间间隔k有关。
Fra Baidu bibliotek
对可能存在的高阶矩也同样。 严平稳性要求是相当高的,比较难满足和证明。
11
现实应用中常采用另一种相对较弱的,使用 比较方便,比较符合计量经济分析要求的弱 平稳性或协方差平稳性。 弱平稳性即满足下列三条要求: (1)E(Yt ) ; 2 2 (2) Var(Yt ) E(Yt ) ; (3)Cov(Yt , Yt k ) E[(Yt )(Yt k )] k。
10
严平稳性隐含任意时刻随机变量的概率分布相 同,意味着各个时点随机变量均值和方差(存 在且有限时)都相同,即 E(Yt ) 和 Var (Yt ) 2 都与t无关,两个随机变量的协方差: Cov(Yt , Yt k ) E[(Yt )(Yt k )] k
13
三、时间序列非平稳和伪回归
时间序列的平稳性并不总是有保证的,许多常 用的经济时间序列,如GDP、物价指数、股票 价格等,都有非平稳的特性。 例如下面图10.1中INVGM和GER两个时间序列 数据的连线图,就是经济时间序列的典型图形。 根据这两个图形很容易看出,这两个时间序列 都不符合平稳时间序列要求的稳定均值的特征, GER的图形也不满足稳定方差的基本特征,因 此这两个时间序列都是非平稳的。
16
如果把非平稳的时间序列当作平稳序列, 事实上会破坏古典线性回归模型的基本 假设,用这样的模型进行回归,得到的 统计量都是失效的,分析、检验和预测 结果都是无效的,对计量回归分析的有 效性有很大的影响。
17
非平稳时间序列的另一个问题是,虽然 这种时间序列事实上会破坏经典回归分 析的基础和有效性,但根据分析结果并 不一定能发现问题。 事实上,有时即使时间序列严重非平稳, R2 分析结果完全无效,t、F、 等指标却 仍然很正常,模型的显著性和拟合程度 看起来都很好。这种问题通常称为“伪 回归” 问题。
因为时间序列数据每个时点的观测统计 值,都相当于该时点生成变量水平的一 个随机变量的一个实现值,因此整个时 间序列数据就是由各个时点的随机变量 构成的随机过程的“一个实现”。
6
二、经典计量分析和时间序列的平稳性
计量经济回归分析的参数估计及相关推断检验, 都是建立在随机变量总体均值、方差推断基础 上的。 如果使用的是截面数据,那么因为截面数据是 一个随机变量的抽样结果,因此根据中心极限 定理等,可以用截面数据的样本均值和方差推 断随机变量的总体均值和方差,以此为基础的 计量回归分析和预测是有效的。
4
所谓随机过程就是一系列具有顺序性和内在联 系的随机变量的集合。 随机过程一般定义为随机变量族 X (t ),t T , 其中T 是给定的实数集,对应每个t T 的 X (t ) 是随机变量。 当进一步明确参数t代表时间,T 是整数集合时, X (t ),t 0,1,称为“时间 2, 离散型随机过程 序列”。
8
其实并不是以时间序列数据为基础的计 量分析都会存在问题。 只要所使用的时间序列数据是平稳的, 以时间序列数据为基础的计量经济分析 就是有效的。 所谓平稳时间序列数据就是由平稳随机 过程生成的时间序列数据。
9
随机过程的平稳性包括严平稳和弱平稳两种情 况。 严平稳即随机过程{Yt , t 0, 1, 2, }在任意时 点概率分布的特性不受时间原点改变的影响, 可以用任意m个时刻 t1 , t2 ,, tm 观测值Yt1 ,Yt2 ,,Ytm 的联合概率分布,与 t1 k , t2 k ,, tm k 时刻 观测值Yt1 k ,Yt 2 k ,,Yt m k 的联合概率分布相同 P(Yt1 ,Yt 2 ,,Yt m ) = P(Yt k , Yt k ,, Yt k ) 表示。 1 2 m
7
当计量分析使用的数据是时间序列数据时,情 况就会有所不同。 因为时间序列并不是一个随机变量的反复抽样, 而是随机过程的一个实现,每个数据都是特定 时间随机变量的唯一实现值,时间序列样本均 值和方差的含义与截面数据也不同,这样以随 机变量总体均值和方差的推断为基础的计量经 济分析的基础就会出现问题。
12
严平稳性一般情况下强于弱平稳性,但也不一 定隐含弱平稳,因为严平稳过程各随机变量的 一、二阶矩并不一定存在。 平稳的时间序列有稳定的趋势(期望)、波动 性(方差)和横向联系(协方差),可以用时 间序列的样本均值和方差推断各时点随机变量 的分布特征。 因此运用平稳时间序列数据的经典回归分析是 有效的,以往时间序列数据的计量回归分析实 际上隐含假设数据是平稳的。
第十章 伪回归和单位根
1
本章结构
第一节 时间序列及其平稳性 第二节 时间序列平稳性检验 第三节 时间序列的单积和协积
2
第一节 时间序列及其平稳性
一、时间序列数据和随机过程
二、经典计量分析和时间序列的平稳性 三、时间序列非平稳和伪回归
3
一、时间序列数据和随机过程
计量经济分析中的截面数据是在同一时点抽样 统计得到的,可以理解为一个随机变量反复抽 样的结果。 时间序列数据则是在不同时间观测或统计的数 据,不能看作同一个随机变量生成的,不能看 作与截面数据一样的同一个随机变量的反复抽 样,而应该看作不同随机变量生成的,看作是 一个随机过程的一个实现。
18
Granger和Newbold提出了判断伪回归的 2 R 一个经验法则:若回归分析结果 >DW 就可能存在伪回归问题。 判断伪回归比较可靠的方法是从导致伪 回归的根源,也就是时间序列的非平稳 性问题出发,通过检验时间序列是否平 稳序列加以判断。
14
图10.1 非平稳时间序列数据连线图
1600 1400 1200 1000 800 600 400 200 36 38 40 42 44 46 48 50 52 54
IN VGM
15
4.0 3.5 3.0 2.5 2.0 1.5 1.0 1000 2000 3000 GER 4000 5000 6000
与时间t无关,只与时间间隔k有关。
Fra Baidu bibliotek
对可能存在的高阶矩也同样。 严平稳性要求是相当高的,比较难满足和证明。
11
现实应用中常采用另一种相对较弱的,使用 比较方便,比较符合计量经济分析要求的弱 平稳性或协方差平稳性。 弱平稳性即满足下列三条要求: (1)E(Yt ) ; 2 2 (2) Var(Yt ) E(Yt ) ; (3)Cov(Yt , Yt k ) E[(Yt )(Yt k )] k。
10
严平稳性隐含任意时刻随机变量的概率分布相 同,意味着各个时点随机变量均值和方差(存 在且有限时)都相同,即 E(Yt ) 和 Var (Yt ) 2 都与t无关,两个随机变量的协方差: Cov(Yt , Yt k ) E[(Yt )(Yt k )] k
13
三、时间序列非平稳和伪回归
时间序列的平稳性并不总是有保证的,许多常 用的经济时间序列,如GDP、物价指数、股票 价格等,都有非平稳的特性。 例如下面图10.1中INVGM和GER两个时间序列 数据的连线图,就是经济时间序列的典型图形。 根据这两个图形很容易看出,这两个时间序列 都不符合平稳时间序列要求的稳定均值的特征, GER的图形也不满足稳定方差的基本特征,因 此这两个时间序列都是非平稳的。
16
如果把非平稳的时间序列当作平稳序列, 事实上会破坏古典线性回归模型的基本 假设,用这样的模型进行回归,得到的 统计量都是失效的,分析、检验和预测 结果都是无效的,对计量回归分析的有 效性有很大的影响。
17
非平稳时间序列的另一个问题是,虽然 这种时间序列事实上会破坏经典回归分 析的基础和有效性,但根据分析结果并 不一定能发现问题。 事实上,有时即使时间序列严重非平稳, R2 分析结果完全无效,t、F、 等指标却 仍然很正常,模型的显著性和拟合程度 看起来都很好。这种问题通常称为“伪 回归” 问题。