时间序列分析word版
传统时间序列分析word精品文档26页
第九章传统时间序列分析时间序列的变动主要是由长期趋势、循环波动、季节变动及不规则变动而形成的,其中前三种变动有一个共同的特点,就是依一定的规则而变化,不规则变动则在综合中可以消除。
基于这种认识,本章主要是介绍设法消除不规则变动,拟合确定型趋势,因而形成了一系列确定型时间序列分析方法。
实验一季节模型实验目的:掌握季节调整的方法。
实验内容:对时间序列进行季节调整。
知识准备:经济时间序列的变化受许多因素的影响,概括地讲,可以将影响时间序列变化的因素分为四种,即长期趋势(T,随着时间的变化,按照某种规律稳步地增长、下降或保持在某一水平上)、季节变动因素(S,在一个年度内依一定周期规则性变化)、周期变动因素(C,以若干年为周期的波动变化)和不规则变动因素(I,许多不可控的偶然因素共同作用的结果)。
传统时间序列分析应是设法消除不规则变动,指拟合确定性趋势,因而形成了长期趋势分析、季节变动分析和循环波动测定等一系列确定型时间序列分析方法。
季节变动是一种较为普遍的现象,其按照一定的周期循环进行,而且每个周期变化强度大体一致。
研究季节变动的目的在于了解季节变动的规律,并进行季节预测。
分析季节变动的方法有很多,其中常用的方法有两类:一是不考虑长期趋势的影响;二是考虑长期趋势的影响,运用时间序列模型分解的方法来计算季节指数。
谓季节调整,就是将某一统计指标的时间序列中的季节性因素和偶然性因素剔除,从而使经过季节调整的时间序列能够较为准确地反映出社会经济运行基本态势。
本章主要介绍X11方法、Census X12方法和移动平均比率法等季节调整方法。
一、X11方法X11的全称是“X11”变量的第二类调查统计方法季节调整方案,通常简称为X11方案。
其基本思想是利用一系列处理技术将不可比因素如季节、节假日、各月(季)的星期数量等分离,大大提高数据的可比性,以便于对系统作出正确的分析和客观的评价;同时,通过分离,获得关于系统动态结构和规律的大量信息。
时间序列分析0000-精品文档
② 高次指数平滑法
二次指数平滑法的预测公式为
ˆ y a b t k t tk
三次指数平滑法的预测公式 为
(3.3.8)
ˆ y a b k c k t k t t t
2
(3.3.9)
(二)趋势线法 三种最常用的趋势线 直线型趋势线
yt abt
指数型趋势线 yt abt 抛物线型趋势线
在以上各式中, 为待估计 i 0 , 1 , 2 , ,p ) i( 的参数值,它们可以通过最小二乘法估计获 得。
三、季节性预测法
基本步骤
(1)对原时间序列求移动平均,以消除 季节变动和不规则变动,保留长期趋势;
(2)将原序列y除以其对应的趋势方程值 (或平滑值),分离出季节变动(含不规则 变动),即
ˆ ˆ y ( 1 ) y y ( 1 ) y t 1 t j t t
j j 0 n 1
(3.3.7)
α为平滑系数。一般时间序列较平稳,α取值 可小一些,一般取 α∈( 0.05,0.3 );若时间序 列数据起伏波动比较大,则 α 应取较大的值, 一般取α∈(0.7,0.95)。
ˆ y ( y y y ) / 3 t t 1 t t 1
(3.3.5)
若l=2,则(3.3.4)式称为五点滑动平均, 其计 算公式为
ˆ y ( y y y y y ) / 5 t t 2 t 1 t t 1 t 2
(3.3.6)
指数平滑法 ① 一次指数平滑
n k
自回归模型的建立
常见的线性自回归模型:
① 一阶线性自回归预测模型为
y y t 0 1 t 1 t
第4章时间序列分析共66页
无关。
10
2、平稳随机过程的数字
特征
(1)数学期望:平稳过程
的数学期望是常数。即
t t
(169 )
( 2 )自协方差函数:平稳过
程的相关函数是与 t
无关的一元函数,即:
= ( x )= D ( X t , X t ) D ( X t , X s )
2
3
二、随机过程的数字特征
随机过程的数学期望和方差函数。
随机过程Xt ,t T,在每一t T的状态是一个
随机变量,它的数学期望和方差都是依赖于参数t的
函数,分别称为随机过程的数学期望和方差函数,
其数学期望为:
t
E(Xt )
xt
f
(xt;t)dxt
方差为:D(Xt ) D(Xt ) E [Xt t ]2
1: 0 0 2 : - = 3 : 0
4 : 是非负定的,即对于任 意数组
t
,
1
t
2,
,
tn
T 和任意实值函数
g (t )都有:
n
( X i X j )g (ti )g (t j ) 0
i, j1
13
(4)、平稳随机过程的遍历性 设xt是平稳过程X T的一个样本函数,若其
S ( ) k e ik
(175 )
k
16
对于白噪声系列ak ,因它的自协方差函为数
k
(a)
2 a
0
k 0 k 0
所以它的谱密度为:
S()
k eik
2 a
k
(176)
17
第二节、时间序列的随机线性模型
SAS学习系列39.时间序列分析Ⅲ—ARIMA模型(可编辑修改word版)
39. 时间序列分析Ⅱ——ARIMA 模型随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。
而非平稳序列随机分析的发展就是为了弥补确定性因素分解方法的不足。
时间序列数据分析的第一步都是要通过有效手段提取序列中所蕴藏的确定性信息。
Box 和Jenkins 使用大量的案例分析证明差分方法是一种非常简便有效的确定性信息的提取方法。
而Gramer 分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息。
(一)ARMA 模型即自回归移动平均移动模型,是最常用的拟合平稳时间序列的模型,分为三类:AR 模型、MA 模型和ARMA 模型。
一、AR(p)模型——p 阶自回归模型1.模型:x t =+1xt-1+pxt-p+t其中,≠ 0 ,随机干扰序列εt为0 均值、2方差的白噪声序列(pE(t s)=0 , t≠s),且当期的干扰与过去的序列值无关,即E(x tεt)=0.11 1 p1 pt t 1p由于是平稳序列,可推得均值=1 - - -. 若0 = 0 ,称为中心化的 AR (p )模型, 对于非中心化的平稳时间序列, 可以令= (1 - - -), x * = x - 转化为中心化。
记 B 为延迟算子, Φ (B ) = I -B - -B p 称为 p 阶自回归多项式,则 AR (p )模型可表示为: Φ p (B )x t = t .2. 格林函数用来描述系统记忆扰动程度的函数,反映了影响效应衰减的快慢程度(回到平衡位置的速度),G j 表示扰动 εt-j 对系统现在行为影响的 权数。
例如,AR(1)模型(一阶非齐次差分方程), G j=j ,j = 0,1, 2,模型解为 x t = ∑G j t - j .j =03. 模型的方差∞22对于 AR(1)模型,Var ( x t ) = ∑G jVar (t - j ) =.4. 模型的自协方差j =01 -2对中心化的平稳模型,可推得自协方差函数的递推公式:用格林函数显示表示:∞ ∞∞(k ) = ∑∑G G E (-- - ) =2∑G + Gij t j t k j j k ji =0 j =0j =0对于 AR(1)模型,∞ p1 111 1i(k)=k (0)=k5.模型的自相关函数递推公式:21 -2对于AR(1)模型,(k ) =k(0) =k.平稳AR(p)模型的自相关函数有两个显著的性质:(1)拖尾性指自相关函数ρ(k)始终有非零取值,不会在k 大于某个常数之后就恒等于零;(2)负指数衰减随着时间的推移,自相关函数ρ(k)会迅速衰减,且以负指数k (其中i为自相关函数差分方程的特征根)的速度在减小。
(完整word版)时间序列的小波分析及等值线图、小波方差制作
时间序列的小波分析时间序列(Time Series )是地学研究中经常遇到的问题。
在时间序列研究中,时域和频域是常用的两种基本形式。
其中,时域分析具有时间定位能力,但无法得到关于时间序列变化的更多信息;频域分析(如Fourier 变换)虽具有准确的频率定位功能,但仅适合平稳时间序列分析。
然而,地学中许多现象(如河川径流、地震波、暴雨、洪水等)随时间的变化往往受到多种因素的综合影响,大都属于非平稳序列,它们不但具有趋势性、周期性等特征,还存在随机性、突变性以及“多时间尺度”结构,具有多层次演变规律。
对于这类非平稳时间序列的研究,通常需要某一频段对应的时间信息,或某一时段的频域信息。
显然,时域分析和频域分析对此均无能为力。
20世纪80年代初,由Morlet 提出的一种具有时-频多分辨功能的小波分析(Wavelet Analysis )为更好的研究时间序列问题提供了可能,它能清晰的揭示出隐藏在时间序列中的多种变化周期,充分反映系统在不同时间尺度中的变化趋势,并能对系统未来发展趋势进行定性估计。
目前,小波分析理论已在信号处理、图像压缩、模式识别、数值分析和大气科学等众多的非线性科学领域内得到了广泛的应。
在时间序列研究中,小波分析主要用于时间序列的消噪和滤波,信息量系数和分形维数的计算,突变点的监测和周期成分的识别以及多时间尺度的分析等。
一、小波分析基本原理1. 小波函数小波分析的基本思想是用一簇小波函数系来表示或逼近某一信号或函数。
因此,小波函数是小波分析的关键,它是指具有震荡性、能够迅速衰减到零的一类函数,即小波函数)R (L )t (2∈ψ且满足:⎰+∞∞-=0dt )t (ψ (1)式中,)t (ψ为基小波函数,它可通过尺度的伸缩和时间轴上的平移构成一簇函数系:)abt (a)t (2/1b ,a -=-ψψ 其中,0a R,b a,≠∈ (2)式中,)t (b ,a ψ为子小波;a 为尺度因子,反映小波的周期长度;b 为平移因子,反应时间上的平移。
(完整word版)时间序列分析基于R__习题答案及解析
第一章习题答案略第二章习题答案2.1(1)非平稳(2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376(3)典型的具有单调趋势的时间序列样本自相关图2.2(1)非平稳,时序图如下(2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图2.3(1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118(2)平稳序列(3)白噪声序列2.4,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。
显著性水平=0.05不能视为纯随机序列。
2.5(1)时序图与样本自相关图如下(2) 非平稳 (3)非纯随机 2.6(1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机第三章习题答案3.1 ()0t E x =,21() 1.9610.7t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115φ=3.3 ()0t E x =,10.15() 1.98(10.15)(10.80.15)(10.80.15)t Var x +==--+++10.80.7010.15ρ==+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-=1110.70φρ==,2220.15φφ==-,330φ=3.4 10c -<<, 1121,1,2k k k c c k ρρρρ--⎧=⎪-⎨⎪=+≥⎩3.5 证明:该序列的特征方程为:32--c 0c λλλ+=,解该特征方程得三个特征根:11λ=,2c λ=3c λ=-无论c 取什么值,该方程都有一个特征根在单位圆上,所以该序列一定是非平稳序列。
时间序列分析部分讲义中国科学研究院安鸿志22页word
时间序列分析 (J.D.Hamilton)前言: 3.平稳ARMA过程(p49-78),6.谱分析(p180-202),11.向量自回归(p345-409),21.异方差时间序列模型(p799-823).3. 平稳ARMA过程3.0 概述 (认识论,方法论,历史观,发展观)什么是”回归模型”?什么是”自回归模型”?它们有什么联系 ?为什么用”回归”一词 ?它们的推广模型是什么 ?它们的应用背景是什么 ?* 考虑”父-子身高的关系”X---父亲的身高,Y---儿子的身高,它们有关系吗? 有什么样的关系呢?不是确定的关系! 又不是没有关系!在同族中抽取n对父-子的身高, 即有n对数据:(X1,Y1), (X2,Y2), … , (X n,Y n).Y k ~ a + bX k , 1≤k≤n.Y k = a + bX k + e k , 1≤k≤n. (0.1)* 此为一元线性回归模型.e k---个体差异, 其他因素, 等等.* 如果, 如果能记录到一个父系的长子身高序列, 即X1,X2,…,X n , 显然, (X1,X2),(X2,X3),…,(X n-1,X n)是(n-1)对父--子身高数据, 与(X k,Y k)相比, 这里的Y k = X k+1 , k=1,2,…,n-1.依同样论述有X k +1 = a + bX k + e k , 1≤k≤n. (0.2)* 此为一元线性自回归模型(自变元Y k是因变元X k的延迟) * 回归←英文翻译←Regression←(0.2),具体说来如下:μ--男人平均身高. 由(0.2)得X k +1-μ = a + bX k + e k -μ (注意μ=(b-1)μ+bμ) = a +(b-1)μ + b(X k -μ)+ e k.W k = (X k -μ)---第k代长子身高与平均身高之差,c= a +(b-1)μ,于是有W k+1 = c + bW k + e k. (0.3) 特别人们发现: 0<b<1.它表明:平均说来, 当父亲身高超过平均身高时,其子身高也会超过平均身高,但是比父亲身高更靠近平均身高.有回归平均身高的趋向!稳定系统!* 回归模型的推广: (线性模型)* 增加自变元个数:比如, 儿子身高不仅与父亲还与母亲, 甚至于祖父母有关, 于是(0.1)式应推广为:Y k = a + b1X1k +…+ b p X pk +e k , 1≤k≤n. (0.4) * 此为p元线性回归模型.* 向非线性推广:仍以父-子身高的关系为例, 它们的真实关系应是比(0.1)式更一般的形式:Y k = ϕ(X k )+ e k , 1≤k≤n. (0.5)(0.4)式更一般的形式:Y k = ϕ(X1k,…,X pk )+ e k , 1≤k≤n. (0.6) 近年来, 又引出了比(0.6)式更广的模型:Y k =ϕ(X1k,…,X pk )+s(X1k,…,X pk )e k ,1≤k≤n. (0.7) * 此为异方差回归模型.(0.7)式的更一般的形式:Y k =ψ(X1k,…,X pk ;e k ),1≤k≤n. (0.8) 模型越复杂, 越近似真实情况, 也越难统计分析.* 应用背景:非常广泛!主要用于预报,控制,检测,管理. 模型的获得方法有两类.3.1 期望,平稳性,遍历性:确切说, 是对(0.1)至(0.8)式中{e k}的最起码的假定, 根据这些假定就可以引出随机过程和各种模型概念, 用它们近似描述{e k}(本来是说不清的).而且, 对这些起码的假定, 也只是以最直观的方式, 而非严格的概率论观点, 加以介绍.* 期望和随机过程* 随机过程: {X(t);-∞<t<∞},其中X(t)是随机变量.* 随机序列: {X k;k=…,-1,0,1,…},其中X k是随机变量.特别当X k=X(kh)时,序列{X k}是过程{X(t)}的等间隔采样序列.回忆随机变量X和它的样本的定义, 我们有:* 样本序列:{…,x-1,x0,x1,…}是序列{X k}的一个样本序列, 又称为一个实现, 又称为一个观测序列,等等.请注意: 随机变量X的一个样本,就是一个数;随机向量X的一个样本,就是一个向量数;随机序列{X k}的一个样本, 是一个无穷数列;在实际应用中, 我们无法记录无穷数列,从而在讨论随机序列{X k}的样本时, 只能考虑一个样本的有限部分, 比如{x1,x2,…,x n}是序列{X k}的一段观测值序列.在理论讨论时,为了方便又不得不涉及无穷数列. 这些都是学习和掌握时间序列分析时, 首先要认清的起点.** 序列的分布 :回忆随机变量X的定义便知,它的特征被它的概率分布所确定. 同样, 随机序列也被它的概率分布所确定.不过, 随机序列的分布是无穷个随机变量的概率分布,其复杂性可以想得到. 这里为了避免涉及太深的概率论概念, 我们仅考虑最简单的特疏情况, 即X k~N(μk,σ2k), 它有密度f k(x)=(2πσ2k)-1/2exp{(x-μk)2/2σ2k}而且(X k+1,X k+2,…,X k+m)有联合正态分布. 于是有:* 期望(均值):EX k=⎰xf k(x)dx=μk,* 方差:Var(X k)=E(X k-μk)2=⎰(x-μk)2f k(x)dx=σ2k.* 自协方差:γkj=E[(X k-μk)(X j-μj)]=⎰⎰(x-μk)(y-μj)f kj(x,y)dxdy = E[(X j-μj)(X k-μk)]= γjk.回忆二元随机变量X和Y的协方差定义便可理解上式.* 平稳序列:一类重要的特疏随机序列.弱平稳序列: 如果μk=μ; γkj=γk-j=γj-k .严平稳序列: 如果 (X k+1,X k+2,…,X k+m)的分布与k无关!正态平稳序列: 弱平稳序列≅严平稳序列!** 遍历性:一个重要性质—-时间序列统计分析的基础.(与大数是律有关)(1/n)∑k=1n X k → EX k=⎰xf k(x)dx=μk, 当n→∞.(1/n)∑k=1n g(X k )→ Eg(X k)=⎰g(x)f k(x)dx, 当n→∞.3.2 白噪声序列: 什么是? 为什么叫? 有什么用?它是基楚性的随机序列,具体来说,{…,ε-1,ε0,…}是相互独立相同分布的随机变量序列,且均值为零,方差为σ2.(常用i.i.d.{εt}表示)Eεt=0, Eεt2=σ2, Eεtεs=0,(t≠s)(3.2.1) (3.2.2) (3.2.3)因为, 当t≠s时γts=E[(εt-Eεt)(εs-Eεs)]=Eεtεs=Eεt Eεs=0=γt-s.为什么叫白噪声序列,在讲谱分析更能看清.它有什么用呢 ? 可以说,很多很多的随机序列都是通过白噪声序列的变化生成的!* 请看几个例子:例1. Y t=a+b t+εt, (确定函数+白噪声)μt=EY t=E(a+b t+εt)=a+b t+Eεt==a+b t,γkj=E[(Y k-EY k)(Y j-EY j)]=Eεkεj=Eεk Eεj=0,(j≠k)γkk=E(Y k-EY k)2=Eεk2=σ2.例2. Y t=εt+a1εt-1+a2εt-2, (白噪声延迟的线性和)例3. Y t=εtεt-1, (白噪声⨯白噪声延迟)例4. Y t=εt/(1+εt-12). (白噪声+白噪声延迟的函数) 一个有趣的问题: 是否用白噪声序列能生成所有的平稳序列 ? (回答是, 不能!)3.3 移动平均过程(滑动平均序列—Moving Average-MA)* 移动平均过程定义的由来---概述:设{εk}为白噪声序列, 顾名思义, 滑动平均序列是: Y t=(εt+εt-1+…+εt-m+1)/m, t=…,-1,0,1,…推而广之Y t=(θ0εt+θ1εt-1+…+θmεt-m+1)/(θ0+θ1+…+θm),更广之Y t=μ+θ1εt-1+…+θmεt-m+1+εt, (3.3.8) 或Y t=μ+∑i=0∞ψiεt-i. (线性序列) (3.3.13)Y t=μ+∑i=-∞∞ψiεt-i. (线性序列,非现实)* 移动平均过程的特征:* 均值函数:EY t=μ+∑i=0∞ψi Eεt-i=μ. (By Eεt-i=0) (*)* 自协方差函数:γkj=E[(Y k-μ)(Y j-μ)] (用上式)=E[∑i=0∞ψiεk-i∑i=0∞ψiεj-i]= E[∑i=0∞∑s=0∞ψiψsεk-iεj-s]= ∑i=0∞∑s=0∞ψiψs Eεk-iεj-s(By Eεk-iεj-s=0,if k-i≠j-s)= ∑i=0∞ψiψi+|k-j|Eε12 (By Eε12=σ2)= σ2∑i=0∞ψiψi+|k-j|= γk-j. (3.3.18)* 可见, (3.3.13)式的{Y t}是平稳序列. 特别当{εk}为正态白噪声序列时, {Y t}也是正态平稳序列.还特别指出: 为保证(3.3.18)式可求和, 要求∑i=0∞ψi2<∞. (3.3.14) 或者更强的要求∑i=0∞|ψi|<∞. (3.3.15) 由此式可导出∑i=0∞|γi|<∞. (3.3.19) 此式能保证序列{Y t}具有遍历性.* 一阶移动平均过程(MA(1))Y t=μ+θεt-1+εt, (3.3.1) 相当于(3.3.13)式中的ψ0=1,ψ1=θ,其它ψi=0. 以此代入(*)和(3.3.13)式则有EY t=μ, (3.3.2) γ0=σ2(1+θ2), γ1=γ-1=σ2θ, γi=0, 当|i|>1时.(3.3.3) (3.3.4) (3.3.5)(3.3.5)式是一阶移动平均过程的基本特征!它表现为自协方差函数序列{γ0,γ1,γ2,…},在1以后是截尾的, 即{γ0,γ1,0,0,0,…}.易见, 这一特征与γ0和γ1的具体取值并不密切, 所以,可用序列的自相关函数表述.* 自相关函数:ρk=γk/γ0, k=0,1,… (3.3.6) 这是因为ρk=γk/γ0=γk/γ01/2γ01/2=E[(Y t+k-μ)(Y t-μ)]/{E(Y t+k-μ)2E(Y t-μ)2}1/2,它是Y t+k和Y t的相关系数, 依平稳性它与t无关, 但与k 有关, 所以称函数, 又因是序列自身的关系, 所以称自相关函数.* 对于(3.3.1)的一阶移动平均过程而言, 由(3.3.4)和(3.3.5)知ρ0=1, ρ1=θ/(1+θ2), 当k>1,ρk=0. (3.3.7) 可见, 自相关函数在1以后全为零(截尾)是一阶移动平均过程的本质性特征!* 以上内容不难推广到* q阶移动平均过程:(MA(q))(见p58-59)模型Y t=μ+θ1εt-1+…+θqεt-q+εt, (3.3.8)特征γk=0, ρk=0, 当k>q. (3.3.12) 即,它的自协方差函数在q步以后截尾.关于γ0, γ1,…,γq的具体表达式为γ0=(1+θ12+θ22+…+θq2)σ2, (σ2=Eεt2) (3.3.10)γj=(θj+θj+1θ1+θj+2θ2+…+θqθq-j)σ2,j=1,2,…,q (3.3.12) 注意, 以上(3.3.10)和(3.3.10)式, 表达了γ0, γ1,…,γq和参数θ1,θ2,…,θq2,σ2的相互依赖关系! 但是, 除非q=1,一般很难求解. 况且, 它们的解还有不唯一性问题, 此问题方在3.7节中解答.例2(见p59).3.4自回归过程.(自回归序列—AutoRegression--AR)* 一阶自回归过程(AR(1)) (相当于概述)* 实际背景:* 定义:Y t= c + φY t-1 + εt , (3.4.1)其中{εt}是白噪声序列, 而且, εt与{Y t-1,Y t-2,…}独立!所以, 在文献中, {εt}又被称为新息序列!* 求解: 由(3.4.1)式反复迭代有: (Y t=c+φY t-1 +εt=c+φ(c+φY t-2 +εt-1)+εt=c+φc+φ2Y t-2 +φεt-1+εt=φ2Y t-2+(c+φc)+(εt+φεt-1)=φ3Y t-3+(c+φc+φ2c)+(εt+φεt-1+φ2εt-2)=φn Y t-n+(c+φc+…+φn-1c)+(εt+φεt-1+…+φn-1εt-n+1)→(c+φc+φ2c+…)+(εt+φεt-1+φ2εt-2…)(当n→∞)=c/(1-φ)+∑k=0∞φkεt-k. (3.4.2)* 平稳性:显然, 上式成立的充分必要条件是:|φ|<1. 即φ∈(-1, 1)于是有名称: 区间(-1,1)为AR(1)模型的平稳域;(3.4.2)式的解为AR(1)模型的平稳解;--- AR(1)平稳序列;它也是MA(∞)序列(见(3.3.13)式).* 均值函数:由(3.4.2)式和Eεt=0,有Y t=c/(1-φ)=μ. (3.4.3)* 自相关函数: 在(3.3.18)式, 此时ψj=φj, j=0,1,…于是AR(1)的自协方差函数为γk=σ2φj/(1-φ2)=φjγ0, j=0,1,… (3.4.5)AR(1)的自相关函数为ρk=γk/γ0=φj, j=0,1,… (3.4.6)回顾模型AR(1)(3.4.1)式Y t=c+φY t-1 +εt, 两边同取均值得μ=EY t=Ec+φEY t-1 +Eεt=c+φμ⇒μ=c/(1-φ).在(3.4.1)式两边同减上式μ=c+φμ得(Y t-μ)=φ(Y t-1-μ)+εt.记W t=(Y t-μ), 它是{Y t}的中心化序列! 它满足中心化的AR(1)模型W t=φW t-1 +εt. (3.4.1)’以W t-k(k≥1)同乘上式两边, 然后再同取均值得γk=EW t W t-k=φEW t-1W t-k+Eεt W t-k=φγk-1, k=1,2,… (3.4.15) 其中用到εt与W t-k独立,和Eεt=0,即Eεt W t-k=Eεt EW t-k=0.由此可得γk=φkγ0.将W t=φW t-1 +εt两边平方后, 再同取均值得γ0=EW t2=φ2EW t-1 2+Eεt2+2φEW t-1εt=φ2γ0+σ2⇒γ0=σ2/(1-φ2).记L为(一步)延迟算子(运算), 即Lεt=εt-1,L2W t=W t-2,等等. 于是, W t=φW t-1 +εt 可写成W t=φLW t +εt或者 W t-φLW t =εt 或者(1-φL)W t=εt . (3.4.1)’’W t=(1-φL)-1εt=∑k=0∞φk L kεt=∑k=0∞φkεt-k.其中(1-φL)-1=∑k=0∞φk L k ⇔ (1-φL)∑k=0∞φk L k=1.以上推演方法, 不仅简便, 而且能推广到高阶情况!* 高阶推广:Y t=c+φ1Y t-1+…+φp Y t-p +εt , (3.4.13)μ=c+φ1μ+…+φpμ,W t=φ1W t-1+…+φp W t-p +εt ,记则 W t=φ1W t-1+…+φp W t-p +εt 等价于Z t=AZ t-1+Uεt . (*)于是, 以上对模型AR(1)的推演步骤都无困难地推广到以上p元一阶AR模型. 唯一的差别就是要用到矩阵运算. 例如, 类似于(3.4.2)式的解为Z t=∑k=0∞A k Uεt-k. (*)此时(3.4.13)式具有平稳解的充分必要条件是:A的本征值的模都小于1,ρ(A)<1. (对比|φ|<1, ρ(A)是A的谱半径).* 二阶AR模型:(见p64-66)(概述其难点所在)模型:Y t=c+φ1Y t-1 +φ2Y t-2+εt,W t=φ1W t-1 +φ2W t-2+εt, (3.4.10)依前所述, 只要求得(3.4.10)式的解, 就不难获得AR(2)模型的个项特征量. 要获得(3.4.10)式的解,就等价于求{W t}的(3.3.13)式中的系数ψj(0≤j<∞). 如上所述, 我们有两种方法:一是用(3.4.10)仿(3.4.2)式)求二元一阶AR模型的解) 说实话,都不简单! 为什么? 请看若用(3.4.10)式反复迭法, 则有W t=φ1W t-1 +φ2W t-2+εt=εt+φ1(φ1W t-2 +φ2W t-3+εt-1)+φ2W t-2=εt +φ1εt-1+(φ12+φ2)W t-2+φ1φ2W t-3=…以下难于寻找 εt-2, εt-3,…的系数的表示法. (难于寻找规律)若用算子的代数运算求解(3.4.10)式, 此时Z t =⎪⎪⎭⎫ ⎝⎛-1t t W W , A=⎪⎪⎭⎫ ⎝⎛0121φφ, 在用(*)式求Z t 的表达式时, 要求出A k(k=1,2,…), 同样难于寻找规律!究其根源在于: 此时(3.4.10)式可写为W t -φ1W t-1 -φ2W t-2=εt , (3.4.10)’记 Φ(L)=1-φ1L -φ2L 2, 则(3.4.10)式又可写为Φ(L)W t =εt , (3.4.10)’’ 于是有解W t =Φ-1(L)εt =∑j=0∞ψj εt-j (=Y t -μ=Y t -c Φ-1(1)) 其中Φ-1(L)=∑i=0∞ψi L j ⇔ Φ(L)=∑i=0∞ψi L j=1 式中的系数ψj 与Φ(x)=0的根有关, 而且只有当Φ(x)=0的根都在单位圆外, 即Φ(x)≠0,对|x |<1.(3.4.18) (3.4.10)式才有平稳解! 而且,一般难于给出ψj 的显示表达式! 对A k而言也如此!注意AR(1)时只有一个实根;AR(2)时可能有两个不同的实根, 有一个的实的双重根, 有两个不同的但是共轭的复根.对于注重应用者, 更关心自协方差函数, 请看:将 W t=φ1W t-1 +φ2W t-2+εt 两边同乘 W t-k , 再求均值可得EW t W t-k=φ1EW t-1W t-k+φ2EW t-2W t-k+Eεt W t-k注意, 对于k≥1时, Eεt W t-k=Eεt EW t-k=0, 于是有γk=φ1γk-1 +φ2γk-2, k≥1, 或者 (3.4.25)γk-φ1γk-1 -φ2γk-2=0, k≥1. (3.4.25)’当k=0时, 将W t=φ1W t-1 +φ2W t-2+εt 两边同乘W t, 再求均值得EW t W t=φ1EW t-1W t+φ2EW t-2W t+Eεt W t=φ1γ1+φ2γ2+Eεt(φ1W t-1 +φ2W t-2+εt)=φ1γ1+φ2γ2+φ1Eεt W t-1+φ2Eεt W t-2+Eεt2 (By Eεt W t-j=0,j≥1)=φ1γ1+φ2γ2+σ2. (3.4.29)至此我们得到了(3.4.29)式和(3.4.25)式. 人们已注意到, (3.4.25)式也是二阶差分方程, 也难得显示解. 但是我们不关心它的解, 而关心γ0,γ1,γ2和参数φ1,φ2,σ2的相互依赖关系! 至于γ3,γ4,…, 它们被γ0,γ1,γ2(或φ1,φ2,σ2)唯一确定, 而且不被关注. 进一步而言, (3.4.29)式和(3.4.25)式中取k=1,2就唯一确定了γ0,γ1,γ2和参数φ1,φ2,σ2的相互依赖关系! 现写下这三个方程:γ0=φ1γ1+φ2γ2+σ2,γ1=φ1γ0 +φ2γ1,γ2=φ1γ1 +φ2γ0.将γ0同除以上后两式的ρ1=φ1+φ2ρ1, (3.4.27)ρ2=φ1ρ1 +φ2. (3.4.28)由此不难解出ρ1,ρ2与φ1,φ2的关系.其实,我们更关心φ1,φ2对ρ1,ρ2的依赖关系! 注意,(3.4.27)和(3.4.28)式联合起来, 称为(AR(2)的)Yule-Walker 方程.* p 阶AR 模型:(见p66-68) 模型:Y t =c+φ1Y t-1 +…+φp Y t-p +εt , (3.4.31) 记W t =Y t -μ=Y t -c/(1-φ1 -…-φp ),W t =φ1W t-1 +…+φp W t-p +εt , (3.4.31)’W t -φ1W t-1 -…-φp W t-p =εt ,Φ(L)W t =εt ,Φ(L)=1-φ1L -…-φp L p . 平稳条件:Φ(x)=0的根都在单位圆外, 即Φ(x)≠0,对|x |<1.(3.4.32) Y-W 方程:ρt =φ1ρt-1 +…+φp ρt-p , t=1,2,… (3.4.37) 若记 φ=(φ1,φ2,…,φp )τ, ρ=(ρ1,ρ2,…,ρp )τ, 再记R=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛----111212111 p p p p ρρρρρρ 则 由(3.4.37)式可得R φ=ρ. (3.4.37)’ 有解φ=R-1ρ. (3.4.37)’’** 偏相关函数:若将(3.4.37)’中的p用k代替, 并记相应的记号为φ(k)=(φ1k,φ2k,…,φkk)τ, ρ(k)=(ρ1,ρ2,…,ρk)τ和R(k),则有φ(k)=R-1(k)ρ(k), k=1,2,… (3.4.37)* 序列{φkk:k=1,2,…}为偏相关函数列.请注意, ρk是W t+k和W t的相关系数,而φkk是在已知W t+1,W t+2,…,W t+k-1条件下, W t+k和 W t的相关系数. 粗略地说, 在扣除W t+1,W t+2,…,W t+k-1的影响后, W t+k和 W t的相关系数.可以证明, 对于平稳AR(p)序列而言, 偏相关函数列在p以后都为零, 也称截尾, 即{φkk:k=1,2,…}={φ11,φ22,…,φpp,0,0,…}. (*)3.5自回归滑动平均过程:(ARMA(p,q))讨论ARMA(p,q)模型时, 用多元化的方法并不方便, 常用的方法是延迟算子的方法. 具体如下:* ARMA(p,q)模型:Y t=c+φ1Y t-1+…+φp Y t-p+θ1εt-1+…+θqεt-q+εt. (3.5.1)Y t-φ1Y t-1-…-φp Y t-p=c+εt+θ1εt-1+…+θqεt-q记Φ(L)= 1-φ1L-…-φp L p ;Θ(L)= 1+θ1L+…+θq L q ;于是(3.5.1)式可写成Φ(L)Y t=c+Θ(L)εt, (3.5.2) 上式有解Y t=Φ-1(L)c+Φ-1(L)Θ(L)εt,=μ+ψ(L)εt.其中μ=c/(1-φ1-…-φp) (书中有此式,但无编号)=cΦ-1(1)ψ(L)εt=Φ-1(L)Θ(L)εt=(∑k=0∞ϕk L k)Θ(L)εt=∑k=0∞ψk L kεt=∑k=0∞ψkεt-k=W t.于是(3.5.1)(或(3.5.2))有解Y t=μ+W t=μ+∑k=0∞ψkεt-k. (*)中心化的ARMA模型为Φ(L)W t=Θ(L)εt, (3.5.2)’W t=Φ-1(L)Θ(L)εt.关于ARMA(p,q)模型的特性, 能说些什么呢 ? 它的自相关函数和偏相关函数都不截尾, 可以说, 正因为都不截尾,就不得不考虑引入ARMA(p,q)模型.当然也不是无条件的, 细究起来要读第5章. 在此, 我们仅介绍以下性质.* (3.5.1)有平稳解的条件:Φ(x)=0的根都在单位圆外, 即Φ(x)≠0,对|x|<1.(3.5.3) * 自协方差序列的尾部特征:将(3.5.2)两边同乘W t-k(k>q), 再取均值得E[(W t-φ1W t-1-…-φp W t-p)W t-k]=E[(εt+θ1εt-1+…+θqεt-q)W t-k] 即有γt-φ1γt-1 +…+φpγt-p=0, t=q+1,q+2,… (3.5.5) 很有趣, 虽然ARMA(p,q)序列的自协方差序列不截尾, 但是它的线性组和序列γt-φ1γt-1 +…+φpγt-p确在q步后截尾. 由此既可给出此模型的判别依据, 又可找到γ0,γ1 ,…,γp+q和参数φ1,φ2,…,φp,θ1,θ2,…,θq,σ2的依赖关系.(见第5章)3.6自协方差生成函数(谱表示)(移至第6章)3.7可逆性:* 先举两个例子,首先看W t=εt+(1/2)εt-1 (*)其中{εt}为正态白噪声,即εt~N(0,σ2). 于是有EW t=0, EW t2=σ2+(1/2)2σ2=(1+(1/4))σ2=(5/4)σ2,γ1=EW t W t-1=E(εt+(1/2)εt-1)(εt-1+(1/2)εt-2)=(1/2)σ2.再考查另一模型Z t=ηt+2ηt-1, (**)其中{ηt}为正态白噪声,即ηt~N(0,σ2/4), 即,Eηt2=ση2=σ2/4, 于是有EZ t=0, EZ t2=ση2+4ση2=5ση2=(5/4)σ2,γ1=EZ t Z t-1=E(ηt+2ηt-1)(ηt-1+2ηt-2)=2ση2=(2/4)σ2=(1/2)σ2. 可见序列{W t}和{Z t}有相同的均值, 和相同的自协方差函数.而且它又是正态的(此条不可少!), 于是它们有完全相同的概率分布结构! 在理论和应用中都无法区分.出现此问题的根源在于: 模型(*)和(**)分别可写成W t=(1+(1/2)L)εt=Θ1(L)εt,Z t=(1+2L)ηt=Θ2(L)ηt,奇妙的是, Θ1(L)=0和Θ2(L)=0 的根互为倒数! 因为, Θ1(L)=0的根是2, Θ2(L)=0的根是1/2.具此,我们可以使用模型(*), 因为Θ1(L)=0的根是2,它在单位圆外!至此, 我们可以回答第3.3节俭的不能唯一确定MA(q)的系数问题了.具体地说, 就是将MA(q)模型的系数多项式Θ(L)限定在单位圆外或者圆上! (详见p77)* 可逆性: 将MA(q)模型的系数多项式Θ(L)限定在单位圆外! 单位圆上也不许有根! 为何加此限制呢? 为了有MA(q)模型有以下的逆转公式可用:εt=Θ-1(L)W t=∑i=0∞πi W t-i. (对比W t=Θ(L)εt)* 对于ARMA模型,既要求它有平稳性,又要求它有可逆性,于是它既可写成传递形式W t=Φ-1(L)Θ(L)εt=∑i=0∞ψiεt-i,又可写成逆转形式εt=∑i=0∞πi W t-i.ARMA模型一览表注1: Θ(L)=1+∑j=1qθj L j ; Φ(L)= 1-∑j=1pφj L j; 其中L为一步延迟运算.注2: 注意各模型的自协方差列{γk}与其参数的关系.第 21 页。
eviews时间序列分析实验Word版
实验一ARMA 模型建模一、实验目的学会检验序列平稳性、随机性。
学会分析时序图与自相关图。
学会利用最小二乘法等方法对ARMA 模型进行估计,以及掌握利用ARMA 模型进行预测的方法。
学会运用Eviews 软件进行ARMA 模型的识别、诊断、估计和预测和相关具体操作。
二、基本概念 1 平稳时间序列:定义:时间序列{zt}是平稳的。
如果{zt}有有穷的二阶中心矩,而且满足:(a )ut= Ezt =c;(b )r(t,s) = E[(zt-c)(zs-c)] = r(t-s,0) 则称{zt}是平稳的。
2 AR 模型:AR 模型也称为自回归模型。
它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测。
具有如下结构的模型称为P 阶自回归模型,简记为AR(P)。
⎪⎪⎪⎪⎨⎧<∀=≠===≠+++++=---ts Ex t s E Var E x x x x t s s t t t p t p t p t t t ,0,0)(,)(,0)(0222110εεεσεεφεφφφφε3 MA 模型:MA 模型也称为滑动平均模型。
它的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测。
具有如下结构的模型称为Q 阶移动平均回归模型,简记为MA(q)。
4 ARMA 模型:ARMA 模型:自回归模型和滑动平均模型的组合, 便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA 。
具有如下结构的模型称为自回归移动平均回归模型,简记为ARMA(p,q)。
112220()0(),()0,t t t t q t q q t t t s x E Var E s t εμεθεθεθεθεεσεε---⎧=+----⎪≠⎨⎪===≠⎩,⎪⎪⎪⎪⎨⎧<∀=≠===≠≠---++++=----ts Ex t s E Var E x x x t s s t t t q p q t q t t p t p t t ,0,0)(,)(,0)(0,0211110εεεσεεθφεθεθεφφφε三、实验内容及要求 1 实验内容:(1)根据时序图判断序列的平稳性;(2)观察相关图,初步确定移动平均阶数q 和自回归阶数p ;2 实验要求:(1)深刻理解平稳性的要求以及ARMA 模型的建模思想;(2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARMA 模型;如何利用ARMA 模型进行预测;(3)熟练掌握相关Eviews 操作,读懂模型参数估计结果。
第四章_时间序列分析
(2)、由时点数列计算序时平均数
①由连续时点数列计算序时平均数 对社会经济现象而言,已知每天数据 可视为连续序列。
a a
n
a
af f
例4-2-2:有某企业职工人数资料:
日期
1日 2日 3日 4日 5日 6日 a1 a2 a3 a4 a5 a6
职工人数(人) 98 100 99 101 108 106
例如,由一年中各月底数计算的全年平均数,就比只用年初和年末两 项数据计算的结果更准确。
9-18
⑵ 对间隔不等时点数列求 (加权序时平均法)
a
a1 a2 2
f1 a2
a3 2
f2
an1 2
an
f n1
f
例4-2-5
时 间 1月初 a1
职工人数(人) 102
3月初 a2 105
9月初 a3 108
第四章 时间序列分析
本章重点
第一节 时间序列分析概述 第二节 时间序列的水平分析 第三节 时间序列的速度分析 第四节 长期趋势的测定
第一节 时间序列分析概述
时间序列的概念 时间序列的种类 时间序列的编制原则
9-2
表4-1
9-3
一、时间序列的概念
时间序列(time series)— 动态数列, 把同
解:
劳动生产率
产量 人数
时期指标 时点指标
设以a、b、c分别表示产量、人数、劳动生产率
所以 c a
b
其中:
a
a
1200
1440 1050
123(0 吨)
n
3
b b1 2 b2 b3 bn1 bn 2 n 1
60 2 60 65 64 2 6(2 人) 4 1
第八章--时间序列分析Word版
第八章时间序列分析与预测【课时】 6学时【本章内容】§8.1 时间序列的描述性分析时间序列的含义、时间序列的图形描述、时间序列的速度分析§8.2 时间序列及其构成分析时间序列的构成因素、时间序列构成因素的组合模型§ 8.3 时间序列趋势变动分析移动平均法、指数平滑法、模型法§8.4 时间序列季节变动分析原始资料平均法、趋势-循环剔除法、季节变动的调整§8.5 时间序列循环变动分析循环变动及其测定目的、测定方法本章小结【教学目标与要求】1.掌握时间序列的四种速度分析2.掌握时间序列的四种构成因素3.掌握时间序列构成因素的两种常用模型4.掌握测定长期趋势的移动平均法5.了解测定长期趋势的指数平滑法6.掌握测定长期趋势的线性趋势模型法7.了解测定长期趋势的非线性趋势模型法8.掌握分析季节变动的原始资料平均法9.掌握分析季节变动的循环剔出法10.掌握测定循环变动的直接法和剩余法【教学重点与难点】1.对统计数据进行趋势变动分析,利用移动平均法、指数平滑法、线性模型法求得数据的长期趋势;2.对统计数据进行季节变动分析,利用原始资料平均法、趋势-循环剔除法求得数据的季节变动;3.对统计数据进行循环变动分析,利用直接法、剩余法求得循环变动。
【导入】很多社会经济现象总是随着时间的推移不断发展变化,为了探索现象随时间而发展变化的规律,不仅要从静态上分析现象的特征、内部结构以及相互关联的数量关系,而且应着眼于现象随时间演变的过程,从动态上去研究其发展变动的过程和规律。
这时需要一些专门研究按照时间顺序观测的序列数据的统计分析方法,这就是统计学中的时间序列分析。
通过介绍一些时间序列分析的例子,让同学们了解时间序列的应用,并激发学生学习本章知识的兴趣。
1.为了表现中国经济的发展状况,把中国经济发展的数据按年度顺序排列起来,据此来研究。
2.公司对未来的销售量作出预测。
这种预测对公司的生产进度安排、原材料采购、存货策略、资金计划等都至关重要。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2章 时间序列的预处理拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。
根据检验的结果可以将序列分为不同的类型,对不同类型的序列我们会采用不同的分析方法。
2.1 平稳性检验 2.1.1 特征统计量平稳性是某些时间序列具有的一种统计特征。
要描述清楚这个特征,我们必须借助如下统计工具。
一、概率分布数理统计的基础知识告诉我们分布函数或密度函数能够完整地描述一个随 机变量的统计特征。
同样,一个随机 变量族的统计特性也完全由它们的联 合分布函数或联合密度函数决定。
对于时间序列{t X ,t ∈T },这样来定义它的概率分布:任取正整数m ,任取m t t t ,,,⋯21∈T ,则m 维随机向量(m t t t X X X ,,,⋯21)’的联合概率分布记为),,,(m t t t x x x F m⋯⋯21,,,21,由这些有限维分布函数构成的全体。
{),,,(m t t t x x x F m⋯⋯21,,,21,∀m ∈正整数,∀m t t t ,,,⋯21∈T } 就称为序列{t X }的概率分布族。
概率分布族是极其重要的统计特征描述工具,因为序列的所有统计性质理论上都可以通过 概率分布推测出来,但是概率分布族的重要 性也就停留在这样的理论意义上。
在实际应 用中,要得到序列的联合概率分布几乎是不 可能的,而且联合概率分布通常涉及非常复 杂的数学运算,这些原因使我们很少直接使 用联合概率分布进行时间序列分析。
二、特征统计量 一个更简单、更实用的描述时间序列统计特征的方法是研究该序列的低阶矩,特别是均值、方差、自协方差和自相关系数,它们也被称为特征统计量。
尽管这些特征统计量不能描述随机序列全部的统计性质,但由于它们概率意义明显,易于计算,而且往往能代表随机 序列的主要概率特征,所以我们对时间序列进行分析,主要就是通过分析这些统计量的统计特性,推断出随机序列的性质。
1.均值对时间序列{t X ,t ∈T }而言,任意时刻的序列值t X 都是一个随机变量,都有它自己的概率分布,不妨记为)(x F t 。
只要满足条件∞<⎰∞∞)(-x xdF t就一定存在着某个常数t μ,使得随机变量t X 总是围绕在常数值t μ附近做随机波动。
我们称t μ为序列{t X }在t 时刻的均值函数。
t μ=t EX =)(-x xdF t ∞∞⎰当t 取遍所有的观察时刻时,就得到一个均值函数序列{t μ,t ∈T }。
它反映的是时间序列{t X ,t ∈T }每时每刻的平均水平。
2.方差当∞<⎰∞∞)(-x xdF t 时,可以定义时间序列的方差函数用以描述序列值围绕其均值做随机波动时的平均波动程度。
)()()(22t 2t x dF x X E DX t t t t μμσ-⎰=-==∞∞-同样,当t 取遍所有的观察时刻时,我们得到一个方差函数序列{T t t ∈,2σ}。
3.自协方差函数和自相关系数类似于协方差函数和相关系数的定义,在时间序列分析中我们定义自协方差函数(autocovariance function )和自相关系数(autocorrelation coefficient )的概念。
对于时间序列{t X ,t ∈T },任取t ,s ∈T ,定义γ(t ,s )为序列{t X }的自协方差函数:))(()s t (s t s t X X E μμγ--=,定义),(s t ρ为时间序列{t X }的自相关系数,简记为ACF 。
st DX DX s t s t •=),(),(γρ之所以称它们为自协方差函数和自相关系数,是因为通常的协方差函数和相关系数度量的是两个不同事件彼此之间的相互影响程度,而自协方差函数和自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。
2.1.2 平稳时间序列的定义平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列。
一、严平稳所谓严平稳(strictly stationary )就是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质不会随时间的推移而发生变化时,该序列才能被认为平稳。
而我们知道,随机变量族的统计性质完全由它们的联合概率分布族决定。
所以严平稳时间序列的定义如下:定义2.1 设{t X }为一时间序列,对任意正整数m ,任取m t t t ,,,⋯21∈T ,对任意整数τ,有),,,(m t t t x x x F m⋯⋯21,,,21=),,,(m t t t x x x F m ⋯+++⋯21,,,21τττ则称时间序列{t X }为严平稳时间序列。
前面说过,在实践中要获得随机序列的联合分布是一件非常困难的事,而且即使知道随机序列的联合分布,计算和应用也非常不便。
所以严平稳时间序列通常只具有理论意义,在实践中用得更多的是条件比较宽松的宽平稳时间序列。
二、宽平稳宽平稳(weak stationary )是使用序列的特征统计量来定义的一种平稳性。
它认为序列的统计性质主要由它的低阶矩决定,所以只要保证效率低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
定义2.2 如果{t X }满足如下三个条件: (1)任取t ∈T ,有∞<2T EX(2)任取t ∈T ,有μμ,=t EX 为常数;(3)任取t ,s ,k ∈T ,且k+s-t ∈T ,有γ(t,s)=γ(k,k+s-t)则称{t X }为宽平稳时间序列。
宽平稳也称为弱平稳或二阶平稳(second-order stationary )。
显然,严平稳比宽平稳的条件严格。
严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对于高于二阶的矩没有任何要求。
所以通常情况下,严平稳序列也满足宽平稳条件,而宽平稳序列不能反推严平稳成立。
但这不是绝对的,两种情况都有特例。
比如服从柯西分布的严平稳序列就不是宽平稳序列,因为它不存在一、二阶矩,所以无法验证它二阶平稳。
严格地讲,只要存在二阶矩的严平稳序列才能保证它一定也是宽平稳序列。
宽平稳一般推不出严平稳,但当序列服从多元正态分布时,则二阶平稳可以推出严平稳。
定义2.3 时间序列{t X }称为正态时间序列,如果任取正整数n ,任取n 21t t t ,,,⋯∈T ,相对应的有限维随机变量n 21...X X X ,,,服从n 维正态分布,密度函数为: )]~~()'~~(21ex p[||)2()~(1212,...,,21n n n n n n nn t t t X X X f n μμπ-Γ--Γ=---其中,'~21),,,(n n X X X X ⋯=;'~21),,,(n n EX EX EX ⋯=μ;n Γ为协方差阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛=Γ),(...),(),(............),(...),(),(),(...),(),(112121211111n n n n n n n t t t t t t t t t t t t t t t t t t γγγγγγγγγ从正态随机序列的密度函数可以看出,它的n 维分布仅由均值向量和协方差阵决定,即对正 态随机序列而言,只要二阶矩平稳了,就等于分布 平稳了,所以宽平稳的正态序列一定是严平稳时间序列。
对于非正态过程,就没有这个性质了在实际应用中,研究最多的是宽平稳随机序列,以后见到平稳随机序列,如果不加特别注明,指的都是宽平稳随机序列。
如果序列不满足平稳条件,就称为非平稳序列。
2.1.3 平稳时间序列的统计性质根据平稳时间序列的定义,可以推断出它一定具有如下两个重要的统计性质。
一、常数均值 T t EX t ∈∀=,μ二、自协方差函数和自相关系数只依赖于时间的平移长度而与时间的起止点无关 T k s t t s k k s t ∈∀-+=,,),,(),(γγ根据这个性质,可以将自协方差函数由二维函数),(s t γ简化为一维函数)(t s -γ: T s t s t t s ∈∀=-,),,()(γγ 由此引出延迟k 自协方差函数的概念。
定义2.4 对于平稳时间序列{t X ,t ∈T },任取t(t+k ∈T ),定义γ(k)为时间序列{t X }的延迟k 自协方差函数:),()(k t t k +=γγ根据平稳序列的这个性质,容易推断出平稳随机序列一定具有常数方差: T t t t DX t ∈∀==),0(),(γγ由延迟k 自协方差函数的概念可以等价得到延迟k 自相关系数的概念:)0()(),(γγγρk DX DX k t t kt t k =•+=+ 容易验证和相关系数一样,自相关系数具有如下三个性质: (1)规范性 10=ρ且k 1k ∀≤,ρ(2)对称性 k k -=ρρ(3)非负定性对任意正整数m ,相关阵m Γ为对称非负定阵。
⎪⎪⎪⎪⎪⎭⎫⎝⎛=Γ----021201110ρρρρρρρρρm m m m m 值得注意的是,k ρ除了具有上述三个性质外,还具有一个特别的性质:对应模型的非唯一性。
一个平稳时间序列一定唯一决定了它的自相关函数,但它的自相关函数未必唯一对应着一个平稳的时间序列。
我们在后面的章节中将证明这一点。
这个性质就给我们根据样本的自相关系数的特点来确定模型增加了一定的难度。
2.1.4 平稳时间序列的意义时间序列分析方法作为数理统计学的一个分支,遵循数理统计学的基本原理,都是利用样本信息来推测总体信息。
传统的统计分析通常都拥有如下数据结构,见表2-1。
根据数理统计学常识,显然要分析的随机变量越少越好(m 越小越好),而每个变量获得的样本信息越多越好(n 越大越好)。
因为随机变量越少,分析的过程越简单, 而样本容量越大,分析的结果就会越可靠。
但是时间序列分析的数据结构有它的特殊性。
对随机序列...}X ...X X {...t 21,,,,,而言,它在任意时刻t 的序列值t X 都是一个随机变量,而且由于时间的不可重复性,该变量在任意一个时刻只能获得唯一的样本观察值。
因为时间序列分析的数据结构如下,见表2-2。
表2-2由于样本信息太少,如果没有其他的辅助信息,通常这种数据结构是没有办法进行分析的。
而序列平稳性概念的提出可以有效地解决这个问题。
在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值数列{}T t t ∈,μ 变成了一个常数序列 {}T t ∈,μ原本每个随机变量的均值)(T t t ∈μ只能依靠唯一的一个样本观察值t x 去估计t t x =μˆ 现在由于)(T t t ∈∀=μμ,于是每一个样本观察值)(T t x t ∈∀,都变成了常数均值μ的样本观察值nxx ni i∑===1ˆμ这极大地减少了随机变量的个数,并增加了待估参数的样本容量。