非线性时间序列模型

合集下载

非线性趋势的时间序列

非线性趋势的时间序列

非线性趋势的时间序列
非线性趋势的时间序列通常具有曲线或曲折的形状,而不是直线或指数型的趋势。

这种时间序列可能表现出各种形式的非线性关系,如凸型、凹型、波动性等。

例如,一个非线性趋势的时间序列可能是一条波动上升的曲线,其中波峰和波谷交替出现,而不是沿着直线或指数型增长。

另一个例子是一条S 型曲线,表现为一段缓慢增长,随后加速上升,最终趋于饱和。

非线性趋势的时间序列具有更加复杂的关系,因此需要更高级的数据分析方法来识别和预测。

常见的方法包括多项式拟合、非参数回归、神经网络模型等。

通过这些方法,可以更好地理解和利用非线性趋势的时间序列数据。

2020版金融计量学:时间序列分析视角(第三版)教学课件第14章第1节

2020版金融计量学:时间序列分析视角(第三版)教学课件第14章第1节

(14.20)
这样,可以把模型(14.19)重新写成
VAR(1)模型的形式,即:
St PSt1 Vt (14.21)
在一阶MS模型中,我们还可以得到比 模型(14.23)更一般的结论,即:
E(Vt Sti ) 0,i 0
无条件期望对应的是其中一个状 态的期数占总共状态期数的比重。我 们知道,对于只有两个状态的MS模型 来说,在每一个时刻点,只有一个状 态,也只有一个扰动项。从模型 (14.16)和(14.21),我们得到:
可以写成如下形式
Yt Yt
X t0 X t1
t0 t1
t0
iid
(0,
2 0
),
st
0
t1 iid (0,12 ), st 1
其中:Yt、Xt 和 分别表示因变量、自变 量矩阵以及系数矩阵。
14.2.4 状态变量的属性
MS模型中不同区制(状态)持续 的时间、区制的期望、区制的向量表 示形式以及利用向量形式的区制形式 预测未来的状态,是状态变量属性中 最重要的几个方面,我们下面分别进 行介绍。
s10
p f1( y1) (1 p) f0 ( y1)
当我们考虑更一般的情况时,则 可以把模型(14.34)拓展为:
Pr| It1]
f ( yt | t1
其中: 1 Pr[s1 1| It1] Pr[st , st1 | It1] st1 0
(1 p){1 p p2
p p2
p2 }
(1
p)
1
1
p
p 1 p
p2 1 p
1 p p2
(14.12)
1 1 p
同理,如果假设
st1 st2 st j 0, st j 1

非线性时间序列分析STAR模型及其在经济学中的应用

非线性时间序列分析STAR模型及其在经济学中的应用

非线性时间序列分析的基本概念 和理论
时间序列是指按照时间顺序排列的一组数据。在经济学中,时间序列数据通 常反映了某一经济现象的历史演变过程,如股票价格、消费支出、生产产量等。 非线性时间序列是指时间序列数据之间存在非线性关系,这种关系往往比线性关 系更为复杂和真实。
STAR模型是一种非线性时间序列分析方法,它可以捕捉时间序列中的非线性 结构和变化。STAR模型基于自回归模型,通过引入平滑转换函数,允许模型在不 同时间点之间平滑转换,以适应时间序列数据的非线性特征。
3、数据预处理
在应用STAR模型之前,需要对时间序列数据进行预处理,如去噪、季节调整 等。这些预处理步骤可以帮助STAR模型更好地识别时间序列的非线性结构。
4、模型应用
一旦STAR模型被估计和识别后,可以将其应用于预测时间序列的未来走势。 此外,STAR模型还可以用于时间序列的分解,将时间序列分解为线性部分和非线 性部分,以便更深入地理解时间序列数据的特征。
非线性动力系统基础
非线性动力系统是指由非线性微分方程或动态方程描述的系统。这些系统具 有丰富的动态行为和复杂的相互作用,无法简单地通过线性系统进行描述。李雅 可夫斯基定理是非线性动力系统理论中的重要成果之一,它揭示了系统中混沌现 象的存在和重要性。此外,同步也是非线性动力系统中的一个重要概念,它描述 了两个或多个系统在某种条件下以相同的方式运动的现象。
非线性时间序列分析STAR模型及其 在经济学中的应用
目录
01 引言
03
非线性时间序列分析 STAR模型
02 非线性时间序列分析 的基本概念和理论
04 参考内容
引言
在经济学中,时间序列数据的应用越来越广泛,例如金融市场价格波动、消 费者行为模式、生产活动变化等。为了更好地理解和预测这些时间序列数据,非 线性时间序列分析方法逐渐受到重视。其中,STAR(Smooth Transition Autoregressive)模型是一种被广泛应用于非线性时间序列分析的方法。本次演 示将详细介绍非线性时间序列分析STAR模型及其在经济学中的应用。

非线性时间序列.doc

非线性时间序列.doc

-------------精选文档 -----------------近代时间序列分析选讲:一. 非线性时间序列二. GARCH 模型三. 多元时间序列四. 协整模型-------------精选文档 -----------------非线性时间序列第一章 .非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章 . 非线性时间序列模型1.概述2.非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章 . 马尔可夫链与 AR 模型1.马尔可夫链2.AR 模型所确定的马尔可夫链-------------精选文档 -----------------3.若干例子第四章 . 统计建模方法1.概论2.线性性检验3.AR 模型参数估计4.AR 模型阶数估计第五章 . 实例和展望1.实例2.展望第一章 .非线性时间序列浅释1.从线性到非线性自回归模型时间序列 {x t } 是一串随机变量序列 , 它有广泛的实际背景 , 特别是在经济与金融-------------精选文档 -----------------领域中尤其显著. 关于它们的从线性与非线性概念 , 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1):x t = x t-1 +e t ,t=1,2,(1.1)其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-1 ,} 独立 .反复使用 (1.1) 式的递推关系 , 就可得到x t =x t-1 +e t=e =e =e ttt+x t-1+{ e t-1 +x t-2 } +e t-1 + 2 x t-2== e t +e t-1 + 2 e t-2+ +n-1 e t-n+1+n x t-n.(1.2)如果当 n时,n xt-n 0, (1.3) {e t + e t-1 + 2 e t-2++n-1 e t-n+1}j=0j et-j .(1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是 , 对以上的简单模型 , 不难相信 , 当| |<1 时 , (1.3)(1.4) 式成立 . 于是 , 当 | |<1时,模型LAR(1)有平稳解 , 且可表达为x t =j=0j e t-j.(1.5) 通过上面叙述可见求LAR(1) 模型的解有简便之优点 , 此其一 . 还有第二点 , 容易推广到 LAR(p) 模型 . 为此考查如下的 p 阶线性自回归模型 LAR(p):x t = 1 x t-1 + 2 x t-2 +...+p x t-p +e t ,t=1,2, (1.6) 其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且 e t与{x t-1 , x t-1 ,} 独立 .虽然反复使用(1.6) 式的递推式, 仍然可得到 (1.2) 式的类似结果, 但是 ,用扩张后的一阶多元 AR 模型求解时 , 可显示出与 LAR(1) 模型求解的神奇的相似. 为此记x t 1x t 1, U= 0X t = ,x t p 1 01 2 p1 0 0(1.7)A= ,0 00于是 (1.6) 式可写成如下的等价形式:X t =A X t-1 + e t U.(1.8) 反复使用此式的递推关系, 形式上仿照 (1.2) 式可得X t =AX t-1 +e t U= e t U+ e t-1 AU+A 2 x t-2==e t U+e t-1 AU+e t-2 A 2 U++e t-n+1 A n-1 U+A n x t-n .如果矩阵 A 的谱半径 (A的特征值的最大模) (A),满足如下条件(A)<1,(1.10)由上式可猜想到 (1.8) 式有如下的解 :X t =k=0 A k Ue t-k .(1.11)其中向量X t的第一分量x t形成的序列 {x t },就是模型 (1.6) 式的解 . 由此不难看出 , 它有以下表达方式x t =k=0k e t-k .(1.11)其中系数k 由(1.6)式中的 1 ,2 , ...,p确定 , 细节从略 . 不过 , (1.11) 式给了我们重要启发 ,即考虑形如x t =k=0k e t-k ,k=0k 2,(1.12)的时间序列类( 其中系数k 能保证(1.12)式中的x t有定义 ). 在文献中 , 这样的序列-------------精选文档 -----------------{x t } 就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1),以便与LAR(1) 模型进行比较分析 . 首先写出 NLAR(1)模型如下x t = (x t-1 )+e t ,t=1,2,(1.13)其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-2 ,} 独立 , 这些假定与LAR(1) 模型相同 , 但是 ,(x t-1 )不再是 x t-1的线性函数 , 代之为非线性函数,比如-------------精选文档 -----------------(x t-1 )=x t-1 /{a+bx t-1 2}.此时虽然仍可反复使用(1.13) 式进行迭代, 但是所得结果是x t =(x t-1 ) +e t= e t +(x t-1 )= e t +( e t-1 +(x t-2 ))= e t +( e t-1 +( e t-2 + (x t-3 )))==e t +( e t-1 +( e t-2 ++(x t-n )) ).(1.14)根据此式 , 我们既不能轻易判断(x t-1 ) 函-------------精选文档 -----------------数满足怎样的条件时, 上式会有极限 , 也不能猜测其极限有怎样的形式.对于 p 阶非线性自回归模型x t = (x t-1 ,x t-2 ,,x t-p )+e t ,t=1,2, (1.15) 仿照 (1.6) 至 (1.9) 式的扩张的方法, 我们引入如下记号(x t 1 , x t 2 ,...,x t px t 1( x t-1 ,x t-2 , ,x t-p ),x t p 1(1.16)我们得到与 (1.15) 式等价的模型X t = (X t-1 ) +e t U, t=1,2,(1.17)但是 , 我们再也得不出(1.9) 至 (1.14) 式的结果 ,至此我们已将看出 , 从线性到非线性自回归模型有实质性差异 , 要说清楚它们 , 并不是很简单的事情 . 从数学角度而言 , 讨论线性自回归模型可借用泛函分析方法 , 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法 . 这也正是本讲座要介绍的主要内容 .2.线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性 , 它与线性时间序列的定义有关.前一小节中(1.12) 式所显示的线性时间序列 , 只是一种定义方式. 如果改变对系数k 的限制条件, 就会给出不同的定义. 更为重要的是 , 在近代研究中 , 将 (1.12) 式中的 i.i.d. 序列 {e t } 放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究 . 事实上 , 已经有丰富的成果被载入文献史册 .依上所述可知 , 由于线性时间序列定义的多样性 , 必然带来非线性时间序列定义的复杂性 . 这里需要强调指的是 , 对于非线性时间序列 , 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同 . 于是人们要问 , 我们用哪些工具来研究非线性时间序列模型解的特性呢 ? 这正是本次演讲要回答的问题 . 确切地说 , 我们将介绍马尔可夫链 , 并借助于此来讨论非线性自回归模型解的问题 .第二章 . 非线性时间序列模型1.概论从(1.12) 式可见,一个线性时间序列 {x t }, 被 {e t } 的分布和全部系数i 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如 ARMA 模型 . 对于非线性时间序列而言 , 使用参数模型方法几乎是唯一的选择 . 由于非线性函数的多样性 ,带来了非线性时间序列模型的多样性 . 但是 , 迄今为止被研究得较多 , 又有应用价值的非线性时序模型 , 为数极少 , 而且主要是针对非线性自回归模型 . 在介绍此类模型之前 , 我们先对非线性时序模型的分类作一概述 .通用假定 : {t }为i.i.d.序列,且E t =0, 而且t 与{x t-1 , x t-2 ,}独立 .可加噪声模型 :x t = (x t-1 ,x t-2 , )+t ,t=1,2, (2.1)其中( ) 是自回归函数. 当它仅依赖于有限个未知参数时 , 记此参数向量为 , 其相应的(2.1) 模型常写成x t = (x t-1 ,x t-2 , ; )+t ,t=1,2, (2.2)否则 , 称(2.1) 式称为非参数模型.关于 (2.1)(2.2)的模型的平稳性,要在下一章讨论 , 但是 , 它有类似于线性A R 模型的几个简单性质, 是重要的而且容易获得的, 它们是 :E(x t |x t-1 ,x t-2 , )=E{ (x t-1 ,x t-2 , )+t |x t-1 ,x t-2 ,}= (x=(xt-1t-1 ,x,xt-2t-2 ,⋯)+E(t |x t-1 ,x t-2 ,⋯),⋯)(2.3)var{x t |x t-1 , x t-2 , ⋯}E{[x t - (x t-1 ,⋯)] 2|x t-1 , x t-2 , ⋯}= E{t 2|x t-1 , x t-2, ⋯}= E t 2=2.(2.4)P{x t <x|x t-1 ,x t-2 , ⋯}= P{(x t-1 ,⋯)+t <x|x t -1 ,x t-2 , ⋯}= P{t <x-(x t-1 ,⋯)|x t-1 ,x t-2 , ⋯}=F (x-(x t-1 ,⋯)).(2.5)其中 F 是t 的分布函数.带条件异方差的模型:x t = (x t-1 ,x t-2 , )+S(x t-1 ,x t-2 , )t ,t=1,2, (2.6)其中( ) 和 S() 也有限参数与非参数型之分 , 这都是不言自明的 . 另外 , (2.6) 式显然不属于可加噪声模型. 但是 , 它比下面的更一般的非可加噪声模型要简单得多. 这可通过推广 (2.3)(2.4)(2.5)式看出,即有,E(x t |x t-1 ,x t-2 , )-------------精选文档 -----------------=E{ (x t-1 ,x t-2 ,⋯)+S(x t-1 ,x t-2 ,⋯)t |x t-1 ,x t-2 ,⋯}=(x t-1 ,x t-2 ,⋯)+S(x t-1 ,x t-2 ,⋯)E{t |x t-1 ,x t-2 ,⋯}= (x t-1 ,x t-2 ,⋯).(2.3) ’var{x t |x t-1 , x t-2 , ⋯}E{[x t - (x t-1 ,⋯)] 2 |x t-1 , x t-2 , ⋯}=E{S 2 (x t-1 ,x t-2 ,⋯)t 2|x t-1 , x t-2, ⋯}=S 2 (x t-1 ,x t-2 ,⋯)E{t 2|x t-1 , x t-2, ⋯}=S 2 (x t-1 ,x t-2 ,⋯) 2 .(2.4) ’P{x t <x|x t-1 ,x t-2 , ⋯}=P{(x t-1 ,⋯)+S(x t-1 ,⋯)t <x|x t-1 , x t-2, ⋯} = P{t <[x-(x t-1 ,⋯)]/S(x t-1 ,⋯)}=F ([x-(x t-1 ,⋯)]/S(x t-1 ,⋯)).(2.5) ’一般非性序模型:x t = (x t-1 ,x t-2 ,⋯;t ,t-1 ,⋯)t=1,2, ⋯(2.7) 其中( ⋯) 也有参数与非参数型之区, 也是不言自明的 . 然 , (2.7) 式既不是可加噪声模型 , 也不属于 (2.6) 式的条件异方差的模型 . 然 , 它可能具有条件异方差性. 相反 , 后两者都是(2.7) 式的特殊型 .虽说 (2.7) 式是更广的模型形式, 在文献中却很少被研究 . 只有双线性模型作为它的一种特殊情况 , 在文献中有些应用和研究结果出现 . 现写出其模型于后, 可供理解其双线性模型的含义x t =j=1 p j x t-j +j=1 q j t-j+i=1 P j=1 Q ij t-i x t-j .2.非线性自回归模型在前一小节中的 (2.1) 和 (2.2) 式就是非线性自回归模型 , 而且属于可加噪声模型类 . 在这一小节里 , 我们将介绍几种 (2.2) 式的常见的模型 .函数后的线性自回归模型:-------------精选文档 -----------------f(x t )= 1 f(x t-1 )+2f(x t-2 )+...+p f(x t- p )+t ,t=1,2, (2.8) 其中 f(.) 是一元函数 , 它有已知和未知的不同情况 , 不过总考虑单调增函数的情况, =( 1 , 2 ,,p )是未知参数. 在实际应用中 , {x t } 是可获得量测的序列.当 f(.) 是已知函数时 , {f(x t )} 也是可获得量测的序列 , 于是只需考虑 y t =f(x t ) 所满足的线性 AR 模型y t = 1 y t-1 + 2 y t-2 +...+p y t-p +t ,t=1,2, (2.9)-------------精选文档 -----------------此时可不涉及非线性自回归模型概念 . 在宏观计量经济分析中 , 常常对原始数据先取对数后 , 再作线性自回归模型统计分析 , 就属于此种情况 . 这种先取对数的方法 , 不仅简单 , 而且有经济背景的合理解释 ,它反应了经济增长幅度的量化规律 . 虽然在统计学中还有更多的变换可使用 , 比如 Box-Cox 变换 , 但是 , 由于缺少经济背景的合理解释,很少被使用 . 由此看来 , 当 f(.) 有实际背景依据时 , 可以考虑使用 (2.7) 式的模型 .当 f(.) 是未知函数时 , {f(x t )} 不是可量测的序列 , 于是只能考虑 (2.8) 模型 . 注意 f(.)是单调函数 , 可记它的逆变换函数为 f -1 (.), 于是由 (2.8) 模型可得-------------精选文档 -----------------x t = f -1 ( 1 f(x t-1 )+ 2 f(x t-2 )+...+p f(x t-p )+t ),t=1,2, (2.9) ’此式属于 (2.7) 式的特殊情况, 此类模型很少被使用 . 取而代之是考虑如下的模型x t = 1 f(x t-1 )+ 2 f(x t-2 )+...+p f(x t-p )+t ,t=1,2, (2.10) 其中 f(.) 是一元函数 , 也有已知和未知之分, 可不限于单调增函数. 此式属于 (2.1) 式的特殊情况 , 有一定的使用价值.当 (2.10) 式中的 f(.) 函数是已知时 , 此式还有更进一步的推广模型 ,-------------精选文档 -----------------x t = 1 f 1 (x t-1 ,⋯,x t-s )+ 2 f 2 (x t-1 ,⋯,x t-s )+...+p f p (x t-1 ,⋯,x t-s )+t ,t=1,2, ⋯(2.11) 其中 f k (⋯)(k=1,2,⋯,p)是已知的s元函数.例如 , 以后将要多次提到的如下的模型:x t = 1 I(x t-1 <0)x t-1 + 2 I(x t-10)x t-1 +t,t=1,2, ⋯(2.12) 其中 I(.) 是示性函数 . 此模型是分段性的, 是著名的TAR模型的特殊情况. 了有助于理解它 , 我写出它的分段形式:-------------精选文档 -----------------1 x1 t , x1 0,x t =, x t 1 t=1,2,2 x t 1 t0.请注意 , (2.8)(2.10) 和(2.11) 式具有一个共同的特征 , 就是未知参数都以线性形式出现在模型中 . 这一特点在统计建模时带来极大的方便 . 此类模型便于实际应用 . 但是 , 对于 {x t } 而言不具有线性特性 , 所以 , 讨论它们的平稳解的问题 , 讨论它们的建模理论依据问题 ,都需要借助于马尔可夫链的工具 .已知非线性自回归函数的模型:x t = (x t-1 ,x t-2 , ,x t-p ; )+t ,t=1,2,(2.13)-------------精选文档 -----------------其中( ) 是 p 元已知函数 , 但是其中含有未知参数=( 1 , 2 ,,p ). 一般说来, 在一定范围内取值.例如 ,x t = 1 x t 1t , t=1,2,1 2 x t2 1其中=( 1 , 2 )是未知参数, 它们的取值范围是:- < < ,0< .这里需要指出 , 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦 , 二是确定( ) 函数的麻烦 . 一般来说 , 只有根据应用背景能确定() 函数时, 才会考虑使用此类模型.-------------精选文档 -----------------广义线性模型 (神经网络模型 ):x t = ( 1 x t-1 + 2 x t-2 ++p x t-p )+ t,t=1,2, (2.14)其中 (.) 是一元已知或未知函数, 参数=( 1 , 2 ,,p )总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对作些约定,其一,|| ||=1,其二,=( 1 , 2 ,,p )中第一个非零分量为正的 . 不难理解 , 若不加这两条约定,模型(2.14) 不能被唯一确定 .当 (.) 是一元已知函数时 , 与神经网络模型相通 .-------------精选文档 -----------------当 (.) 是一元未知函数时 , 与回归模型中的 PP 方法相通 .除了以上两类模型外, 还有 (2.1) 式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难 . 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题 , 对这类模型不再仔细讨论 .。

非线性经济时间序列数据分析

非线性经济时间序列数据分析

非线性经济时间序列数据分析随着技术的发展,数据分析已经成为了现代经济发展的重要手段。

经济时间序列数据分析,作为数据分析的一种重要方法,已经得到了广泛的应用。

而非线性经济时间序列数据分析,更是在近几年得到了越来越多的关注。

非线性经济时间序列数据分析是指,对于经济时间序列数据进行非线性分析,从而揭示其中的非线性关系。

这种分析方法不仅可以帮助我们更好地了解经济现象,还可以为经济政策的制定提供一定的参考。

为什么需要进行非线性经济时间序列数据分析呢?这是因为经济现象具有一定的不确定性和复杂性,而且受到多种因素的影响。

传统的线性分析方法可能无法很好地识别这些非线性因素,因此需要进行非线性经济时间序列数据分析。

非线性分析方法主要包括非线性统计建模、混沌理论、复杂网络分析等。

其中,非线性统计建模是最常用的分析方法。

该方法可以根据数据的特征,选择适合的非线性模型,从而识别出数据中的非线性因素。

非线性模型可以是神经网络模型、有限自回归模型、时滞自回归模型等。

混沌理论是一种基于非线性动力系统的分析方法,可以研究系统的演化过程和未来趋势。

在经济领域,混沌理论主要用于研究经济波动和预测股市走势等问题。

复杂网络分析是一种将系统中的元素和它们之间的关系表示为网络的分析方法。

在经济领域,复杂网络分析可以用于研究公司之间的关系、股市的网络结构等问题。

非线性经济时间序列数据分析的应用非常广泛。

例如,可以用于股票价格的预测、宏观经济指标的预测、货币市场的交易规律分析等。

同时,非线性经济时间序列数据分析也可以用于分析环境污染和气候变化等大数据领域。

需要注意的是,非线性经济时间序列数据分析在实践中也存在一些问题。

首先,非线性模型的选择比较困难,需要根据数据的特征进行合理选择。

其次,非线性分析方法对数据的要求比较高,需要满足数据的充分条件。

最后,非线性分析结果的解释比较困难,需要结合实际情况进行评估。

总之,非线性经济时间序列数据分析是当前经济数据分析领域的一个热门话题。

非线性模型-TAR

非线性模型-TAR

8.
9.
10.
根据第4步的检验结果,定出d的取值; 确定门限的可能取值; 对第6步中每个可能的门限值,做门限自回归模型 的估计; 选取使得AIC获得最小的门限值; 对所估计的模型进行检验、评价,看看模型是否是 充分的。所用的方法是对残差进行分析,看一下残 差是否是独立同分布的或者是不相关的。对残差分 析,我们可以借助于残差的自相关、偏向关函数, 或者是L-B-P统计量; 如果必要的话,用AIC或SC准则对估计好的模型进 行改进,得出最符合实际的AR的阶数、延迟参数、 门限变量。
i 1 j 1 i 1 j 1
上式比ARMA( p, q)模型多了一个双线性项,因此可以 看作ARMA模型的推广。当x(.)固定时,变成关于a(.) 的线性模型;当a (.)固定时,变成x(.)的线性模型,因 此称之为双线性模型。由于它是非线性模型,模型的 定阶、判别准则、稳定性等远比ARMA模型复杂和困 难得多。
其中Z t d 为门限变量,在Ft 1上可测,参数d被称为延迟变量, 为正整数;初始值( x0 , x1 ,..., x p j 1 )已知, j , j 1, 2,..., k}为门限 {r 值,满足- r0 r1 ... rk 1 rk , k 取正整数,为TAR模型 的段数, jt }是独立同分布随机白噪声序列。满足上述条件的 { 模型通常记为:TAR (d,k,p1 , p2 ,..., pk )。当p1 p2 ... pk p时, 即模型满足在各段阶数相等时记为:TAR (d,k,p )。
双线性模型

双线性模型是由Granger和Anderson(1978) 提出,并得到广泛研究。Subba Rao和 Gabr(1984)讨论了这个模型的一些性质和 应用,Liu和Brockwell(1988)研究了一般的 双线性模型。

非线性时间序列

非线性时间序列

近代时间序列分析选讲:一. 非线性时间序列二. GARCH模型三. 多元时间序列四. 协整模型非线性时间序列第一章.非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章. 非线性时间序列模型1. 概述2. 非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章.马尔可夫链与AR模型1. 马尔可夫链2. AR模型所确定的马尔可夫链3. 若干例子第四章. 统计建模方法1. 概论2. 线性性检验3.AR模型参数估计4.AR模型阶数估计第五章. 实例和展望1. 实例2.展望第一章.非线性时间序列浅释1. 从线性到非线性自回归模型时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1):x t=αx t-1+e t, t=1,2,…(1.1)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=2<, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到x t=αx t-1+e t= e t + αx t-1= e t + α{ e t-1 + αx t-2}= e t + αe t-1 + α2 x t-2=…= e t + αe t-1 + α2e t-2+…+ αn-1e t-n+1 +αn x t-n. (1.2)如果当n时,αn x t-n0, (1.3){e t+αe t-1+α2e t-2+…+αn-1e t-n+1}αj e t-j . (1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为x t=j=0αj e t-j . (1.5)通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):x t =α1x t-1+α2x t-2+...+αp x t-p +e t ,t=1,2,… (1.6)其中{e t }为i.i.d.序列,且Ee t =0, Ee t =2<, 而且e t 与{x t-1, x t-1,…}独立.虽然反复使用(1.6)式的递推式, 仍然可得到(1.2)式的类似结果, 但是,用扩张后的一阶多元AR 模型求解时, 可显示出与LAR(1)模型求解的神奇的相似. 为此记X t =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+--11p t t t x x x , U=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛001 , A=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛00000121 pααα, (1.7)于是(1.6)式可写成如下的等价形式:X t=A X t-1+ e t U. (1.8)反复使用此式的递推关系, 形式上仿照(1.2)式可得X t=AX t-1+e t U= e t U+e t-1AU+A2x t-2==e t U+e t-1AU+e t-2A2U+…+e t-n+1A n-1U+A n x t-n.如果矩阵A的谱半径(A的特征值的最大模) (A), 满足如下条件(A)<1, (1.10)由上式可猜想到(1.8)式有如下的解:X t=k=0A k Ue t-k. (1.11)其中向量X t的第一分量x t形成的序列{x t}, 就是模型(1.6)式的解. 由此不难看出, 它有以下表达方式x t=k=0k e t-k. (1.11)其中系数k由(1.6)式中的α1,α2, ... ,αp确定, 细节从略. 不过, (1.11)式给了我们重要启发, 即考虑形如=k=0k e t-k, k=0k2,x(1.12)的时间序列类(其中系数k能保证(1.12)式中的x t有定义). 在文献中, 这样的序列{x t}就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1), 以便与LAR(1)模型进行比较分析. 首先写出NLAR(1)模型如下x t=(x t-1)+e t,t=1,2,…(1.13)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=2<, 而且e t与{x t-1,x t-2,…}独立, 这些假定与LAR(1)模型相同, 但是, (x t-1)不再是x t-1的线性函数, 代之为非线性函数, 比如(x t-1)=x t-1/{a+bx t-12}.此时虽然仍可反复使用(1.13)式进行迭代, 但是所得结果是x t=(x t-1) +e t= e t+ (x t-1)= e t+ ( e t-1+ (x t-2))= e t+ ( e t-1+ ( e t-2+ (x t-3)))=…=e t+( e t-1+ ( e t-2+ …+(x t-n))…).(1.14)根据此式, 我们既不能轻易判断(x t-1)函数满足怎样的条件时, 上式会有极限, 也不能猜测其极限有怎样的形式.对于p 阶非线性自回归模型x t =(x t-1,x t-2,…,x t-p )+e t ,t=1,2,… (1.15)仿照(1.6)至(1.9)式的扩张的方法, 我们引入如下记号( x t-1,x t-2,…,x t-p )⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+-----1121,...,,(p t t p t t t x x x x x ϕ, (1.16)我们得到与(1.15)式等价的模型X t =(X t-1) +e t U, t=1,2,… (1.17)但是, 我们再也得不出(1.9)至(1.14)式的结果,至此我们已将看出, 从线性到非线性自回归模型有实质性差异, 要说清楚它们,并不是很简单的事情. 从数学角度而言, 讨论线性自回归模型可借用泛函分析方法, 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法. 这也正是本讲座要介绍的主要内容.2. 线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性, 它与线性时间序列的定义有关. 前一小节中(1.12)式所显示的线性时间序列, 只是一种定义方式. 如果改变对系数k的限制条件, 就会给出不同的定义. 更为重要的是, 在近代研究中, 将(1.12)式中的i.i.d.序列{e t}放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究. 事实上, 已经有丰富的成果被载入文献史册.依上所述可知, 由于线性时间序列定义的多样性, 必然带来非线性时间序列定义的复杂性. 这里需要强调指的是, 对于非线性时间序列, 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同. 于是人们要问, 我们用哪些工具来研究非线性时间序列模型解的特性呢? 这正是本次演讲要回答的问题. 确切地说, 我们将介绍马尔可夫链, 并借助于此来讨论非线性自回归模型解的问题.第二章. 非线性时间序列模型1. 概论从(1.12)式可见,一个线性时间序列{x t}, 被{e t}的分布和全部系数i 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如ARMA模型. 对于非线性时间序列而言, 使用参数模型方法几乎是唯一的选择. 由于非线性函数的多样性, 带来了非线性时间序列模型的多样性. 但是,迄今为止被研究得较多, 又有应用价值的非线性时序模型, 为数极少, 而且主要是针对非线性自回归模型. 在介绍此类模型之前, 我们先对非线性时序模型的分类作一概述.通用假定: {t}为i.i.d.序列,且E t=0, 而且t与{x t-1, x t-2,…}独立.可加噪声模型:x t=(x t-1,x t-2,…)+t,t=1,2,…(2.1)其中(…)是自回归函数. 当它仅依赖于有限个未知参数时, 记此参数向量为, 其相应的(2.1)模型常写成x t=(x t-1,x t-2,…;)+t,t=1,2,…(2.2)否则, 称(2.1)式称为非参数模型.关于(2.1)(2.2)的模型的平稳性, 要在下一章讨论, 但是, 它有类似于线性AR模型的几个简单性质, 是重要的而且容易获得的, 它们是:E(x t|x t-1,x t-2,…)=E{(x t-1,x t-2,…)+t|x t-1,x t-2,…}=(x t-1,x t-2,…)+E(t|x t-1,x t-2,…)=(x t-1,x t-2,…) (2.3)var{x t|x t-1, x t-2 , …}E{[x t-(x t-1,…)]2|x t-1, x t-2 , …} = E{t2|x t-1, x t-2 , …}= E t2=2. (2.4)P{x t<x|x t-1,x t-2, …}= P{(x t-1,…)+t<x|x t-1,x t-2, …}= P{t<x-(x t-1,…)|x t-1,x t-2, …}=F(x-(x t-1,…)). (2.5)其中F是t的分布函数.带条件异方差的模型:x t=(x t-1,x t-2,…)+S(x t-1,x t-2,…)t,t=1,2,…(2.6)其中(…)和S(…)也有限参数与非参数型之分, 这都是不言自明的. 另外, (2.6)式显然不属于可加噪声模型. 但是, 它比下面的更一般的非可加噪声模型要简单得多. 这可通过推广(2.3)(2.4)(2.5)式看出, 即有,E(x t|x t-1,x t-2,…)=E{(x t-1,x t-2,…)+S(x t-1,x t-2,…)t|x t-1,x t-2,…}=(x t-1,x t-2,…)+S(x t-1,x t-2,…)E{t|x t-1,x t-2,…}=(x t-1,x t-2,…) . (2.3)’var{x t|x t-1, x t-2 , …}E{[x t-(x t-1,…)]2|x t-1, x t-2 , …} =E{S2(x t-1,x t-2,…)t2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)E{t2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)2. (2.4)’P{x t<x|x t-1,x t-2, …}=P{(x t-1,…)+S(x t-1,…)t<x|x t-1, x t-2 , …}= P{t<[x-(x t-1,…)]/S(x t-1,…)}=F([x-(x t-1,…)]/S(x t-1,…)).(2.5)’一般非线性时序模型:x t=(x t-1,x t-2,…; t, t-1,…)t=1,2,…(2.7)其中(…)也有参数与非参数型之区别, 这也是不言自明的. 显然, (2.7)式既不是可加噪声模型, 也不属于(2.6)式的带条件异方差的模型. 虽然, 它可能具有条件异方差性质. 相反, 后两者都是(2.7)式的特殊类型. 虽说(2.7)式是更广的模型形式, 在文献中却很少被研究. 只有双线性模型作为它的一种特殊情况, 在文献中有些应用和研究结果出现. 现写出其模型于后, 可供理解其双线性模型的含义x t=j=1p j x t-j+j=1q j t-j+i=1P j=1Q ij t-i x t-j.2. 非线性自回归模型在前一小节中的(2.1)和(2.2)式就是非线性自回归模型, 而且属于可加噪声模型类. 在这一小节里, 我们将介绍几种(2.2)式的常见的模型.函数后的线性自回归模型:f(x t)=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,…(2.8)其中f(.)是一元函数, 它有已知和未知的不同情况, 不过总考虑单调增函数的情况, α=(α1,α2,…,αp)是未知参数. 在实际应用中, {x t}是可获得量测的序列.当f(.)是已知函数时, {f(x t)}也是可获得量测的序列, 于是只需考虑y t=f(x t)所满足的线性AR模型y t=α1y t-1+α2y t-2+...+αp y t-p+εt,t=1,2,…(2.9)此时可不涉及非线性自回归模型概念. 在宏观计量经济分析中, 常常对原始数据先取对数后, 再作线性自回归模型统计分析, 就属于此种情况. 这种先取对数的方法, 不仅简单, 而且有经济背景的合理解释,它反应了经济增长幅度的量化规律. 虽然在统计学中还有更多的变换可使用, 比如Box-Cox变换, 但是, 由于缺少经济背景的合理解释, 很少被使用. 由此看来, 当f(.)有实际背景依据时, 可以考虑使用(2.7)式的模型.当f(.)是未知函数时, {f(x t)}不是可量测的序列, 于是只能考虑(2.8)模型. 注意f(.)是单调函数, 可记它的逆变换函数为f-1(.), 于是由(2.8)模型可得x t= f-1(α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt),t=1,2,…(2.9)’此式属于(2.7)式的特殊情况, 此类模型很少被使用. 取而代之是考虑如下的模型x t=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,…(2.10)其中f(.)是一元函数, 也有已知和未知之分, 可不限于单调增函数. 此式属于(2.1)式的特殊情况, 有一定的使用价值.当(2.10)式中的f(.)函数是已知时, 此式还有更进一步的推广模型,x t=α1f1(x t-1,…,x t-s)+α2f2(x t-1,…,x t-s)+...+αp f p(x t-1,…,x t-s)+εt,t=1,2,…(2.11)其中f k(…)(k=1,2,…,p)是已知的s元函数. 例如, 以后将要多次提到的如下的模型:x t =α1I(x t-1<0)x t-1+α2I(x t-1≥0)x t-1+εt ,t=1,2,… (2.12)其中I(.)是示性函数. 此模型是分段线性的, 是著名的TAR 模型的特殊情况. 为了有助于理解它, 我们写出它的分段形式:x t =.0,0,,111211≥<⎩⎨⎧++--t t t t x x x x εαεα t=1,2,…请注意, (2.8)(2.10)和(2.11)式具有一个共同的特征, 就是未知参数都以线性形式出现在模型中. 这一特点在统计建模时带来极大的方便. 此类模型便于实际应用. 但是, 对于{x t }而言不具有线性特性, 所以, 讨论它们的平稳解的问题, 讨论它们的建模理论依据问题,都需要借助于马尔可夫链的工具.已知非线性自回归函数的模型:x t =(x t-1,x t-2,…,x t-p ;)+t ,t=1,2,… (2.13)其中(…)是p 元已知函数, 但是其中含有未知参数=(1,2,…,p ).一般说来, 在一定范围内取值.例如,x t =tt t x x εαα++--212111, t=1,2,… 其中=(1,2)是未知参数, 它们的取值范围是: -<<, 0<.这里需要指出, 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦, 二是确定(…)函数的麻烦. 一般来说, 只有根据应用背景能确定(…)函数时, 才会考虑使用此类模型.广义线性模型(神经网络模型):x t=(1x t-1+2x t-2+…+p x t-p)+t,t=1,2,…(2.14)其中(.)是一元已知或未知函数, 参数=(1,2,…,p)总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对作些约定, 其一, ||||=1, 其二, =(,,…,p)中第一个非零分量为正的. 不难2理解, 若不加这两条约定, 模型(2.14)不能被唯一确定.当(.)是一元已知函数时, 与神经网络模型相通.当(.)是一元未知函数时, 与回归模型中的PP方法相通.除了以上两类模型外, 还有(2.1)式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难. 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题, 对这类模型不再仔细讨论.。

统计学中的时间序列分析及其应用研究

统计学中的时间序列分析及其应用研究

统计学中的时间序列分析及其应用研究一、时间序列分析的基本概念及内容时间序列分析是统计学中的一门重要学科,其研究对象是有时间顺序上的相关性的数据序列。

时间序列分析的主要任务是在对时间序列的内在规律进行揭示和预测的基础上,实现对历史数据的回顾、对未来发展趋势的预测以及对变量的推测等目的。

时间序列分析的研究对象主要包含以下几个方面:1.时间序列的分解时间序列的趋势、周期和随机成分可以从原序列中分离出来,从而可以更加清晰地认识时间序列的内在特征。

2.时间序列的描述通过时间序列的均值、方差、自相关系数等统计量,对时间序列的整体状态进行描述,为时间序列建立合适的模型提供基础。

3.时间序列建模基于分解和描述,在统计学的框架下,对时间序列进行建模,从而更好地预测时间序列未来的趋势。

4.时间序列的预测基于时间序列的建模结果,结合时间序列的发展趋势和规律,对未来的时间序列进行预测,这是时间序列分析的核心任务。

二、时间序列分析的方法时间序列分析的方法主要包含以下几个方面:1. 平稳性检验原始数据中存在趋势、季节性、循环性等因素,这些因素影响了时间序列的建模和预测。

因此,需要对时间序列进行平稳性检验,从而消除这些因素的影响。

平稳性检验是时间序列分析的前提和基础。

2. 自相关系数自相关系数衡量了时间序列中的各项数据之间的相关性,其大小可以反映时间序列中的趋势、季节性、循环性等特征。

自相关系数是描述时间序列的基本工具。

3. 移动平均法和指数平滑法移动平均和指数平滑是时间序列平稳化和平滑化的方法。

它们通过对时间序列的数据进行平均或加权平均,实现对时间序列的平滑处理。

这两种方法常用于预测时间较短的时间序列。

4. ARIMA模型ARIMA模型是一种经典的时间序列模型,它可以对时间序列进行建模和预测。

ARIMA模型包含自回归、差分和移动平均三个部分,可以较好地描述时间序列的特征和规律。

5. 非线性时间序列模型传统的ARIMA模型是线性模型,但是现实中的时间序列往往具有非线性和异方差性。

时间序列分析模型

时间序列分析模型

时间序列分析模型时间序列分析模型是一种通过对时间序列数据进行建模和分析的方法,旨在揭示数据中的趋势、季节性、周期和不规则波动等特征,并进行预测和决策。

时间序列分析模型在经济、金融、市场、气象、医学等领域都有广泛的应用。

本文将介绍几种常见的时间序列分析模型。

1. 移动平均模型(MA)移动平均模型是时间序列分析中最简单的模型之一。

它基于一个基本假设,即观察到的时间序列数据是对随机误差的线性组合。

该模型表示为:y_t = c + e_t + θ₁e_(t-1) + θ₂e_(t-2) + … + θ_qe_(t-q)其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,θ₁,θ₂,…,θ_q 是移动平均项的参数,q 是移动平均项的阶数。

2. 自回归模型(AR)自回归模型是基于一个基本假设,即观察到的时间序列数据是过去若干时间点的线性组合。

自回归模型表示为:y_t = c + ϕ₁y_(t-1) + ϕ₂y_(t-2) + … + ϕ_p y_(t-p) + e_t其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,ϕ₁,ϕ₂,…,ϕ_p 是自回归项的参数,p 是自回归项的阶数。

3. 自回归移动平均模型(ARMA)自回归移动平均模型将自回归模型和移动平均模型结合在一起,用于处理同时具有自相关和移动平均性质的时间序列数据。

自回归移动平均模型表示为:y_t = c + ϕ₁y_(t-1) + ϕ₂y_(t-2) + … + ϕ_p y_(t-p) + e_t +θ₁e_(t-1) + θ₂e_(t-2) + … + θ_qe_(t-q)其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,ϕ₁,ϕ₂,…,ϕ_p 是自回归项的参数,θ₁,θ₂,…,θ_q 是移动平均项的参数,p 是自回归项的阶数,q 是移动平均项的阶数。

4. 季节性自回归移动平均模型(SARIMA)季节性自回归移动平均模型是自回归移动平均模型的扩展,用于处理具有季节性和趋势变化的时间序列数据。

经济时间序列分各种模型分析

经济时间序列分各种模型分析

经济时间序列分各种模型分析经济时间序列分析是经济学中非常重要的一个研究领域。

对于经济时间序列,我们可以使用多种模型进行分析,以揭示其中的规律和趋势。

本文将介绍几种常见的经济时间序列模型。

首先,最常用的模型是自回归移动平均模型(ARMA)。

ARMA模型结合了自回归(AR)和移动平均(MA)两个部分,用于描述时间序列数据中的自相关性和滞后平均性。

通过对历史数据进行分析,我们可以建立ARMA模型,并预测未来的经济变化。

其次,自回归条件异方差模型(ARCH)是一种考虑时间序列数据波动性变化的模型。

在经济领域,波动性是一个非常重要的指标,因为它涉及到风险和不确定性。

ARCH模型基于时间序列数据内在的波动性特征,可以更好地描述经济变动过程中的波动性变化。

另外,向量自回归模型(VAR)是一种多变量时间序列模型。

与单变量时间序列模型不同,VAR模型可以同时考虑多个经济变量之间的相互关系和影响。

通过建立VAR模型,我们可以分析各个经济变量之间的因果关系,并进行经济政策的预测。

此外,状态空间模型是一种广义的时间序列模型,可以包含各种经济数据。

状态空间模型可以用来描述许多复杂的现象,例如经济周期、金融市场波动等。

通过建立状态空间模型,我们可以更全面地分析经济系统的结构和运行机制。

最后,非线性时间序列模型是一类适用于非线性数据的经济时间序列模型。

在现实经济中,很多经济变量的关系不能简单地用线性模型来描述。

非线性时间序列模型可以更准确地捕捉经济系统中的非线性关系,从而提供更精确的预测结果。

总之,经济时间序列分析可以使用多种模型进行分析。

从基本的ARMA模型到更复杂的VAR模型、ARCH模型、状态空间模型和非线性时间序列模型,每种模型都有其适用的领域和优势。

经济学家通过对时间序列数据的建模和分析,可以更好地理解经济变动的规律和趋势,并对未来经济发展进行预测和决策。

经济时间序列分析作为经济学中的一个重要分支,对于理解和预测经济变动具有极大的意义。

用于非线性时间序列预测的POD-RBF神经网络

用于非线性时间序列预测的POD-RBF神经网络

用于非线性时间序列预测的POD-RBF神经网络随着人工智能技术的不断发展,预测模型的研究也越来越成熟。

在非线性时间序列预测领域中,POD-RBF神经网络是一种较为优秀的预测模型。

本文将从什么是POD-RBF神经网络、其工作原理和应用等方面,进行800字的简单介绍。

一、POD-RBF神经网络简介POD-RBF神经网络是基于POD(Proper Orthogonal Decomposition,广泛应用于流体力学中)和RBF(Radial Basis Function,径向基函数)神经网络的预测模型。

其主要用于传统方法难以处理的非线性时间序列预测问题。

二、POD-RBF神经网络工作原理1.数据处理POD-RBF神经网络模型的输入数据通常需要进行处理,常见的处理方式是将其归一化处理。

对于具有多个输入变量的数据,可以对每个输入变量进行单独处理,也可以将其组合成一个总体处理。

2.POD分解POD-RBF神经网络模型采用的是现代数学的快速分解方法POD。

通过POD分解,可以将复杂的空间时间序列分解为多个空间模态,大幅度简化了数据的处理和计算难度。

3.RBF神经网络RBF神经网络是POD-RBF神经网络中的一个重要组成部分,主要用于模型构建和模型预测。

RBF神经网络采用的是径向基函数和线性可分技术,能够很好地处理非线性数据特征,并且具有高度准确性和预测能力。

4.模型预测POD-RBF神经网络通过对历史数据进行学习和预测,得到了一组时间序列预测值。

然后,将这些预测值进行拟合,得到未来时间序列的预测值,并根据实际预测结果进行调整。

三、POD-RBF神经网络应用1.气象预测POD-RBF神经网络可以预测精确的气象变化,使得气象预测更加准确,从而有利于人们做出调整。

2.股票走势预测POD-RBF神经网络可以对股票走势预测,使得投资者能够更好地把握市场,规避风险。

3.环境预测POD-RBF神经网络可以预测污染事件,使环境保护能够提前预警,从而避免环境污染。

时间序列预测的常用方法及优缺点分析

时间序列预测的常用方法及优缺点分析

时间序列预测的常用方法及优缺点分析时间序列预测是指根据过去的一系列观测值来预测未来的数值变化趋势。

时间序列预测在各行业中广泛应用,如金融领域的股票价格预测、销售预测等。

本文将介绍时间序列预测的常用方法,并分析各方法的优缺点。

1. 移动平均法移动平均法是一种常用的简单预测方法,它基于过去一段时间内的平均值来预测未来的数值。

移动平均法的优点是简单易懂,计算复杂度低,并且对于平稳序列的预测效果较好。

然而,移动平均法不能很好地处理非平稳序列或者具有长期趋势的序列。

2. 简单指数平滑法简单指数平滑法也是一种简单的时间序列预测方法。

它将未来的预测值与过去的实际观测值相结合,通过加权平均来预测未来的数值。

简单指数平滑法的优点是计算简单,对于平稳序列和趋势序列的预测效果较好。

然而,简单指数平滑法无法处理季节性数据,并且对于突发事件的预测效果较差。

3. 自回归移动平均模型(ARIMA)ARIMA模型是一种基于时间序列的统计模型,它结合了自回归模型(AR)和移动平均模型(MA),通过拟合历史数据来预测未来的数值。

ARIMA模型的优点是对于各种类型的时间序列都有较好的适用性,并且可以处理非平稳序列和具有长期趋势的序列。

然而,ARIMA模型需要进行参数估计和模型诊断,对于数据量较大或者噪声较多的情况下计算复杂度较高。

4. 季节性分解法季节性分解法是一种将序列分解为趋势、季节和残差三个部分的方法。

通过对这些部分进行建模来预测未来的数值。

季节性分解法的优点是可以较好地处理季节性数据,并且能够捕捉到数据的长期和短期趋势。

然而,季节性分解法对于非线性、非平稳的序列效果较差,且需要事先对数据进行季节性分解,增加了预测的难度。

5. 神经网络方法神经网络方法是一种基于人工神经网络的时间序列预测方法。

它通过学习历史数据的模式和规律来预测未来的数值。

神经网络方法的优点是对于非线性、非平稳的序列具有较好的适应性,并且可以自动学习数据的特征。

非线性时间序列预测模型研究

非线性时间序列预测模型研究

非线性时间序列预测模型研究第一章引言时间序列分析在许多领域中被广泛应用,它能够揭示数据中的趋势和周期性变化,并对未来的发展做出预测。

然而,很多现实世界的时间序列数据并不是线性的,包含着复杂的非线性关系。

因此,研究非线性时间序列预测模型成为当前的研究热点。

本章将首先介绍非线性时间序列预测模型的研究背景和意义,然后概述目前主要的非线性时间序列预测方法,并最后给出本文的研究内容和组织结构。

第二章非线性时间序列预测模型概述2.1 非线性时间序列的特点非线性时间序列数据与线性时间序列数据相比具有一些特殊的性质。

例如,非线性时间序列数据可能包含多个不同的周期性变化、季节性变化和趋势变化,同时还可能受到外部因素的影响。

此外,非线性时间序列数据还可能存在非平稳性和噪声干扰等问题。

2.2 非线性时间序列预测方法的分类目前,研究人员提出了许多非线性时间序列预测方法,这些方法可以根据其模型结构和预测方法分为不同的分类。

常见的非线性时间序列预测方法包括支持向量机、神经网络、深度学习和基于混沌理论的方法等。

2.3 非线性时间序列预测模型评价指标为了评估非线性时间序列预测模型的性能,研究人员提出了一系列的评价指标。

这些指标包括均方根误差、平均绝对百分比误差和相关系数等。

第三章支持向量机在非线性时间序列预测中的应用3.1 支持向量机的原理和模型支持向量机是一种基于统计学习理论的非线性分类和回归方法。

它通过寻找一个最优的超平面将样本分为不同的类别,从而实现对非线性时间序列的预测。

3.2 支持向量机在非线性时间序列预测中的应用案例本节将以股票市场的预测为例,介绍支持向量机在非线性时间序列预测中的应用。

通过使用支持向量机模型,可以对股票市场的波动进行有效的预测和分析。

3.3 支持向量机在非线性时间序列预测模型中的优缺点在使用支持向量机进行非线性时间序列预测时,虽然可以取得不错的预测效果,但也存在一些问题和限制。

本节将对这些问题和限制进行详细的讨论。

非线性时间序列

非线性时间序列

第六章 时间序列的平滑6.1 引论上一章我们引进非参数函数估计的基本概念,现在将它应用到时间序列别的重要平滑问题上. 对估计慢变化时间趋势,平滑技术是有用的图示工具,它产生了时域平滑(§6.2). 对将来事件和与之相联系的现在与过去变量之间的关系的非参数统计推断导致了§6.3的状态域平滑. §6.4 引入的样条方法是对§6.3引入的局部多项式方法的有用替代. 这此方法能够容易地推广到时间序列的条件方差(波动性)的估计,甚至整个条件分布的估计,参阅§6.5.6.2 时域平滑6.2.1 趋势和季节分量分析时间序列的第一步是画数据图. 这种方法使得人们可以从视觉上检查一个时间序列是否像一个平稳随机过程. 如果观察到趋势或季节分量,在分析时间序列之前通常要将它们分离开来.假定时间序列{}t Y 能够分解成t t t t Y f s X =++, (6.1)其中t f 表示慢变函数,称为“趋势分量”,t s 是周期函数,称为“季节分量”,t X 是随机分量,它被假定是零均值的平稳序列. 在使用这种分解之前,可以先用方差稳定变换或Box-Cox 变换. 这类幂变换有如下以参数λ为指标的形式,0,()log(),0,u g x u λλλ⎧≠=⎨=⎩ (6.2)或具有在0λ=点处连续的变换形式()(1)/g u u λλ=-.这类变换由Box 和Cox (1964)给出. 注意,由在幂变换中数据必须是非负的,因此,在使用幂变换之前,可能必须先实施平移变换.我们的目的是估计和提取确定性分量t f 和t s . 我们希望残差分量t X 是平稳的,且能够用线性和非线性技术做进一步的分析. 通过推广Box 和Jenkins (1970)而发展的一个替代方法是对时间序列{}t Y 重复应用差分算子,直到被差分的序列表现为平稳为止. 这时,被差分的序列可以进一步平衡时间序列技术来处理. 作为说明Box 和Jenkins 方法的一个例子,我们先取S&P500指数的对数变换,然后计算一阶差分. 图6.1给出了这个预处理序列. 所得序列基本上是该指数中变化的每日价格的百分比. 除了几个异常值(即1987年10月19日20.47%的市场崩盘,金融市场称之为“黑色星期一”)外,这个序列显示出平稳性. 这个变换与金融工程中常用资产定价的几何布朗运动模型的离散化有关.图6.1 1972年1月3日至1999年12月31日(上图)和1999年1月4日至1999年12月31日(下图)S&P500指数对数变换的差分我们首先把注意力集中在没有季节分量的情形,即,0t t t t Y f X EX =+=. (6.3)然后,我们再在§6.3.8中估计趋势和季节分量.6.2.2 滑动平均平均是最常用的消除随机噪声的技术. 假定趋势是慢变化的,使得其能够在大小为h 的局部时间窗中用常数来逼近,即,t i t t i Y f X h i h ++≈+-≤≤. (6.4)这时t f 能够用该窗周围的局部平均来估计:1(21)h t i t i h f h Y -+=-=+∑, (6.5)随着中心t 的改变,局部窗也在移动. 例如,在图6.2中,50t =处20h =所得的估计是落在第一个窗内的那些数据的平均. 窗的中心移动到新的点处以构成在这些点处的估计. 随着局部窗从左向右滑动,它的轨迹就是所得的滑动平均曲线. 这是滑动平均平滑的最简单的例子. 它常常被用来验证时间序列的趋势. 图6.2描绘的是从1999年1月4日到1999年12月1日S&P500指数一个月和两个月的滑动平均.图6.2 1999年1月4日至12月31日S&P500指数和它的21个交易日(粗线)和41个交易日(虚线)的滑动平均在边界处,滑动平均估计的习惯做法是忽略超出观察时间范围的那些数据. 例如,2f 是用数据12,,h Y Y +的平均所得的简单估计(时间点2右边的数据比左边更多). 这种不对称平均可能会产生边界偏倚. 当边界处趋势陡峭且带宽又大时,这种边界效应更为明显. 正如图6.2所示那样,在右边界处的滑动平均低估了趋势. 该问题能够通过使用局部线性平滑. (参见§6.2.6)或别的边界改善方法,比如,边界核方法(Gasser 和Müller 1979;Müller 1993)和数据削尖方法(Choi, Hall 和Bousson 2000)来减弱.滑动平均数列(6.5)利用了时间t 周围两边的数据. 这样它还依赖于时间t 之后的数据. 为便于预报,单变滑动平均数列*11h t i t i f h Y--==∑ (6.6)也常被用来验证时间趋势. 数列仅用直到时间1t -的过去的数据.6.2.3 核平滑滑动平均估计的一个改善方法是引进一个加权设计. 这允许对所给时间点附近的数据给予较大的权数. 这也就得到了核回归估计,定义为00101()()T t t t T t t t Y K h f t t K h ==-∑=-∑. (6.7) 这个估计还被称为Nadaraya-Watson 估计. 参阅Nadaraya (1964)和Watson (1964). 当我们使用均匀核()0.5(||1)K u I u =≤时,上述核估计就变成滑动平均估计(6.5). 当核函数有有界支撑[1,1]-时,核回归估计就是一个局部(21)h +数据的加权平均. 当核()K t 是模在零点的单峰函数时,0t 附近的数据点获得更多的权. 一般地,核函数不要求有一个有界的支撑,只要它薄尾的(如它是一个有二阶矩的密度函数). K 的非负性要求还能被减弱. 带宽h 也不必是整数.注意,在高斯核定义中的标准化常数和核的对称Beta 族只是用来保证函数K 是一个概率密度函数. 在核回归估计中它们并不起作用. 在计算时,我们常常标准化各种核函数使得它们如图 5.2那样有相同的最大值 1. 由于这种标准化,(6.7)可以直观地理解为10{()/}Tt K t t h =∑-数据点的有效平均. 当核函数有在(,0)-∞中的支撑时(这样的核还可看作是单边核),核回归估计所使用的数据仅到时间01t -. 这是单边滑动平均(6.6)的推广.如同在核密度估计中那样,在核回归估计中带宽h 是一个重要参数. 如同在图6.2中所显示的那样,大的带宽h 产生过度平滑的估计,遗漏趋势和所估计的峰和谷的度量上的一些可能的细节. 特别地,当使用大的带宽时,估计可能产生大的偏差. 当使用小的带宽时,仅有几个局部的数据被使用,降低了估计的方差,却导致所得估计是一条波动的曲线. 例如,用带宽0h =,滑动平均估计(6.5)简单地复制原始数据. 为了得到满意的结果需要反复尝试和修正. 带宽的数据驱动选择能够帮助我们确定所要的平滑度. 正如在§6.2.9所看到的那样,渐近方差本质上依赖于所研究的过程的相关结构. 因此,针对独立数据的由数据驱动选择的带宽在时域平滑中效果不佳. 实际上,Altman (1990),Chu 和Marron (1991a )以及Hart (1991)指出,对相依数据,通常的留一在外(leave-one-out ) 交叉核实方法效果不好. 这些作者提出了几个修正的方法. 对带宽选择的嵌入方法由Ray 和Tsay (1997)以及Beran 和Feng (2000)提出.以上考虑能够通过计算核回归估计的偏倚和方差得到理解. 经过直接计算,在模型(6.3)下,核估计得偏倚为0000101()()()T t t t t t T t t t f f K h E f f t t K h==-∑--=-∑. 它不依赖于误差过程. 它实际上是一个逼近误差. 当带宽取得小时,逼近误差0t t f f -小,从而偏倚也小. 另一方面,当h 取得大时,大多数逼近误差0t t f f -是大的归因于t 和0t 间的距离是大的,因此,偏倚可能是大的. 这个线性估计的方差00011(),()T t t t t T t t t t K h f wY w t t K h ==-==-∑∑还能够被计算. 令()X t γ是过程()X t 的自协方差函数,则011Var()(||)T T X i j t i j f i j w w γ===-∑∑. (6.8)该方差依赖于自相关函数. 进一步简化需要渐近分析. 我们将在§6.2.9中讨论. 在那里我们将看到当k →∞时方差()X k γ的渐近行为. 但我们现在可以指出,当带宽小时,核平滑的方差增大,这归因于在局部领域中数据点数太小的缘故.6.2.4 核平滑的变种核平滑有许多变种. (6.7)中的分母对相对于t 求导数和数学上的分析是不方便的. 代替用核函数的高度作为权,我们还可用核函数下方的面积作为权. 由于核函数下方的总面积是1,分母不需要. 这就是隐含在Gasser-Müller 估计中的基本思想.在现在的框架下,令(21)/2(1,,1)t s t t T =+=-,其中0s =-∞和T s =∞. Gasser 和Müller (1979)提出了以下的估计:0101()tt T s h t t s t f K u t duY -==-∑⎰.由于总的权1001()()1t t T s h h s t K u t du K u t du -∞-∞=-=-=∑⎰⎰,所以没有分母. Gasser-Müller 估计是对Priestley 和Chao (1972)早期版本的一种修正. Priestley 和Chao (1972)给出的估计定义为001()Th t t t f K t t Y ==-∑.这个估计简单地去掉了Nadaraya-Watson 估计的分母. 通过积分和变量变换逼近黎曼和,对适当选择的h ,我们得到总的权00()/001(1)/1()()()T T T t hh h t h t K t t K t t du K u du ---=-≈-=∑⎰⎰,如果0t 不太接近边界,且h 相对于T 小,并使得0(1)/t h -和0()/T t h -大,则上述积分近似地等同于()1K u du ∞-∞=⎰.事实上,只要K 的支撑限制在区间00[(1)/,()/]t h T t h ---内,等式就精确地成立. 换句话,对不在边界区域的点0t ,总的权近似于1. 以上观点依赖于设计点为等间隔的. 事实上,Priestley 和Chao 估计仅能用于等间隔情形. 它不能用于§6.3所讨论的状态域平滑.6.2.5 滤波核回归是用于工程的卷积滤波的一种特殊形式. 一般地,一个长度为21h +的线性滤波定义为h i t i t i h f wY +=-=∑. (6.9)当K 有支撑[1,1]-时,核回归对应(/)(/)hi j h w K i h K j h =-=∑. 滤波能够被设计为拥有各种性质. 例如,它能够被设计成可以去掉高频信号(低通滤波),或低频信号(高通滤波)或超出某个频率范围的信号(带通滤波);见§2.3.3.核平滑是一种低通滤波.线性滤波变换可以用递推方式来定义. 例如,单边滑动平均t f 可以对某个1b <,利用下式来定义1(1),2,,t t t f bY b f t T -=+-=, 这等价于用1,,t Y Y 的如下的加权滑动平均:21121(1)(1)(1)t t t t t f bY b b Y b b Y b b Y ---=+-++-+-. 由于权以指数速度快速衰减,以上滤波实际上仅用了时刻t 附近的局部数据. 平滑的有效性依赖于参数b . 这种方法称为指数平滑.指数平滑是用1/1h b λ=-的()(0)x h K x I x λ=≥的一种特殊的核平滑. 这是一种单边平滑. 它仅使用直到现大时刻t 的数据. 关于这方面内容的进一步讨论可参见Gijbels 、Pope 和Wand (1999).6.2.6 局部线性平滑局部常数逼近(6.4)能够通过使用局部线性逼近来改善. 我们把趋势i f 通过如下线性函数局部地近似为i 的函数(),||i t t i Y f f i t X i t h '≈+-+-≤.这样,t f 就近似地看做上述局部线性模型的截距. 可见图6.3中时刻200t =处的图示. 窗内的数据用一个线性回归来拟合. 对局部窗附件的数据用最小二乘方法,我们通过相对于a 和b 极小化下式可得到局部截距的估计21{()}()T ih i Y a b i t K i t =----∑.这里引进核权是为了减少距离给定时间点t 较远的数据的贡献. 令t a 和t b 是最小二乘解. 这里用下标t 是为了表示所得的解依赖于给定的时间点t . 这时,t f 用局部截距t a 来估计,它有如下的精确表示,,,,2,111/,(){()()()}T T t i i t i t i h T T t i i f a w Y w w K i t S t i t S t =====---∑∑, (6.10) 其中,1()()()T jT j i h S t K i t i t ==∑--. 当t 从1取到T 时就得到整个趋势函数. 这样,局部线性平滑实际上是一种移动线性回归方法. 正如图6.3所示那样,在80t =处的估计由一个新的局部最小二乘问题得到. 在每个数据窗中拟合的直线用实线表示. 估计的局部截距的值位于虚垂直线和局部直线的交叉处. 局部斜率是时间趋势导数的估计. 此外,这些局部窗还可以互相重叠(见图6.2). S-Plus 函数“lls.s ”已写成程序差可用于计算图6.3中的平滑曲线. 这个S-Plus 函数能够从本书的网址获得.图6.3 使用Epanechnikov 核和带宽20h =所得的1999年1月4日至1999年12月31日S&P500指数局部线性拟合. 在每个窗中的虚抛物线表示每个局部数据点所得的权局部线性平滑能够很容易地堆广到局部多项式平滑. 局部多项式拟合和它的应用的全面介绍可参阅Fan 和Gijbels (1996). 局部多项式拟合的优点总结在§6.3.3中. 注意,(6.11)中的权,t i w 满足,,1,2,2,11()()()()()0.T t i T T T T i wi t S t S t S t S t =-=-=∑ (6.11)这就蕴涵了如果趋势是线性的,t f t αβ=+,则局部线性平滑是无偏的:,,11()/T Tt i t i t i i E f w i w t αβαβ===+=+∑∑.换句话,无论趋势函数多以陡峭,只估计线性趋势时,局部线性平滑就是无偏的. 这对在内部以及边界处的点t 的同样成立. 也就是说对于估计陡峭趋势,局部线性估计将有小的偏倚. 另一方面,因为类似于(6.11)的方程即便是近似地也都不成立,因此,对估计边界区域附近的点估计陡峭趋势,核平滑将有较大的偏差.6.2.7 其他的平滑方法核局部线性平滑有许多别的方法. 例如,Gasser 和Müller (1979)使用了不同于核和局部线性平滑的权形式,Jones (1997)介绍了局部线性平滑的各种形式. Fan 和Gijbels (1996)给出了各种平滑技术的概述,包括样本和正交级数方法.核回归和局部多项式建模是基于在许多格子点上的局部近似. 诸如样条这样的全局逼近方法还能够用于对时间域的平滑. 这些思想将在关于状态域平滑的§6.4中介绍.对诸如时域平滑这样的等间隔设计,正交级数方法也非常容易使用. 其基本思想是先用正交矩阵对数据进行变换,然后,在高频点向零点有选择地调整系数(或向零点收缩它们). 平滑估计能够通过tapered 系数的逆变换来获得. 常用的正交变换包括傅里叶变换和小波变换. 它们的统计应用可参阅Ogden (1997)、Efromovich (1999)和Vidakovic (1999)等近期出版的专著.6.2.8 季节分量修正有许多实用的修正季节分量的方法. 在此我们概要地介绍一个方法以说明其基本大意.假定(6.1)中的季节分量的周期是p ,即1,0p k jp k k k s s s+===∑. (6.12)后一个约束是一个可识别条件. 若此约束不成立时,只要加一个常数到趋势分量t f ,并在季节分量修正中减去相同的常数. 归因于约束(6.12),当p 是一个奇数时,趋势能够方便地用具有(1)/2h p =-的滑动平均(6.5)来估计. 在(6.5)中季节分量平均掉,因而对趋势估计没有贡献. 当周期p 是偶数时,用如下稍加修改的形式估计趋势11(0.50.5)/,/2t d t d t d t d t f Y Y Y Y p d p --++-+=++++=.季节分量能够按如下步骤来估计. 就一个例子来说,我们假定要处理的月度数据,且周期12p =. 在3月的季节分量的值能用在3月所得一切观测值的移去趋势分量后的平均来很好地近似. 这就得到估计[()/]*[()/]1()/{[()/][()/]1}T d k p k k jp k jp j d k p s Y f T d k p d k p --++=-+=-----+∑,其中[]a 表示a 的整数部分,[/2]d p =. 在上述求和中对上下限所作的限制是为了保证数据不要太接近边界使得在趋势估计中边界影响达到最小. 这种初步估计可能不能精确地满足约束(6.12). 但这能够容易地通过用下式估计季节分量{}k s 来作修正**11,1,,d k k i i s s d s k p -==-=∑.以上方法还被用于没有趋势分量t f 的情形. 在这种情形,不需要移去趋势,即令0.t f =6.2.9 理论概况*问题(6.3)的理论表述应该得到注意. 一个简单的方式是把所得的时间序列{}t Y 看作是来自如下连续过程的离散化样本路径()()().Y t f t X t =+这种表述常常被用在金融时间序列建模中. 时间单位通常取年,每星期数据被看作是以1/52∆=的速度抽自连续过程. 对金融中的期权定价和风险管理,这种表述是非常有效的. 然而,在时域平滑方面,这种述有一些缺点. 首先,为了能够相容地估计()f t ,我们需要在给定的时间0t 的周围用大小为0h →的窗局部化数据. 但是,只要过程()X t 是连续的,所有的局部数据0{():}Y t t t h ∈±都是高度相关的,且当0h →时,相关系数趋于1. 这就蕴涵了局部数据变化不大,因而也就不需要局部平滑. 正如在图6.2中所看到的那样,局部数据变化很大,局部平滑就能改善趋势估计. 这样,以上表述从理论的观点来看似乎是病态的. 其次,在以上的表述下,趋势()f t 和随机误差()X t 有相似的光滑度(两者都是连续的). 因此,在()Y t 中没有希望将随机部分与趋势部分分离开来.一个代替的表述是推广等间隔设计的非线性回归模型到时间序列框架. 假定所得到的时间序列是来自模型(/),1,,,t t Y g t T X t T =+= (6.13)其中g 是平滑时间趋势函数,{}t X 是随机过程,0t EX =. 在这种表述下,我们现在能够利用平滑技术从随机噪声中分离出平滑趋势. 一个小的缺点是平滑趋势()(/)f t g t T =依赖于观测数量T . 这个问题早就出现在具有固定设计的非参数回归文献中. 实际上它不是一个严重问题. 渐近理论毕竟只是一个工具,为我们理解理论性质提供简化的结构. 用(/)g t T 建模趋势是捕捉趋势比噪声变化更慢这一特征的简单的技术手段.在以上两种表述之间选择哪一个依赖于所研究的问题. 在纵向数据和泛函数据分析中,Hart 和Wehrly (1986)以及Silverman (1996)基本上是用前一种表述:人们通过模型()()()Y t f t X t =+观测到大量独立序列. 这种表述对他们的问题是适合的. 对时域平滑,模型(6.13)常被假定. 例如见Hall 和Hart (1990),Robinson (1997),以及Johnstone 和Silverman (1997). 这就保证了能捕捉到时间趋势比随机噪声更光滑这一特征. 进一步,它也保证了能相容地估计时间趋势.由公式(6.13)能够获得核和局部线性平滑的渐近性质. 估计g 的偏倚与具有均匀设计的独立样本情形是相同的. 核和局部线性平滑的方差经繁琐的计算也可得到. 它们依赖于噪声过程{}t X 的协方差结构. 一般地,我们假定{}t X 的自方差函数满足()Cov(,)~,X t t k X k X X C k k αγ-+≡→∞, (6.14)其中0,X C α>是常数. 在2.5.2中定义的分式ARIMA 过程就满足(6.14). 我们将估计(6.10)重写为(/)g t T . 对任何/(0,1)u t T =∈,使用(/)i EY g i T =和(6.11),我们得到偏倚1,1,{(/)()()(/)}()()Ti Tu i T i Tu i w g i T g u g u i T u Eg u g u w =='∑----=∑. (6.15)注意,这个偏倚不依赖于误差过程{()}X t . 它完全是局部线性拟合的近似误差.为理论叙述的简单,我们假定K 有有界支撑. 这个假定可以冗长的叙述为代价而得到减弱. 特别地,可以使用像高斯核这样的轻尾核. 由j μ表示()j v K v dv +∞-∞⎰.在下面的定理中我们总结了渐近偏倚和方差,定理的证明放在§6.6.1. 注意,由于时间单位的尺度,/h T 和用在一般的非参数回归中的带宽是相同的.定理6.1 假定K 有有界支撑,满足0()1K μ=和1()0K μ=,且当/0h T →时,带宽h →∞.(a )如果()g ''⋅存在,且在点u 处连续,则3221()()()()(/){(/)}2Eg u g u K g x x T o h T μ''-=+. (b )如果自方差函数X γ满足(6.14),我们有212212()()||,01,Var{()}2||||log(),1,()||||, 1.X X j X C K x K y x y dxdyh g u C K h h j K h ααααγα---∞-=-∞⎧-<<⎪⎪==⎨⎪∑>⎪⎩⎰⎰ (6.16) 定理6.1表明,过程{}t X 的协方差结构对渐近方差有强烈的影响. 反过来这也影响到渐近最优带宽,并解释了为什么独立数据的数据驱动带宽选择不能直接应用到相依数据.对核估计的类似于定理6.1的结果由Hall 和Hart (1990)证明. 最近,这些结果被Beran 和Feng (2000)用不同于§6.6.1给出的方法推广到局部多项式拟合. 他们还证明了对anti-persistent 过程,渐近方差具有阶12d h --.局部线性估计的渐近正态性也可以被建立. 如果误差过程{}t X 是高斯的,则它的加权平均估计(6.10)还是高斯的. 这样,局部线性估计的渐近正态性直接由定理6.1得到. 此外,在正态假定下,Csörgö和Mielniczuk (1995)建立了类似于定理5.4的最大偏差的渐近分布. 然而,对{}t X 的正态假定并不是本质的. 正如在Robinson (1997)中所证明的那样,这个条件可以去掉. 我们在此概要地叙述用于本章的技术. 令{}t ε是相对于它自身σ域的鞅差序列,即(|{,})0, a.s.t j E j t εε<=假定{}t X 是一双边无穷阶滑动平均过程:2,,t j t jjj j X a aε∞∞-=-∞=-∞=<∞∑∑且2{}t ε是一致可积的,并满足2(|{,})1,a.s.t j E j t εε<=分式ARIMA 过程满足这三个假定. 考虑加权和,,11TT T T t t T t t j j t j t S w X w a ε∞-==-∞=⎛⎫== ⎪⎝⎭∑∑∑,它是鞅差序列的和. 由鞅的性质,2,1Var()T T t t j j t S w a ∞∞-=-∞=⎛⎫= ⎪⎝⎭∑∑,假定这个方差存在. 下面的定理由Robinson (1997)给出. 类似的结果还可在Ibragimov 和Linnik (1971)中发现.定理6.2 在上面所述的条件下,倘若1/2,1max(Var())TT t t jT jt wao S --==∑,则有1/2Var()N(0,1)DT T S S -−−→.对于局部线性估计(6.10),易见,,11/.T Tt i i t i t t i i f E f w X w ====∑∑这时渐近正态性变为验证定理6.2中所叙述的条件. 我们略去细节.6.3 状态域平滑6.3.1 非参数自回归状态域平滑与非参数预报密切相关. 考虑一个平稳时间序列{}t X . 为了简单起见,我们考虑仅基于变量1t X -的预报. 基于1t X x -=的t X 的最优预报是给定1t X x -=时,t X 的条件期望1()(|)t t m x E X X x -==,它在所有的预报函数g 中极小化MSE21{()}t t E X g X --.这个函数还称为阶为1的自回归函数. 当{}t X 是零均值平稳高斯过程时,这个条件均值是线性函数()m x ax =,条件方差是常数. 这就得到一个AR (1)模型1t t t X aX ε-=+.一般地,函数()m x 不必是线性的,条件方差也不必是常数. 然而,总是能够以如下方式表示数据11()()t t t t X m X X σε--=+, (6.17)其中21()Var(|)t t x X X x σ-==. 这里,t ε的条件均值为零,条件方差为1,即11(|)0,Var(|)1t t t t E X X εε--==.非参数平滑技术还能够用于包括自回归函数的估计以外的领域. 考虑一个双变量序列{(,):1,,}t t X Y t T =,它可以被看作是来自平稳过程的一个实现. 我们的兴趣是估计回归函数()(|)t t m x E Y X x ==. 为便于对问题的理解,我们记()()t t t t Y m X X σε=+, (6.18)其中2()Var(|),t t t x Y X x σε==满足(|)0,Var(|)1t t t t E X X εε==.显然,这个结构包括通过取1t t Y X +=而把估计的自回归函数作为一个特定的例子. 下面是三个有用的例子.例6.1 考虑平稳时间序列{}t Z . 对给定的k ,我们取1(),kt t t t Y Z X Z -==. 则目标函数变为1()(|)k k t t m x E Z Z x -==.条件方差可以通过用221()()m x m x -来估计. 特别地,当1()m x 小得如例1.1中所给的利率差分数据,2()m x 基本上就如同条件方差. 换句话,对下面图6.4中所给的数据,均值回归函数是波动函数的平方()x σ=这就是由Stanton (1997)以及Fan 和Yao (1998)所给出的波动估计的基础.图6.4 对12个月国库券回报用局部线性拟合估计条件方差. (a )具有Epanechnikov 核和带宽索3.06h =的局部线性拟合的图示;(b )估计条件标准差用局部线性拟合(实曲线), Fan 和Yao (1998)的基于残差的方法(短虚曲线)和具有0.143α=和 1.324β=的参数模型()x x βσα=(长虚曲线)例6.2 再考虑平稳时间序列{}t Z . 我们取()t t Y I a Z b =<≤,它是区间(,]a b 上的示性函数,1t t X Z -=. 则目标函数变为1()(|)t t m x P a Z b Z x -=<≤=.特别地,如果a =-∞,我们就得到条件分布估计. 进一步,如果a y δ=-和b y δ=+,则当δ取值小时,()/(2)m x δ基本上就如同给定1t Z x -=时t Z 的条件密度. 这个条件密度函数对了解给定1t Z x -=时t Z 分布的全貌是非常有用的. 特别地,自回归函数是这个分布的中心,波动函数是这个分布的扩展. 这个思想形成了Fan 、Yao 和Tong (1996)估计条件密度(§6.5)和与它们相关的泛函(§10.3),以及Hall ,Wolff 和Yao (1999)估计条件分布函数(§10.3),Polonik 和Yao (2000)估计最小量预报区域(§10.4)等所用方法的起源.例6.3 对给定的时间序列{}t Z ,多步预报能够通过令t t d Y Z +=和t t X Z =来完成,其中d 是预报步长数. 对这种情形,我们用非参数方法,基于变量t Z 来估计最优d 步预报()(|)t d t m x E Z Z x +==,下面的图6.6画出了山猫数据的一步和两步预报. 把这个方法和例6.1和例6.2中的技术结合起来,我们能够估计多步预报的条件方差和条件密度. 6.3.2 局部多项式拟合局部多项式拟合是一个用途广泛的非参数技术. 它拥有多种好的统计性质. 关于这些内容可参阅Fan 和Gijbels (1996). 令()()v mx 是定义在(6.18)中的回归函数v 阶导数. 局部多项式技术可非常方便地用来估计()()v mx ,包括回归函数本身(0)()()m x m x =. 由于回归函数的形式没有被指定,因而距离0x 远的数据点对0()m x 提供了很少的信息. 因此,我们只能使用0x 附近的局部数据点. 假定()m x 在0x 点处有(1)p +阶导数. 由泰勒展开,对0x 局部邻域的x ,我们有200000()()()()()()2!m x m x m x m x x x x x '''=+-+- ()1000()(){()}!p p p m x x x O x x p +++-+-. (6.19) 在统计建模方面,对0x 周围的局部点,我们建模()m x 为00()()pj jj m x x x β=≈-∑. (6.20)参数{}j β依赖于0x ,故称之为局部参数. 显然,局部参数()0()/!v v m x v β=. 用局部数据拟合局部模型(6.20)可极小化2001{()}()pT j tjt h t t j Y X x K X x β==---∑∑, (6.21)其中h 是控制局部邻域大小的带宽.作为一个说明的例子,我们取21()t t t Y X X -=-,其中t X 是12个月国库券回报. 带宽为 3.06h =,它是由预渐近代入法(见§6.3.5)用C-程序“lls.c ”计算得到的. 在012x =点处(百分数),线段(1)p =用来拟合在阴影区域0x h ±中的局部数据,在此对每个数据,权用虚曲线(对应于Epanechnikov 核)表示. 在0x 点处局部截距0β是拟合的线段和垂直线段间的交点. 这就构成了在点012x =处的回归函数(0)v =的估计. 沿着水平轴滑动这个窗,我们就获得在区间[3,14]上要估计的曲线. 条件标准差被展示在图6.4(b )中. 基于残差来估计条件方差的方法由Fan 和Yao (1998)提出,其计算通过C 程序“autovar.c ”来实现(还可见§8.7.2),为比较方便,它用短虚曲线表示. 参数模型()m x x βα=常被用来对生产率动态的波动进行建模,它用长的虚曲线表示. 正如人们所看到的那样,在参数和非参数方法之间还存在本质差异,这对参数拟合是否合适提出了疑问. 选择带宽预渐近代入方法由Fan 和Gijbels (1995)提出,见§6.3.5. 用,0,,j j p β=,表示最小二乘问题(6.21)的解. ()0()v m x 的局部多项式估计是0()!(0,1,,)v v m x v v p β==. 这里,我们不用记号()0()v m x 是为了避免由估计回归0()m x 的v 阶导函数所带来的混淆. 事实上,导数()m x '是用局部斜率来估计,而不是用估计的回归函数的导数来估计.当0p =,局部多项式拟合退化为该回归估计11()()()T t t h t T t h tY K X x m x K X x ==∑-=∑-, 它还被称为Nadaraya-Watson 估计. 因此,从局部逼近的观点来看,核回归估计是基于局部常数逼近的. 见(6.19).使用矩阵记号来表示局部多项式回归更为方便. 用X 表示相应于(6.21)的设计矩阵:1010001()()1()()p p T T X x X x X x X x ⎛⎫-- ⎪=⎪ ⎪--⎝⎭X ,且令01,T p Y Y βββ⎛⎫⎛⎫⎪ ⎪== ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭y .则加权最小二乘问题(6.21)能够写为min()()T βββ--y X W y X , (6.22)其中0(,,)T p βββ=,W 是对角矩阵,它的第i 个元素为0()h i K X x -. 解向量为1()T T β-=X WX X Wy . (6.23)为了实现局部多项式估计,我们需要选择阶p ,带宽h 和核K . 当然,这些参数相互关联. 当h =∞时,局部多项式拟合就变成全局多项式拟合,阶p 决定模型的复杂性. 与参数模型不同,局部多项式拟合的复杂性主要是由带宽来控制. 因此,p 通常是较小的,故而选择p 的问题就变得不重要了. 如果目的是估计()v m,则当p v -是奇数,局部多项式拟合自动修正边界偏倚. 进一步,当p v -是奇数,与1p -阶拟合(则1p v --是偶数)相比较,p 阶拟合包含了一个多余参数,但没有增加估计()v m的方差. 不过这个。

非线性时间序列模型

非线性时间序列模型
其中 t 独立同分布,且有E(t ) 0 ,D(t) ; 2 0 0 , i 0
(i1,2, ,q),则称 t 服从q阶的ARCH过程,记作
t ARCH(q)。
上海财经大学统计学系
13

定理9.1
对于ARCH(1)模型,E
(
2 t
r
)
存在的
充要条件是 r
1r (2 j 1) 1
FCAR(p),p为模型的阶数。
返回
上海财经大学统计学系
11
§9.2 条件异方差模型
• ARCH模型 • GARCH 模型 • 模型推广形式
上海财经大学统计学系
12
ARCH模型的定义
ARCH(q)模型定义如下:
yt xtt t1,2, ,T
若随机过程t 2 t0 的1 t 2 t21 平 方2 t 服2 2 从A Rq (qt 2 )q 过 程t ,即
x il tl ti
j1
k0
i1l1
其中p,q,Q和P是非负整数, t 是白噪声序列。
上海财经大学统计学系
返回 8
非参数时间序列模型
• 非参数自回归模型的一般形式为
xt xt 1, ,xtpt
(9.22)
其中 是R p到 R 1 的可测函数, t 是白噪声序
列。模型(9.22)有如下两种特殊形式。
非线性时间序列模 型
§9.1 一般非线性时间序列模型 介绍
• 参数非线性时间序列模型 • 非参数时间序列模型
上海财经大学统计学系
2
参数非线性时间序列模型
• SETAR (Self-exciting threshold autoregressive model)模型
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

r分别取 , 1, 0.5,0四个数值,我们对每个模 型分别产生样本长度是500的序列。当 r 时,TAR模型退化成线性AR(1)过程。其他三种情 况,显示了明显的非线性特征。
拟线性自回归模型
拟线性自回归模型为 x f x , ,x
t 0 1 1 t 1 t p
xt j xt j k t k il xt l t i
j 1 k 0 i 1 l 1
t 是白噪声序列。 其中p,q,Q和P是非负整数, 返回
非参数时间序列模型
• 非参数自回归模型的一般形式为
t 是白噪声序 其中 是 R p到 R1 的可测函数, 列。模型(9.22)有如下两种特殊形式。 • (1)可加非线性自回归模型 (2)函数系数自回归模型
函数系数自回归模型
函数系数自回归模型为
xt c f1 xt d xt 1 f p xt d xt p t 其中c为常数, fi ( i 1, , p )为p个一元非参数
0 d p 为整数,称为滞后参 型的未知函数, 数, t 是白噪声序列,模型记为 FCAR(p),p为模型的阶数。 返回
非线性时间序列模型
• 一般非线性时间序列模型介绍 • 条件异方差模型
§9.1 一般非线性时间序列模型 介绍
• 参数非线性时间序列模型 • 非参数时பைடு நூலகம்序列模型
参数非线性时间序列模型
• SETAR (Self-exciting threshold autoregressive model)模型 • 拟线性自回归模型 • 指数自回归模型 • 双线性模型
§9.2 条件异方差模型
• ARCH模型 • GARCH 模型 • 模型推广形式
ARCH模型的定义
ARCH(q)模型定义如下:
yt xt t t 1, 2, , T 若随机过程t 的 t2平方服从AR(q) 过程,即
t2 0 1t21 2t22
q t2q t
t
其中t 独立同分布,且有E( ) 0 , D( ) ; i 0 0 0, ( i 1, 2, , q ),则称 t 服从q阶的ARCH过程,记作 t ARCH(q)。
2
t
E ( ) 存在的 • 定理9.1 对于ARCH(1)模型, 充要条件是 r r
t 1
T
ARCH模型的极大似然估计
• yt xt t , t 1,2,, T 的对数似然函数为 T L( ) log f ( y x , Y ; ) log(2 ) l ( ) 2 • 对数似然函数关于参数的一阶偏导数为
T
T
t 1
t
t
t 1
t 1
j
SETAR (Self-exciting threshold autoregressive model)模型
考虑一个简单的 SETAR2;1,1 模型
-0.7xt 1 t , xt 0.7 xt 2 t , xt 1 r xt 1 r
t
N(0,0.52 )
s f s xt 1 ,
p
,xt p t
1
其中 f i (i 1,, s)
是s个已知的 R 到 R 的 i (i 1,, s)。 可测函数, t 是白噪声序列,
指数自回归模型
指数自回归模型为
xt 00 0k 1k e
k 1 p

xt21
x
t k
t
(9.17)
00 ,0k ,1k (k 1,, p) 和 0 其中 t 是白噪声序列, 为未知参数,正整数 p 为模型的阶数,模型(9.17) 记为EAR(p)。
双线性模型
• 双线性模型由Granger和Anderson(1978)提出, 并得到进一步研究和发展,Subba Rao和Gabr (1984)讨论了这个模型的一些性质和应用,Liu 和Brockwell(1988)推广到一般的双线性模型 • 双线性模型形式 p q Q P
t
L( ) ˆ 0 • 参数向量 的极大似然估计 为方程
lt ( ) L( ) T lt ( ) lt ( ) t 1
xt xt 1 , ,xt p t
(9.22)
可加非线性自回归模型
可加非线性自回归模型为
xt c f1 xt 1 f p xt p t
其中c为常数,fi ( i 1, , p ) 为p个一元非参数 型的未知函数, t 是白噪声序列,模型记 为ANLAR(p),p为模型的阶数。
2r t
1 (2 j 1) 1
j 1
• 定理9.2 ARCH(q)二阶平稳的充要条件是 相应的特征方程的所有根都大于1,此时平 稳序列 t 的无条件方差为
E ( t2 ) 0
q 1 j j 1
L( ) log f ( yt xt , Yt 1; )
R x , ,x : r x r , j 1, ,l 当分割为 j 1 p j d j 1
其中 l d p 为某个整数,称此模型为Self-exciting Threshold Autoregressive Model ,其形式为 l p xt jk xt k I rj xt d rj 1 t (9.6) j 1 k 1 其中 r1 r2 rl rl 1 整数d称为滞后参数, r2 ,, rl 称为门限参数, 模型(9.6)记为SETARl; p1 ,, pl 模型
相关文档
最新文档