非线性时间序列.doc
近十年国内外计量经济学研究进展与趋势
近十年国内外计量经济学研究进展与趋势近十年来,计量经济学在国内外取得了长足的发展,涌现出许多重要的研究成果,对经济学理论的深化和实证分析方法的改进起到了重要的推动作用。
在国际上,计量经济学研究的范围不断扩大,方法不断创新,其中包括了处理大数据、非线性时间序列、因果推断和机器学习等新兴领域。
而在国内,随着国家经济的快速发展,计量经济学研究也在不断拓展,探讨了许多与国情相关的重大课题,为我国的实证研究提供了有力的支持。
近年来,计量经济学研究的主要进展与趋势体现在以下几个方面:大数据和机器学习方法的兴起。
随着信息技术的快速发展,大数据时代的到来,大数据分析和机器学习成为了计量经济学研究的重要工具。
传统统计方法在处理大规模数据时显得力不从心,而机器学习方法可以更好地处理大数据,并从中发现隐藏的规律和模式。
大数据和机器学习方法在计量经济学研究中得到了广泛的应用,成为了研究的热点之一。
非线性时间序列分析的发展。
在金融、宏观经济等领域,经济数据往往表现出非线性特征。
传统的线性模型在描述和预测非线性时间序列数据时存在局限性,因此非线性时间序列分析成为了计量经济学研究的重要方向。
在非线性时间序列分析中,ARCH/GARCH模型、平滑转换模型等方法得到了广泛应用,并取得了丰硕的研究成果。
因果推断方法的应用。
因果推断是计量经济学研究的重要内容,它旨在分析因果关系而非相关性。
近年来,随机对照实验、断点回归设计等因果推断方法在计量经济学研究中得到了广泛应用,并为实证研究提供了更为严谨和有效的方法。
在一些政策评估和社会科学研究中,因果推断方法发挥了重要作用。
空间计量经济学的兴起。
随着地理信息系统(GIS)和计算能力的提高,空间计量经济学作为计量经济学的一个重要分支得到了快速发展。
空间计量经济学不仅可以更好地描述和预测空间数据的特征,还可以分析空间之间的相互作用和影响关系,对区域经济发展和城市规划具有重要意义。
在国内,与国际接轨是计量经济学研究的一个显著特点。
马尔卡夫链的介绍
非线性时间序列与马尔可夫链第一章.非线性时间序列浅释 (2)1.从线性到非线性自回归模型的差异2.线性时间序列定义的多样性第二章. 非线性时间序列模型 (6)1. 概述2. 非线性自回归模型3. 带条件异方差的自回归模型第三章. 马尔可夫链---描述AR模型的特性 (12)1.马尔可夫链2. AR模型所确定的马尔可夫链3.若干例子第四章. 统计建模方法 (29)1. 概论2. 线性性检验3. AR模型参数估计4.AR模型阶数估计第五章. 实例和展望 (46)1. 实例2.展望参考文献 (50)第一章.非线性时间序列浅释1. 从线性到非线性自回归模型的差异时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的线性与非线性概念, 可用以下的例子作些简单的解释.考察一阶线性自回归模型---LAR(1):x t=αx t-1+e t, t=1,2,…(1.1) 其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, e t与{x t-1,x t-2,…}独立. 使用(1.1)式, 递推可得x t=αx t-1+e t= e t + αx t-1= e t + α{ e t-1 + αx t-2}= e t + αe t-1 + α2 x t-2 =…=e t+αe t-1+α2e t-2+…+αn-1e t-n+1+αn x t-n. (1.2) 当|α|<1时, 不难论证αn x t-n→ 0, (1.3) {e t+αe t-1+α2e t-2+…+αn-1e t-n+1}→∑j=0∞αj e t-j. (1.4) 于是模型LAR(1)有平稳解, 且可表达为x t=∑j=0∞αj e t-j. (1.5) 可见, 求LAR(1)模型解的方法是很简便的. 而且, 还容易推广到p 阶LAR(p)模型. 为此考察如下的p阶线性自回归模型LAR(p):x t =α1x t-1+α2x t-2+...+αp x t-p +e t , t=1,2,… (1.6) 其中{e t }为i.i.d.序列,且Ee t =0, Ee t =σ2<∞, e t 与{x t-1, x t-2,…}独立. 虽然, 反复使用(1.6)式, 仍然可得到(1.2)式的类似结果, 但是, 用扩张后的多元AR(1)模型求解时, 则显示出与LAR(1)模型求解的步骤完全相似. 为此记X t =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+--11p t t t x x x ,U=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛001 , A=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛000.........00121 p ααα, (1.7)于是(1.6)式可写成如下的等价形式:X t =A X t-1+ e t U. (1.8) 仿照(1.2)式, 反复使用此式, 递推可得X t =AX t-1+e t U= e t U+ e t-1AU+A 2x t-2=⋯=e t U+e t-1AU+e t-2A 2U+…+e t-n+1A n-1U+A n x t-n . (1.9) 如果矩阵A 的谱半径(A 的特征值的最大模)λ(A), 满足λ(A)<1, 上式启发我们, (1.8)式有如下的解:X t =∑k=0∞A k Ue t-k . (1.10) 其中向量X t 的第一分量x t 形成的序列{x t }, 就是模型(1.6)式的解. 由此不难看出, 它有以下表达方式x t =∑k=0∞ϕk e t-k . (1.11)其中系数ϕk 由(1.6)式的α1,α2, ... ,αp 确定, 细节从略,此外, (1.11)式给了人们一点启发, 即考虑形如x t=∑k=0∞ψk e t-k, ∑k=0∞ψk2<∞, (1.12)的时间序列, 其中系数ψk能保证(1.12)式中的x t有定义. 在文献中, 这样的{x t}被称为线性时间序列.虽然这里给出了线性时间序列的定义, 但是, 我们暂时不去定义非线性时间序列, 先讨论一阶非线性自回归模型---NLAR(1), 并与线性LAR(1)模型进行比较. 首先写出NLAR(1)模型如下x t=ϕ(x t-1)+e t,t=1,2,…(1.13)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, e t与{x t-1, x t-2,…}独立, 这些假定与LAR(1)模型相同, 但是, ϕ(x t-1)是x t-1非线性函数, 比如ϕ(x t-1)=x t-1/{a+bx t-12}. 此时虽然仍可反复使用(1.13)式, 进行递推, 但是所得结果是x t=ϕ (x t-1) +e t= e t+ ϕ (x t-1)= e t+ ϕ ( e t-1+ ϕ (x t-2))= e t+ ϕ ( e t-1+ ϕ ( e t-2+ ϕ (x t-3)))=…=e t+ ϕ ( e t-1+ ϕ ( e t-2+ …+ϕ (x t-n))…). (1.14) 根据此式, 我们既不能轻易判断ϕ(x t-1)函数满足怎样的条件时, 上式会有极限, 也不能猜测其极限有怎样的形式.对于p阶非线性自回归模型x t =ϕ(x t-1,x t-2,…,x t-p )+e t , t=1,2,… (1.15) 仿照(1.6)至(1.9)式的扩张的方法, 引入记号 Φ( x t-1,x t-2,…,x t-p )≡⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+-----1121),...,,(p t t p t t t x x x x x ϕ, (1.16)得到与(1.15)式等价的模型X t =Φ(X t-1) +e t U, t=1,2,… (1.17)但是, 却得不出(1.9)至(1.11)式的结果.至此可看出, 从线性到非线性自回归模型有实质性差异, 要说清楚它们, 并不太简单. 从数学理论而言, 讨论线性自回归模型可借用泛函分析方法, 讨论非线性自回归模型则要借用马尔可夫链的理论和方法. 这也正是本讲座要介绍的主要内容.2. 线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性, 它与线性时间序列的定义有关. 前一小节中(1.12)式的线性时间序列, 只是一种定义方式. 如果改变对系数ψk 的限制条件, 就会给出不同的定义. 在近代研究中, (1.12)式的序列{e t }又被放宽为平稳鞅差序列, 这又引出另一种线性时间序列. 这在预报理论中有重要背景.无论对哪种线性时间序列, 都要研究它们的概率特性. 这已有丰富的成果载入文献. 可是, 非线性时间序列与此情况不同, 几乎没有文章研究它们的一般特性. 我们将要介绍的马尔可夫链, 也只是用来讨论满足非线性自回归模型的时间序列的特性问题.第二章. 非线性时间序列模型1. 概论从(1.12)式可见,线性时间序列{x t}, 被{e t}的分布和全部系数ψi 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们关心依赖有限参数的线性时间序列,即满足有限参数模型. 常用的如ARMA模型. 同样, 讨论非线性时间序列, 参数模型也更普遍. 不过, 由于非线性函数的多样性, 使得非线性时序模型更复杂. 在介绍此类模型之前, 我们先对非线性时序模型的分类作一概述.通用假定: {εt}为i.i.d.序列,且Eεt=0, 而且εt与{x t-1, x t-2,…}独立. (这是受研究方法所限)可加噪声模型:x t=ϕ(x t-1,x t-2,…,x t-p)+εt,(2.1)其中ϕ(…)是p元函数. 当它仅依赖于有限个未知参数时, 记此参数向量为α, 其相应的(2.1)模型常写成x t=ϕ(x t-1,x t-2,…,x t-p;α)+εt,(2.2)否则, 称(2.1)式称为非参数模型.带条件异方差的模型:x t=ϕ(x t-1,x t-2,…,x t-p)+S(x t-1,x t-2,…,x t-q)εt,(2.3) 其中ϕ(…)是p元函数, S(…)是q元函数. 它们也有参数与非参数的区分. 显然(2.3)式不是可加噪声模型.一般非线性时序模型:x t=ψ(x t-1,x t-2,…,x t-p; εt,εt-1,…,εt-q),t=1,2,… (2.4) 其中ψ(…)是p+q元函数. 显然, (2.4)式是最广义的非线性ARMA模型, 但是, 无论理论研究, 还是统计建模, 都难于进行, 所以在文献中很少见此模型. 只有双线性模型作为它的一种特殊情况, 有些应用和研究结果出现. 现写出一般双线性模型x t=∑j=1pαj x t-j+∑j=0qβjεt-j+∑i=1P∑j=1Qθijεt-i x t-j. (2.5)其中β0=1. 一种简单情况如x t=αx t-1+ θεt-1x t-1+εt. (2.6) 2. 非线性自回归模型前面的(2.1)和(2.2)式是非线性自回归模型, 而且属于可加噪声模型类. 现介绍几种(2.2)式的常见形式.函数后的线性自回归模型:f(x t)=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,(2.7)其中f(.)是一元函数, 它有已知和未知的不同情况, 不过总考虑单调增函数的情况, α=(α1,α2,…,αp)τ是未知参数. 在实际应用中, {x t}是可获得量测的序列.当f(.)是已知函数时, {f(x t)}也是可获得量测的序列, 于是只需考虑y t=f(x t)满足的线性AR模型y t=α1y t-1+α2y t-2+...+αp y t-p+εt,(2.8)这是线性自回归模型. 在宏观计量经济分析中, 常常对原始数据先取对数后, 再作线性自回归模型统计分析, 就属于此种情况. 这种先取对数的方法, 不仅简单, 而且有经济背景的合理解释,它反应了经济增长幅度的量化规律. 虽然在统计学中还有更多的变换可使用, 比如Box-Cox变换, 但是, 由于缺少经济背景的合理解释,很少被使用. 由此看来, 当f(.)有实际背景依据时, 可以考虑使用(2.7)式的模型.当f(.)是未知函数时, {f(x t)}不是可量测的序列, 于是只能考虑(2.7)模型. 注意f(.)是单调函数, 记它的逆变换函数为f-1(.), 由(2.7)式可得x t=f-1(α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt),(2.9) 此式是(2.4)式的特殊情况, 此类模型很少被使用. 取而代之是考虑如下的模型x t=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt, (2.10) 其中f(.)是一元函数, 也有已知和未知之分, 可不限于单调增函数. 此式属于(2.2)式的特殊情况, 有一定的使用价值. 例如x t =α1I(x t-1<0)x t-1+α2I(x t-1≥0)x t-1+εt , (2.11) 其中I(.)是示性函数. 此模型是分段线性的, 是著名的TAR 模型的特殊情况(详见后文). 其分段形式如下:x t =⎩⎨⎧≥+<+----.0,,0,112111t t t t t t x x x x εαεα t=1,2,… (2.12)请注意, (2.10)和(2.11)式有一个共同的特征, 就是未知参数都以线性形式出现在模型中. 这一特点在统计建模时带来极大的方便. 此类模型便于实际应用. 但是, 对于{x t }而言不具有线性特性, 所以, 讨论它们的平稳解, 以及建模理论等问题, 都需要借助于马尔可夫链的工具.参数型的非线性自回归模型: 即(2.2)式,x t =ϕ(x t-1,x t-2,…,x t-p ;α)+εt , (2.13)其中ϕ(…)是p 元已知函数, 但是其中含有未知参数α=(α1,α2,…,αp )τ. 一般说来, α在一定范围内取值.例如,x t =212111--+t t x x αα+εt , (2.14)其中α=(α1,α2)τ是未知参数, 它们的取值范围是: -∞<α1<∞, 0≤α2<∞.这里需要指出, 使用(2.13)式的模型, 不仅要借助马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦, 二是确定ϕ(…)函数的麻烦. 一般来说, 只有根据应用背景能确定ϕ(…)函数形式时, 才会考虑使用此类模型.除了以上两类模型外, 还有(2.1)式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难. 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性, 对这类模型不再仔细讨论.3. 带条件异方差的自回归模型前面的(2.3)式就是带条件异方差的自回归模型. 在这一小节里, 将介绍几种(2.3)式的常见形式.函数型条件异方差的自回归模型:x t=ϕ(x t-1,x t-2,…,x t-p)+S(x t-1,x t-2,…,x t-q)εt,(2.15)其中ϕ(…)是p元函数, S(…)是q元函数. 它们也有参数型和非参数型之分别, 这里不再赘述. 有两点必须指出: 为保证(2.15)式中S(…)被唯一确定, 还要限定Eεt2=1; 另外, 为(2.15)式建模时, 需要对ϕ(…)和S(…)都作估计.带ARCH模型的自回归模型:x t=ϕ(x t-1,x t-2,…,x t-p)+e t, (2.16)其中e t=S(e t-1,e t-2,…,e t-q)εt,S(e t-1,e t-2,…,e t-q)={α0+α1e t-12+…+αp e t-p2}1/2. (2.17)带ARCH 模型的自回归模型, 与函数型条件异方差的自回归模型, 都可借助马尔可夫链的工具加以研究. 研究带GARCH 模型的自回归模型, 仍有困难. 现在回顾(2.12)式的一般形式:x t =⎩⎨⎧≥++++<++++------,,...,,...22121201111110c x x x c x x x d t t q t q t d t t p t p t εαααεααα (2.18)其中{ε1t }和{ε2t }为相互独立的i.i.d.序列, 且ε1t ~N(0,σ12), ε2t ~N(0,σ22), 此外, 在(2.18)式中, d ≥1可能是未知的, c 被称为门限值, 一般也是未知的, 这些未知信息都会带来统计的麻烦. 现在我们讨论它的类型问题. 为此先改写它的形式如下:x t ={α10+α11x t-1+…+α1p x t-p +ε1t }I(x t-d <c)+{α20+α21x t-1+…+α2q x t-q +ε2t }I(x t-d ≥c)={α10+α11x t-1+…+α1p x t-p }I(x t-d <c)+{α20+α21x t-1+…+α2q x t-q }{I(x t-d ≥c)+{ε1t I(x t-d <c)+ε2t I(x t-d ≥c)}. (2.19) 由此可见, 当{ε1t }={ε2t }={εt }时, 上式变成x t ={α10+α11x t-1+…+α1p x t-p }I(x t-d <c)+{α20+α21x t-1+…+α2q x t-q }{I(x t-d ≥c) +εt , (2.20) 此式表明, 它属于(2.10)式的自回归模型. 由(2.20)式, 不难写出(2.10)式中的f k (.)函数(k=1,2,…,p+q+2), 注意它们都不是连续函数. 在实际应用中发现, (2.19)式中的两个残差项很少相同. 在此情况下, (2.19)式属于上述提到的哪一类呢? 易见, 它有条件异方差特性, 但是, 它又不像(2.15)或(2.16)式的任何一类. 它属于下面的多噪声驱动的自回归模型.两噪声驱动的自回归模型:x t=ϕ(x t-1,x t-2,…,x t-p)+S1(x t-1,x t-2,…,x t-q)ε1t,+ S2(x t-1,x t-2,…,x t-q)ε2t,(2.21) 其中{ε1t}和{ε2t}为相互独立的i.i.d.序列, Eε1t=Eε1t=0, Eε1t2=1 Eε2t2=1. 为了统计建模方便, 常假定它们有正态分布. 读者不难看出(2.19)式中的ϕ(x t-1,x t-2,…,x t-p), S1(x t-1,x t-2,…,x t-q)和S2(x t-1,x t-2,…,x t-q)的具体表达式.顺便指出, 称{ε1t}和{ε2t}为驱动噪声, 因为它们都是白噪声序列, 而且是不可观测的. 这样的模型可称为自激系统. 此类模型亦可借助于马尔可夫链的工具加以研究. 读者不难想到多噪声驱动的自回归模型, 这里从略.第三章. 马尔可夫链---描述AR模型的特性1.马尔可夫链时间序列{x t; t=1,2,…}, 是一个随机变量序列, 也简称随机序列. 与随机过程{x(t); t=∈(0,∞)}相比, 它只在离散时间取随机变量值的过程, 故此得名. 随机过程的类型很多, 研究的方法很多, 取得的成果也很多. 其中最重要的是马尔可夫过程, 当它是随机序列时, 称为马尔可夫链. 初次接触此类过程时, 先了解马尔可夫链为宜, 即{x t; t=1,2,…}为一马尔可夫链. 为易于理解概念的实质, 不妨考虑x t只取两个可能值的最简单情况. 以下就从一个示意性的例子说起.一个例子: 甲乙二人进行赌博, 每局分主(庄家)客方, 第一局的主客方由二人协商确定, 以后各局, 由前一局的取胜者担任(每局必分胜负)主方. 记x t=1表示在第t局时由甲任主方; x t=2表示在第t局时由乙任主方. 那么{x1, x2, …}是一个时间序列. 虽然它们只取1和2两个可能值, 但是不能预先知道它们的确切取值, 所以这它是随机序列.我们先用直观分析方法考察此例的特征. 如果此赌博含有技巧因素, 那么他们坐庄的多少与他们的水平有关. 以t表示当前局, 那末, x t的取值已定. 比如x t=1时, 意味着甲坐庄, 此时不能预知x t+1=1还是2. 如果x t+1=1意味着甲继续坐庄, 如果x t+1=2意味着甲丢掉庄家. 虽然不能预知x t+1的取值, 但是我们关心甲有多大把握继续坐庄. 重复上面的叙述, 当x t=2时, 我们关心甲有多大把握上庄. 在以上分析中, 我们忽略了x1, x2, …, x t-1的已知取值信息, 在已知x1,x 2, …, x t-1 , x t 时, 回答前面的两个问题, 只与x t 的取值有关. 此特征是被马尔可夫首先注意到的(1906年).现在将以上问题给出概率描述如下:P(x t+1=1⎜x t =1)=? P(x t+1=1⎜x t =2)=?被马尔可夫注意到的特征的概率论描述如下:P(x t+1=k ⎜x t =j,x t-1=j t-1,…,x 1=j 1)=P(x t+1=k ⎜x t =j), (3.1)如果上式的P(x t+1=k ⎜x t =j)与t 无关(详见后文), 可记P(x t+1=k ⎜x t =j)=p jk , j, k=1,2. (3.2)称p jk 为从状态j 向状态k 的转移概率. 注意, 此时只有两个可能状态(对应于x t =1或2), 于是易见p j1+p j2=1, 即p j2=1- p j1, j=1,2. (3.3)再将这些记号概括到如下的矩阵中, 即P=⎪⎪⎭⎫ ⎝⎛--=⎪⎪⎭⎫ ⎝⎛q q p p p p p p 1122211211, (3.4)称P 为马尔可夫链{x t }的一步转移概率矩阵, 也简称为转移矩阵. 又因(3.3)式成立, 故可简化记为p 11= p, p 22=q. p 11恰好表示甲继续坐庄的概率(相当于把握的大小), p 22恰好表示甲继续不坐庄的概率. 经马尔可夫和后来人的不断研究表明, 在以上例子中, 转移矩阵P 能刻画出马尔可夫链{x t }的全部概率特征. 对更广泛的马尔可夫过程也有类似结论. 在随机过程中有关马尔可夫过程的内容非常丰富. 在本讲义中, 只介绍某些马尔可夫链的知识, 又尽可能少地涉及深层理论内容. 为此, 我们先将马尔可夫过程理论分为四大类, 概括在如下的一拦表中, 据此可明确我们将关心哪一类. 当然, 也只关心此类中的局部内容(见后文便知). 为列此表, 首先注意, 在马尔可夫过程{x t}中, 时间t 有连续和离散的区分; x t的取值(又称为状态)也有连续和离散的区分. 上述例子就是离散型, 而且是两状态的, 这是有限状态马尔可夫链的最简单的情况. 依此划分可列出下表:马尔可夫过程分类表有趣的是, 这四类的研究历程有如下的先后次序: 离散状态马尔可夫链, 20年代---马尔可夫过程, 50年代---马尔可夫跳过程, 60年代---连续状态马尔可夫链, 70年代---我们关心连续状态马尔可夫链, 这是较近代的内容(1975年以后). 此内容恰好是近代非线性时间序列分析盼望已久的理论基础. 以下的各节将介绍连续状态马尔可夫链的定义和特性.马尔可夫链的定义: 若随机序列{x t}具有以下性质, 则称它为马尔可夫链,P(x t+1<x⎜x t, x t-1, …, x1)=P(x t+1<x⎜x t). (3.5)上式表明: 在给定x t, x t-1, …, x1时, x t+1的条件分布, 与给定x t时x t+1的条件分布相等, 记它为F t(x|x t). 在给定x t时, F t(x|x t)是一个分布函数, 它会随着x t的取值不同而不同. 易见, 此定义对离散和连续状态的马尔可夫链都适用.在非线性时间序列模型讨论中, 还须要用到多元马尔可夫链, 即{X t}中的X t=( X t1, X t2,…, X tm)τ是随机向量. 以上定义不难推广到向量的情况.向量马尔可夫链的定义: 若随机序列{X t}具有以下性质, X t=( X t1, X t2,…, X tm)τ是随机向量, 而且P(X t+1∈A ⎜X t, X t-1, …,X1)=P(X t+1∈A ⎜X t). (3.6) 在(3.6)式中的A, 是m维欧氏空间的可测集合. 特别取A={Y: Y =(Y1, Y2,…, Y m)τ , Y i<x i, i=1,2,…,m}, 便得到X t+1的多元分布函数.其实, 向量马尔可夫链的定义蕴涵了马尔可夫链的定义. 在后文中不再区分向量与非向量, 一律用马尔可夫链称之, 或者简称马氏链. 它们的维数会不言自明. 有了上述定义, 我们的目的是介绍马尔可夫链的平稳性条件. 为此, 还有几个概念不可缺少. 严格地说, 这几个概念和上面的定义, 都要用到测度论的术语. 这里回避了它们, 因为我们只是为了使用这些概念, 而不是研究它们. 在后文中将看到, 这并不影响使用这些概念来解决非线性自回归模型的平稳性等问题.齐时马尔可夫链: 如果马尔可夫链{x t}(一元的或多元的)满足P(x, A)=P(x t+1∈A⎜x t=x), t=1,2,…(3.7)与时刻t无关, 称{x t}为齐时马尔可夫链. 再记P k(x, A)=P(x t+k∈A⎜x t=x), k=1,2,…(3.8) 表示在当前时刻t处在x t=x, 经过k步后的x t+k落入A 的概率, 简称为k步转移概率. 显然, 依(3.7)式知P1(x, A)=P(x t+1∈A⎜x t=x)= P(x, A).又易见P2(x, A)=P(x2∈A⎜x0=x)=⎰P(y, A)P(x, dy). (3.9)此式表明, 两步转移概率P2(x, A), 可写成从x0=x先用一步转移到y, 再从x1=y转移到A的概率的平均. 其平均是指按一步转移概率分布完成, 以一元为例, P1(x, (-∞,y))= P(x, (-∞,y)), P(x, dy)=dP(x, (-∞,y)). 重复上面的推理可得P k(x, A)=P(x k∈A⎜x0=x)=⎰P k-1(y, A)P(x, dy),k=2,3,…(3.10) 马尔可夫链的不可约性: 如果马尔可夫链{x t}满足∑k=1∞ P k(x, A)>0, (3.11)其中x是m(≥1)维欧氏空间R m的任意一点, A是m(≥1)维欧氏空间的任意一个有正测度的可测集合, 这里的测度不妨用Lebesgue测度, 在本讲义中已是够用了.现在对不可约概念作些直观解释. 先从(3.11)式的定义可看出, 从R m中的任何一点出发, 对任何指定的正测度集合A, 用有限步转移到A的概率是正的. 换句话说, 不存在那样的点x和正测度集合A, 从x出发永远不能到达A. 更直观解释可用类似于前边的例子. 考察甲对乙, 丙对丁同来赌博, 并争用同一赌具的例子. 因为只有一个台面可用, 于是, 要用抽签决定哪一对进行赌博. 我们记x t=1表示在第t局时由甲坐庄; x t=2表示由乙坐庄; x t=3表示由丙坐庄; x t=4表示由丁坐庄. 于是{x1, x2, …}是一个时间序列. 不难验证这是一个马尔可夫链. 但是, 当x1=1或2时, 此后的x t, 只能x t=1或2, 不可能取3或4; 反之, 如果x1=3或4时, 此后也只能x t=3或4, 不可能取1或2. 这就是说, 在(3.11)式中取x=1, A={3,4}时, (3.11)式等于0值. 所以此马尔可夫链不是不可约的. 此例显然是编撰的, 通过它可说明, 对于可约的马尔可夫链, 可以分解成子序列分别去研究. 也就是说, 我们应当对甲--乙和丙--丁的博弈分别进行考察, 没有必要放在一个马尔可夫链中来讨论.马尔可夫链的周期性: 如果存在互不相交的正测度可测集合A1,A2,…,A d, 使得马尔可夫链{x t}满足P(x, A k)=1, 当x∈A k-1, k=2,3,…,d,P(x, A1)=1, 当x∈A d.则称{x t}为具有周期长度为d的周期马尔可夫链.此定义表明, 周期马尔可夫链, 必然从A1转移到A2, 再从A2转移到A3,…, 最后, 又从A d转移到A1, 形成周期性的转移规律. 须注意, 从A k-1转移到A k时, 具体转移到A k中哪一点, 仍然是随机的, 否则不是随机序列了. 虽然如此, 对周期马尔可夫链, 只需要研究其等间隔的子链{x td}即可, 因为其它子链{x td+k}(k=1,2,…,d-1)与{x td}的概率结构相同. 所以, 我们也只需考察非周期马尔可夫链, 即d=1的情况. 对此概念不在作直观解释了.马尔可夫链的小集合: 对于马尔可夫链{x t}, 如果存在非空的可测集合C∈R m, 一个正整数q, 一个正常数λ, 和某个概率测度ν, 使得P q(x, A) ≥λν(A), 对于任何x∈C, A∈R m, (3.12)则称C是马尔可夫链{x t}的小集合.以上小集合是一个重要的概念, 它是从一般离散状态马尔可夫链中的相应概念演化而来的. 对它要作直观解释比较困难, 将涉及太多的其它相关知识, 这里只得放弃了. 好在, 在下一节的应用时只用此定义而已, 在很宽松的条件下, 又是通过很容易的论证, 即可得知怎样的马尔可夫链会有怎样的小集合.以上叙述了马尔可夫链的转移概率. 现在考虑它的分布. 首先考察x0的分布, 它是初始的随机变量, 可以有其自己的分布, 也称为此马尔可夫链的初始分布, 不妨记为F0. 欲考察x1的分布F1, 根据齐时马尔可夫链的性质, 利用条件分布公式可得(当m=1时) F1(x)=P(x1<x)=⎰P(y, (-∞,x))dF0(y).当x1的维数m>1时, 将上面的分布F0和分布F1, 改用概率测度记号P0和P1更方便, 即有P1(A)=P(x1∈A)=⎰P(y, A)P0(dy). (3.13)仿此式可得P t(A)=P(x t∈A)=⎰P(y, A)P t-1(dy), t=1,2,… (3.14) 依此式和x0的概率测度P0, 就能确定马尔可夫链的全部概率分布. 在初始概率测度中, 如果存在这样的P, 能保证(3.13)式成为P1(A)=P(x1∈A)=⎰P(y,A)P(dy)=P(A)=P(x0∈A), (3.15) 此式意味着, 初始概率测度P经过一步转移后得到x1的概率测度P1, 与P相同, 或者说, 此概率测度P经过一步转移后不变, 称这样的P为不变概率测度. 将(3.15)式代入(3.14)式, 并反复迭代可得P t(A)=P(x t∈A)=⎰P(y, A)P t-1(dy)=⎰P(y, A)P(dy). t=1,2,…(3.16) 可见, 若以不变概率测度作为初始概率测度时, 则x t 都有相同的分布.马尔可夫链的平稳性: 考察齐时马尔可夫链{x t; t=0,1,2,…}, 若它有不变概率分布, 则称它为马尔可夫链的平稳分布, 当以此作为初始概率测度时, 则称这样的马尔可夫链为平稳的, 或者说它具有平稳性.须注意, 不是任何马尔可夫链都有平稳分布. 人们自然关心怎样的马尔可夫链有平稳分布, 如何获得其平稳分布的问题. 稍后将讨论此类问题.马尔可夫链的遍历性: 如果马尔可夫链{x t}有不变概率测度P, 对任意x∈R m, 取(3.13)式中的P0(x0=x)=1, 即取初始概率测度为在点x处的点分布, 记P n x为由(3.14)式确定的x n的概率测度, 如果有lim n→∞||P n x-P||=0, (3.17)称此马尔可夫链{x t}为遍历的; 如果存在ν>1使得lim n→∞νn||P n x-P||=0, (3.18)称此马尔可夫链{x t}为几何速度遍历, 又简称几何遍历性. 在(3.18)式中的||P n x-P||表示(P n x-P)的模数, 即两个概率测度P n x和P之差的距离的度量. 我们这里采用(P n x-P)的全变差作为度量模数. 粗略地说, 就是||P n x-P||=⎰|P n x(dy)-P(dy)|.注意, 上式右边的积分, 如果放弃取绝对值的记号, 上式=1-1=0; 加上绝对值记号, 称为全变差. 显然, 上式>0, 除非P n x=P.根据上述定义, 如果一个马尔可夫链有遍历性, 那么, 从任何一点x出发, 经过n步转移后得到x n的概率测度P n x, 都会收敛到它的不变概率测度P, 甚至于会有几何速度收敛. 具有遍历本必有不变概率测度, 可见这是重要的性质. 至于如何判断马尔可夫链是否有遍历性, 请看以下的定理.飘移定理: 如果马尔可夫链{x t}是齐时的, 不可约的, 非周期的, 还存在小集合C, 此外还有一非负(m 元)可测函数g, 和常数c 1>0, c 2>0, 使得(i) E{g(x n )| x n-1 =x}≤g(x)-c 1, 当x ∉C,(ii) E{g(x n )| x n-1 =x}≤c 2, 当x ∈C,那么, 此马尔可夫链为遍历的. 如果还存在0<ρ<1, 使得以上(i)被如下的(i)’代替, (ii)仍保持, 即(i)’ E{g(x n )| x n-1 =x}≤ρg(x)-c 1, 当x ∉C,那么, 此马尔可夫链为几何遍历的.此定理是下一节定理的基基础. 在实际应用时, 既可直接使用此定理, 也可以使用下一节的定理. 而且, 下一节的定理是针对NLAR(p)模型的, 更实用.2. AR 模型所确定的马尔可夫链对于p 阶非线性自回归模型x t =ϕ(x t-1,x t-2,…,x t-p )+εt , t=1,2,… (3.19)仿照(1.6)至(1.9)式的扩张的方法, 引入记号 Φ(x t-1,x t-2,…,x t-p )≡⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+-----1121),...,,(p t t p t t t x x x x x ϕ, U=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛001 , (3.20)得到与(3.19)式等价的模型X t =Φ(X t-1) +εt U, t=1,2,… (3.21)当p=1时, (3.19)式为x t =ϕ(x t-1)+εt , t=1,2,…于是P(x t <x|x t-1,x t-2,…,x 1)=P(ϕ(x t-1)+εt <x|x t-1,x t-2,…,x 1)=P(ϕ(x t-1)+εt<x|x t-1)=P(x t<x| x t-1),由此可知, 满足NLAR(1)模型的序列{x t}是马尔可夫链. 但是, 满足NLAR(p)模型(3.19)式的序列{x t}不是马尔可夫链. 幸运的是, 仿照推论NLAR(1)序列{x t}是马氏链的步骤, 容易得知, 满足p元NLAR(1)模型(3.21)式的多元序列{x t}是多元马氏链, 因为P( X t∈A| X t-1,X t-2,…,X1)= P( X t∈A| X t-1).在后文中, 常用多元马氏链, 为了节省符号, 一般不用大小写字母来区分一元与多元x t, 在讨论中, 它的维数是不言自明的.引理3.1. 在模型(3.19)式中, 如果εt和ϕ(…)满足(i) i.i.d.序列{εt}中的εt有处处为正的密度函数,(ii) 对任何K<∞, 可测函数ϕ满足sup||x||<K|ϕ(x)| <∞那么, 满足(3.21)式的{X t}是一马尔科夫链, 而且它是: 齐时性的; 不可约性的; 非周期性的;而且任何有界可测集是小集.此结果的证明并不难, 不过, 还是有太多的数学推演内容, 这里从略. 有兴趣者可参见安和陈的书(第4章,1998). 由此引理可见, 尽管在前一小节中叙述了较多的概念, 有的还难于理解, 但是, 当讨论在时序模型中的应用时, 竟如此简单, 并不涉及对诸多概念的太深理解. 由此引理和飘移定理又可得如下定理.定理3.2. 在模型(3.19)式中, 如果εt和ϕ(…)满足(i) εt有处处为正的密度函数, Eεt=0, Eεt2<∞,(ii) 存在0≤ρ<1, c≥0, 和加权模数||.||w , 使得||ϕ(x)||w≤ρ||x||w +c, (3.22) 或者|ϕ(x)|=|ϕ(x1, x2,…, x p)|≤ρmax{|x1|, |x2|,…, |x p|}+c, (3.23)那么, 满足(3.21)式的{X t; t≥1}是几何遍历的马尔科夫链. 其中加权模数是指:||x||w2=∑k=1m w jk x j x k=xτWx, W=(w jk)>0.这里使用加权模数, 是为了放宽(3.22)式的约束性.由此可知, 在时序模型中应用马氏链, 主要归于验证前一引理和此定理的条件.此定理的证明有太多数学推演, 这里从略. 此定理是比较重要的一个. 还有其它的定理讨论自回归模型有遍历性条件, 在此不逐一介绍, 有兴趣者可参见安和陈的书(第4章,1998). 以下再叙述一个有关带条件异方差自回归模型的遍历性定理.定理3.3. 考察带条件异方差的模型:x t=ϕ(x t-1,x t-2,…,x t-p)+S(x t-1,x t-2,…,x t-q)εt,(3.24) 如果εt,ϕ(…)和S(…)满足(i) εt 有处处为正的密度函数, E εt =0, E εt 2=1,(ii) 存在一种加权模数||.||w 和0<ρ<1, c ≥0, 使得(3.22)式成立,(iii) S(…)是正的连续函数, 而且lim ||x||→∞ S(x)/||x||=0, (3.25) 那么, 满足(3.24)式的{X t }是几何遍历的马尔科夫链.3.若干例子以下总假定{εt }满足定理3.2中的条件(i).例3.1. 有界自回归模型. 若非线性AR(p)模型 x t =ϕ(x t-1,x t-2,…,x t-p )+εt , 中的ϕ(…)是有界函数, 即存在K<∞, 使得|ϕ(x)| <K.取ρ=0, c=K, W=I(单位方阵), 则(3.22)式成立, 模型有几何遍历性. 如(2.14)式, ϕ(x t-1)=212111--+t t x x αα是有界函数.例3.2. 衰减型自回归模型. 若非线性AR(p)模型 x t =ϕ(x t-1,x t-2,…,x t-p )+εt , 中的ϕ(…)有以下的衰减性质, 即lim ||x||→∞||ϕ(x)||/||x||=0, (3.26) 任取0<ρ<1, c>0, W=I, 易见(3.22)式成立, 模型有几何遍历性.例3.3. 线性自回归模型. 若线性AR(p)模型 x t =α1x t-1+α2x t-2+…+αp x t-p +εt ,其中系数满足平稳性条件, 即1-α1u-α2u 2-…-αp u p ≠0, |u|≤1. (3.27)回顾(1.6)(1.7)和(1.8)式, 上式可写成等价模型X t =A X t-1+ e t U.依(1.7)式关于A 的定义, 以及(3.27)式, 必存在加权模数 ||.||w 使得(3.22)式成立, 其中0<λ(A)<ρ<1, 这里λ(A)是A 的谱半径. 所以此模型有几何遍历性.例3.4. 半参数自回归模型.x t =α1x t-1+α2x t-2+…+αp x t-p +f(x t-1,x t-2,…,x t-q )+εt , 其中系数满足平稳性条件(3.27)式, 连续函数f(…)满足(3.26)式, 所以此模型有几何遍历性. 论证从略.例3.5. 门限自回归模型.(Threshold AR---TAR) 考察(2.12)和(2.18)式的一般形式, 即x t =⎪⎪⎩⎪⎪⎨⎧∞<<++++≤<++++≤<∞-++++----------,,...,,...,,...1110212121201111110d t s t p t sp t s s d t t p t p t d t t p t p t x c if x x c x c if x x c x if x x εαααεαααεααα (3.28)其中在各段的{εt }亦可互不相同, 且互相独立, 这里讨论相同情况. 如果(3.28)式的系数满足ρ=max 1≤k ≤s ∑j=1p |αkj |<1, (3.29)不难验证(3.23)式成立, 于是此模型有几何遍历性. 例3.6. β-ARCH 模型:x t =h t 1/2εt , t=1,2,… (3.30)。
非线性时间序列
近代时间序列分析选讲:一. 非线性时间序列二. GARCH模型三. 多元时间序列四. 协整模型第一部分非线性时间序列第一章.非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章. 非线性时间序列模型1. 概述2. 非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章.马尔可夫链与AR模型1. 马尔可夫链2. AR模型所确定的马尔可夫链3. 若干例子第四章. 统计建模方法1. 概论2. 线性性检验3.AR模型参数估计4.AR模型阶数估计第五章. 实例和展望1. 实例2.展望第一章.非线性时间序列浅释1. 从线性到非线性自回归模型时间序列{x t}是一串随机变量序列,它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1):x t=αx t-1+e t, t=1,2,…(1.1)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到x t=αx t-1+e t= e t + αx t-1= e t + α{ e t-1 + αx t-2}= e t + αe t-1 + α2 x t-2=…= e t + αe t-1 + α2e t-2+…+ αn-1e t-n+1 +αn x t-n. (1.2)如果当n→∞时,αn x t-n→0, (1.3){e t +αe t-1+α2e t-2+…+αn-1e t-n+1}→ ∑j=0∞ αj e t-j . (1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为x t =∑j=0∞ αj e t-j . (1.5)通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p 阶线性自回归模型LAR(p):x t =α1x t-1+α2x t-2+...+αp x t-p +e t ,t=1,2,… (1.6)其中{e t }为i.i.d.序列,且Ee t =0, Ee t =σ2<∞, 而且e t 与{x t-1, x t-1,…}独立.虽然反复使用(1.6)式的递推式, 仍然可得到(1.2)式的类似结果, 但是,用扩张后的一阶多元AR 模型求解时, 可显示出与LAR(1)模型求解的神奇的相似. 为此记X t =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+--11p t t t x xx , U=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛001 , A=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛00000121 pααα, (1.7)于是(1.6)式可写成如下的等价形式:X t =A X t-1+ e t U. (1.8)反复使用此式的递推关系, 形式上仿照(1.2)式可得X t =AX t-1+e t U= e t U+ e t-1AU+A 2x t-2=⋯=e t U+e t-1AU+e t-2A2U+…+e t-n+1A n-1U+A n x t-n.如果矩阵A的谱半径(A的特征值的最大模)λ(A), 满足如下条件λ(A)<1, (1.10)由上式可猜想到(1.8)式有如下的解:X t=∑k=0∞A k Ue t-k. (1.11)其中向量X t的第一分量x t形成的序列{x t}, 就是模型(1.6)式的解. 由此不难看出, 它有以下表达方式x t=∑k=0∞ϕk e t-k. (1.11)其中系数ϕk由(1.6)式中的α1,α2, ... ,αp确定, 细节从略. 不过, (1.11)式给了我们重要启发, 即考虑形如x t=∑k=0∞ψk e t-k, ∑k=0∞ψk2<∞, (1.12)的时间序列类(其中系数ψk能保证(1.12)式中的x t有定义). 在文献中, 这样的序列{x t}就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1), 以便与LAR(1)模型进行比较分析. 首先写出NLAR(1)模型如下x t=ϕ(x t-1)+e t,t=1,2,…(1.13)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-2,…}独立, 这些假定与LAR(1)模型相同, 但是, ϕ(x t-1)不再是x t-1的线性函数, 代之为非线性函数, 比如ϕ(x t-1)=x t-1/{a+bx t-12}.此时虽然仍可反复使用(1.13)式进行迭代, 但是所得结果是x t=ϕ (x t-1) +e t= e t+ ϕ (x t-1)= e t+ ϕ ( e t-1+ ϕ (x t-2))= e t+ ϕ ( e t-1+ ϕ ( e t-2+ ϕ (x t-3)))=…=e t+ϕ ( e t-1+ ϕ ( e t-2+ …+ϕ (x t-n))…).(1.14)根据此式, 我们既不能轻易判断ϕ(x t-1)函数满足怎样的条件时, 上式会有极限, 也不能猜测其极限有怎样的形式.对于p 阶非线性自回归模型x t =ϕ(x t-1,x t-2,…,x t-p )+e t ,t=1,2,… (1.15)仿照(1.6)至(1.9)式的扩张的方法, 我们引入如下记号Φ( x t-1,x t-2,…,x t-p )≡⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+-----1121,...,,(p t t p t t t x x x x x ϕ, (1.16)我们得到与(1.15)式等价的模型X t =Φ(X t-1) +e t U, t=1,2,… (1.17)但是, 我们再也得不出(1.9)至(1.14)式的结果,至此我们已将看出, 从线性到非线性自回归模型有实质性差异, 要说清楚它们, 并不是很简单的事情. 从数学角度而言, 讨论线性自回归模型可借用泛函分析方法, 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法. 这也正是本讲座要介绍的主要内容.2. 线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性, 它与线性时间序列的定义有关. 前一小节中(1.12)式所显示的线性时间序列, 只是一种定义方式. 如果改变对系数ψk 的限制条件, 就会给出不同的定义. 更为重要的是, 在近代研究中, 将(1.12)式中的i.i.d.序列{e t }放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究. 事实上, 已经有丰富的成果被载入文献史册.依上所述可知, 由于线性时间序列定义的多样性, 必然带来非线性时间序列定义的复杂性. 这里需要强调指的是, 对于非线性时间序列, 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同. 于是人们要问, 我们用哪些工具来研究非线性时间序列模型解的特性呢? 这正是本次演讲要回答的问题. 确切地说, 我们将介绍马尔可夫链, 并借助于此来讨论非线性自回归模型解的问题.第二章. 非线性时间序列模型1. 概论从(1.12)式可见,一个线性时间序列{x t }, 被{e t }的分布和全部系数ψi 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如ARMA模型. 对于非线性时间序列而言, 使用参数模型方法几乎是唯一的选择. 由于非线性函数的多样性, 带来了非线性时间序列模型的多样性. 但是, 迄今为止被研究得较多, 又有应用价值的非线性时序模型, 为数极少, 而且主要是针对非线性自回归模型. 在介绍此类模型之前, 我们先对非线性时序模型的分类作一概述.通用假定: {εt}为i.i.d.序列,且Eεt=0, 而且εt与{x t-1, x t-2,…}独立.可加噪声模型:x t=ϕ(x t-1,x t-2,…)+εt,t=1,2,…(2.1)其中ϕ(…)是自回归函数. 当它仅依赖于有限个未知参数时, 记此参数向量为α, 其相应的(2.1)模型常写成x t=ϕ(x t-1,x t-2,…;α)+εt,t=1,2,…(2.2)否则, 称(2.1)式称为非参数模型.关于(2.1)(2.2)的模型的平稳性, 要在下一章讨论, 但是, 它有类似于线性AR模型的几个简单性质, 是重要的而且容易获得的, 它们是:E(x t|x t-1,x t-2,…)=E{ϕ(x t-1,x t-2,…)+εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…)+E(εt|x t-1,x t-2,…)=ϕ(x t-1,x t-2,…) (2.3)var{x t|x t-1, x t-2 , …}≡E{[x t-ϕ(x t-1,…)]2|x t-1, x t-2 , …}= E{εt2|x t-1, x t-2 , …}= Eεt2=σ2. (2.4)P{x t<x|x t-1,x t-2, …}= P{ϕ(x t-1,…)+εt<x|x t-1,x t-2, …}= P{εt<x-ϕ(x t-1,…)|x t-1,x t-2, …}=Fε(x-ϕ(x t-1,…)). (2.5)其中Fε是εt的分布函数.带条件异方差的模型:x t=ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)εt,t=1,2,…(2.6)其中ϕ(…)和S(…)也有限参数与非参数型之分, 这都是不言自明的. 另外, (2.6)式显然不属于可加噪声模型. 但是, 它比下面的更一般的非可加噪声模型要简单得多. 这可通过推广(2.3)(2.4)(2.5)式看出, 即有,E(x t|x t-1,x t-2,…)=E{ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)E{εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…) . (2.3)’var{x t|x t-1, x t-2 , …}≡E{[x t-ϕ(x t-1,…)]2|x t-1, x t-2 , …}=E{S2(x t-1,x t-2,…)εt2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)E{εt2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)σ2. (2.4)’P{x t<x|x t-1,x t-2, …}=P{ϕ(x t-1,…)+S(x t-1,…)εt<x|x t-1, x t-2 , …}= P{εt<[x-ϕ(x t-1,…)]/S(x t-1,…)}=Fε([x-ϕ(x t-1,…)]/S(x t-1,…)). (2.5)’一般非线性时序模型:x t=ψ(x t-1,x t-2,…; εt, εt-1,…)t=1,2,…(2.7)其中ψ(…)也有参数与非参数型之区别, 这也是不言自明的. 显然, (2.7)式既不是可加噪声模型, 也不属于(2.6)式的带条件异方差的模型. 虽然, 它可能具有条件异方差性质. 相反, 后两者都是(2.7)式的特殊类型. 虽说(2.7)式是更广的模型形式, 在文献中却很少被研究. 只有双线性模型作为它的一种特殊情况, 在文献中有些应用和研究结果出现. 现写出其模型于后, 可供理解其双线性模型的含义x t=∑j=1pαj x t-j+∑j=1qβjεt-j+∑i=1P∑j=1Qθijεt-i x t-j.2. 非线性自回归模型在前一小节中的(2.1)和(2.2)式就是非线性自回归模型, 而且属于可加噪声模型类. 在这一小节里, 我们将介绍几种(2.2)式的常见的模型.函数后的线性自回归模型:f(x t)=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,…(2.8)其中f(.)是一元函数, 它有已知和未知的不同情况, 不过总考虑单调增函数的情况, α=(α1,α2,…,αp )τ是未知参数. 在实际应用中, {x t }是可获得量测的序列.当f(.)是已知函数时, {f(x t )}也是可获得量测的序列, 于是只需考虑y t =f(x t )所满足的线性AR 模型y t =α1y t-1+α2y t-2+...+αp y t-p +εt ,t=1,2,… (2.9)此时可不涉及非线性自回归模型概念. 在宏观计量经济分析中, 常常对原始数据先取对数后, 再作线性自回归模型统计分析, 就属于此种情况. 这种先取对数的方法, 不仅简单, 而且有经济背景的合理解释,它反应了经济增长幅度的量化规律. 虽然在统计学中还有更多的变换可使用, 比如Box-Cox 变换, 但是, 由于缺少经济背景的合理解释, 很少被使用. 由此看来, 当f(.)有实际背景依据时, 可以考虑使用(2.7)式的模型.当f(.)是未知函数时, {f(x t )}不是可量测的序列, 于是只能考虑(2.8)模型. 注意f(.)是单调函数, 可记它的逆变换函数为f -1(.), 于是由(2.8)模型可得x t = f -1(α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p )+εt ),t=1,2,… (2.9)’此式属于(2.7)式的特殊情况, 此类模型很少被使用. 取而代之是考虑如下的模型x t =α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p )+εt ,t=1,2,… (2.10)其中f(.)是一元函数, 也有已知和未知之分, 可不限于单调增函数. 此式属于(2.1)式的特殊情况, 有一定的使用价值.当(2.10)式中的f(.)函数是已知时, 此式还有更进一步的推广模型,x t =α1f 1(x t-1,…,x t-s )+α2f 2(x t-1,…,x t-s )+...+αp f p (x t-1,…,x t-s )+εt ,t=1,2,… (2.11)其中f k (…)(k=1,2,…,p)是已知的s 元函数.例如, 以后将要多次提到的如下的模型:x t =α1I(x t-1<0)x t-1+α2I(x t-1≥0)x t-1+εt ,t=1,2,… (2.12)其中I(.)是示性函数. 此模型是分段线性的, 是著名的TAR 模型的特殊情况. 为了有助于理解它, 我们写出它的分段形式:x t =.0,0,,111211≥<⎩⎨⎧++--t t t tx x x x εαεα t=1,2,…请注意, (2.8)(2.10)和(2.11)式具有一个共同的特征, 就是未知参数都以线性形式出现在模型中. 这一特点在统计建模时带来极大的方便. 此类模型便于实际应用. 但是, 对于{x t }而言不具有线性特性, 所以, 讨论它们的平稳解的问题, 讨论它们的建模理论依据问题,都需要借助于马尔可夫链的工具.已知非线性自回归函数的模型:x t =ϕ(x t-1,x t-2,…,x t-p ;α)+εt ,t=1,2,… (2.13)其中ϕ(…)是p 元已知函数, 但是其中含有未知参数α=(α1,α2,…,αp )τ.一般说来, α在一定范围内取值.例如,x t =t t t x x εαα++--212111,t=1,2,…其中α=(α1,α2)τ是未知参数, 它们的取值范围是: -∞<α<∞, 0≤α<∞.这里需要指出, 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦, 二是确定ϕ(…)函数的麻烦. 一般来说, 只有根据应用背景能确定ϕ(…)函数时, 才会考虑使用此类模型.广义线性模型(神经网络模型):x t =ϕ(α1x t-1+α2x t-2+…+αp x t-p )+εt ,t=1,2,… (2.14)其中ϕ(.)是一元已知或未知函数, 参数α=(α1,α2,…,αp )τ总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对α作些约定, 其一, ||α||=1, 其二, α=(α1,α2,…,αp )τ中第一个非零分量为正的. 不难理解, 若不加这两条约定, 模型(2.14)不能被唯一确定.当ϕ(.)是一元已知函数时, 与神经网络模型相通.当ϕ(.)是一元未知函数时, 与回归模型中的PP 方法相通.除了以上两类模型外, 还有(2.1)式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难. 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题, 对这类模型不再仔细讨论.3. 带条件异方差的自回归模型在第一小节中的(2.6)式就是带条件异方差的自回归模型. 在这一小节里, 我们将介绍几种(2.2)式的常见参数模型.参数型条件异方差的自回归模型:x t =ϕ(x t-1,x t-2,…,x t-p )+S(x t-1,x t-2,…,x t-q )εt ,t=1,2,… (2.15)其中ϕ(…)是p 元函数, S(…)是q 元函数. 它们也有限参数型和非参数型之分别, 这里不在赘述. 有两点必须指出: 为了保证(2.15)式中的ϕ(…)和S(…)被唯一确定, 还要限定E εt 2=1; 另外, 在根据数据为(2.15)式建模时, 需要对ϕ(…)和S(…)都作估计.x t =ϕ(x t-1,x t-2,…,x t-p )+{α0+α1x t-12+…+αp x t-p 2}1/2εt ,=ϕ(x t-1,x t-2,…,x t-p )+S(x t-1,x t-2,…,x t-q )εt ,t=1,2,… (2.16)其中S 2(x t-1,x t-2,…,x t-q )={α0+α1x t-12+…+αp x t-p 2}. (2.17)我们将看到, 带异方差ARCH 模型的自回归模型. 它们都可以借助于马尔可夫链的工具加以研究, 但是, 对于推广后的GARCH 模型, 还会遇到某些麻烦.此为后话.现在, 让我们再回顾一下(2.12)式的原始的一般形式:x t=⎩⎨⎧≥++++<++++------,,...,,...22121201111101c x x x c x x x dt t p t p t dt t p t p t εαααεαααt=1,2,… (2.18)其中{ε1t }和{ε2t }为相互独立的i.i.d.序列, 且ε1t ~N(0,σ12), ε2t ~N(0,σ22),此外, 在(2.18)式中, d ≥1可能是未知的, c 被称为门限值, 一般也是未知的, 这些未知信息都会带来统计的麻烦. 现在我们关心它的类型问题. 为此先改写它的形式如下:x t ={α10+α11x t-1+…+α1p x t-p +ε1t }I(x t-d <c)+{α20+α21x t-1+…+α2q x t-q +ε2t }I(x t-d ≥c)={α10+α11x t-1+…+α1p x t-p }I(x t-d <c)+{α20+α21x t-1+…+α2q x t-q }{I(x t-d ≥c)+{ε1t I(x t-d <c)+ε2t I(x t-d ≥c)}.(2.19)对此模型计算x t 的条件均值和方差,即(2.1)(2.2)式, 并不难, 其条件均值是:E{x t |x t-1,x t-2,…}={α10+α11x t-1+…+α1p x t-p }I(x t-d <c)+{α20+α21x t-1+…+α2q x t-q }{I(x t-d ≥c).但是, 条件方差有异样, 我们只给出它的计算过程如下:var{x t|x t-1,x t-2,…} (用前一式)=E{[ε1t I(x t-d<c)+ε2t I(x t-d≥c)]2|x t-1,x t-2,…}=E{ε1t2I(x t-d<c)|x t-1,x t-2,…}+E{ε2t2I(x t-d≥c)|x t-1,x t-2,…}+2E{[ε1tε2t I(x t-d<c)I(x t-d≥c)]|x t-1,…}= I(x t-d<c)E{ε1t2|x t-1,x t-2,…}+I(x t-d≥c)E{ε2t2|x t-1,x t-2,…}+2I(x t-d<c)I(x t-d≥c)E{ε1tε2t|x t-1,…}=σ12I(x t-d<c)+σ22I(x t-d≥c)+2I(x t-d<c)I(x t-d≥c)≡S(x t-d).据此可见, (2.19)式不能写成(2.6)式的条件异方差模型, 虽然它的条件方差不是常数!进而, x t的条件分布要比(2.3)式更复杂, 不仿一试.由此可见, 当{ε1t}={ε2t}={εt}时, 上式变成x t={α10+α11x t-1+…+α1p x t-p}I(x t-d<c)+{α20+α21x t-1+…+α2q x t-q}I(x t-d≥c)+εt ,={α10+α11x t-1+…+α1p x t-p}+{(α20+α21x t-1+…+α2q x t-q)-(α10+α11x t-1+…+α1p x t-p)}I(x t-d≥c)+εt , (2.20)此式表明, 它属于函数后的线性自回归模型. 由(2.20)式不难写出(2.11)式中的f k(.)函数(k=1,2,…,p), 注意它们都不是连续函数. 但是, 在实际应用中发现, (2.19)式中的两个残差项很少相同. 在此情况下, (2.19)式属于上述提到的哪一类呢? 易见, 它有条件异方差特性, 但是, 它又不像(2.15)或(2.16)式的任何一类. 事实上它属于下面的多噪声驱动的性自回归模型.多噪声驱动的自回归模型:x t=ϕ(x t-1,x t-2,…,x t-p)+S1(x t-1,x t-2,…,x t-q)ε1t+ S2(x t-1,x t-2,…,x t-q)ε2t,t=1,2,…(2.21)其中{ε1t}和{ε2t}为相互独立的i.i.d.序列, Eε1t=Eε1t=0, Eε1t2=σ12, Eε2t2=σ22. 为了统计建模方便, 常假定它们有正态分布. 读者不难看出(2.19)式中的ϕ(x t-1,x t-2,…,x t-p), S1(x t-1,x t-2,…,x t-q)和S2(x t-1,x t-2,…,x t-q)的具体表达式.仿照对(2.19)式的条件均值和方差的讨论, 不难讨论(2.21)式的条件均值和方差, 不仿一试.虽然还可写出比(2.21)式更广的形式, 那不是我们所关心的内容. 这里顺便指出,称{ε1t}和{ε2t}为驱动噪声, 它们都是白噪声序列, 而且是不可观测的. 因此, 这样的模型可称为自激系统. 此类模型亦可借助于马尔可夫链的工具加以研究.(总结两要点: 非线性的复杂性与实用性)4. 两种可逆性(1). 对严平稳序列{x t }而言, 称它对新息序列{e t } (e t 定义见(2.2)式)是可逆的,如果F t x =F t e , 对每个t 成立, (2.22)其中F t x 和F t e 的定义:F t x =σ{x s ; s ≤t}, F t e =σ{e s ; s ≤t},显然, x t ∈F t e .(2). 平稳序列{x t }对时间是可逆的, 如果{x t }与{x -t }有相同概率分布结构。
(完整版)天津大学非线性信息处理技术
2.1 考察本章所列出的几种典型(一维Logistic Map 、二维Henon Map 、Lorenz 系统、Rossler 系统)非线性动力学系统通向混沌途经。
要求:(1). 进行数值求解,考察求解变量非线性时间序列曲线,并绘制出2D 及3D 解集,总结吸引子特征;(2). 考察初值敏感性,即改变初值后的解轨线敏感变化情况;(3). 考察2D 往返图,考察混沌系统吸引子形态。
2.1.1 Logistic MapLogistic 的方程表达式为:1(1)n n n x rx x +=-现在x 的变化范围是[0,1], 参量r 通常在0到4取值。
取x 的初值为0.5,r=3时进行方程的迭代。
迭代结果以及对应的递归图如图1所示。
X 序列图横坐标是迭代次数,纵坐标是n 所对应的x 值。
对应的Recurrence Plot 横坐标是n X ,纵坐标是1+n X图1 r 取3 , 3.2 , 3.45 , 3.8时对应的序列从图1中可以看出随着参数r 的变化,x 值的吸引子由一个变为两个,两个变为四个。
不断的变化。
那么是否logisticm Map就是随着r的变化逐渐进入一种无序的随机状态呢?再来看看不同的r值对应x吸引子的变化情况。
图2 Logstic混沌模型倍周期分叉图图2是利用matlab绘制的Logistic map图。
横坐标是参变量r,纵坐标是对应的吸引子。
从图2可以看出系统是周期分叉进入混沌系统。
当r值大于3.7左右后系统进入混沌状态。
在混沌区并非“漆黑一片”,将某些周期窗口局部放大,竟然可见模样相似的倍周期分岔结构,如此继续,可得无穷嵌套的自相似结构,章法井然,显然是无序中的有序。
如图3,图4所示。
图3 混沌区中的窗口图4 放大坐标得到的自相似图形初值变化对Logstic 系统的影响。
如下图所示,r=3时,系统没有进入混沌状态,改变初值,x 值收敛到定值。
初值的变化对系统最终的状态没有多大的影响。
集成经验模态分解方法
集成经验模态分解方法在当今数据分析与信号处理领域,经验模态分解(Empirical Mode Decomposition,EMD)已成为一种重要的时间序列分析技术。
集成经验模态分解方法(Ensemble Empirical Mode Decomposition,EEMD)作为EMD 的改进算法,通过引入白噪声辅助分析,提高了分解的稳定性和准确性。
本文将详细介绍集成经验模态分解方法的基本原理及其在信号处理中的应用。
一、集成经验模态分解方法简介集成经验模态分解方法(EEMD)是在经验模态分解(EMD)的基础上发展起来的。
EMD是一种基于数据本身的时间尺度分析方法,它将时间序列信号分解为多个固有模态函数(Intrinsic Mode Functions,IMFs)和一个残差项。
然而,传统的EMD存在端点效应和模态混叠等问题。
为了克服这些问题,EEMD通过在原始信号中引入白噪声序列,提高分解的稳定性和可靠性。
二、集成经验模态分解方法原理1.加入白噪声序列:将原始时间序列信号与不同频率和幅值的白噪声序列相加,形成多个含噪信号。
2.EMD分解:对每个含噪信号进行EMD分解,得到一系列IMFs和残差项。
3.集成平均:将所有含噪信号分解得到的IMFs进行平均处理,得到最终的IMFs。
4.残差项处理:对所有含噪信号的残差项进行平均,得到最终的残差项。
5.信号重构:将得到的IMFs和残差项相加,得到重构的原始信号。
三、集成经验模态分解方法应用1.信号去噪:EEMD具有良好的去噪性能,可应用于通信信号、生物医学信号等领域。
2.非线性时间序列分析:EEMD能够有效地提取时间序列的非线性特征,为非线性动力学研究提供有力支持。
3.故障诊断:EEMD在机械故障诊断领域具有广泛的应用前景,可提高故障诊断的准确性和可靠性。
4.气象预测:EEMD在气象数据分析中具有重要作用,有助于提高气象预测的准确性。
四、总结集成经验模态分解方法(EEMD)作为一种改进的时频分析方法,通过引入白噪声序列,提高了分解的稳定性和准确性。
非线性时间序列分析方法与模型
非线性时间序列分析方法与模型时间序列分析是一种研究随时间变化的数据模式和趋势的统计方法。
在传统的时间序列分析中,线性模型被广泛应用,但是线性模型无法捕捉到一些复杂的非线性关系。
因此,非线性时间序列分析方法和模型的发展成为了研究的热点。
一、非线性时间序列分析方法的发展1.1 非线性时间序列分析的起源非线性时间序列分析方法的起源可以追溯到20世纪60年代。
当时,经济学家和统计学家开始发现一些经济和金融数据中存在着非线性关系,传统的线性模型无法很好地解释这些数据。
这引发了对非线性时间序列分析方法的研究兴趣。
1.2 常用的非线性时间序列分析方法随着研究的深入,许多非线性时间序列分析方法被提出和应用。
其中,最常用的方法包括:傅里叶变换、小波分析、自回归条件异方差模型(ARCH)、广义自回归条件异方差模型(GARCH)、支持向量机(SVM)等。
二、非线性时间序列模型的应用2.1 ARCH和GARCH模型ARCH和GARCH模型是用于建模金融时间序列数据的非线性模型。
ARCH模型通过引入条件异方差来捕捉金融数据中的波动性特征,而GARCH模型在ARCH 模型的基础上进一步考虑了波动性的长期记忆效应。
2.2 小波分析小波分析是一种将时间序列分解成不同频率的成分的方法。
通过小波分析,可以将时间序列的低频和高频成分分离出来,从而更好地理解时间序列的特征和趋势。
2.3 支持向量机支持向量机是一种机器学习方法,在非线性时间序列分析中得到了广泛应用。
支持向量机通过将时间序列映射到高维空间,并在该空间中构建超平面来进行分类和回归分析。
三、非线性时间序列分析方法的优势和局限性3.1 优势非线性时间序列分析方法能够更好地捕捉到数据中的非线性关系,提高模型的预测精度。
这对于金融市场的预测和风险管理具有重要意义。
3.2 局限性非线性时间序列分析方法的建模过程较为复杂,需要较大的计算量和数据量。
此外,非线性时间序列分析方法对初始条件较为敏感,对于数据的噪声和异常值较为敏感。
非线性时间序列的建模与预测
非线性时间序列的建模与预测近年来,非线性时间序列分析方法在各个领域得到了广泛的应用。
非线性时间序列的模型与预测是一项复杂而具有挑战性的任务,因为非线性时间序列数据的生成过程可能受到多个非线性因素的影响,传统的线性模型无法准确描述这些变化趋势和特征。
为了建立非线性时间序列的模型和进行准确的预测,我们需要采用一些常见的非线性时间序列分析方法,例如相空间重构、近邻嵌入、分形分析等。
其中,相空间重构是一种常用的方法,它通过将时间序列数据映射到更高维的相空间中,就可以揭示出数据的非线性结构和动力学特征。
这种方法不仅可以帮助我们理解时间序列的内在机制,还可以为后续的模型建立和预测提供基础。
除了相空间重构方法外,近邻嵌入技术也是一种常用的非线性时间序列分析方法。
该方法通过在时间序列数据中寻找相似性较高的子序列,然后将这些子序列重组成一个新的时间序列,从而揭示出时间序列数据的非线性结构。
近邻嵌入方法主要涉及到参数的选择和邻居的确定,这是一个需要仔细考虑和调整的过程。
通过选择合适的参数和邻居,我们可以准确地建立非线性时间序列的模型,并进行精确的预测。
此外,分形分析也是一种重要的非线性时间序列分析方法。
分形分析通过计算时间序列数据的分形维数,可以揭示出数据的复杂性和自相似性。
这种方法适用于许多复杂系统的研究,例如金融市场、气象系统等。
通过分形分析,我们可以获得时间序列数据中的分形维数,从而为后续的模型建立和预测提供重要的依据。
在非线性时间序列的建模和预测中,还有一些其他的方法,例如神经网络、支持向量机等。
这些方法的应用已经得到了广泛的认可,并在许多实际问题中取得了良好的效果。
与传统的线性模型相比,这些方法可以更好地处理复杂的非线性关系和非稳态数据,从而提高模型的准确性和预测能力。
总之,非线性时间序列的建模和预测是一项具有挑战性的任务,需要运用各种先进的非线性时间序列分析方法。
通过相空间重构、近邻嵌入、分形分析等方法,我们可以揭示出非线性时间序列中的隐藏结构和动力学特征。
时间序列分析模型
时间序列分析模型时间序列分析模型是一种通过对时间序列数据进行建模和分析的方法,旨在揭示数据中的趋势、季节性、周期和不规则波动等特征,并进行预测和决策。
时间序列分析模型在经济、金融、市场、气象、医学等领域都有广泛的应用。
本文将介绍几种常见的时间序列分析模型。
1. 移动平均模型(MA)移动平均模型是时间序列分析中最简单的模型之一。
它基于一个基本假设,即观察到的时间序列数据是对随机误差的线性组合。
该模型表示为:y_t = c + e_t + θ₁e_(t-1) + θ₂e_(t-2) + … + θ_qe_(t-q)其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,θ₁,θ₂,…,θ_q 是移动平均项的参数,q 是移动平均项的阶数。
2. 自回归模型(AR)自回归模型是基于一个基本假设,即观察到的时间序列数据是过去若干时间点的线性组合。
自回归模型表示为:y_t = c + ϕ₁y_(t-1) + ϕ₂y_(t-2) + … + ϕ_p y_(t-p) + e_t其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,ϕ₁,ϕ₂,…,ϕ_p 是自回归项的参数,p 是自回归项的阶数。
3. 自回归移动平均模型(ARMA)自回归移动平均模型将自回归模型和移动平均模型结合在一起,用于处理同时具有自相关和移动平均性质的时间序列数据。
自回归移动平均模型表示为:y_t = c + ϕ₁y_(t-1) + ϕ₂y_(t-2) + … + ϕ_p y_(t-p) + e_t +θ₁e_(t-1) + θ₂e_(t-2) + … + θ_qe_(t-q)其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,ϕ₁,ϕ₂,…,ϕ_p 是自回归项的参数,θ₁,θ₂,…,θ_q 是移动平均项的参数,p 是自回归项的阶数,q 是移动平均项的阶数。
4. 季节性自回归移动平均模型(SARIMA)季节性自回归移动平均模型是自回归移动平均模型的扩展,用于处理具有季节性和趋势变化的时间序列数据。
《非线性编辑》习题与答案
《非线性编辑》习题与答案(解答仅供参考)一、名词解释1. 非线性编辑:非线性编辑是一种不同于传统线性编辑(如磁带对编)的影视制作技术,它允许用户在计算机上直接对数字化的视频和音频素材进行随机访问、任意剪辑和修改,不受时间顺序限制,操作灵活高效。
2. 时间线(Timeline):在非线性编辑软件中,时间线是一个可视化的编辑界面,用于组织和排列不同轨道上的视频、音频和其他多媒体元素,以形成最终的节目序列。
3. 轨道(Track):在非线性编辑系统的时间线上,轨道是承载各种媒体元素(如视频、音频、字幕等)的独立空间,每个轨道可以放置一个或多个素材片段,并能相互叠加和混合。
4. 剪辑点(Edit Point):在非线性编辑过程中,剪辑点是指在视频或音频素材中确定的开始和结束位置,通过设置剪辑点来选取并组合素材,实现内容的裁剪、拼接和过渡效果。
5. 动态链接(Dynamic Linking):非线性编辑中的动态链接功能允许在一个项目中无缝地引用和编辑来自其他应用程序(如Adobe After Effects中的特效、动画或Premiere Pro中的序列)的内容,无需预先渲染或导出文件。
二、填空题1. 在非线性编辑软件中,可以使用______工具精确控制剪辑点的位置。
答案:滑动工具或滚动编辑工具2. 为了保证音视频同步,非线性编辑系统通常采用______码流来进行数据传输与处理。
答案:时间码(Timecode)3. 非线性编辑系统的色彩校正模块可对视频素材进行______调整,确保整体画面色调的一致性和美观性。
答案:白平衡、亮度、对比度、饱和度、色调等4. 在非线性编辑过程中,将多个视频层按照一定规则混合在一起以产生特殊视觉效果的过程称为______。
答案:多层混合或多轨合成5. 对于高清及超高清视频制作,非线性编辑系统需具备足够的______性能以支持流畅播放和实时预览。
答案:计算能力和存储容量三、单项选择题1. 下列哪项不是非线性编辑系统的主要组成部分?A. 计算机硬件B. 非线性编辑软件C. 数字调音台D. 视频采集卡答案:C2. 在非线性编辑中,关于关键帧的说法正确的是:A. 关键帧只能应用于视频剪辑B. 关键帧用于定义特效、转场或属性随时间变化的状态C. 设置关键帧后,其前后的所有帧都会自动应用相同的参数值D. 音频剪辑不能添加关键帧答案:B3. 当需要对一段视频进行变速处理时,以下哪种方式更为合理?A. 直接改变视频文件的帧率B. 在非线性编辑软件中调整速度/持续时间参数C. 使用压缩或拉伸帧的方法D. 重新拍摄视频答案:B4. 下列哪项不是非线性编辑系统的优势?A. 灵活便捷的剪辑方式B. 可以无损修改已编辑好的内容C. 高效的资源共享能力D. 必须按照时间顺序逐个处理素材答案:D5. 若想在非线性编辑软件中加入三维动画效果,应采取何种方法?A. 直接在非线性编辑软件中创建三维动画B. 使用专门的三维动画软件制作后导入非编软件C. 导入预先渲染好的视频格式D. 利用插件直接在非编软件内完成三维动画制作答案:B 或 C (视具体情况而定,如果非编软件支持插件则选B,否则选C)四、多项选择题1. 下列哪些是非线性编辑系统的主要特点?A. 随机存取素材B. 无损编辑C. 实时预览特效和转场D. 支持多轨音频混音E. 只能进行视频剪辑,不能处理音频答案:ABCD2. 在非线性编辑过程中,可以使用以下哪些工具或功能?A. 剪辑工具(如刀片工具)B. 转场特效C. 时间线(Timeline)上的层叠和混合D. 视频色彩校正E. 音频均衡器与降噪处理答案:ABCDE3. 关于非线性编辑中的关键帧,以下说法正确的是:A. 关键帧用于记录特定时间点的属性值B. 通过在不同时间点设置关键帧并定义其参数,可以实现动画效果C. 关键帧仅应用于视频剪辑的运动轨迹D. 音频参数如音量和效果也可以应用关键帧技术E. 使用关键帧技术可以创建复杂的视觉和听觉变化答案:ABDE4. 在非线性编辑软件中,关于输出格式的选择,考虑的因素包括:A. 播出平台要求的格式标准B. 文件大小和存储空间限制C. 后期制作需求,如调色、特效等D. 观众观看设备支持的格式E. 制作成本和项目预算答案:ABCDE5. 对于非线性编辑系统的硬件配置,以下哪些是重要的性能指标?A. 处理器性能(CPU速度和核心数)B. 显卡性能(GPU对于图形处理和编码解码的支持)C. 内存容量(RAM)D. 存储设备类型和速度(如SSD或HDD)E. 高分辨率显示器及颜色准确性答案:ABCDE五、判断题1. 非线性编辑系统中的素材可以直接从网络下载后立即使用。
非线性时间序列分析与预测
非线性时间序列分析与预测时间序列分析是一种重要的统计学方法,用于研究时间序列数据的内在规律和趋势。
线性时间序列分析方法广泛应用于股市、天气、经济等领域的预测和分析中。
然而,传统的线性时间序列模型往往忽略了数据间的非线性关系,因此在某些复杂的系统中表现得并不理想。
为了进一步提高预测模型的准确性和稳定性,非线性时间序列分析方法应运而生。
非线性时间序列分析方法关注的是序列间的非线性依赖关系,通过刻画不同序列数据之间的非线性关系,揭示数据背后的深层结构和机制。
非线性时间序列分析通常包括非线性动力学、盒子维数、延迟坐标等方法。
首先,非线性动力学是非线性时间序列分析的核心方法之一。
它基于动力系统理论,将时间序列数据视为系统状态的演化过程,并通过构建非线性微分方程的数学模型来描述数据的动力学行为。
通过对非线性动力学系统的分析,我们可以更好地了解其内在的演化规律和趋势。
其次,盒子维数是衡量数据集中不规则程度的指标。
对于线性时间序列数据,在经典的离散傅里叶变换等方法中,我们可以得到精确的盒子维数。
然而,对于非线性时间序列数据,精确的盒子维数往往难以获得。
因此,非线性时间序列分析中通常使用分形维数或局部盒子维数来描述数据的复杂性和自相似性。
最后,延迟坐标方法是非线性时间序列分析中常用的一种方法。
该方法通过构造延迟嵌入向量来反映数据的时间延迟特性,并将原始的高维数据降维到低维空间中进行分析。
通过延迟坐标方法,我们可以还原数据间的非线性关系,从而更好地理解时间序列数据的动态特性。
非线性时间序列分析方法在众多领域中都得到了广泛的应用。
在金融市场中,非线性时间序列分析方法可以用于股票价格的预测和波动性分析;在气象预测中,非线性时间序列分析方法可以用于预测台风路径和强度变化;在经济中,非线性时间序列分析方法可以用于GDP增长和通货膨胀预测。
然而,非线性时间序列分析方法也面临着一些挑战和局限性。
首先,非线性时间序列分析方法对数据的质量和精确性要求较高,若数据存在缺失值或噪声,将影响预测结果的准确性。
非线性时间序列预测模型研究
非线性时间序列预测模型研究第一章引言时间序列分析在许多领域中被广泛应用,它能够揭示数据中的趋势和周期性变化,并对未来的发展做出预测。
然而,很多现实世界的时间序列数据并不是线性的,包含着复杂的非线性关系。
因此,研究非线性时间序列预测模型成为当前的研究热点。
本章将首先介绍非线性时间序列预测模型的研究背景和意义,然后概述目前主要的非线性时间序列预测方法,并最后给出本文的研究内容和组织结构。
第二章非线性时间序列预测模型概述2.1 非线性时间序列的特点非线性时间序列数据与线性时间序列数据相比具有一些特殊的性质。
例如,非线性时间序列数据可能包含多个不同的周期性变化、季节性变化和趋势变化,同时还可能受到外部因素的影响。
此外,非线性时间序列数据还可能存在非平稳性和噪声干扰等问题。
2.2 非线性时间序列预测方法的分类目前,研究人员提出了许多非线性时间序列预测方法,这些方法可以根据其模型结构和预测方法分为不同的分类。
常见的非线性时间序列预测方法包括支持向量机、神经网络、深度学习和基于混沌理论的方法等。
2.3 非线性时间序列预测模型评价指标为了评估非线性时间序列预测模型的性能,研究人员提出了一系列的评价指标。
这些指标包括均方根误差、平均绝对百分比误差和相关系数等。
第三章支持向量机在非线性时间序列预测中的应用3.1 支持向量机的原理和模型支持向量机是一种基于统计学习理论的非线性分类和回归方法。
它通过寻找一个最优的超平面将样本分为不同的类别,从而实现对非线性时间序列的预测。
3.2 支持向量机在非线性时间序列预测中的应用案例本节将以股票市场的预测为例,介绍支持向量机在非线性时间序列预测中的应用。
通过使用支持向量机模型,可以对股票市场的波动进行有效的预测和分析。
3.3 支持向量机在非线性时间序列预测模型中的优缺点在使用支持向量机进行非线性时间序列预测时,虽然可以取得不错的预测效果,但也存在一些问题和限制。
本节将对这些问题和限制进行详细的讨论。
非线性时间序列模型
(i1,2, ,q),则称 t 服从q阶的ARCH过程,记作
t ARCH(q)。
上海财经大学统计学系
13
•
定理9.1
对于ARCH(1)模型,E
(
2 t
r
)
存在的
充要条件是 r
1r (2 j 1) 1
FCAR(p),p为模型的阶数。
返回
上海财经大学统计学系
11
§9.2 条件异方差模型
• ARCH模型 • GARCH 模型 • 模型推广形式
上海财经大学统计学系
12
ARCH模型的定义
ARCH(q)模型定义如下:
yt xtt t1,2, ,T
若随机过程t 2 t0 的1 t 2 t21 平 方2 t 服2 2 从A Rq (qt 2 )q 过 程t ,即
x il tl ti
j1
k0
i1l1
其中p,q,Q和P是非负整数, t 是白噪声序列。
上海财经大学统计学系
返回 8
非参数时间序列模型
• 非参数自回归模型的一般形式为
xt xt 1, ,xtpt
(9.22)
其中 是R p到 R 1 的可测函数, t 是白噪声序
列。模型(9.22)有如下两种特殊形式。
非线性时间序列模 型
§9.1 一般非线性时间序列模型 介绍
• 参数非线性时间序列模型 • 非参数时间序列模型
上海财经大学统计学系
2
参数非线性时间序列模型
• SETAR (Self-exciting threshold autoregressive model)模型
非线性时间序列分析方法综述
非线性时间序列分析方法综述引言时间序列分析是一种用于研究时间上连续观测数据的统计方法。
在传统的时间序列分析中,线性模型被广泛应用,但随着对非线性现象的认识不断增加,非线性时间序列分析方法逐渐受到关注。
本文将对非线性时间序列分析方法进行综述,包括非线性动力学方法、复杂网络方法和机器学习方法。
非线性动力学方法非线性动力学方法是研究非线性时间序列的一种重要方法。
其中,相空间重构是一个核心概念。
相空间重构通过将一维时间序列转化为高维相空间中的轨迹,揭示了时间序列中的非线性结构。
常用的相空间重构方法有延迟重构和嵌入维度选择。
延迟重构通过选择不同的延迟时间,将一维时间序列转化为多维相空间中的轨迹,从而恢复出时间序列中的非线性动力学信息。
嵌入维度选择是指确定相空间重构中的嵌入维度,常用的方法有自相关函数法和最小平均互信息法。
复杂网络方法复杂网络方法是一种基于图论的非线性时间序列分析方法。
它将时间序列数据转化为网络结构,通过研究网络的拓扑特性来揭示时间序列中的非线性关系。
常用的复杂网络方法包括小世界网络、无标度网络和模块化网络。
小世界网络描述了网络中节点之间的短路径长度和高聚集性特征,可以用来分析时间序列中的局部关联。
无标度网络描述了网络中节点的度分布呈幂律分布的特性,可以用来分析时间序列中的长尾分布。
模块化网络描述了网络中节点的聚类特性,可以用来分析时间序列中的模式和结构。
机器学习方法机器学习方法是一种基于统计学习理论的非线性时间序列分析方法。
它通过构建预测模型来揭示时间序列中的非线性关系。
常用的机器学习方法包括支持向量机、人工神经网络和随机森林。
支持向量机是一种基于结构风险最小化理论的分类器,可以用于时间序列的分类和回归分析。
人工神经网络是一种模拟大脑神经元工作原理的计算模型,可以用于时间序列的模式识别和预测分析。
随机森林是一种基于集成学习的分类器,可以用于时间序列的多样本预测和异常检测。
结论非线性时间序列分析方法是研究时间序列中非线性关系的重要工具。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-------------精选文档 -----------------近代时间序列分析选讲:一. 非线性时间序列二. GARCH 模型三. 多元时间序列四. 协整模型-------------精选文档 -----------------非线性时间序列第一章 .非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章 . 非线性时间序列模型1.概述2.非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章 . 马尔可夫链与 AR 模型1.马尔可夫链2.AR 模型所确定的马尔可夫链-------------精选文档 -----------------3.若干例子第四章 . 统计建模方法1.概论2.线性性检验3.AR 模型参数估计4.AR 模型阶数估计第五章 . 实例和展望1.实例2.展望第一章 .非线性时间序列浅释1.从线性到非线性自回归模型时间序列 {x t } 是一串随机变量序列 , 它有广泛的实际背景 , 特别是在经济与金融-------------精选文档 -----------------领域中尤其显著. 关于它们的从线性与非线性概念 , 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1):x t = x t-1 +e t ,t=1,2,(1.1)其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-1 ,} 独立 .反复使用 (1.1) 式的递推关系 , 就可得到x t =x t-1 +e t=e =e =e ttt+x t-1+{ e t-1 +x t-2 } +e t-1 + 2 x t-2== e t +e t-1 + 2 e t-2+ +n-1 e t-n+1+n x t-n.(1.2)如果当 n时,n xt-n 0, (1.3) {e t + e t-1 + 2 e t-2++n-1 e t-n+1}j=0j et-j .(1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是 , 对以上的简单模型 , 不难相信 , 当| |<1 时 , (1.3)(1.4) 式成立 . 于是 , 当 | |<1时,模型LAR(1)有平稳解 , 且可表达为x t =j=0j e t-j.(1.5) 通过上面叙述可见求LAR(1) 模型的解有简便之优点 , 此其一 . 还有第二点 , 容易推广到 LAR(p) 模型 . 为此考查如下的 p 阶线性自回归模型 LAR(p):x t = 1 x t-1 + 2 x t-2 +...+p x t-p +e t ,t=1,2, (1.6) 其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且 e t与{x t-1 , x t-1 ,} 独立 .虽然反复使用(1.6) 式的递推式, 仍然可得到 (1.2) 式的类似结果, 但是 ,用扩张后的一阶多元 AR 模型求解时 , 可显示出与 LAR(1) 模型求解的神奇的相似. 为此记x t 1x t 1, U= 0X t = ,x t p 1 01 2 p1 0 0(1.7)A= ,0 00于是 (1.6) 式可写成如下的等价形式:X t =A X t-1 + e t U.(1.8) 反复使用此式的递推关系, 形式上仿照 (1.2) 式可得X t =AX t-1 +e t U= e t U+ e t-1 AU+A 2 x t-2==e t U+e t-1 AU+e t-2 A 2 U++e t-n+1 A n-1 U+A n x t-n .如果矩阵 A 的谱半径 (A的特征值的最大模) (A),满足如下条件(A)<1,(1.10)由上式可猜想到 (1.8) 式有如下的解 :X t =k=0 A k Ue t-k .(1.11)其中向量X t的第一分量x t形成的序列 {x t },就是模型 (1.6) 式的解 . 由此不难看出 , 它有以下表达方式x t =k=0k e t-k .(1.11)其中系数k 由(1.6)式中的 1 ,2 , ...,p确定 , 细节从略 . 不过 , (1.11) 式给了我们重要启发 ,即考虑形如x t =k=0k e t-k ,k=0k 2,(1.12)的时间序列类( 其中系数k 能保证(1.12)式中的x t有定义 ). 在文献中 , 这样的序列-------------精选文档 -----------------{x t } 就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1),以便与LAR(1) 模型进行比较分析 . 首先写出 NLAR(1)模型如下x t = (x t-1 )+e t ,t=1,2,(1.13)其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-2 ,} 独立 , 这些假定与LAR(1) 模型相同 , 但是 ,(x t-1 )不再是 x t-1的线性函数 , 代之为非线性函数,比如-------------精选文档 -----------------(x t-1 )=x t-1 /{a+bx t-1 2}.此时虽然仍可反复使用(1.13) 式进行迭代, 但是所得结果是x t =(x t-1 ) +e t= e t +(x t-1 )= e t +( e t-1 +(x t-2 ))= e t +( e t-1 +( e t-2 + (x t-3 )))==e t +( e t-1 +( e t-2 ++(x t-n )) ).(1.14)根据此式 , 我们既不能轻易判断(x t-1 ) 函-------------精选文档 -----------------数满足怎样的条件时, 上式会有极限 , 也不能猜测其极限有怎样的形式.对于 p 阶非线性自回归模型x t = (x t-1 ,x t-2 ,,x t-p )+e t ,t=1,2, (1.15) 仿照 (1.6) 至 (1.9) 式的扩张的方法, 我们引入如下记号(x t 1 , x t 2 ,...,x t px t 1( x t-1 ,x t-2 , ,x t-p ),x t p 1(1.16)我们得到与 (1.15) 式等价的模型X t = (X t-1 ) +e t U, t=1,2,(1.17)但是 , 我们再也得不出(1.9) 至 (1.14) 式的结果 ,至此我们已将看出 , 从线性到非线性自回归模型有实质性差异 , 要说清楚它们 , 并不是很简单的事情 . 从数学角度而言 , 讨论线性自回归模型可借用泛函分析方法 , 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法 . 这也正是本讲座要介绍的主要内容 .2.线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性 , 它与线性时间序列的定义有关.前一小节中(1.12) 式所显示的线性时间序列 , 只是一种定义方式. 如果改变对系数k 的限制条件, 就会给出不同的定义. 更为重要的是 , 在近代研究中 , 将 (1.12) 式中的 i.i.d. 序列 {e t } 放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究 . 事实上 , 已经有丰富的成果被载入文献史册 .依上所述可知 , 由于线性时间序列定义的多样性 , 必然带来非线性时间序列定义的复杂性 . 这里需要强调指的是 , 对于非线性时间序列 , 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同 . 于是人们要问 , 我们用哪些工具来研究非线性时间序列模型解的特性呢 ? 这正是本次演讲要回答的问题 . 确切地说 , 我们将介绍马尔可夫链 , 并借助于此来讨论非线性自回归模型解的问题 .第二章 . 非线性时间序列模型1.概论从(1.12) 式可见,一个线性时间序列 {x t }, 被 {e t } 的分布和全部系数i 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如 ARMA 模型 . 对于非线性时间序列而言 , 使用参数模型方法几乎是唯一的选择 . 由于非线性函数的多样性 ,带来了非线性时间序列模型的多样性 . 但是 , 迄今为止被研究得较多 , 又有应用价值的非线性时序模型 , 为数极少 , 而且主要是针对非线性自回归模型 . 在介绍此类模型之前 , 我们先对非线性时序模型的分类作一概述 .通用假定 : {t }为i.i.d.序列,且E t =0, 而且t 与{x t-1 , x t-2 ,}独立 .可加噪声模型 :x t = (x t-1 ,x t-2 , )+t ,t=1,2, (2.1)其中( ) 是自回归函数. 当它仅依赖于有限个未知参数时 , 记此参数向量为 , 其相应的(2.1) 模型常写成x t = (x t-1 ,x t-2 , ; )+t ,t=1,2, (2.2)否则 , 称(2.1) 式称为非参数模型.关于 (2.1)(2.2)的模型的平稳性,要在下一章讨论 , 但是 , 它有类似于线性A R 模型的几个简单性质, 是重要的而且容易获得的, 它们是 :E(x t |x t-1 ,x t-2 , )=E{ (x t-1 ,x t-2 , )+t |x t-1 ,x t-2 ,}= (x=(xt-1t-1 ,x,xt-2t-2 ,⋯)+E(t |x t-1 ,x t-2 ,⋯),⋯)(2.3)var{x t |x t-1 , x t-2 , ⋯}E{[x t - (x t-1 ,⋯)] 2|x t-1 , x t-2 , ⋯}= E{t 2|x t-1 , x t-2, ⋯}= E t 2=2.(2.4)P{x t <x|x t-1 ,x t-2 , ⋯}= P{(x t-1 ,⋯)+t <x|x t -1 ,x t-2 , ⋯}= P{t <x-(x t-1 ,⋯)|x t-1 ,x t-2 , ⋯}=F (x-(x t-1 ,⋯)).(2.5)其中 F 是t 的分布函数.带条件异方差的模型:x t = (x t-1 ,x t-2 , )+S(x t-1 ,x t-2 , )t ,t=1,2, (2.6)其中( ) 和 S() 也有限参数与非参数型之分 , 这都是不言自明的 . 另外 , (2.6) 式显然不属于可加噪声模型. 但是 , 它比下面的更一般的非可加噪声模型要简单得多. 这可通过推广 (2.3)(2.4)(2.5)式看出,即有,E(x t |x t-1 ,x t-2 , )-------------精选文档 -----------------=E{ (x t-1 ,x t-2 ,⋯)+S(x t-1 ,x t-2 ,⋯)t |x t-1 ,x t-2 ,⋯}=(x t-1 ,x t-2 ,⋯)+S(x t-1 ,x t-2 ,⋯)E{t |x t-1 ,x t-2 ,⋯}= (x t-1 ,x t-2 ,⋯).(2.3) ’var{x t |x t-1 , x t-2 , ⋯}E{[x t - (x t-1 ,⋯)] 2 |x t-1 , x t-2 , ⋯}=E{S 2 (x t-1 ,x t-2 ,⋯)t 2|x t-1 , x t-2, ⋯}=S 2 (x t-1 ,x t-2 ,⋯)E{t 2|x t-1 , x t-2, ⋯}=S 2 (x t-1 ,x t-2 ,⋯) 2 .(2.4) ’P{x t <x|x t-1 ,x t-2 , ⋯}=P{(x t-1 ,⋯)+S(x t-1 ,⋯)t <x|x t-1 , x t-2, ⋯} = P{t <[x-(x t-1 ,⋯)]/S(x t-1 ,⋯)}=F ([x-(x t-1 ,⋯)]/S(x t-1 ,⋯)).(2.5) ’一般非性序模型:x t = (x t-1 ,x t-2 ,⋯;t ,t-1 ,⋯)t=1,2, ⋯(2.7) 其中( ⋯) 也有参数与非参数型之区, 也是不言自明的 . 然 , (2.7) 式既不是可加噪声模型 , 也不属于 (2.6) 式的条件异方差的模型 . 然 , 它可能具有条件异方差性. 相反 , 后两者都是(2.7) 式的特殊型 .虽说 (2.7) 式是更广的模型形式, 在文献中却很少被研究 . 只有双线性模型作为它的一种特殊情况 , 在文献中有些应用和研究结果出现 . 现写出其模型于后, 可供理解其双线性模型的含义x t =j=1 p j x t-j +j=1 q j t-j+i=1 P j=1 Q ij t-i x t-j .2.非线性自回归模型在前一小节中的 (2.1) 和 (2.2) 式就是非线性自回归模型 , 而且属于可加噪声模型类 . 在这一小节里 , 我们将介绍几种 (2.2) 式的常见的模型 .函数后的线性自回归模型:-------------精选文档 -----------------f(x t )= 1 f(x t-1 )+2f(x t-2 )+...+p f(x t- p )+t ,t=1,2, (2.8) 其中 f(.) 是一元函数 , 它有已知和未知的不同情况 , 不过总考虑单调增函数的情况, =( 1 , 2 ,,p )是未知参数. 在实际应用中 , {x t } 是可获得量测的序列.当 f(.) 是已知函数时 , {f(x t )} 也是可获得量测的序列 , 于是只需考虑 y t =f(x t ) 所满足的线性 AR 模型y t = 1 y t-1 + 2 y t-2 +...+p y t-p +t ,t=1,2, (2.9)-------------精选文档 -----------------此时可不涉及非线性自回归模型概念 . 在宏观计量经济分析中 , 常常对原始数据先取对数后 , 再作线性自回归模型统计分析 , 就属于此种情况 . 这种先取对数的方法 , 不仅简单 , 而且有经济背景的合理解释 ,它反应了经济增长幅度的量化规律 . 虽然在统计学中还有更多的变换可使用 , 比如 Box-Cox 变换 , 但是 , 由于缺少经济背景的合理解释,很少被使用 . 由此看来 , 当 f(.) 有实际背景依据时 , 可以考虑使用 (2.7) 式的模型 .当 f(.) 是未知函数时 , {f(x t )} 不是可量测的序列 , 于是只能考虑 (2.8) 模型 . 注意 f(.)是单调函数 , 可记它的逆变换函数为 f -1 (.), 于是由 (2.8) 模型可得-------------精选文档 -----------------x t = f -1 ( 1 f(x t-1 )+ 2 f(x t-2 )+...+p f(x t-p )+t ),t=1,2, (2.9) ’此式属于 (2.7) 式的特殊情况, 此类模型很少被使用 . 取而代之是考虑如下的模型x t = 1 f(x t-1 )+ 2 f(x t-2 )+...+p f(x t-p )+t ,t=1,2, (2.10) 其中 f(.) 是一元函数 , 也有已知和未知之分, 可不限于单调增函数. 此式属于 (2.1) 式的特殊情况 , 有一定的使用价值.当 (2.10) 式中的 f(.) 函数是已知时 , 此式还有更进一步的推广模型 ,-------------精选文档 -----------------x t = 1 f 1 (x t-1 ,⋯,x t-s )+ 2 f 2 (x t-1 ,⋯,x t-s )+...+p f p (x t-1 ,⋯,x t-s )+t ,t=1,2, ⋯(2.11) 其中 f k (⋯)(k=1,2,⋯,p)是已知的s元函数.例如 , 以后将要多次提到的如下的模型:x t = 1 I(x t-1 <0)x t-1 + 2 I(x t-10)x t-1 +t,t=1,2, ⋯(2.12) 其中 I(.) 是示性函数 . 此模型是分段性的, 是著名的TAR模型的特殊情况. 了有助于理解它 , 我写出它的分段形式:-------------精选文档 -----------------1 x1 t , x1 0,x t =, x t 1 t=1,2,2 x t 1 t0.请注意 , (2.8)(2.10) 和(2.11) 式具有一个共同的特征 , 就是未知参数都以线性形式出现在模型中 . 这一特点在统计建模时带来极大的方便 . 此类模型便于实际应用 . 但是 , 对于 {x t } 而言不具有线性特性 , 所以 , 讨论它们的平稳解的问题 , 讨论它们的建模理论依据问题 ,都需要借助于马尔可夫链的工具 .已知非线性自回归函数的模型:x t = (x t-1 ,x t-2 , ,x t-p ; )+t ,t=1,2,(2.13)-------------精选文档 -----------------其中( ) 是 p 元已知函数 , 但是其中含有未知参数=( 1 , 2 ,,p ). 一般说来, 在一定范围内取值.例如 ,x t = 1 x t 1t , t=1,2,1 2 x t2 1其中=( 1 , 2 )是未知参数, 它们的取值范围是:- < < ,0< .这里需要指出 , 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦 , 二是确定( ) 函数的麻烦 . 一般来说 , 只有根据应用背景能确定() 函数时, 才会考虑使用此类模型.-------------精选文档 -----------------广义线性模型 (神经网络模型 ):x t = ( 1 x t-1 + 2 x t-2 ++p x t-p )+ t,t=1,2, (2.14)其中 (.) 是一元已知或未知函数, 参数=( 1 , 2 ,,p )总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对作些约定,其一,|| ||=1,其二,=( 1 , 2 ,,p )中第一个非零分量为正的 . 不难理解 , 若不加这两条约定,模型(2.14) 不能被唯一确定 .当 (.) 是一元已知函数时 , 与神经网络模型相通 .-------------精选文档 -----------------当 (.) 是一元未知函数时 , 与回归模型中的 PP 方法相通 .除了以上两类模型外, 还有 (2.1) 式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难 . 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题 , 对这类模型不再仔细讨论 .。