第九章非线性时间序列模型
非线性趋势的时间序列
非线性趋势的时间序列
非线性趋势的时间序列通常具有曲线或曲折的形状,而不是直线或指数型的趋势。
这种时间序列可能表现出各种形式的非线性关系,如凸型、凹型、波动性等。
例如,一个非线性趋势的时间序列可能是一条波动上升的曲线,其中波峰和波谷交替出现,而不是沿着直线或指数型增长。
另一个例子是一条S 型曲线,表现为一段缓慢增长,随后加速上升,最终趋于饱和。
非线性趋势的时间序列具有更加复杂的关系,因此需要更高级的数据分析方法来识别和预测。
常见的方法包括多项式拟合、非参数回归、神经网络模型等。
通过这些方法,可以更好地理解和利用非线性趋势的时间序列数据。
第九章 非线性时间序列模型
t1 lt ( )
•
参数向量 的解。
的极大似然估计
ˆ
为方程
L( )
0
上海财经大学统计学系
15
ARCH模型的假设检验
• 原假设和备择假设分别为
H0 :1 2 ... q 0 H1 : i 0
• 检验统计量为
9
可加非线性自回归模型
可加非线性自回归模型为
xt c f1 xt1 f p xtp t
其中c为常数,fi( i 1, , p ) 为p个一元非参数
型的未知函数,t 是白噪声序列,模型记
为ANLAR(p),p为模型的阶数。
上海财经大学统计学系
10
函数系数自回归模型
rl1
整数d称为滞后参数,r2 ,, rl 称为门限参数,
模型(9.6)记为SETARl; p1,, pl 模型
上海财经大学统计学系
4
考虑一个简单的 SETAR2;1,1 模型
xt
0-0.7.7xxt t 21
t , t ,
xt1 r xt1 r
0(i
1,2,...,p);
(B) 为滞后算子多项式且(B) 1B 2B2 ... pBp 。
上海财经大学统计学系
19
GARCH模型的极大似然估计
• GARCH(p,q)模型的对数似然函数为
L()
T t 1
lt ( )
T 2
log(2 )
1 2
非线性时间序列模型
• 一般非线性时间序列模型介绍 • 条件异方差模型
非线性时间序列分析STAR模型及其在经济学中的应用
非线性时间序列分析的基本概念 和理论
时间序列是指按照时间顺序排列的一组数据。在经济学中,时间序列数据通 常反映了某一经济现象的历史演变过程,如股票价格、消费支出、生产产量等。 非线性时间序列是指时间序列数据之间存在非线性关系,这种关系往往比线性关 系更为复杂和真实。
STAR模型是一种非线性时间序列分析方法,它可以捕捉时间序列中的非线性 结构和变化。STAR模型基于自回归模型,通过引入平滑转换函数,允许模型在不 同时间点之间平滑转换,以适应时间序列数据的非线性特征。
3、数据预处理
在应用STAR模型之前,需要对时间序列数据进行预处理,如去噪、季节调整 等。这些预处理步骤可以帮助STAR模型更好地识别时间序列的非线性结构。
4、模型应用
一旦STAR模型被估计和识别后,可以将其应用于预测时间序列的未来走势。 此外,STAR模型还可以用于时间序列的分解,将时间序列分解为线性部分和非线 性部分,以便更深入地理解时间序列数据的特征。
非线性动力系统基础
非线性动力系统是指由非线性微分方程或动态方程描述的系统。这些系统具 有丰富的动态行为和复杂的相互作用,无法简单地通过线性系统进行描述。李雅 可夫斯基定理是非线性动力系统理论中的重要成果之一,它揭示了系统中混沌现 象的存在和重要性。此外,同步也是非线性动力系统中的一个重要概念,它描述 了两个或多个系统在某种条件下以相同的方式运动的现象。
非线性时间序列分析STAR模型及其 在经济学中的应用
目录
01 引言
03
非线性时间序列分析 STAR模型
02 非线性时间序列分析 的基本概念和理论
04 参考内容
引言
在经济学中,时间序列数据的应用越来越广泛,例如金融市场价格波动、消 费者行为模式、生产活动变化等。为了更好地理解和预测这些时间序列数据,非 线性时间序列分析方法逐渐受到重视。其中,STAR(Smooth Transition Autoregressive)模型是一种被广泛应用于非线性时间序列分析的方法。本次演 示将详细介绍非线性时间序列分析STAR模型及其在经济学中的应用。
非线性规划模型
进行分配,因而存在部分 DVD 的两次被租赁,但因为是处理 同一份订单,因而不存在会员的第二次租赁.
基于这个假设,为了最小化购买量,我们在允许当 前某些会员无法被满足租赁要求,让其等待,利用部分 会员还回的 DVD 对其进行租赁.
根据问题一,我们认为,一个月中每张 DVD 有 0.6 的概率被租赁两次,0.4 的概率被租赁一次。即在二次 租赁的情况下,每张 DVD 相当于发挥了0.6 2 0.4 1.6张 DVD 的作用.
hi
第i种油的每单位的存储费用
ti
第i种油的每单位的存储空间
T
总存储公式
由历史数据得到的经验公式为 :
min
f
(x1, x2 )
a1b1 x1
h1x1 2
a2b2 x2
h2 x2 2
s.t. g(x1, x2 ) t1x1 t2x2 T
且提供数据如表5所示:
表5 数据表
石油的
例 8.(生产计划问题)某厂生产三种布料 A1, A2, A3, 该厂两班生产,每周生产时间为 80h,能耗不得超过 160t 标准煤,其它数据如下表:
布料 生产数量( m/ h ) 利润( 元 / m)
A1
400
0.15
A2
510
0.13
A3
360
0.20
最大销售量( m / 周) 40000 51000 30000
种类
ai
bi
hi
ti
1
9
3
0.50
2
2
4
5
0.20
4
已知总存储空间 T 24
代入数据后得到的模型为:
min
f
(x1, x2 )
统计学 第9章时间 序列分析
492 505.375 529.25
592 671.75 706.75 697.83 664.06 631.9075 652.605 719.65 764.92
应用移动平均数应注意的问题:
1.移动平均的项数越多,修匀效果越好; 2.移动平均所取项数,应考虑研究对象的周期; 3.如采用偶数项移动平均,需进行两次移动平均; 4.移动平均所取项数越多,所得新数列项数则越少
2、时间序列中指标出现0或负数时,不宜计算速度
第二节 长期趋势的测定
一、时间数列的分解
1、社会经济指标的时间数列包含以下四种变动因素:
(1)长期趋势(Trend) (2)季节变动(Seasonal)
可解释的变动
(3)循环变动(Cyclical)
(4)不规则变动(Irregular) ——不规则的不可解释的变动
t2
t
Y
1992 -4
29 -116
1993 -3
32 -96
1994 -2
36 -72
1995 -1
40 -40
1996 0
例:年末总人口数
相对数时间序列: 由一系列相对数按照时间顺序排列而成的数列
例:性别比 平均数时间序列: 由一系列平均数按照时间顺序排列而成的数列
例:职工平均工资
二、时间序列的分析指标
绝对数分析指标 发展水平, 增长量
相对数分析指标 发展速度 , 增长速度
平均数分析指标 平均发展水平 ,平均增长量 平均发展速度 ,平均增长速度
时间 t 1 2 3 4 5 6 7 8 9 45
产量 逐期增 ty t2 Y 长量
29
--
29
32
3
64
36
时间序列模型概述
时间序列模型概述时间序列模型是一种用于对时间序列数据进行建模和预测的统计模型。
时间序列数据是指按照时间顺序记录的一系列观测值,比如股票价格、气温、销售量等。
时间序列模型的目标是通过分析过去的观测值来预测未来的观测值。
这种模型通常基于以下两个假设:1. 时间序列的未来值是过去值的函数;2. 时间序列的未来值受到随机误差的影响。
常见的时间序列模型包括自回归移动平均模型(ARMA)、自回归整合移动平均模型(ARIMA)、季节性自回归移动平均模型(SARIMA)和指数平滑模型等。
ARMA模型是将时间序列的过去值和滞后误差作为解释变量,使用线性回归方法来预测未来值。
它是基于两个基本组件:自回归(AR)和移动平均(MA)。
AR部分建模了时间序列的过去值与当前值之间的关系,MA部分建模了观测误差的相关性。
ARIMA模型是在ARMA模型的基础上引入了差分操作,用于处理非平稳时间序列。
差分操作可以将非平稳时间序列转化为平稳时间序列,从而使得模型更可靠。
SARIMA模型是ARIMA模型的扩展,用于处理季节性时间序列。
它在ARIMA模型的基础上引入了季节差分,以及季节AR和MA项,以更好地拟合和预测季节性变化。
指数平滑模型是一类基于加权平均的模型,根据时间序列数据的特点赋予不同权重,进行预测。
常见的指数平滑模型包括简单指数平滑(SES)、双指数平滑和三指数平滑。
时间序列模型需要通过对历史数据的拟合来估计模型参数,并通过模型参数进行未来观测值的预测。
评估时间序列模型通常使用误差度量指标,比如均方误差(MSE)和平均绝对误差(MAE)。
时间序列模型在很多领域都有广泛的应用,比如经济学、金融学、气象学、销售预测等。
它可以帮助我们理解时间序列数据的动态特征,提供未来预测和决策支持。
然而,在实际应用中,时间序列模型也面临一些挑战,比如数据缺失、异常值和非线性关系等。
因此,选择适合的时间序列模型需要综合考虑数据的特性和模型的假设。
非线性金融时间序列模型的应用与研究
非线性金融时间序列模型的应用与研究引言金融市场的波动性一直是投资者关注的焦点之一。
在传统的金融时间序列模型中,假设市场的波动是线性的,但实际上,金融市场波动的特征往往是非线性的。
因此,研究非线性金融时间序列模型对于了解金融市场的波动性具有重要意义。
一、非线性金融时间序列模型的基础A. 线性时间序列模型简介传统的线性时间序列模型包括AR、MA和ARMA模型,它们假设变量之间的关系是线性的,可以用来描述市场的长期趋势。
B. 非线性金融时间序列模型简介非线性时间序列模型则引入了非线性因素,更适用于描述金融市场中的波动性。
常见的非线性模型包括ARCH、GARCH和EGARCH模型。
二、ARCH模型的应用与研究A. ARCH模型的基本原理ARCH模型是自回归条件异方差模型,它允许波动率的变化是由过去的残差所决定的。
它的基本原理是变量的波动率与过去的波动率存在正反馈的关系。
B. ARCH模型的实证研究ARCH模型在金融市场的实证研究中有较为广泛的应用。
例如,研究者通过应用ARCH模型对股票市场的波动性进行建模,可以更好地预测股票市场的风险。
三、GARCH模型的应用与研究A. GARCH模型的基本原理GARCH模型是广义自回归条件异方差模型,相比ARCH模型,它引入了过去的波动率因素,更能够准确描述金融市场的波动性。
B. GARCH模型的实证研究GARCH模型在金融市场的实证研究中也有重要应用。
例如,研究者利用GARCH模型对汇率市场的波动性进行建模,可以有效地预测汇率的波动。
四、EGARCH模型的应用与研究A. EGARCH模型的基本原理EGARCH模型是扩展的GARCH模型,它引入了对称和非对称效应的观念,能够更好地描述金融市场的波动性。
B. EGARCH模型的实证研究EGARCH模型在金融市场的实证研究中也有广泛应用。
例如,研究者通过应用EGARCH模型对商品期货市场的波动性进行建模,可以更好地预测商品期货市场的价格波动。
时间序列分析模型
时间序列分析模型时间序列分析模型是一种通过对时间序列数据进行建模和分析的方法,旨在揭示数据中的趋势、季节性、周期和不规则波动等特征,并进行预测和决策。
时间序列分析模型在经济、金融、市场、气象、医学等领域都有广泛的应用。
本文将介绍几种常见的时间序列分析模型。
1. 移动平均模型(MA)移动平均模型是时间序列分析中最简单的模型之一。
它基于一个基本假设,即观察到的时间序列数据是对随机误差的线性组合。
该模型表示为:y_t = c + e_t + θ₁e_(t-1) + θ₂e_(t-2) + … + θ_qe_(t-q)其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,θ₁,θ₂,…,θ_q 是移动平均项的参数,q 是移动平均项的阶数。
2. 自回归模型(AR)自回归模型是基于一个基本假设,即观察到的时间序列数据是过去若干时间点的线性组合。
自回归模型表示为:y_t = c + ϕ₁y_(t-1) + ϕ₂y_(t-2) + … + ϕ_p y_(t-p) + e_t其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,ϕ₁,ϕ₂,…,ϕ_p 是自回归项的参数,p 是自回归项的阶数。
3. 自回归移动平均模型(ARMA)自回归移动平均模型将自回归模型和移动平均模型结合在一起,用于处理同时具有自相关和移动平均性质的时间序列数据。
自回归移动平均模型表示为:y_t = c + ϕ₁y_(t-1) + ϕ₂y_(t-2) + … + ϕ_p y_(t-p) + e_t +θ₁e_(t-1) + θ₂e_(t-2) + … + θ_qe_(t-q)其中,y_t 是观察到的数据,c 是常数,e_t 是随机误差,ϕ₁,ϕ₂,…,ϕ_p 是自回归项的参数,θ₁,θ₂,…,θ_q 是移动平均项的参数,p 是自回归项的阶数,q 是移动平均项的阶数。
4. 季节性自回归移动平均模型(SARIMA)季节性自回归移动平均模型是自回归移动平均模型的扩展,用于处理具有季节性和趋势变化的时间序列数据。
时间序列模型的介绍
时间序列模型的介绍时间序列模型是一种用于分析和预测时间序列数据的统计模型。
时间序列数据是按时间顺序收集的观测数据,通常具有一定的趋势、季节性和随机性。
时间序列模型的目标是通过对过去的数据进行分析,揭示数据背后的规律性,从而对未来的数据进行预测。
时间序列模型可以分为线性模型和非线性模型。
线性模型假设时间序列数据是由线性组合的成分构成的,常见的线性模型有自回归移动平均模型(ARMA)、自回归模型(AR)和移动平均模型(MA)等。
非线性模型则放宽了对数据的线性假设,常见的非线性模型有非线性自回归模型(NAR)和非线性移动平均模型(NMA)等。
在时间序列模型中,常用的预测方法包括平滑法、回归法和分解法。
平滑法通过对时间序列数据进行平均、加权或移动平均等处理,来消除数据中的随机波动,得到趋势和季节性成分。
回归法则是通过建立时间序列数据与其他影响因素的关系模型,来预测未来的数据。
分解法则将时间序列数据分解为趋势、季节性和随机成分,分别进行建模和预测。
时间序列模型的应用非常广泛。
在经济领域,时间序列模型可以用于宏观经济指标的预测,如国内生产总值(GDP)、通货膨胀率和失业率等。
在金融领域,时间序列模型可以用于股票价格的预测和风险管理,如股票市场的指数预测和波动率的估计。
在气象领域,时间序列模型可以用于天气预报和气候变化研究,如温度、降雨量和风速等的预测。
在交通领域,时间序列模型可以用于交通流量的预测和拥堵状况的评估,如道路交通量和公共交通客流量等的预测。
然而,时间序列模型也存在一些限制和挑战。
首先,时间序列数据通常具有一定的噪声和不确定性,模型需要能够对这些随机波动进行合理的建模和处理。
其次,时间序列数据可能存在非线性关系和非平稳性,传统的线性模型可能无法很好地捕捉到数据的特征。
此外,时间序列数据的长度和频率也会对模型的预测能力产生影响,较短的数据序列和较低的采样频率可能导致预测结果的不准确性。
为了克服这些挑战,研究人员不断提出新的时间序列模型和方法。
非线性时间序列分析与预测
非线性时间序列分析与预测时间序列分析是一种重要的统计学方法,用于研究时间序列数据的内在规律和趋势。
线性时间序列分析方法广泛应用于股市、天气、经济等领域的预测和分析中。
然而,传统的线性时间序列模型往往忽略了数据间的非线性关系,因此在某些复杂的系统中表现得并不理想。
为了进一步提高预测模型的准确性和稳定性,非线性时间序列分析方法应运而生。
非线性时间序列分析方法关注的是序列间的非线性依赖关系,通过刻画不同序列数据之间的非线性关系,揭示数据背后的深层结构和机制。
非线性时间序列分析通常包括非线性动力学、盒子维数、延迟坐标等方法。
首先,非线性动力学是非线性时间序列分析的核心方法之一。
它基于动力系统理论,将时间序列数据视为系统状态的演化过程,并通过构建非线性微分方程的数学模型来描述数据的动力学行为。
通过对非线性动力学系统的分析,我们可以更好地了解其内在的演化规律和趋势。
其次,盒子维数是衡量数据集中不规则程度的指标。
对于线性时间序列数据,在经典的离散傅里叶变换等方法中,我们可以得到精确的盒子维数。
然而,对于非线性时间序列数据,精确的盒子维数往往难以获得。
因此,非线性时间序列分析中通常使用分形维数或局部盒子维数来描述数据的复杂性和自相似性。
最后,延迟坐标方法是非线性时间序列分析中常用的一种方法。
该方法通过构造延迟嵌入向量来反映数据的时间延迟特性,并将原始的高维数据降维到低维空间中进行分析。
通过延迟坐标方法,我们可以还原数据间的非线性关系,从而更好地理解时间序列数据的动态特性。
非线性时间序列分析方法在众多领域中都得到了广泛的应用。
在金融市场中,非线性时间序列分析方法可以用于股票价格的预测和波动性分析;在气象预测中,非线性时间序列分析方法可以用于预测台风路径和强度变化;在经济中,非线性时间序列分析方法可以用于GDP增长和通货膨胀预测。
然而,非线性时间序列分析方法也面临着一些挑战和局限性。
首先,非线性时间序列分析方法对数据的质量和精确性要求较高,若数据存在缺失值或噪声,将影响预测结果的准确性。
非线性时间序列模型
(5)
当线性原假设成立,即H0 : 0 时,ht 0
也成立,现求 F (zt )在 ht 为0附近的三阶泰
勒展开最后可得
yt 0 +1wtht +2wtht2 +3wtht3+et (6)
平滑转移模型
根据转换函数形式的不同,Granger和 Teräsvirta把STR模型具体分为逻辑形式 STR模型(Logistic STR,LSTR)和指数 形式的STR模型(Exponential STR, ESTR)两大类。
平滑转移模型
在LSTR模型中,转换函数F(zt ) 被认为是服从逻辑函数的形式:
非线性时间序列模型
线性模型
AR模型 MA模型 ARMA模型 ARIMA模型
非线性模型
ARCH模型 门限模型
Markov 区制转移模型
平滑转移模型STR
自回归条件异方差(ARCH)模型
ARCH模型首先由Engle(1982)为建模 英国的通货膨胀的预报方差而引进, 用于建模时间序列变化的(条件)方 差或波动性,从此这个模型被广泛地 用来建模金融和经济时间序列的波动 率。
Markov区制转移模型
Markov区制转移模型能够给出数据生 成过程中结构变化的转移概率,并模 拟出时间序列的内生变化过程,能够 更好的模拟动态变化过程;Markov区 制转移模型能够详细的给出研究变量 的区制和区制转移时间,可以分阶段 对比政策对经济的作用效果。
平滑转移模型
平滑转移模型(smooth transition regression)主要解决经济过程的机制 转化行为,将数据生成过程中的非线 性信息转换成可控制的模型机制,它 可以通过选取不同的转移变量或转移 函数形式较为准确的捕捉经济过程中 对称与非对称的转换。
非线性时间序列分析方法综述
非线性时间序列分析方法综述引言时间序列分析是一种用于研究时间上连续观测数据的统计方法。
在传统的时间序列分析中,线性模型被广泛应用,但随着对非线性现象的认识不断增加,非线性时间序列分析方法逐渐受到关注。
本文将对非线性时间序列分析方法进行综述,包括非线性动力学方法、复杂网络方法和机器学习方法。
非线性动力学方法非线性动力学方法是研究非线性时间序列的一种重要方法。
其中,相空间重构是一个核心概念。
相空间重构通过将一维时间序列转化为高维相空间中的轨迹,揭示了时间序列中的非线性结构。
常用的相空间重构方法有延迟重构和嵌入维度选择。
延迟重构通过选择不同的延迟时间,将一维时间序列转化为多维相空间中的轨迹,从而恢复出时间序列中的非线性动力学信息。
嵌入维度选择是指确定相空间重构中的嵌入维度,常用的方法有自相关函数法和最小平均互信息法。
复杂网络方法复杂网络方法是一种基于图论的非线性时间序列分析方法。
它将时间序列数据转化为网络结构,通过研究网络的拓扑特性来揭示时间序列中的非线性关系。
常用的复杂网络方法包括小世界网络、无标度网络和模块化网络。
小世界网络描述了网络中节点之间的短路径长度和高聚集性特征,可以用来分析时间序列中的局部关联。
无标度网络描述了网络中节点的度分布呈幂律分布的特性,可以用来分析时间序列中的长尾分布。
模块化网络描述了网络中节点的聚类特性,可以用来分析时间序列中的模式和结构。
机器学习方法机器学习方法是一种基于统计学习理论的非线性时间序列分析方法。
它通过构建预测模型来揭示时间序列中的非线性关系。
常用的机器学习方法包括支持向量机、人工神经网络和随机森林。
支持向量机是一种基于结构风险最小化理论的分类器,可以用于时间序列的分类和回归分析。
人工神经网络是一种模拟大脑神经元工作原理的计算模型,可以用于时间序列的模式识别和预测分析。
随机森林是一种基于集成学习的分类器,可以用于时间序列的多样本预测和异常检测。
结论非线性时间序列分析方法是研究时间序列中非线性关系的重要工具。
基于注意力机制的非线性时间序列预测模型
基于注意力机制的非线性时间序列预测模型基于注意力机制的非线性时间序列预测模型时间序列预测是一项重要的任务,广泛应用于金融、气象、交通等领域。
随着深度学习的兴起,基于神经网络的时间序列预测方法取得了很大的进展。
然而,传统的线性模型在处理非线性时间序列数据时存在一定的局限性。
为了通过神经网络更好地捕捉非线性关系,引入了注意力机制的非线性时间序列预测模型。
注意力机制源于生物学的视觉研究,它通过对输入的不同部分赋予不同的重要性来提升神经网络的性能。
在时间序列预测中,注意力机制可以帮助模型更好地关注序列中的特定时间点或特征,从而提高预测的准确性。
在基于注意力机制的非线性时间序列预测模型中,通常采用循环神经网络(RNN)作为基本的模型结构。
RNN可以有效地处理时间序列数据,并具有记忆功能。
通过在RNN的基础上引入注意力机制,可以进一步提升模型的性能。
该模型的主要思想是,在每个时间步骤上,通过计算注意力权重,对序列中的不同特征进行加权求和。
注意力权重是根据当前时间步骤的输入和之前时间步骤的隐藏状态来计算得出的。
通过关注重要的特征,模型可以更好地学习到序列中的非线性关系。
具体来说,模型首先将输入序列通过一个嵌入层转换为固定维度的向量表示。
然后,这些向量通过一个RNN层进行处理,得到隐藏状态序列。
接下来,通过计算注意力权重,对隐藏状态序列和输入序列进行加权求和,得到经过注意力机制的表示。
最后,将这些表示通过一个全连接层进行预测。
为了实现非线性的时间序列预测,可以在模型中引入非线性激活函数,如ReLU、tanh等。
这样可以增强模型对非线性关系的建模能力。
在训练过程中,可以使用平均绝对误差(MAE)或均方误差(MSE)作为损失函数,通过反向传播算法不断优化模型参数。
同时,为了防止过拟合,可以使用正则化技术,如L1或L2正则化。
经过实验证明,基于注意力机制的非线性时间序列预测模型相比于传统的线性模型,在多个时间序列预测任务上表现出更好的性能。
非线性时间序列
近代时间序列分析选讲:一. 非线性时间序列二. GARCH模型三. 多元时间序列四. 协整模型非线性时间序列第一章.非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章. 非线性时间序列模型1. 概述2. 非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章.马尔可夫链与AR模型1. 马尔可夫链2. AR模型所确定的马尔可夫链3. 若干例子第四章. 统计建模方法1. 概论2. 线性性检验3.AR模型参数估计4.AR模型阶数估计第五章. 实例和展望1. 实例2.展望第一章.非线性时间序列浅释1. 从线性到非线性自回归模型时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1):x t=αx t-1+e t, t=1,2,…(1.1)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=2<, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到x t=αx t-1+e t= e t + αx t-1= e t + α{ e t-1 + αx t-2}= e t + αe t-1 + α2 x t-2=…= e t + αe t-1 + α2e t-2+…+ αn-1e t-n+1 +αn x t-n. (1.2)如果当n时,αn x t-n0, (1.3){e t+αe t-1+α2e t-2+…+αn-1e t-n+1}αj e t-j . (1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为x t=j=0αj e t-j . (1.5)通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):x t =α1x t-1+α2x t-2+...+αp x t-p +e t ,t=1,2,… (1.6)其中{e t }为i.i.d.序列,且Ee t =0, Ee t =2<, 而且e t 与{x t-1, x t-1,…}独立.虽然反复使用(1.6)式的递推式, 仍然可得到(1.2)式的类似结果, 但是,用扩张后的一阶多元AR 模型求解时, 可显示出与LAR(1)模型求解的神奇的相似. 为此记X t =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+--11p t t t x x x , U=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛001 , A=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛00000121 pααα, (1.7)于是(1.6)式可写成如下的等价形式:X t=A X t-1+ e t U. (1.8)反复使用此式的递推关系, 形式上仿照(1.2)式可得X t=AX t-1+e t U= e t U+e t-1AU+A2x t-2==e t U+e t-1AU+e t-2A2U+…+e t-n+1A n-1U+A n x t-n.如果矩阵A的谱半径(A的特征值的最大模) (A), 满足如下条件(A)<1, (1.10)由上式可猜想到(1.8)式有如下的解:X t=k=0A k Ue t-k. (1.11)其中向量X t的第一分量x t形成的序列{x t}, 就是模型(1.6)式的解. 由此不难看出, 它有以下表达方式x t=k=0k e t-k. (1.11)其中系数k由(1.6)式中的α1,α2, ... ,αp确定, 细节从略. 不过, (1.11)式给了我们重要启发, 即考虑形如=k=0k e t-k, k=0k2,x(1.12)的时间序列类(其中系数k能保证(1.12)式中的x t有定义). 在文献中, 这样的序列{x t}就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1), 以便与LAR(1)模型进行比较分析. 首先写出NLAR(1)模型如下x t=(x t-1)+e t,t=1,2,…(1.13)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=2<, 而且e t与{x t-1,x t-2,…}独立, 这些假定与LAR(1)模型相同, 但是, (x t-1)不再是x t-1的线性函数, 代之为非线性函数, 比如(x t-1)=x t-1/{a+bx t-12}.此时虽然仍可反复使用(1.13)式进行迭代, 但是所得结果是x t=(x t-1) +e t= e t+ (x t-1)= e t+ ( e t-1+ (x t-2))= e t+ ( e t-1+ ( e t-2+ (x t-3)))=…=e t+( e t-1+ ( e t-2+ …+(x t-n))…).(1.14)根据此式, 我们既不能轻易判断(x t-1)函数满足怎样的条件时, 上式会有极限, 也不能猜测其极限有怎样的形式.对于p 阶非线性自回归模型x t =(x t-1,x t-2,…,x t-p )+e t ,t=1,2,… (1.15)仿照(1.6)至(1.9)式的扩张的方法, 我们引入如下记号( x t-1,x t-2,…,x t-p )⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+-----1121,...,,(p t t p t t t x x x x x ϕ, (1.16)我们得到与(1.15)式等价的模型X t =(X t-1) +e t U, t=1,2,… (1.17)但是, 我们再也得不出(1.9)至(1.14)式的结果,至此我们已将看出, 从线性到非线性自回归模型有实质性差异, 要说清楚它们,并不是很简单的事情. 从数学角度而言, 讨论线性自回归模型可借用泛函分析方法, 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法. 这也正是本讲座要介绍的主要内容.2. 线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性, 它与线性时间序列的定义有关. 前一小节中(1.12)式所显示的线性时间序列, 只是一种定义方式. 如果改变对系数k的限制条件, 就会给出不同的定义. 更为重要的是, 在近代研究中, 将(1.12)式中的i.i.d.序列{e t}放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究. 事实上, 已经有丰富的成果被载入文献史册.依上所述可知, 由于线性时间序列定义的多样性, 必然带来非线性时间序列定义的复杂性. 这里需要强调指的是, 对于非线性时间序列, 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同. 于是人们要问, 我们用哪些工具来研究非线性时间序列模型解的特性呢? 这正是本次演讲要回答的问题. 确切地说, 我们将介绍马尔可夫链, 并借助于此来讨论非线性自回归模型解的问题.第二章. 非线性时间序列模型1. 概论从(1.12)式可见,一个线性时间序列{x t}, 被{e t}的分布和全部系数i 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如ARMA模型. 对于非线性时间序列而言, 使用参数模型方法几乎是唯一的选择. 由于非线性函数的多样性, 带来了非线性时间序列模型的多样性. 但是,迄今为止被研究得较多, 又有应用价值的非线性时序模型, 为数极少, 而且主要是针对非线性自回归模型. 在介绍此类模型之前, 我们先对非线性时序模型的分类作一概述.通用假定: {t}为i.i.d.序列,且E t=0, 而且t与{x t-1, x t-2,…}独立.可加噪声模型:x t=(x t-1,x t-2,…)+t,t=1,2,…(2.1)其中(…)是自回归函数. 当它仅依赖于有限个未知参数时, 记此参数向量为, 其相应的(2.1)模型常写成x t=(x t-1,x t-2,…;)+t,t=1,2,…(2.2)否则, 称(2.1)式称为非参数模型.关于(2.1)(2.2)的模型的平稳性, 要在下一章讨论, 但是, 它有类似于线性AR模型的几个简单性质, 是重要的而且容易获得的, 它们是:E(x t|x t-1,x t-2,…)=E{(x t-1,x t-2,…)+t|x t-1,x t-2,…}=(x t-1,x t-2,…)+E(t|x t-1,x t-2,…)=(x t-1,x t-2,…) (2.3)var{x t|x t-1, x t-2 , …}E{[x t-(x t-1,…)]2|x t-1, x t-2 , …} = E{t2|x t-1, x t-2 , …}= E t2=2. (2.4)P{x t<x|x t-1,x t-2, …}= P{(x t-1,…)+t<x|x t-1,x t-2, …}= P{t<x-(x t-1,…)|x t-1,x t-2, …}=F(x-(x t-1,…)). (2.5)其中F是t的分布函数.带条件异方差的模型:x t=(x t-1,x t-2,…)+S(x t-1,x t-2,…)t,t=1,2,…(2.6)其中(…)和S(…)也有限参数与非参数型之分, 这都是不言自明的. 另外, (2.6)式显然不属于可加噪声模型. 但是, 它比下面的更一般的非可加噪声模型要简单得多. 这可通过推广(2.3)(2.4)(2.5)式看出, 即有,E(x t|x t-1,x t-2,…)=E{(x t-1,x t-2,…)+S(x t-1,x t-2,…)t|x t-1,x t-2,…}=(x t-1,x t-2,…)+S(x t-1,x t-2,…)E{t|x t-1,x t-2,…}=(x t-1,x t-2,…) . (2.3)’var{x t|x t-1, x t-2 , …}E{[x t-(x t-1,…)]2|x t-1, x t-2 , …} =E{S2(x t-1,x t-2,…)t2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)E{t2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)2. (2.4)’P{x t<x|x t-1,x t-2, …}=P{(x t-1,…)+S(x t-1,…)t<x|x t-1, x t-2 , …}= P{t<[x-(x t-1,…)]/S(x t-1,…)}=F([x-(x t-1,…)]/S(x t-1,…)).(2.5)’一般非线性时序模型:x t=(x t-1,x t-2,…; t, t-1,…)t=1,2,…(2.7)其中(…)也有参数与非参数型之区别, 这也是不言自明的. 显然, (2.7)式既不是可加噪声模型, 也不属于(2.6)式的带条件异方差的模型. 虽然, 它可能具有条件异方差性质. 相反, 后两者都是(2.7)式的特殊类型. 虽说(2.7)式是更广的模型形式, 在文献中却很少被研究. 只有双线性模型作为它的一种特殊情况, 在文献中有些应用和研究结果出现. 现写出其模型于后, 可供理解其双线性模型的含义x t=j=1p j x t-j+j=1q j t-j+i=1P j=1Q ij t-i x t-j.2. 非线性自回归模型在前一小节中的(2.1)和(2.2)式就是非线性自回归模型, 而且属于可加噪声模型类. 在这一小节里, 我们将介绍几种(2.2)式的常见的模型.函数后的线性自回归模型:f(x t)=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,…(2.8)其中f(.)是一元函数, 它有已知和未知的不同情况, 不过总考虑单调增函数的情况, α=(α1,α2,…,αp)是未知参数. 在实际应用中, {x t}是可获得量测的序列.当f(.)是已知函数时, {f(x t)}也是可获得量测的序列, 于是只需考虑y t=f(x t)所满足的线性AR模型y t=α1y t-1+α2y t-2+...+αp y t-p+εt,t=1,2,…(2.9)此时可不涉及非线性自回归模型概念. 在宏观计量经济分析中, 常常对原始数据先取对数后, 再作线性自回归模型统计分析, 就属于此种情况. 这种先取对数的方法, 不仅简单, 而且有经济背景的合理解释,它反应了经济增长幅度的量化规律. 虽然在统计学中还有更多的变换可使用, 比如Box-Cox变换, 但是, 由于缺少经济背景的合理解释, 很少被使用. 由此看来, 当f(.)有实际背景依据时, 可以考虑使用(2.7)式的模型.当f(.)是未知函数时, {f(x t)}不是可量测的序列, 于是只能考虑(2.8)模型. 注意f(.)是单调函数, 可记它的逆变换函数为f-1(.), 于是由(2.8)模型可得x t= f-1(α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt),t=1,2,…(2.9)’此式属于(2.7)式的特殊情况, 此类模型很少被使用. 取而代之是考虑如下的模型x t=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,…(2.10)其中f(.)是一元函数, 也有已知和未知之分, 可不限于单调增函数. 此式属于(2.1)式的特殊情况, 有一定的使用价值.当(2.10)式中的f(.)函数是已知时, 此式还有更进一步的推广模型,x t=α1f1(x t-1,…,x t-s)+α2f2(x t-1,…,x t-s)+...+αp f p(x t-1,…,x t-s)+εt,t=1,2,…(2.11)其中f k(…)(k=1,2,…,p)是已知的s元函数. 例如, 以后将要多次提到的如下的模型:x t =α1I(x t-1<0)x t-1+α2I(x t-1≥0)x t-1+εt ,t=1,2,… (2.12)其中I(.)是示性函数. 此模型是分段线性的, 是著名的TAR 模型的特殊情况. 为了有助于理解它, 我们写出它的分段形式:x t =.0,0,,111211≥<⎩⎨⎧++--t t t t x x x x εαεα t=1,2,…请注意, (2.8)(2.10)和(2.11)式具有一个共同的特征, 就是未知参数都以线性形式出现在模型中. 这一特点在统计建模时带来极大的方便. 此类模型便于实际应用. 但是, 对于{x t }而言不具有线性特性, 所以, 讨论它们的平稳解的问题, 讨论它们的建模理论依据问题,都需要借助于马尔可夫链的工具.已知非线性自回归函数的模型:x t =(x t-1,x t-2,…,x t-p ;)+t ,t=1,2,… (2.13)其中(…)是p 元已知函数, 但是其中含有未知参数=(1,2,…,p ).一般说来, 在一定范围内取值.例如,x t =tt t x x εαα++--212111, t=1,2,… 其中=(1,2)是未知参数, 它们的取值范围是: -<<, 0<.这里需要指出, 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦, 二是确定(…)函数的麻烦. 一般来说, 只有根据应用背景能确定(…)函数时, 才会考虑使用此类模型.广义线性模型(神经网络模型):x t=(1x t-1+2x t-2+…+p x t-p)+t,t=1,2,…(2.14)其中(.)是一元已知或未知函数, 参数=(1,2,…,p)总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对作些约定, 其一, ||||=1, 其二, =(,,…,p)中第一个非零分量为正的. 不难2理解, 若不加这两条约定, 模型(2.14)不能被唯一确定.当(.)是一元已知函数时, 与神经网络模型相通.当(.)是一元未知函数时, 与回归模型中的PP方法相通.除了以上两类模型外, 还有(2.1)式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难. 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题, 对这类模型不再仔细讨论.。
计量经济学第九章 时间序列结构模型课件
计量经济学第九章时间序列结构模型课件第九章结构型时间序列模型时间序列回归模型分类:1.不含外生变量的非结构型模型,包括单方程模型(如ARMA模型)和多方程模型(如向量自回归模型,VAR)2.传统的结构模型,包括含有外生变量的单方程回归模型(如确定性趋势或季节模型、静态模型、分布滞后模型、自回归分布滞后模型等)和联立方程模型1 / 62计量经济学第九章时间序列结构模型课件3.协整和误差修正模型等现代时间序列模型第二、三类模型反统称为结构型时间序列模型。
本章将对最基本的几种结构型时间序列模型进行简要介绍。
第一节确定性趋势及季节模型确定性趋势及季节模型将经济变量看作是时间的某种函数,用于描述时间序列观测值的长期趋势特征和周期性变动特征。
其中的自变量2 / 62计量经济学第九章时间序列结构模型课件是确定性的时间变量t或反映季节的虚拟变量。
由于自变量是非随机变量,自然是严格外生的,所以不涉及诸如非平稳性、高度持久等问题,一般可以如同横截面数据一样,直接使用经典线性模型的回归分析方法。
一、确定性趋势模型(一)种类按照因变量y及时间t的关系不同,常用的确定性趋势模型主要有3 / 62计量经济学第九章 时间序列结构模型课件4 / 62以下三类:1. 线性趋势模型01t t y t u ββ=++ (9.1)当时间序列的逐期增长量(即一阶一次差分1t t t y y y -∆=-)大体相同时,可以考虑拟合直线趋势方程。
2. 曲线趋势模型2012k t k t y t t t u ββββ=+++⋅⋅⋅++ (9.2)计量经济学第九章 时间序列结构模型课件5 / 62若逐期增长量的逐期增长量(二阶一次差分21t t t y y y -∆=∆-∆)大致相同,可拟合二次曲线2012t t y t t u βββ=+++。
类似地,如果事物发展趋势有两个拐点,可以拟合三次曲线230123t t y t t t u ββββ=++++。
非线性时间序列分析及其应用
抄完温师兄的笔记,觉得蛮过瘾;于是继续抄抄抄...这两天终于抄累了,决定不再抄了.已经整理成电子版的,尽量发文发上来,就此作罢;天知道怎么会抄e版笔记也会抄上瘾?看来真有点控制不住自己,就跟小时候逃课去打街机一个德性...再不抄了,就此作罢.非线性时间序列的例子1.Logistic模型x n+1=Rx n(1-x n)R=1.5时,不管初始状态x0在何处,随时间的演化,系统都将单调地趋向于1/3,R=2.9时,不管初始状态x0在何处,随时间的演化,系统都将交替地趋向于19/29,Logistic模型R=3.3时, 不管初始状态x0在何处,随时间的演化,系统都将在0.48和0.82两个状态之间周期性地变化,R=4时,随时间的演化,系统将出现不规则的振荡,看起来好像是随机的-- ->表明系统对初值具有非常敏感的依赖性,也说明这样的系统只能进行短期预测,要进行较长时间的预测会变得不正确.2.弹簧振子受迫振动3.Lorenz系统dx/dt=sigma (y-z)dy/dt=x(r-z)-ydz/dt=xy-bz取sigma=10,r=28,b=8/3时,系统是混沌的.4.实际问题中的实测时间序列股票指数时间序列太阳黑子数时间序列Chapter 2:单变量非线性时间序列分析例2.1 Henon映射:x n+1=1-1.4x n2+y ny n+1=0.3x n该系统实际上只与状态变量x n的前两个时刻的状态有关.相空间重构的基本原理是F.Takens和R.Mane的延迟嵌入定量,它建立了观测信号系统时间波动和动力系统特征之间的桥梁.基本思想:通过观测或实验获得单变量时间序列{x n},做以下相空间重构:x n=(x n,x n-tao,…,x n-(m-1)*tao)从而形成m维状态空间,在重构的m维状态空间中可以建立数学模型:x n+1=G(x n)F.Takens和R.Mane证明了只要适当选取m和tao,原未知数学模型的混沌动力系统的几何特征与重构的m维状态空间的几何特征是等价的,它们具有相同的拓扑结构,这意味着原未知数学模型的混沌动力系统中的任何微分或拓扑不变量可以在重构的状态空间中计算,并且可以通过在重构的m维状态空间中建立数学模型对原未知数学模型的动力系统进行预测,进一步解释/分析/指导原未知数学模型的动力系统.相空间重构设动力系统是由非线性差分方程:z n+1=F(z n)表示的离散系统,或者是由微分方程d z(t)/dt = F(z(t))表示的连续系统,其中z n或z(t)是系统在时刻n或t的状态向量,F(.)是向量值函数.时间序列{x n}是观测到的系统某一维输出,即:x n=h(z n)+w n,或:x n=x(t0+nΔt)=h*z(t0+nΔt)++w n,式中,h(.)是多元数量值函数;w n为在观测或者测量过程中由于技术手段不完善或者精度不够引起的测量噪声.根据F.Takens的定理,当w n=0时,观察到的时间序列{x n}以向量:x n=(x n,x n-tao,…,x n-(m-1)*tao)形成m维空间,只要m>=2d+1,动力系统的几何结构可以完全打开,其中d是系统中吸引子的维数,tao是正整数,称为延迟时间间隔.条件m>=2d+1是动力系统重构的充分但不必要条件,获得动力系统重构的整数m叫做嵌入维数.状态空间中x n- ->x n+1的演化反映了未知动力系统z n- ->z n+1或z(t)- ->z(t+1)的演化,并且状态空间R m中吸引子的几何特征与原动力系统的几何特征等价,这意味着原动力系统中任何微分或拓扑不变量可以重构的状态空间中计算.F.Takens 的定理是在无噪声的情况下考虑的,w n=0,后来T.Sauer等把延迟嵌入定理推广到了具有噪声的情形.对一组长为N的实测时间序列{x n}n=1N,由x n=(x n,x n-tao,…,x n-(m-1)*tao)可构造出m维状态向量:x n=(x n,x n-tao,…,x n-(m-1)*tao) in R m, n=N0,N0+1,…,N其中N0=(m-1)*tao+1,tao是延迟时间间隔.在R m中在L2或L infinity范数定义x i到x j的距离.为了能在重构的R m空间中刻画原动力系统的性质,需正确地确定延迟时间间隔tao和嵌入维数m.延迟时间间隔的确定由延迟嵌入定理可知,在时间序列无限长,无噪声,无限精确的情况相,可以任意选择tao,但实测时间序列是有限长的,且一般都有噪声污染和测量误差,只能根据经验来选择tao.选择tao 的基本思想是使x n与x n+tao具有某种程度的独立但又不完全相关,以便它们能在重构的相空间中作为独立的坐标处理.如果tao太大,则x n与x n+tao的值充分靠近,以至于不能区分它们,从实际观点看不能提供两个独立的坐标,导致吸引子重构非常靠近相空间中的”对角线”,重构的相空间可能总是杂乱无规则的;如果tao太大, x n与x n+tao可能会不相关,吸引子轨道会投影在两个完全不相关的方向上,不能反映相空间中轨线的真实演化规则.鉴于此,需要选择一个比较合适的延迟时间间隔tao.目前,可以使用的方法有很多,但从计算复杂性和使用的简便性等角度看,比较常用的方法主要有自相关函数法和平均互信息法.1.自相关函数法基本思想是要考察观测量x n与x n+tao与平均观测量的差之间的线性相关性,即如果假设:x n+tao– x-bar = C L(tao) (x n– x-bar)其中:x-bar=1/N Σn=1N x n (算术平均),则使:Σn=1N [x n+tao– x-bar - C L(tao) (x n– x-bar)]2,最小的C L(tao)为:C L(tao)=A/B;A=1/N Σn=1N (x n+tao– x-bar)(x n– x-bar)B=1/N Σn=1N (x n– x-bar)2;称这样的C L(tao)为线性自相关函数.取C L(tao)第一次为零时的tao为延迟时间间隔,此时在平均意义下, x n与x n+tao是线性无关的.自相关函数法是比较简单的寻找时间延迟tao的一种方法,但这种方法只考虑到时间序列中线性关系,至于非线性关系并不清楚,所以并不适合所有情况.特别当自相关函数变化十分缓慢时,选择会非常困难.2.平均互信息法不同于自相关函数法,平均互信息法将非线性关系也考虑在内,这种方法的根据是可从事件b j 在B中发生的概率中得到关于a j在集A中发生概率的信息.I(tao)= 1/N Σn=1N P(x n, x n+tao) log2 [P(x n, x n+tao)/(p(x n)p(x n+tao))]式中,P(x n),P(x n+tao),P(x n,x n+tao)为概率.概率P(x n),P(x n+tao)可以通过计算时间序列的直方图获得,联合概率P(x n,x n+tao)可以通过计算时间序列的二维直方图获得,利用计算机可以很方便地计算观测时间序列的平均互信息.文献[5]建议选择I(tao)的第一个局部最小时的tao为延迟时间间隔,因为此时产生的冗余最小,产生了最大的独立性.与自相关函数法相比,平均互信息法考虑了非线性依赖性,但仍有其局限性,如有时可能无局部最小或对某些例子特别不合适.除此之外,选择tao的方法还有重构展开法,高阶关联法,通过分析整体和局部混沌吸引子行为获得优化延迟时间的填充因子法等多种方法,这些方法都有各自的特点,但实际应用中用得较多的还是自相关函数法和平均互信息法.嵌入维数的确定已从理论上证明m>=2d+1时可获得一个吸引子的嵌入,其中d是吸引子的分形维数,但这只是一个充分条件,对观测时间序列选择m没有帮助.如果仅仅是计算关联维数,已证明了对无噪声,无限长的时间序列,只要取m为大于关联维数d的最小整数即可,但对长度有限且具噪声的时间序列,m要比d大得多.如果m选得太小,则吸引子可能折叠以致在某些地方自相交,这样在相交区域的一个小领域内可能会饮食来自吸引子不同部分的点;如果m选得太大,理论上是可以的,但在实际应用中,随着m的增加会大大增加吸引子几何不变量(如关联维数,Lyapunov指数)的计算工作量,且噪声和舍入误差的影响会大大增加.1.试算法通过逐步增加计算过程中的嵌入维数,观察什么时候某些几何不变量(例如,关联积分/关联维数/Lyapunov指数等)停止变化的方法.从理论上来讲,由于这些几何不变量是吸引子的几何性质,当m大于最小嵌入维数时,几何结构被完全打开,因此这些不变量与嵌入维数无关,取吸引子的几何不变量停止变化时的m为最小维数.这种方法的缺点是对数据要求较高(无噪声),计算量大且比较主观.例如,P.Grassberger通过增加嵌入维数m,计算关联积分C N(r,m,tao),取当关联积分C N(r,m,tao)不再变化时的m为嵌入维数.2.虚假邻点法虚假邻点法建立在以下事实的基础上:选择太小的嵌入维数将导致那些在原相空间中离得比较远的点会在重构的相空间中靠近.其基本思想是当嵌入维数从m变化到m+1时,考察轨线x n邻点中哪些是真实的邻点,哪些是虚假的邻点,当没有虚假邻点时,可以认为几何结构被完全打开.设x n的最近邻点为x yita(n),当嵌入维数从m增加到m+1时,它们之间的距离从d(m)变为d(m+1),若d(m+1)比d(m)大很多,可以为是由于高维吸引子中两个不相邻的点在投影到低维轨线上时变成相邻的两点造成的,因此这样的邻点是虚假的.阈值R tol.观测时间序列通常具有噪声且长度有限,所以仅仅用上面的标准判别虚假最近邻点会不正确,为此M.B.Kennel等提出了增加以下标准,阈值A tol.让m从1开始增加,计算每个m时的虚假最近邻点的比例,直到虚假最近邻点的比例小于5%或虚假最近邻点不再随着m的增加而减少时,可以认为吸引子几何结构完全打开(???????是为何意???????),此时的m为嵌入维数.从几何的观点来看,这是一种较好的方法,但在判断虚假邻点时阈值的不同选取会导致不同的结果,因此具有较大的主观性.阈值应当由时间序列的方差确定,因此,不同的时间序列有不同有阈值,这意味洋着要给出一个合适和合理的阈值是非常困难的甚至是完全不可能的.3.改进的虚假邻点法,文献[15]类似虚假最近邻点法的思想,定义:a(n,m) = d(m+1)infinity / d(m)infinity, 采用L infinity范数记所有a(n,m)关于n的均值值为:E(m)=1/(N-N0+1) Σn=N0N a(n,m),式子x n=(x n,x n-tao,…,x n-(m-1)*tao) in R m, n=N0,N0+1,…,N 是向后重构,而文献[15]是向前重构,所以有所不同,但本质上是一样的.E(m)只依赖于嵌入维数m和延迟时间间隔tao,为了研究嵌入维数从m变为m+1时相空间的变化情况,定义:E1(m)=E(m+1)/E(m),如果当m大于某个m0时,E1(m)停止变化,则m0+1就是重构相空间的最小嵌入维数.对来自于随机系统的时间序列,原则上,随着m的增加,E1(m)将永远不会达到饱和值,但在实际计算中,当m充分大时,很难分辨E1(m)是在缓慢增加还是停止变化.事实上,由于获得的观测时间序列是有限长的,可能会出现虽然是随机时间序列,但E1(m)会在某一m处停止变化.为了解决这一问题,文献[15]定义了量E*(m):记E2(m)= E*(m+1)/E*(m),对随机时间序列,由于将来的值与过去的值独立,对任何m,E2(m)将等于1,而对确定性系统的观测时间序列,E2(m)显示与m有关,不可能为常数.因此,文献[15]建议可以通过同时计算E1(m)与E2(m)来确定时间序列相空间重构的最小嵌入维数,同时也区分了时间序列是来自于确定性系统还是随机系统.除上述方法外,确定嵌入维数的方法还有关联积分法,奇异值分解以及上述各种的改进方法.2.3几何不变量的计算分形维数的定义有很多种,从时间序列的角度看,关联维数是易于计算的一种分形维数(G-P算法以及Kolmogorov熵公式) .关联维数是系统复杂性程度的一种很好的度量.一般认为,大于关联维数的下一个整数是刻画系统所需的独立变量的个数,这为从时间序列恢复原复杂系统确定了一个框架.Lyapunov指数(轨线法)度量了复杂系统的预测性,定量地刻画了初始靠近的状态空间轨线的指数发散.在确定性系统中,关联维数就是生成相应复杂系统所必需的独立变量的个数,规则的确定性系统有整数关联维数,而混沌系统有非整数关联维数,大于此关联维数的下一个整数就是系统的独立变量的个数.但是某些关联的随机过程中也有非整数维数[24].文献[25]证明了非整数关联维数不能成为混沌判断的充分条件,因为分形的Browian运动,虽然不是混沌的,但也有非整数关联维数.关联维数G-P算法:(经典方法)关联积分:C N(r,τ,m)如果在r的某一区间段内,有C N(r,τ,m)∝r d,则称d是关联维数,这样定义的d就是近似刻产生时间序列的复杂系统复杂程度的某种维数.d就是双对数图ln C N(r,τ,m) – ln r图的线性部分的分辨率,由于连续采样点之间的相关性,会造成”肩峰”效应,为了消除这种效应,文献[27]对关联积分作了修改,忽略了嵌入空间中非常靠近的点对关联积分的贡献,只考虑满足|i-j|≥w的点,其中w>τ(2/N)2/m,特别取w=τ即可.实际应用中,关联维数的计算是非常耗费时间的,为了改善前面算法的计算效率,文献[35]提出了一种修改算法.在关联积分中,较短的距离起着更有意义的作用,因此选取r的截断距离r0,这样可以把计算时间从O(N2)减到O(Nlog2N).当关联维数的值较大时,所需的时间序列要求较长,而实际问题中,观测或实验获得的时间序列一般都比较短,为解决这一问题,文献[30]利用极大似然法估计关联维数的方法就有对数据要求相对较少的优点,这一方法的关键在于r0的选取,较小时,可计算的点减少,则估计变得不可靠;较大时,虽然可以产生较稳定的结果,但由于C(r)=(r/r0)d, (0<r≤r0)的距离分布方差使结果产生较大的偏差,文献[30]详细给出了利用χ2测试确定r0的一种方法.Kolmogorov熵K1和Renyi熵K q显然有:lim q->∞K q=K1K q是关于q单调减少的,特别q=2时,就是关联积分,因此可由关联积分计算K2.它可以作为K1的一个下界.Lyapunov指数混沌系统的基本特点就是系统对初始值的极端敏感性,两个相差无几的初值所产生的轨迹,随着时间的推移按指数方式分离,lyapunov指数就是定量的描述这一现象的.如果最大Lyapunov指数是正的,意味着相邻的轨线按指数发散,即系统是混沌的.对观测获得的混沌时间序列,最大Lyapunov指数可由A.Wolf等提出的轨线法计算[20],而[41,42]diverge参考资料:/2007/03/wolflyapunov.html/wiki/Lyapunov_exponent/LyapunovCharacteristicExponent.html2.4 观测时间序列平稳性的检验“弱平稳性”的概念2.5基于观测时间序列的系统非线性性检验2.6基于观测时间序列的系统确定性检验2.7观测时间序列噪声处理技术Chapter 3: 基于观测时间序列的系统非线性性检验Chapter 4: 多变量时间序列相空间重构Chapter 5: 多变量非线性时间序列预测方法Chapter 6: 非线性时间序列分析法在证券市场中的应用……。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数, t是白噪声序列,模型记为
FCAR(p),p为模型的阶数。
返回
上海财经大学统计学系
11
§9.2 条件异方差模型
• ARCH模型 • GARCH 模型 • 模型推广形式
上海财经大学统计学系
12
ARCH模型的定义
ARCH(q)模型定义如下:
yt xt t
t 1, 2,L ,T
若随机过程t的 t2平方服从AR(q) 过程,即
(1984)讨论了这个模型的一些性质和应用,Liu 和Brockwell(1988)推广到一般的双线性模型
• 双线性模型形式
p
q
QP
xt j xt j ktk
il xtlti
j 1
k 0
i1 l 1
其中p,q,Q和P是非负整数, t 是白噪声序列。
上海财经大学统计学系
返回 8
非参数时间序列模型
T t 1
et2
2 0
1
zt0
(ˆ
)
• 在 H0 成立时,统计量 有2(q)极限分布。
上海财经大学统计学系
16
ARCH模型的特点
•
模型中将条件方差
2 t
表达成过去扰动项的回归函数形式,形式恰能
反映金融市场波动集聚性特点,即较大幅度的波动后面紧接着较大
幅度波动,较小幅度的波动后面紧接着较小幅度的波动。
其中c为常数,fi( i 1,L , p ) 为p个一元非参数
型的未知函数,t 是白噪声序列,模型记
为ANLAR(p),p为模型的阶数。
上海财经大学统计学系
10
函数系数自回归模型
函数系数自回归模型为
xt c f1 xtd xt1 L f p xtd xtp t
其中c为常数,fi( i 1,L , p )为p个一元非参数 型的未知函数,0 d p为整数,称为滞后参
t2
0
1 t21
2
2 t 2
L
qt2q t
其中t独立同分布,且有E(t ) 0 , ; D(t ) 2 0 0,i 0
(i 1,2,L , q ),则称 t服从q阶的ARCH过程,记作
t : ARCH(q)。
上海财经大学统计学系
13
•
定理9.1
对于ARCH(1)模型,E
(
2 t
r
)
存在的
• 拟线性自回归模型 • 指数自回归模型 • 双线性模型
上海财经大学统计学系
3
SETAR (Self-exciting threshold
autoregressive model)模型
当分割为Rj
x1 ,K
,xp
: rj
xd
rj1 , j
1,K
,l
其中 l d p
为某个整数,称此模型为Self-exciting Threshold
• yt xt t , t 1,2, ,T 的对数似然函数为
•
对数似然函数关于参数的一阶偏导数为 L()
T
log
t 1
f ( yt
xtLeabharlann , Yt 1;)T 2
log(2
)
T t 1
lt
(
)
lt ( )
L( )
T
lt
(
)
t1 lt ( )
•
参数向量 的解。
的极大似然估计
ˆ
为方程
L( )
0
上海财经大学统计学系
15
ARCH模型的假设检验
• 原假设和备择假设分别为
H0 :1 2 ... q 0 H1 : i 0
• 检验统计量为
T
(
L(ˆ)
)Iˆ1
(
L(ˆ)
)
1 2
T t 1
et202
1
zt0
(ˆ
)
T t 1
zt0 (ˆ)zt0 (ˆ)1
4
考虑一个简单的 SETAR2;1,1 模型
xt
0-0.7.7xxt t 21
t , t ,
xt1 r xt1 r
t : N( 0,0.52 )
r分别取,1,0.5,0四个数值,我们对每个模
型分别产生样本长度是500的序列。当 r
时,TAR模型退化成线性AR(1)过程。其他三种情 况,显示了明显的非线性特征。
• 非参数自回归模型的一般形式为
xt xt1 ,K ,xtp t
(9.22)
其中 是R p到 R1的可测函数,t是白噪声序
列。模型(9.22)有如下两种特殊形式。
• (1)可加非线性自回归模型
(2)函数系数自回归模型
上海财经大学统计学系
9
可加非线性自回归模型
可加非线性自回归模型为
xt c f1 xt1 L f p xtp t
非线性时间序列模型
• 一般非线性时间序列模型介绍 • 条件异方差模型
上海财经大学统计学系
1
§9.1 一般非线性时间序列模型 介绍
• 参数非线性时间序列模型 • 非参数时间序列模型
上海财经大学统计学系
2
参数非线性时间序列模型
• SETAR (Self-exciting threshold autoregressive model)模型
• ARCH模型的随机误差项 t 服从宽尾的无条件分布,这恰好能描述
上海财经大学统计学系
5
拟线性自回归模型
拟线性自回归模型为
xt 0 1 f1 xt1 ,K ,xtp L s fs xt1 ,K ,xtp t
其中 fi (i 1, , s) 是s个已知的 R p 到 R1 的
可测函数,t是白噪声序列,i (i 1, , s)。
上海财经大学统计学系
6
指数自回归模型
指数自回归模型为
p
xt 00
e x xt21
0k
1k
tk
t
k 1
(9.17)
其中t 是白噪声序列,00,0k ,1k (k 1, , p) 和 0
为未知参数,正整数 p 为模型的阶数,模型(9.17)
记为EAR(p)。
上海财经大学统计学系
7
双线性模型
• 双线性模型由Granger和Anderson(1978)提出, 并得到进一步研究和发展,Subba Rao和Gabr
充要条件是 r
1r (2 j 1) 1 j 1
• 定理9.2 ARCH(q)二阶平稳的充要条件是
相应的特征方程的所有根都大于1,此时平
稳序列 t 的无条件方差为
E(t2 ) 0
q
1 j
j1
上海财经大学统计学系
14
T
L( ) log f ( yt xt ,Yt1; ) t 1
ARCH模型的极大似然估计
Autoregressive Model,其形式为
l pj
xt
jk xtk I rj xtd rj1 t
(9.6)
其中 r1
r j1 k1
2
rl
rl1
整数d称为滞后参数,r2 , , rl 称为门限参数,
模型(9.6)记为SETARl; p1, , pl 模型
上海财经大学统计学系