第一章_时间序列分析简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2016/2/29
10
1.3 时间序列分析方法
描述性时序分析
统计时序分析
2016/2/29
11
描述性时序分析
基本思路: 通过直观的数据比较或绘图观测,寻 找序列中蕴含的发展规律。
特点: 具有操作简单、直观有效的特点,通 常是进行统计时序分析的第一步。
2016/2/29
12
描述性时序分析典型案例
简记为 { X t , t T }或{ X t }
观察值序列: 随机序列的n个有序观察值, 称为序列长度为n的观察值序列
x1 , x2 ,, xn或{ xt , t 1,2,...,n}
2016/2/29
9ቤተ መጻሕፍቲ ባይዱ
随机序列和观察值序列的关系
观察值序列是随机序列的一个实现。 时间序列分析目的是通过观察值序列揭 示随机序列的性质。 时间序列分析手段都是通过观察值序列 的性质进行推断。
描述性时序分析
早期时序分析,主要依赖于对数据的直观比 较或者是简单的绘图观测.随着研究领域的 逐渐拓宽和研究问题的复杂化,这种单纯的 描述性分析不能满足需要,概率理论中随机 变量的发展以及统计数学中一些结论和方法 的提出,使研究重心从对表面现象的总结逐 渐转移到分析随机序列内在本质的相关关系 上,从而开辟了统计时序分析的时代。
二、时域分析方法(重点)
原理
事件的发展通常都具有一定的惯性,即序列值 之间存在着一定的相关关系,这种相关关系通常具 有某种统计规律。
目的
确定序列在不同时刻取值的相互依赖关系,即 找出序列值之间相关关系的统计规律,并拟合出适 当的数学模型来描述这种规律,进而利用这个拟合 模型预测序列未来的趋势。
一、频域(频谱)分析方法
随着概率和统计技术这些外围理论的发展,以及对 估计和预测精度需求的提高,周期图方法进一步得 到发展,但其周期不稳定的缺陷也逐渐暴露; 1945年肯德尔提出,周期图可能会导致一些错误性 的后果,这一观点后来被英国统计学家巴特利特从 理论上证实,并指出,抽样结果会歪曲时间序列的 周期图。 这些问题的出现再次引发人们对频域方法的研究兴 趣。
章节安排
第一章 时间序列分析简介
第二章 时间序列的预处理 第三章 平稳时间序列分析 第四章 非平稳序列的确定性分析 第五章 非平稳序列的随机分析
第六章 多元时间序列分析
2016/2/29
1
第一章 时间序列分析简介
2016/2/29
2
本章内容
引言 时间序列的定义 时间序列分析方法简介 时间序列分析软件
一、频域(频谱)分析方法
原理 一个时间序列都可以分解成若干不同频率的 周期波动,即可看成各种周期扰动的叠加。 频域分析就是确定各周期的振动能量的分配 (称为“谱”或“功率谱”) ,所以也叫谱分析。 发展过程
早期的频域分析借助富里埃分析从频率角度揭示时间序列 规律 ; 后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个 函数; 20世纪60年代,引入最大熵谱估计理论,进入现代谱分析 阶段 。
尤尔的出发点是“根据时间序列数据, 统计学家为什么经常会得到一些奇怪的 相关?”,他否定了变量是时间的函数 ,而认为变量不是与时间相关,时间也 不是因果因素.以此为基础, 1927 年, 在研究沃尔夫太阳黑子数、探讨受扰动 序 列 的 周 期 时, Yule 首 创 AR(2) 模型和 AR(4)模型。1931年,沃克推广到AR(S).
基本概念推动着统计性时序分析的初步发展
17世纪,当帕斯卡和费马等学者以机会游戏 为基础讨论稳定的概率比率时,欧洲的商人 没有借鉴这些自然哲学家的数学方法,而是 借助不同的定量推理,计算自己在市场变化 中的利益得失。他们利用商人的独特方法分 析市场波动情形,无意中为商业实践转入统 计性时序分析奠定了基础。
统计时序分析
利用数理统计原理研究分析时间序 列的方法,即一般所说的时间序列分析。 分两大类: 频域分析方法
时域分析方法
2016/2/29
20
一、频域(频谱)分析方法
时间序列分析旨在从系统模式或行为中分离随机白 噪声,通过分析数据,最终发现序列的真实过程或 现象特征,如平稳性水平、季节性长度、振幅、频 率和相位等,其中,振幅、频率和相位属于时间序 列的频域性质,对他们的研究常称为频域分析或谱 分析。
2016/2/29
6
3、循环波动:是时间序列呈现出的非固定长 度的周期性变动。循环波动的周期可能会持续 一段时间,但与长期趋势不同,它不是朝着单 一方向的持续变动,而是涨落相同的交替波动。 4、不规则波动:是时间序列中除去趋势、季 节变动和周期波动之后的随机波动。不规则波 动通常总是夹杂在时间序列中。
2016/2/29
4
时间序列的含义
按照时间顺序把随机事件变化过程量化 记录下来的一列有序数据,构成一个时 间序列。
对时间序列进行观察、研究,找出变化 发展的规律,预测它将来的趋势就是时 间序列分析。
5
2016/2/29
时间序列的组成因素:
(长期趋势,季节变动,循环波动,不规则波动)
1、长期趋势:是时间序列在长时期内呈现出 来的持续向上或持续向下的变动。 2、季节变动:是时间序列在一年内重复出现 的周期性波动。如气候条件、生产条件、节假 日或人们的风俗习惯等各种因素影响的结果。
商业贸易活动中的日常变化可被抽象到人类自然规 律中,是差分方法从金融领域到政治领域的过渡。 统计学家有意识地利用上述技术进行科学调查,逐 步把这些工具用于截痕数据或随机试验,使得这些 概念进入到科学计算和现代数学的领域。 光滑过程把波动转变为振荡和偏差,由此产生了序 列相关、趋势和分解等重要思想.差分成为消除趋 势、产生平稳时间序列的基本技术,消除了趋势项 影响后的序列更适宜于用统计工具处理。
Box—Jenkins模型实际上主要是运用于单变量、 同方差场合的线性模型 ,存在局限性。
2016/2/29
34
ARIMA(博克斯&詹金斯)
1970年,博克斯和詹金斯出版了关于时 间序列的奠基性著作《时间序列分析: 预测与控制》讨论了非平稳自回归移动 平均ARIMA模型,以及整套的建模、估 计、检验和控制方法,时间序列的理论 和实践得到了飞速发展,在现代社会中 的应用也日益广泛.
德国业余天文学家施瓦尔发现太阳黑子的活动具有11年左右的周期
2016/2/29
13
描述性时序分析
英国学者格朗特分析了持续二十余年的时 间序列数据,对伦敦教会自1604年起每周 一次发表的死亡公报中的数据进行整理, 所提出的创新思想“统计比率对于时间和 空间的稳定性”,正是19世纪商业实践 应用于平稳时间序列的理论基础和铺垫知 识,是平稳时间序列产生的背景。 ……
特点
理论基础扎实,操作步骤规范,分析结果易于解释, 是时间序列分析的主流方法。
27
2016/2/29
时域分析方法的分析步骤
考察观察值序列的特征; 根据序列的特征选择适当的拟合模型;
根据序列的观察数据确定模型口径(参数);
检验进而优化模型;
利用模型来推断序列其它的统计性质或预测序
列将来的发展 。
最初,这些概念只是金融家进行贸易猜测、欺骗大 众和掩盖真相的工具。
如为应对议会调查其暂缓现金支付的行为, 银行试图在掩盖真实数值的基础上,揭示变 化模式的数据处理,最终导致了1797年指数 换算序列和1832年滑动平均序列的首次公开 ;一阶差分首先被商人和金融家用来观察价 格和数量的重大变化。
基本概念推动着统计性时序分析的初步发展
MA(斯卢茨基)
斯卢茨基等俄罗斯概率理论家感兴趣于 时间序列随机成分的性质,在把随机成 分看作观察误差转变到视为扰动。
ARMA(沃尔德)
1938年,瑞典著名的计量经济学家和统计学家 沃尔德以离散平稳随机过程为研究对象,并严 格证明了离散平稳过程由隐周期和线性回归组 成,其中,隐周期是确定性成分,线性回归部 分由滑动平均和自回归过程组成,属于随机扰 动的非确定性成分. 任何平稳序列,其确定性成分被消去后,可减 少到随机扰动的线性组合,这一著名的时间序 列分解思路是ARMA模型拟合平稳序列的理论 基础.
2016/2/29
7
时间序列的应用
从经济到工程技术,从医学到生物,从天文、
地理到气象,几乎在各种领域中都会遇到时间
序列。
例如:沪市日收盘指数、月交通事故死亡人数、 某地月平均气温及降雨量等等。
2016/2/29
8
1.2 时间序列的定义
随机序列: 按时间顺序排列的一组随机变 量 , X 1 , X 2 ,, X t ,
一、频域(频谱)分析方法
1906年,德国学者舒斯特创建周期图模型,考察了 1750~1900年太阳黑子序列的周期,而且把150年 间隔平均分成两阶段逐个调查,成功地解决了太阳 黑子的周期问题:太阳黑子不仅有众所周知的11年 周期,也存在其他的确定周期如4.78、8.38年,3个 周期11.125、8.38和4.78年不仅都是周期33.375年 的子周期,而且前2个周期频率的和与第3个周期的 频率相一致.此后,周期图方法成为调查各类自然 现象周期问题的基本工具,引领着时间序列频域分 析的发展。
2016/2/29
28
时域分析方法的发展过程
基础阶段 核心阶段 完善阶段
2016/2/29
29
基础阶段
G.U.Yule
1927年,AR(自回归)模型 1931年,MA(平均)模型 ARMA(自回归移动平均)模型
G.T.Walker
2016/2/29
30
AR(尤尔&沃克)
特点
非常有用的动态数据分析方法,但是由于分析方法复杂, 结果抽象,有一定的使用局限性,在这了解即可。
25
2016/2/29
二、时域分析方法(重点)
1877年,生物学家高尔顿在研究甜豌豆亲、子代种 子间的关系时,首次提出了回归与相关系数的概念 ,此后,高尔顿、埃奇沃思和皮尔逊继续深入探讨 样本相关系数,创造了相关面和回归折线定量推断 优生学问题,但当统计学家把这些技术应用到时间 序列数据时,暴露的问题引发了对时间相关性的讨 论. 英国统计学家尤尔正是出于对时间相关问题的困惑 ,最终创立了平稳线性自回归模型,开辟了时间序 列时域分析的现代发展。
一、频域(频谱)分析方法
时间序列的频域发展首先源于1807年法国数学家傅 里叶宣称“任何级数可用正、余弦项之和逼近”的 思想,随着傅里叶理论的发展,任何时间序列也被 展开成无限逼近于该序列的正、余弦项之和。但是 ,存在一个最大的困难在于傅里叶级数不能容忍白 噪声的存在,这是一个很大的缺憾,因为没有白噪 声的序列几乎不存在,傅里叶级数用于预测的希望 被埋没。
基本概念推动着统计性时序分析的初步发展 19世纪的数学家正是在欣赏并应用上述金融 算术的过程中,逐步开始讨论对时间现象的 建模问题。由此产生了一些重要的概念。 这些基本概念都经历了从金融算术到政治算 术,最后进入科学算术阶段及现代化数学领 域的发展过程.
基本概念推动着统计性时序分析的初步发展
核心阶段
G.E.P.Box和 G.M.Jenkins
1970年,出版《Time Series Analysis Forecasting and Control》。 提出ARIMA(p,d,q)(差分自回归滑动平均 )模型 (Box—Jenkins 模型) --经典模型。
(其中p为自回归项数,q为滑动平均项数,d为使之成为平稳 序列所做的差分阶数)。
2016/2/29
3
1.1 引言
最早的时间序列分析可以追溯到7000年前的古 埃及。
天狼星:夜空里最亮的恒星,是大犬座中的一颗双星。 古埃及人把尼罗河涨落的情况逐天记录下来,就构 成所谓的时间序列。 双星中的亮子星是一颗比太阳亮 23倍的蓝白星,体积略大 尼罗河:尼罗河位于非洲东北部,流经布隆迪、卢旺达、 于太阳。 对这个时间序列长期的观察,发现尼罗河的涨落非 坦桑尼亚、乌干达、苏丹和埃及等国,跨越世界上面积最 在中国古代,看作恶星,象征侵扰,所以文人们写出 常有规律。 大的撒哈拉沙漠,最后注入地中海。全长 6650公里,为世 “会挽雕弓如满月,西北望,射天狼”的词句。 掌握了尼罗河泛滥的规律,使古埃及农业迅速发展, 界上最长的河流。(尼罗河 —阿拉伯语意为“大河) 而古埃及却崇拜天狼星,因为它与尼罗河的泛滥有着密 从而创建了埃及灿烂的史前文明。 切的联系。