数学建模时间序列分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

时间序列的组成部分
从例1可以看出,该时间序列可以有三
部分组成:趋势(trend)、季节(seasonal) 成分和无法用趋势和季节模式解释的随 机干扰(disturbance)。 例1数据的销售额就可以用这三个成分 叠加而成的模型来描述。一般的时间序 列还可能有循环或波动(Cyclic, or fluctuations)成分;循环模式和有规律 的季节模式不同,周期长短不一定固定。 比如经济危机周期,金融危机周期等等。
确定型过程即可以用关于时间t的函数描
述的过程。例如,真空中的自由落体运 动过程,电容器通过电阻的放电过程, 行星的运动过程等。 非确定型过程即不能用一个(或几个) 关于时间t的确定性函数描述的过程。换 句话说,对同一事物的变化过程独立、 重复地进行多次观测而得到的结果是不 相同的 。
例如,对河流水位的测量。其中每一时
际航空公司1949—1960年间客票月总数 (单位:千张)的时间序列曲线.直观上看, 每年有一次大的峰值和一次小的降值.并 且逐年不断增加。
一、时间序列的含义
例2,图2是我国铁路客流员的统计曲线,记录
了1971—1981年客票月总数.从铁路客流量的 时间序列曲线上可见,每年都有一次较大的峰 值,大约是在1、2月份,也就是每年的春节前 后有一次最大的峰值. 时间序列分析的任务就是根据以往的数据找出 变化规律,预报将来的客流量。
一、时间序列的含义
如表1中列出的是某地电风扇1994年到
1996年间各月的销售量(单位:万台), 按时间顺序排成一个数列,就是一个时 间序列。相对于时间的数据图如图1所示。
百度文库
电风扇月销售量数据图
300 250 200 150 100 50 0
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
第一节 时间序列分析的一般问题
一、时间序列的含义
从统计意义上讲,所谓时间序列就是将
某一个指标在不同时间上的不同数值, 按照时间的先后顺序排列而成的数列。 这种数列由于受到各种偶然因素的影响, 往往表现出某种随机性,彼此之间存在 着统计上的依赖关系。
一、时间序列的含义
例1、国际航线旅客客票数.图1给出某国
综上所述,时间序列具有如下特点:
序列中的数据或数据点的位置依赖于时间,即数
据的取值依赖于时间的变化,但不一定是时间t的 严格函数。
每一时刻上的取值或数据点的位置具有一定的随
机性,不可能完全准确地用历史值预测。
前后时刻(不一定是相邻时刻)的数值或数据点的位
置有一定的相关性,这种相关性就是系统的动态 规律性。
图1 某企业从1990年1月到2002年12月的销售数据图 (单位:百万元)
图1就是由该数据得到的一个时间序列
图。从这个点图可以看出。总的趋势 是增长的,但增长并不是单调上升的; 有涨有落。大体上看,这种升降不是 杂乱无章的,和季节或月份的周期有 关系。当然,除了增长的趋势和季节 影响之外,还有些无规律的随机因素 的作用。 这个只有一种随着时间变化的变量 (销售额)的序列一般称为纯粹时间 序列(pure time series)。
图3 例1的时间序列分解出来的纯趋势成分和纯季节 成分两条曲线。
S from SEA SO N, MO D_1 ES from SEA SO N, MO D_ Trend-cycle for SALE Seas factors for SAL
120
100
80
60
40
20
0
-20
Date
02 20 P 02 SE 20 1 N 00 JA Y 2 0 A 0 M 20 P 00 SE 20 9 N 99 JA Y 1 8 A 9 M 19 P 98 SE 19 7 N 99 JA Y 1 6 A 9 M 19 P 96 SE 19 5 N 99 JA Y 1 4 A 9 M 19 P 94 SE 19 3 N 99 JA Y 1 2 A 9 M 19 P 92 SE 19 1 N 99 JA Y 1 0 A 9 M 19 P 90 SE 19 N JA
120
100
80
60
40
20
0
-20
Date
02 20 P 02 SE 20 1 N 00 JA Y 2 0 A 0 M 20 P 00 SE 20 9 N 99 JA Y 1 8 A 9 M 19 P 98 SE 19 7 N 99 JA Y 1 6 A 9 M 19 P 96 SE 19 5 N 99 JA Y 1 4 A 9 M 19 4 P 9 SE 19 3 N 99 JA Y 1 2 A 9 M 19 P 92 SE 19 1 N 99 JA Y 1 0 A 9 M 19 P 90 SE 19 N JA

3.按序列的统计特性分有 平稳时间序列和非平稳时间序列两 类。
如果一个时间序列的概率分布与时间t无
关,则称该序列为严格的(狭义的)平稳 时间序列。如果序列的一、二阶矩存在, 而且对任意时刻t满足: (1)均值为常数 (2)协方差为时间间隔τ的函数 则称该序列为宽平稳时间序列,也叫 广义平稳时间序列,如图3所示。
前面例子中,我们所研究的只是某种商品
销售量这一数列,即为一元时间序列;但 是,如果我们所研究的对象不仅仅是这一 数列,而是多个变量,如是按年、月顺序 排列的气温、气压、雨量数据,每个时刻t 对应着多个变量,则这种序列为多元时间 序列。多元时间序列不仅描述了各个变量 的变化规律,而且还揭示了各变量间相互 依存关系的动态规律性。
时间序列分析是用随机过程理论和数理统计学
的方法,研究随机数据序列所遵从的统计规律, 以用于解决实际问题。

由于在大多数的问题中,随机数据都是依照 时间先后顺序排列的,故称为时间序列。它包 括一般统计分析,统计模型的建立与推断,以 及关于随机序列的最优预测、控制和滤波等。

时间序列分析在第二次世界大战前就已应用 于经济预测。二次大战中和战后,在军事科学、 空间科学、气象预报和工业自动化等部门的应 用更加广泛。近年来多维时间序列分析的研究 有所进展。
则可以轻而易举地得到该序列的趋势、 季节和误差成分。 下面的图2表示了去掉季节成分,只有 趋势和误差成分的序列的一条曲线。 图3用两条曲线分别描绘了纯趋势成分 和纯季节成分。图4用两条曲线分别描 绘了纯趋势成分和纯误差成分。这些 图直观地描述了对于带有几种成分的 时间序列的分解。
图2 去掉季节成分,只有趋势和误差成分的例1的时间序列
注意:
我们以后所研究的时间序列主要是宽平
稳时间序列。如果不明确提出严平稳, 所谓的平稳即指宽平稳。反之,不具有 平稳性即序列均值或协方差与时间有关 的序列称之为非平稳序列,如图1、图2 所示。 图3 列车运行数量平稳化后数据图
4.按序列的分布规律来分,有高斯型
(Gaussian)时间序列和非高斯型(non— Gaussian)时间序列。
时间序列分析
从统计学的内容来看,统计所研究和处理的是
一批有“实际背景”的数据,尽管数据的背景 和类型各不相同,但从数据的形成来看,无非 是横剖面数据和纵剖面数据两类(或者叫做静 态数据和动态数据)。 横剖面数据是由若干相关现象在某一时点上所 处的状态组成的,它反映一定时间、地点等客 观条件下诸相关现象之间存在的内在数值联系。 研究这种数据结构的统计方法是多元统计分析。 纵剖面数据是由某一现象或若干现象在不同时 刻上的状态所形成的数据,它反映的是现象以 及现象之间关系的发展变化规律性。研究这种 数据的统计方法就是时间序列分析。
一个时间序列可能有趋势、季节、循
环这三个成分中的某些或全部再加上 随机成分。 因此,如果要想对一个时间序列本身 进行较深入的研究,把序列的这些成 分分解出来、或者把它们过滤掉则会 有很大的帮助。 如果要进行预测,则最好把模型中的 与这些成分有关的参数估计出来。
对例1的时间序列通过软件进行分解,
2.按时间的连续性可将时间序列分为 离散时间序列和连续时间序列两种。
如果某一序列中的每一个序列值所对应
的时间参数为间断点,则该序列就是一 个离散时间序列; 如果某一序列中的每个序列值所对应的 时间参数为连续函数,则该序列就是一 个连续时间序列。 我们主要研究离散时间序列,并用Xt 表 示,对于连续时间序列,可通过等间隔 采样使之转化为离散时间序列后加以研 究。
服从高斯分布(正态分布)的时间序列叫
做高斯型时间序列,否则叫做非高斯 型时间序列。本书所介绍的模型多数 是假设服从高斯分布的高斯型时序模 型。对于一些非高斯序列,往往通过 适当变换,则可近似地看成是高斯型 时间序列。
四、随机过程、时间序列
为什么在研究时间序列之前先要介绍随
机过程?因为时间序列是由相应随机过 程产生的。我们从随机过程的理论来理 解和认识时间序列的一般规律。对时间 序列的认识才会更深刻。 自然界中事物变化的过程可以分成两类。 一类是确定型过程,一类是非确定型过 程。
从整体上看,时间序列往往呈现某种趋势性或出
现周期性变化的现象。
二、时间序列的分解
下面看一个时间序列的数据例子。我们
希望能够从这个数据找出一些规律,并 且建立可以对未来的销售额进行预测的 时间序列模型。 例1.某企业从1990年1月到2002年12月 的销售数据(单位:百万元)。该数据 有按照时间顺序的按月记录,共156个 观测值。数据如下。
刻的水位值都是一个随机变量。如果以 一年的水位纪录作为实验结果,便得到 一个水位关于时间的函数xt。这个水位函 数是预先不可确知的。只有通过测量才 能得到。而在每年中同一时刻的水位纪 录是不相同的。
随机过程:由随机变量组成的一个有序序列称
为随机过程,记为{x (s, t) , sS , tT }。其中S 表示样本空间,T表示序数集。对于每一个 t, tT, x (·t ) 是样本空间S中的一个随机变量。 , 对于每一个 s, sS , x (s, · 是随机过程在序数集 ) T中的一次实现。 随机过程简记为 {xt} 或 xt。随机过程也常简称 为过程。
31
33
¼ 1 µ ·É Ô Ï Ê Á Ê ¾ Í Í ç ç È Â ú Û ¿ ý Ý ¼
35
按时间次序排列的随机变量序列
X1,X2,…,Xi,…,XN (1.1) 称为时间序列。 如果用 x1,x2,…,xi,…,xN (1.2) 分别表示随机变量X1 ,X2 ,…,Xi ,…, XN 的观察值,则称(1.2)是时间序列 (1.1)的N个观测样本,这里N为观测样 本的个数。
图4 例1的时间序列分解出来的纯趋势成分和纯误差成分两 条曲线
S from SEA SON, MOD_1 Trend-cycle for SALE Error for SALES from SEA SON, MOD_1 A DD
三、时间序列的主要分类
1. 按所研究的对象的多少分,有一元
时间序列和多元时间序列。
材料裂纹长度与其承受的压力
时间序列是所研究系统的历史行为的客观记录,
因而它包含了系统结构特征及其运行规律。 时间序列分析是根据观察数据的特点为数据建 立尽可能合理的统计模型,然后利用模型的统 计特性去研究和认识系统的结构特征(如周期波 动的周期、振幅、趋势的种类等);揭示其运行 规律,进而用以预测、控制其未来行为;修正 和重新设计系统(如改变其周期、参数),使之 按照新的结构运行。 时间序列的一个目的是用变量过去的观测值来 预测同一变量的未来值。
从系统意义上看,时间序列就是某一系统
在不同时间(地点、条件等)的响应。这个 定义从系统运行的观点出发,不仅指出时 间序列是按一定顺序排列而成的;这里的 “一定顺序”既可以是时间顺序,也可以 是具有各种不同意义的物理量,如代表长 度、温度,速度或其它单调递增地取值的 物理量。可见,时间序列只强调顺序的重 要性,而并非强调必须以时间顺序排列。 例如:材料裂纹长度与其承受的压力有关, 将材料裂纹长度按其所受压力周期数排列, 也是一个时间序列(见表2),其散点图见图 2。
相关文档
最新文档