第六章 动态数据分析模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
采样
动态数据的特点
1. 数据取值随时间变化 2. 在每一时刻取什么值,不可能完全准确地 用历史值预报 3. 前后时刻(不一定是相邻时刻)的数值或 数据点有一定的相关性 4. 整体存在某种趋势或周期性
1.3 动态数据的构成与分解
时间序列=趋势+周期+平稳随机成分+白噪声
线性
季节性的 其他
自回归模型
2. 移动步长为K(1<K<n)的移动平均序列为
Yi Yi 1 YK i 1 Yi K
移动平均法-趋势图
200
汽 150 车 产 100 量 (万辆)50
产量
五项移动平均趋势值 五项移动中位数
0 1981
1993 1997 (年份) 汽车产量移动平均趋势图
1985
1989
• 提取单时间序列中存 在的周期的方法 • 时间域
– 离散
• 频率域
– 连续
• 方法
– 谐波分析 – 周期图 – 谱分析
1) 谐波分析
• 利用傅立叶级数把时间序列表示成无数个 不同周期的简谐波和的形式来分析序列变 化规律的一种方法
• 序列长度为N的时间序列数据 • 假设N为一个完整的周期,而且由K个谐波 组成
– 过程的统计特性不随时间的平移而变化
严平稳和宽平稳
• 严平稳
– 一种条件比较苛刻的平稳性定义。认为只有当 序列所有的统计性质都不会随着时间的推移而 发生变化时,该序列才能被认为平稳。
• 宽平稳
– 宽平稳是使用序列的特征统计量来定义的一种 平稳性。认为序列的统计性质主要由它的低阶 矩决定,所以只要保证序列低阶矩平稳(二 阶),就能保证序列的主要性质近似稳定。
a、b、c 为未知常数 根据最小二乘法求得
4.4 随机性时间序列分析
• 数据随时间的变化具 有随机性 • 无法用确定的函数进 行拟合
2)非线性趋势
• 指数曲线 • 二次曲线
指数曲线(Exponential curve)
1. 用于描述以几何级数递增或递减的现象 2. 一般形式为
t ˆ Yt ab
a、b为未知常数 若b>1,增长率随着时间t的增加而增加 若b<1,增长率随着时间t的增加而降低 若a>0,b<1,趋势值逐渐降低到以0为极限
第六章 动态数据分析模型
内容
一.动态数据及其的特点 二.动态数据的模型分类 三.动态数据建模方法和建模步骤 四.周期分析 五.时间序列预测 六.灰色系统建模 七.系统动力学建模
一、动态数据
• 是指观察或记录下来的一组按时间先后 顺序排列起来的数据序列
1.1 数据特征
• 构成
– 时间 – 反映现象在一定时间条 件下的数量特征的指标 值
绝对数 时期
绝对数 时点
3923
121121
122389
123626
4854
5576
6079
平均数/相对数
28.62 29.04 29.37 29.92
时间数据分类-按照时间的表现形式
• 连续 • 离散
时间序列中,时间必须是等间隔的
河流水位
10 2 4 4 5 8
时间
河流水位 10 2 4 时间 4 6 8
移动平均法-应注意的问题
1. 移动平均后的趋势值应放在各移动项的中 间位置
– – – – 对于偶数项移动平均需要进行“中心化” 如果现象的发展具有一定的周期性,应以周 期长度作为移动间隔的长度 若时间序列是季度资料,应采用4项移动平均 若为月份资料,应采用12项移动平均
2. 移动间隔的长度应长短适中
k:滞后值
• 适用于长序列
4.3 确定性时间序列分析
• 可以使用确定性函数 进行拟合未来趋势 • 趋势分析 • 季节变化分析
4.3.1 趋势分析
• 线性趋势 • 非线性趋势 • 趋势线的选择
趋势
1. 现象在较长时期内持续发 展变化的一种趋向或状态
2. 由影响时间序列的基本因 素作用形成 3. 时间序列的主要构成要素
份
1991
1992
1993
1994
1995
1996
1997
国内生产 总值 (亿元) 年底 总人口数 (万人) 人均国内生 产总值 (元/人) 城镇 人口比重 (%) 26.37 27.63 28.14 1879 2287 2939 115823 117171 118517 119850 21618 26638 34634 46759 58478 67885 74772
平稳序列的统计性质
• 常数均值 • 自协方差函数和自相关函数只依赖于时 间的平移长度而与时间的起止点无关
如果是平稳 的,那么
2)自相关函数
• 同一序列不同时间间 隔的相关性 • 自相关函数的性质
– 规范性 – 对称性
ˆk
( x x )( x
t 1 t n t 1 t
nk
t k 2
4. 有线性趋势和非线性趋势
1)线性趋势
1. 现象随时间的推移呈现出稳定增长或下降的 线性变化规律
2. 方法
–
–
线性模型法
移动平均法
线性模型法
1. 现象的发展按线性趋势变化时,可用线性 模型表示 2. 线性模型的形式为
ˆ — 时间序列的趋势值 Y t t —时间标号 a—趋势线在Y 轴上的截距 b—趋势线的斜率,表示时间 t 变动一个单位时观 察值的平均变动数量
回归分析,人工识别
二、动态数据分析模型分类
动态数据建模需要回答的问题
• 是确定的序列还是随机的序列? • 变量的变化有规律吗?
– 周期、趋势、相关
• 这种变化与其他变量的变化有什么关系? • 不同的因素相互影响、相互作用,使得系 统目标发生了什么变化?
动态数据分析模型分类
• 研究单变量或少数几个变量的变化
指数曲线-趋势图
250 汽 200 车 产 150 量 (万辆) 100 50 0 1981
汽车产量
趋势值
1985
1989
汽车产量指数曲线趋势
1993 1997 (年份)
二次曲线 (Second Degree Curve)
1. 现象的发展趋势为抛物线形态 2. 一般形式为
2 ˆ Yt a bt ct
x(t ) a0 (ak cos k t bk sin k t )
k 1
周期
1 n a0 n xt t 1 2 n 2 k (t 1) ak xt cos n t 1 n 2 n 2 k (t 1) bk xt sin n t 1 n
– 时间域 – 频率域
• 模型内容
– 周期分析 – 时间序列预测
时间序列模型的表示
• 相关的检验参数
xt f ( xt 1 , xt 2 , ) t
白噪声
2.2 动态系统模型
• 研究具有时变特点的 多个因素之间的相互 作用,以及这些作用 与系统整体发展之间 的关系的模型。 • 模型主要用于模拟和 情景分析 • 重点
三点平滑:
X(t)=(x(t-1)+x(t)+x(t+1))/3 t=1,…,N
5)差分
• 按照求导原理,对于线性趋势,那么,其 一阶差分近似为常数,对于二次曲线变化 趋势,则二阶差分近似等于常数。 • 对于蕴含着固定周期的序列,差分的间隔 设为周期长度通常可以较好地去除周期。
过差分
• 足够的差分运算可以充分地提取原序列中 的非平稳确定性信息 • 但过度的差分会造成有用信息的浪费 • 如果差分后序列的方差增加,那么该差分 为过差分。
– 各种因素是如何相互作 用影响系统总体发展的
• 特点
– 系统反馈
• 系统动力学
模型表示
• 因果反馈逻辑图 • 未来系统要素变化趋势图
因果反馈逻辑图
未来系统要素变化趋势图
3 建模步骤
• • • • 分析数据的动态特征 进行数据序列分解 数据预处理 模型构建模型确认
建模方法
• 统计学方法
– 随机过程理论
序列的长度n k为谐波个数,最大取n/2的整数部分 TK为第k个波的周期
n Tk k
1 2 (a k bk2 ) 2
振幅 AK2
2 sk
功率谱
预测模型
x(t ) a0 (a j cos(
j 1 m
2 K j n
(t 1)) b j sin(
2 K j n
(t 1)))
问题
• 准周期 • 周期叠合
3)滤波
• 输入信号x(t)(原序列),经过一个过滤系 统(通过脉冲响应函数进行数字运算), 得到一个新的输出g(t)(过滤后的时间序列)
gt
i k
x
i
k
t i
Wt
三项平滑 wt=1/3,k=-1,0,1 高斯滤波 wt是高斯函数 窗口函数
4)数据平滑
ˆ a bt Y t
线性模型法-趋势图
200 汽 150 车 产 量 100 (万辆) 50 0 1981 汽车产量 趋势值
1985
1989
汽车产量直线趋势
1993 1997 (年份)
移动平均法(Moving Average Method)
1. 测定长期趋势的一种较简单的常用方法
– – 通过扩大原时间序列的时间间隔,并按一定的间 隔长度逐期移动,计算出一系列移动平均数 由移动平均数形成的新的时间序列对原时间序列 的波动起到修匀作用,从而呈现出现象发展的变 动趋势
x)
(x x )
理解计算过程
k
p 1 0.2970 2 -0.2034 3 -0.0537 4 -0.3843
15 10 5 0 0 5 10 15
0.4000 0.2000 0.0000 -0.2000 -0.4000 -0.6000 1 2 3 4
3)白噪声
• 纯随机过程
– 随机过程由无关的随机变量序列构成
t: 连续的时间,=1,2,3… n: 样本数 m: 周期显著的谐波个数 Kj: 与j对应的谐波数K
2) 周期图
• 谐波分析只考虑了整个序列的时间区间内的整数 谐波振动,波数是整数,而对应的周期则不一定 是整数。 • 周期图方法估计功率谱则以整数为周期,由它所 构成的谱图横轴常用整数周期表示。
• 假设序列是给定的周期的叠加结果 • 给定一个周期,将序列分解为m各子序列。将各 个子序列加和求平均,得到新的序列,然后对新 的序列计算参数ak和bk等。
• 灰色系统方法 • 动态系统仿真方法
时间序列模型
动态系统 模型
建模步骤
研究目标和内容 一个序列 几个序列 序列之间的关系 预测 模拟
选择使用的模型
数据预处理
建立模型进行分析
结果分析验证
4 时间序列模型
4.1 基本概念
1)平稳随机过程
• 如果一个随机过程的均值和方差在时间过 程上是常数,并且在任何两时期之间的协 方差值仅依赖于该两时期间的距离和滞后, 而不依赖于计算这个协方差的实际时间, 那么,这个随机过程称为平稳的随机过程。 • 特点
• T时刻的值与过去的值没有关系
• 研究中可供对比的背景
– 白噪声检验
时间域和频率域
• 时间域
– 时间t作为自变量 – 离散 – 使用差分方程和相关函 数进行研究
• 频率域
– 假设随机过程是不同的 正弦函数和余弦函数叠 加(积分)的结果 – 基于傅里叶变换 – 谱分析
• 自回归模型
• 周期分析
4.2 周期分析
– 随机过程
• 周期分析和时间序列分析 时间序列 模型
– 灰色系统
• 关联分析,GM模型
• 研究多变量的变化
– 系统动力学建模
动态系统 模型
2.1 时间序列模型
• 研究一个或多个被解 释变量随时间变化规 律的模型 • 模型主要用于预测分 析 • 目的
– 精确预测未来变化
• 数据要求
– 序列平稳
• 研究角度
过差分
在实际建模过程中,对原序列做了一阶和二 阶差分,两次差分处理后序列都满足平稳 性 计算了两次差分后得到的两个新序列的方差, 比较后如果二阶差分后的 序列的方差值大 于一阶差分后的序列的方差值,那么二阶 差分是过差分。
差分计算
一阶差分: dx(t)=x(t)-x(t-k) 二阶差分: d’x(t)=dx(t)-dx(t-k)
21
12
21
10
离散序列
350 300 250 200 150 100 50 0 8 10 12 小时 14 16 18
流量
350 300 250 200 150 100 50 0 8 10 12 小时 14 16 18
流量
内插
连续序列
25 20
气温
15 10 5 0 8 10 12 小时 14 16 18
• 表示
– x(t)
• 时间t为自变量
– 整数:离散的,等间距 的 – 非整数:连续的。实际 分析时必须进行采样处 理
Байду номын сангаас
• 时间单位
– 秒,分,小时,日,周, 月,年
1.2 动态数据分类-按照指标值的表现形式
• 绝对数序列
– 时期序列
• 可加性
– 时点序列
• 不可加性
• 相对数/平均数序列
年 指 标