时间序列电子科大第一章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3. 异方差类非平稳序列
图1.1.4
图1.1.5
图1.1.6
4. 混合类非平稳序列 图1.1.7
图1.1.8
非平稳序列建模的思路: 1.选择适当的模型对序列进行拟合. 2.对数据进行平稳化预处理.
二、数据的预处理 分析观察动态数据散布图: 1. 异常值的检验与处理; 2. 缺损值的补足; 3.异方差非平稳过程
• 自相关图检验 – 平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着 延迟期数的增加,平稳序列的自相关系数会很快地衰减向零
• 例 检验1964年——1999年中国纱年产量序列 的平稳性
自相关图
例 检验1962年1月——1975年12月平均每头奶牛 月产奶量序列的平稳性
自相关图
例 检验1949年——1998年北京市每年最高气温 序列的平稳性
自相关图
二、纯随机性检验
• 纯随机序列的定义 • 纯随机性的性质 • 纯随机性检验
纯随机序列的定义 • 纯随机序列也称为白噪声序列,它满足如下两条性质
(1)EX t , t T
(2)
(t,
s)
2,t
s
,
t,
s
T
0, t s
纯随机性的性质
• 纯随机性 (k) 0,k 0
– 各序列值之间没有任何相关关系,即为 “没有记忆”的序列
LB n(n 2) (
ˆ
2 k
) ~ 2(m)
k1 n k
判别原则
例 标准正态白噪声序列纯随机性检验 样本自相关图
检验结果
延迟 延迟6期 延迟12期
P值
2.36
0.8838
5.35
0.9454
例 对1950年——1998年北京市城乡居民定期储 蓄所占比例序列的平稳性与纯随机性进行检验
s 1)随季节变化有明显周期 = 4 ;
2)年平均数据有缓慢的逐年上升趋势.
年平均曲线
数据 曲线
三、趋势项和季节项的估计和分离 针对不同分解式, 有各种剔除确定性成分的方法
1. 仅含趋势项的识别与剔除
方法1 最小二乘法
X t mt Yt
基本思想:拟合均值函数并将过程零均值化
例11 罢工次数有明显的趋势项
自相关图
白噪声检验结果
延迟阶数 6 12
75.46 82.57
P值 <0.0001 <0.0001
二、非平稳时间序列实例 存在大量的非平稳序列. 1.均值非常数类非平稳序列
例1 美国人口总数
例2 美国罢工次数
例3 美国的月事故死亡数据
图1.1.1 图1.1.2 图1.1.3
2. 周期类非平稳序列 例4 地球50年温度数据
Zˆ t X t mˆ t , t 1,2, ,24
Yˆt X t mˆ t sˆt , t 1,2, ,24
随机项
季节项
{Yˆ } 问题1 如何判断 是否为平稳序列?
t
问题2 能否用其他曲线拟合趋势项?
随机项 季节项
数据的二次趋势项
方法2 滑动平均平滑方法
X t mt Yt
数据分解目的:识别、估计、和提取 出确定性成分,使噪声项Yt 成为平稳序列
一般假定分解式(1.2.1)满足:
E(Yt ) 0 ;
s
st j 0, t 1,2,
j1
因季节项 S t + s = St , t = 1,2, …
(1.2.2)
s{ t }在任何一个周期有
s 1 s
s j1 t j C ,
图1.1.9
对数处理法; 图1.1.9
趋势识别法. 图1.1.5
4.一般非平稳时间序列的分解.
大量时间序列的观察样本都表现出趋势性、季节性(周期性)和随机性,每 个时间序列或经过适当的函数变换的时间序列,可分解为
X t m t st Yt
(1.2.1)
X t m t st Yt
mt —趋势项,一般是实值函数;
基本思想:以直代曲,平滑数据, 消去噪声项.
算法步骤: 1) 取非负整数q ;
2) 求 X t 的m双边t 滑动Y平t均
适用于无季节项的情 形
W t
1 2q 1
q
Xt
jq
j
Xt 及前后相邻2q个数据的 算术平均值
3) 令
mˆ t W t
则噪声Yt 的估计值为
q
Yˆt X t mˆ t X t X t j /( 2q 1) jq
• 方差齐性
– 根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到
的未知参数估计值才D是X准t 确的、(有0)效的 2
纯随机性检验 • 检验原理 Barlett定理
如果一个时间序列是纯随机的,得到一个观察期数 为 n 的观察序列,那么该序列的延迟非零期的样本 自相关系数将近似服从均值为零,方差为序列观察 期数倒数的正态分布
ˆ k
~
N (0, 1 ) , n
k
0
假设条件
• 原假设:延迟期数小于或等于 m 期的序列值之间相互独立
• 备择假设:延迟期数小于或等于 m 期的序列值之间有相关性
H

0
1
2
m
0,m
1
H

1






k
0, m
1,k
m
检验统计量
• Q统计量 • LB统计量
m
Q n
ˆ
2 k
~
2(m)
k 1
m
§1.3 时间序列的平稳化预处理
时间序列分析的主要任务: 1)根据观察数据的特点为数据建立尽可能合理的统计模型.
2)利用模型的统计特性去解释数据来源系统的统计规律,以期达到预测 或控制的目的.
对数据进行充分分析是建立模型前的重要工作.
一、平稳性的检验(图检验方法)
• 时序图检验 – 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该 显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、 无明显趋势及周期特征
有缓慢的上升趋势,可用直线表示趋势项,认为( mt , t)满足一元线性函数:
m t a bt, t 1,2, ,24
用最小二乘估计法得到
aˆ 5780.1, bˆ 21.9
趋势项{mt }的估计值满足
mˆ t aˆ bˆt 5780.1 21.9t , t 1,2, ,24

st — 季节项,周期为 s 的周期函数;
Yt — 平稳随机噪声项(残量 )
mt 和st是非随机的确定性成份
(1.2.1)
非随机确定性成分份
应有明确的 物理解释
例7 网络流量数据有季节性 例8 美国的月事故死亡数据 例9 罢工次数有明显的趋势项
图1.1.3 图1.1.2
时间序列分解:将趋势性、季节性和随机性分解出来是时间序列分析首要 的一步.
C是常数
将分解式(1.2.1)改写为
s X t ( m t C ) ( t C ) Y t
(1 .2 .3 )
s 新季节项{ t- C}在任何一个周期有
1
s
s
(st j
j1
C)
0,
t 1,2,
例5 下面的数据是某城市1991~1996年中每个季度的民用煤消耗量(单位: 吨)
民用煤消耗量数据散布图
例11 罢工数据的5项滑动平均处理.
图1.1.3
图1.1.11
算法分析: 假设趋势项mt在[t-q, t+q]上近似线性函数,滑动平均
Wt
1 2q 1
q
mt
jq
j
1 2q 1
q
Yt j
jq
mˆ t
Xt
Wt mt
mt
图1.1.12
图1.1.1
图1.1.2-1
图1.1.2-2
图1.1.3
图1.1.4
图1.1.5
图Fra Baidu bibliotek.1.6
图1.1.7
图1.1.8
图1.1.9
图1.1.10
原IF、HS数据序列存在异方差,对其取自 然对数的结果.
图1.1.11
罢工数据的5项滑动平均 mˆ t
罢工数据的5项滑动平均残量 Y t X t mˆ t 图1.1.12
图1.1.3
令 m t A cost, 1951 t 1980
最小化残差
1980
(xt mt )2
t 1951
得到参数A ,ω的估计值 噪声Yt 的估计值为
Aˆ 、ωˆ .
Yˆt X t mˆ t X t Aˆ cos ˆ t , 1951 t 1980
例6 民用煤消耗量
直线 趋势项
相关文档
最新文档