时间序列分析教程重点讲义资料
精选时间序列分析时间序列讲解讲义
§1.2 平稳序列
一· 平稳序列
定义 如果时间序列 {X t} {X t : t N满}足
(1) 对任何的
t
N,
EX
2 t
(2) 对任何的 t N , EX t
(3) 对任何的 t, s N , E[( X t )( X s )] ts
就称是 X平t 稳时间序列,简称时间序列。称实数 为 的{自 t协} 方差X函t 数。
a则j 称 是绝对可{a和j}的。
j
对于绝对可和的实数列
,{a{定Xj}{义tX}零t}均值白噪声 的无穷{滑t动} 和
如下 X t a j t j ,t ,Z则 是{X平t}稳序列。下面说明 是
j
{X t}
平稳序列。
由 Schwarz不等式得到
E[ a jt j ] a j E t j a j
j0
k
q
0, k q
{ X t }平稳
第三十七页,共74页。
例:X t t 0.36 * t1 0.85 * t2 , t ~ WN (0,22 )
第三十八页,共74页。
概率极限定理:
定理 (单调收敛定理) 如果非负随机变量序列单调不减: 0 1 2
lim 则当 n ,a时s ,有 E
{St }
3. 随机项估计即为
方法一:分段趋势法
1 趋势项(年平均)
第五页,共74页。
减去趋势项后,所得数据 {Xt Tˆt}
第六页,共74页。
2、季节项 {Sˆt}
第七页,共74页。
3.随机项的估计 Rˆt xt Tˆt Sˆt ,t 1,2,,24.
第八页,共74页。
方法二:回归直线法
当 0, 2 称1为标准白噪声。
时间序列分析复习要点重点
一.导 论1. 计量经济学和时间序列分析的区别与联系2. 时间序列分析的概念:时间序列分析(T i m e s e r i e s a n a l y s i s ) 是一种根据动态数据揭示系统动态结构和规律性的统计方法,是统计学的一个分支。
3. 时间序列分析的研究对象:时间序列数据 4. 时间序列分析的基本思想:样本推断根据系统的有限长度的运行记录(样本数据),建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借以对系统的未来发展进行预报(时间序列预测)。
二.时间序列分析基础 1、随机过程(1)含义:在数学上,随机过程被定义为一组随机变量。
(2)特征:① 从顺序角度来看:随机过程是随机变量的集合;随机变量是随时间产生的,在任意时刻t ,总有随机变量X t 与之相对应;事物发展没有必然变化规律。
② 从数学角度看:不可用时间t 的函数确定的描述。
③ 从试验角度来看:不可重复。
(3)重要的随机过程 ①白噪声过程②随机游走过程:x t = x t -1 + u t 如果u t 为白噪声过程,则称x t 为随机游走过程。
(4)随机过程的平稳性随机过程的统计特征不随时间的推移而发生变化。
严平稳:随机过程中随机变量的任意子集的联合分布函数与时间无关。
宽平稳:∞<=+2),(k k t t x x Cov σ∞<=2)(σt x Var∞<=μ)(t x E直观的看,平稳的数据可以看作是一条围绕其均值上下波动的曲线。
(5)随机过程与时间序列:随机过程的一次实现称为时间序列随机过程的实现: 由随机变量组成的一个有序序列称为随机过程,记为{},t Y t T ∈,简记为Y t 。
其中,每一个元素Y t 都是随机变量。
将每一个元素的样本点按序排列,称为随机过程的一个实现,即时间序列数据,亦即样本。
2、差分方程的展开式子差分方程:变量当期值定义为它的前期和一个当期的随机扰动因素的函数。
《时间序列分析》讲义 第三章 平稳时间序列分析
k
1 k1 2 k2,k
2
自相关系数
自相关系数的定义
k
k 0
平稳AR(p)模型的自相关系数递推公式
k 1k 1 2 k 2 p k p
常用AR模型自相关系数递推公式
AR(1)模型 k 1k , k 0
AR(2)模型
1,
k
1
1 2
1k1 2 k2
k 0 k 1 k2
自回归系数多项式
(B) 11B 2B2 pBp
特征方程
中心化AR(p)模型
xt 1 xt1 2 xt2 p xt p t
可以看成p阶常系数非齐次线性差分方程
xt 1 xt1 2 xt2 p xt p t
它对应的齐次方程的特征方程为
p 1 p1 p1 p 0
1 12
协方差函数
在平稳AR(p)模型两边同乘xt-k,再求期望
E(xt xtk ) 1E(xt1xtk ) p E(xt p xtk ) E(t xtk )
根据
E( t xtk ) 0 ,k 1
得协方差函数的递推公式
k 1 k1 2 k 2 p k p
例题
例3.3 求平稳AR(1)模型的协方差
12
2 2
,
0,
k 0 k 1
k 2 k 3
偏自相关系数
滞后k偏自相关系数由Yule-Walker方程 确定
zt a1 zt1 a2 zt2 a p zt p h(t)
齐次线性差分方程
zt a1 zt1 a2 zt2 a p zt p 0
齐次线性差分方程的解
特征方程
p a1p1 a2p2 ap 0
特征方程的根称为特征根,记作1,2,…,p
时间序列分析讲义
– 在SAS系统中有一个专门进行计量经济与时间序列分析 的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强 大,分析结果精确,是进行时间序列分析与预测的理 想的软件
– 由于SAS系统具有全球一流的数据仓库功能,因此在进 行海量数据的时间序列分析时它具有其它统计软件无 可比拟的优势
例2.3自相关图
时间序列分析讲义
例2.4时序图
时间序列分析讲义
例2.4 自相关图
时间序列分析讲义
例2.5时序图
时间序列分析讲义
例2.5自相关图
时间序列分析讲义
• 例2.3时序为非平稳的,有趋势; • 例2.4时序非平稳性,有趋势 • 例2.5时序是一个平稳的
时间序列分析讲义
非平稳性序列的平稳化
时间序列分析讲义
2020/11/16
时间序列分析讲义
第一章 时间序列分析基本概 念
时间序列分析讲义
第一章 时间序列分析基本概念
1.1 时间序列的定义
• 随机序列:按时间顺序排列的一组随机变量
• 观察值序列:随机序列的 个有序观察值,称之为 序列长度为 的观察值序列
• 随机序列和观察值序列的关系
– 观察值序列是随机序列的一个实现 – 我们研究的目的是想揭示随机时序的性质 – 实现的手段都是通过观察值序列的性质进行推断
满足下列条件的随机序列称为白噪声序列,也称 为纯随机序列:
注1:白噪声序列也是平稳时间序列中的特例. 注2:由于白噪声序列不同时刻的值相互独立,那么 这样的序列数值不能对于将来进行推断与预测,所以 白噪声是不能建立模型的。 时序图1.3符合白噪声序列特征
时间序列分析讲义
若满足时间序列满足: 称该时间序列是周期为T的时间序列.
时间序列分析法讲义
2004
(4) 1451604 1494570 1478651 1577307 6002132
季别累计
(5) 5277839 5503950 5333203 5724816 21839808
季别平均 季节指数
(6) 1319460 1375988 1333301 1431204 1364988
(7) 0.9666 1.0081 0.9768 1.0485 4.0000
97
8
20 -1 503 - 1
07
50
3
20 0 526 0 0 08
20 1 559 55 1
09
9
解:设t表示年次,y表示年发电量,则方成为:y=a+bt
a y 2677 535.4
n5
b ty 278 27.8 t 2 10
y=535.4+27.8t
当t=3时,y=618.8
指数平滑法是生产预测中常用的一种方法。 也用于中短期经济发展趋势预测,
(1) 一次指数平滑法(单重指数平滑法)
X t1
S (1) t
X t
(1
)S
(1) t 1
一次指数平滑法的初值的确定有几种方法
(A) 取第一期的实际值为初值(数据资料较多);S0(1) X1 (B) 取最初几期的平均值为初值(数据资料较少)。
2、指数的分类 (1)个体指数:反映某一具体经济现象动态变动的相
对数
(2)综合指数:反映全部经济现象动态变动的相对数
(3)数量指标指数:它是表明经济活动结果数量 多少的指数。
(4)质量指标指数:它是表明经济工作质量好坏 的指数。
(5)定基指数:它是指各个指数都是以某一个固 定时期为基期而进行计算的一系列指数。
时间序列分析知识点总结(1)
一.时间序列分析的相关概念♦随机过程:若对于每一个特定的t ∈T ,X(t)是一个随机变量,则称这一族无穷多个随机变量{X(t),t ∈T}是一个随机过程。
♦纯随机过程:随机过程X(t)(t=1,2,…),如果是由一个不相关的随机变量序列构成的,即对于所有s ≠t ,随机变量X t 和X s 的协方差均为零,则称其为纯随机过程。
♦♦♦♦独立增量随机过程:任意两相邻时刻上的随机变量之差是相互独立的,则称其为独立增量随机过程。
二阶矩过程:若随机过程{X(t),t ∈T},对每个t ∈T ,X(t)的均值和方差存在,则称其为二阶矩过程。
正态过程:若{X(t)}的有限维分布都是正态分布,则称{X(t)}为正态随机过程。
平稳过程(严平稳):如果对于时间t 的任意n 个值t 1,t 2,…,t n 和任意实数 ,随机过程X(t)的n 维分布函数满足关系式F n (x 1,x 2,…,x n ; t 1,t 2,…,t n ) = F n (x 1,x 2,…,x n ; t 1+ε,t 2+ε,…,t n+ε),则称X(t)为平稳过程。
即是统计特性不随时间的平移而变化的过程。
♦宽平稳:若随机过程{X(t),t ∈T}的均值和协方差存在,且满足①EX t ∈a,∀t ∈T ;②E[X t+τ-a][X t -a]=R(τ),∀t,t+τ∈T ,则称{X(t),t ∈T}为宽平稳随机过程,R(τ)为X(t)的协方差函数。
♦非平稳随机过程:不具有平稳性的过程就是非平稳过程。
即序列均值或协方差与时间有关时,就可以认为是非平稳的。
♦♦自相关:指时间序列观察资料互相之间的依存关系。
动态性(记忆性):指系统现在的行为与其历史行为的相关性。
如果某输入对系统后继n 个时刻的行为都有影响,就说该系统具有n 阶动态性。
二.刻画时间序列统计特性的各种数字特征的定义、性质等♦均值函数其中,F t (x)为随机序列X t 的分布密度函数。
时间序列分析讲义 第01章 差分方程
第一章差分方程差分方程是连续时刻情形下微分方程的特例。
差分方程及其求解是时刻序列方法的根底,也是分析时刻序列动态属性的全然方法。
经济时刻序列或者金融时刻序列方法要紧处理具有随机项的差分方程的求解咨询题,因此,确定性差分方程理论是我们首先需要了解的重要内容。
§1.1一阶差分方程假设利用变量t y 表示随着时刻变量t 变化的某种事件的属性或者结构,那么t y 便是在时刻t 能够瞧测到的数据。
假设t y 受到前期取值1-t y 和其他外生变量t w 的碍事,并满足下述方程:t t t w y y ++=-110φφ(1.1)在上述方程当中,由于t y 仅线性地依靠前一个时刻间隔自身的取值1-t y ,因此称具有这种结构的方程为一阶线性差分方程。
要是变量t w 是确定性变量,那么此方程是确定性差分方程;要是变量t w 是随机变量,那么此方程是随机差分方程。
在下面的分析中,我们假设t w 是确定性变量。
例1.1货币需求函数假设实际货币余额、实际收进、银行储蓄利率和商业票据利率的对数变量分不表示为t m 、t I 、bt r 和ct r ,那么能够估量出美国货币需求函数为: 上述方程便是关于t m 的一阶线性差分方程。
能够通过此方程的求解和结构分析,判定其他外生变量变化对货币需求的动态碍事。
1差分方程求解:递回替代法差分方程求解确实是根基将方程变量表示为外生变量及其初值的函数形式,能够通过往常的数据计算出方程变量的当前值。
由于方程结构关于每一个时刻点根基上成立的,因此能够将(1.1)表示为多个方程: 0=t :01100w y y ++=-φφ1=t :10101w y y ++=φφt t =:t t t w y y ++=-110φφ依次进行叠代能够得到:i ti i t t i i t w y y ∑∑=-=++=0111010φφφφ(1.2)上述表达式(1.2)便是差分方程(1.1)的解,能够通过代进方程进行验证。
第四章_时间序列分析
(2)、由时点数列计算序时平均数
①由连续时点数列计算序时平均数 对社会经济现象而言,已知每天数据 可视为连续序列。
a a
n
a
af f
例4-2-2:有某企业职工人数资料:
日期
1日 2日 3日 4日 5日 6日 a1 a2 a3 a4 a5 a6
职工人数(人) 98 100 99 101 108 106
例如,由一年中各月底数计算的全年平均数,就比只用年初和年末两 项数据计算的结果更准确。
9-18
⑵ 对间隔不等时点数列求 (加权序时平均法)
a
a1 a2 2
f1 a2
a3 2
f2
an1 2
an
f n1
f
例4-2-5
时 间 1月初 a1
职工人数(人) 102
3月初 a2 105
9月初 a3 108
第四章 时间序列分析
本章重点
第一节 时间序列分析概述 第二节 时间序列的水平分析 第三节 时间序列的速度分析 第四节 长期趋势的测定
第一节 时间序列分析概述
时间序列的概念 时间序列的种类 时间序列的编制原则
9-2
表4-1
9-3
一、时间序列的概念
时间序列(time series)— 动态数列, 把同
解:
劳动生产率
产量 人数
时期指标 时点指标
设以a、b、c分别表示产量、人数、劳动生产率
所以 c a
b
其中:
a
a
1200
1440 1050
123(0 吨)
n
3
b b1 2 b2 b3 bn1 bn 2 n 1
60 2 60 65 64 2 6(2 人) 4 1
时间序列分析基本知识讲解
时间序列分析基本知识讲解时间序列分析是指对一系列按照时间顺序排列的数据进行分析、建模和预测的方法。
它在许多领域都有广泛的应用,如经济学、金融学、气象学等。
时间序列数据的特点是具有时间依赖性和序列自相关性,即当前的观测值与前面的观测值之间存在一定的关联。
时间序列分析的基本目的是通过观察过去的数据模式,来预测未来的值或者了解数据的发展趋势。
在进行时间序列分析时,我们通常关注以下几个方面的内容:1. 趋势分析:时间序列数据中的趋势是指长期内数据值的增长或下降趋势。
趋势的存在可能是持续性的,也可能是周期性的。
常见的趋势分析方法包括移动平均法、指数平滑法等。
2. 季节性分析:时间序列数据中的季节性是指每年或每个周期内数据值呈现出的周期性规律。
季节性可以是固定的,也可以是随机的。
常用的季节性分析方法有季节性指数法、周期性指数法等。
3. 周期性分析:时间序列数据中的周期性是指数据值在一段时间内出现的循环规律。
周期性往往是由于外部因素引起的,如经济周期、自然环境等。
周期性分析常用的方法有傅里叶分析、自相关函数等。
4. 随机性分析:时间序列数据中的随机性是指数据值的不可预测性和不规律性。
随机性分析可以用来寻找数据中的异常值、离群点等。
常用的随机性分析方法有自回归滑动平均模型(ARMA)、随机游走模型等。
时间序列分析的基本步骤包括收集数据、可视化数据、数据预处理、建立模型、模型检验和评估模型的预测能力等。
常用的时间序列模型有自回归移动平均模型(ARMA)、自回归整合移动平均模型(ARIMA)、季节性自回归整合移动平均模型(SARIMA)等。
总之,时间序列分析是研究时间序列数据的变化规律和趋势的一种方法。
通过对时间序列数据的分析,我们可以预测未来的趋势和变化,辅助决策制定和问题解决。
在实际应用中,时间序列分析与其他统计方法和机器学习方法结合,可以提高分析预测的准确性和可靠性。
时间序列分析是研究时间序列数据的内在规律和趋势的一种方法。
时间序列分析讲义 第01章 差分方程
第一章 差分方程差分方程是连续时间情形下微分方程的特例。
差分方程及其求解是时间序列方法的基础,也是分析时间序列动态属性的基本方法。
经济时间序列或者金融时间序列方法主要处理具有随机项的差分方程的求解问题,因此,确定性差分方程理论是我们首先需要了解的重要内容。
§1.1 一阶差分方程假设利用变量t y 表示随着时间变量t 变化的某种事件的属性或者结构,则t y 便是在时间t 可以观测到的数据。
假设t y 受到前期取值1-t y 和其他外生变量t w 的影响,并满足下述方程:t t t w y y ++=-110φφ (1.1)在上述方程当中,由于t y 仅线性地依赖前一个时间间隔自身的取值1-t y ,因此称具有这种结构的方程为一阶线性差分方程。
如果变量t w 是确定性变量,则此方程是确定性差分方程;如果变量t w 是随机变量,则此方程是随机差分方程。
在下面的分析中,我们假设t w 是确定性变量。
例1.1 货币需求函数 假设实际货币余额、实际收入、银行储蓄利率和商业票据利率的对数变量分别表示为t m 、t I 、bt r 和ct r ,则可以估计出美国货币需求函数为:ct bt t t t r r I m m 019.0045.019.072.027.01--++=-上述方程便是关于t m 的一阶线性差分方程。
可以通过此方程的求解和结构分析,判断其他外生变量变化对货币需求的动态影响。
1.1.1 差分方程求解:递归替代法差分方程求解就是将方程变量表示为外生变量及其初值的函数形式,可以通过以前的数据计算出方程变量的当前值。
由于方程结构对于每一个时间点都是成立的,因此可以将(1.1)表示为多个方程:0=t :01100w y y ++=-φφ1=t :10101w y y ++=φφt t =:tt t w y y ++=-110φφ依次进行叠代可以得到:1011211010110101)()1()(w w y w w y y ++++=++++=--φφφφφφφφ0111122113121102)1(w w w y y φφφφφφφ++++++=-i ti i t t i i t w y y ∑∑=-=++=0111010φφφφ (1.2)上述表达式(1.2)便是差分方程(1.1)的解,可以通过代入方程进行验证。
时间序列分析课件讲义共85页
时间序列分析课件讲义
11、获得的成功越大,就越令人高兴 。野心 是使人 勤奋的 原因, 节制使 人枯萎 。 12、不问收获,只问耕耘。如同种树 ,先有 根茎, 再有枝 叶,尔 后花实 ,好好 劳动, 不要想 太多, 那样只 会使人 胆孝懒 惰,因 为不实 践,甚 至不接 触社会 ,难道 你是野 人。(名 言网) 13、不怕,不悔地为每一个人祝福 。我爱 自己, 我用清 洁与节 制来珍 惜我的 身体, 我用智 慧和知 识充实 我的头 脑。 15、这世上的一切都借希望而完成。 农夫不 会播下 一粒玉 米,如 果他不 曾希望 它长成 种籽; 单身汉 不会娶 妻,如 果他不 曾希望 有小孩 ;商人 或手艺 人不会 工作, 如果他 不曾希 望因此 而有收 益。-- 马钉路 德。
1、最灵繁的人也看不见自己的背脊。——非洲 2、最困难的事情就是认识自己。——希腊 3、有勇气承担命运这才是英雄好汉。——黑塞 4、与肝胆人共事,无字句处读书。——周恩来 5、阅读使人充实,会谈使人敏捷,写作使人精确。——培根
时间序列分析讲义 第02章 滞后算子
第二章 滞后算子及其性质滞后算子是对时间序列进行动态线性运算的主要工具,利用滞后算子可以使得一些非线性运算非常简洁。
§2.1 基本概念时间序列是以观测值发生的时期作为标记的数据集合。
一般情况下,我们是从某个特定的时间开始采集数据,直到另一个固定的时间为止,我们可以将获得的数据表示为:),,,(21T y y y如果能够从更早的时间开始观测,或者观测到更晚的时期,那么上面的数据区间可以进一步扩充。
相对而言,上述数据只是一个数据的片段,整个数据序列可以表示为:+∞=-∞==t t t T y y y y }{),,,,,,(21例2.1 几种代表性的时间序列(1) 时间趋势本身也可以构成一个时间序列,此时:t y t =;(2) 另一种特殊的时间序列是常数时间序列,即:c y t =,c 是常数,这种时间的取值不受时间的影响;(3) 在随机分析中常用的一种时间序列是高斯白噪声过程,表示为:t t y ε=,+∞=-∞=t t t }{ε是一个独立随机变量序列,每个随机变量都服从),0(2σN 分布。
时间序列之间也可以进行转换,类似于使用函数关系进行转换。
它是将输入时间序列转换为输出时间序列。
例2.2 几种代表性的时间序列转换(1) 假设t x 是一个时间序列,假设转换关系为:t t x y β=,这种算子是将一个时间序列的每一个时期的值乘以常数转换为一个新的时间序列。
(2) 假设t x 和t w 是两个时间序列,算子转换方式为:t t t w x y +=,此算子是将两个时间序列求和。
定义2.1 如果算子运算是将一个时间序列的前一期值转化为当期值,则称此算子为滞后算子,记做L 。
即对任意时间序列t x ,滞后算子满足:1)(-≡t t x x L (1)类似地,可以定义高阶滞后算子,例如二阶滞后算子记为2L ,对任意时间序列t x ,二阶滞后算子满足:22)]([)(-=≡t t t x x L L x L (2)一般地,对于任意正整数k ,有:k t t k x x L -=)( (3)命题2.1 滞后算子运算满足线性性质: (1) )()(t t x L x L ββ= (2) )()()(t t t t w L x L w x L +=+证明:(1) 利用滞后算子性质,可以得到:)()(1t t t x L x x L βββ==-(2) )()()(11t t t t t t w L x L w x w x L +=+=+-- End 由于滞后算子具有上述运算性质和乘法的交换性质,因此可以定义滞后算子多项式,它的作用是通过它对时间序列的作用获得一个新的时间序列,并且揭示这两个时间序列之间的关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.3时间序列分析3.3.1时间序列概述1.基本概念(1)一般概念:系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。
它是系统中某一变量受其它各种因素影响的总结果。
(2)研究实质:通过处理预测目标本身的时间序列数据,获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。
它不研究事物之间相互依存的因果关系。
(3)假设基础:惯性原则。
即在一定条件下,被预测事物的过去变化趋势会延续到未来。
暗示着历史数据存在着某些信息,利用它们可以解释与预测时间序列的现在和未来。
近大远小原理(时间越近的数据影响力越大)和无季节性、无趋势性、线性、常数方差等。
(4)研究意义:许多经济、金融、商业等方面的数据都是时间序列数据。
时间序列的预测和评估技术相对完善,其预测情景相对明确。
尤其关注预测目标可用数据的数量和质量,即时间序列的长度和预测的频率。
2.变动特点(1)趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。
(2)周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。
(3)随机性:个别为随机变动,整体呈统计规律。
(4)综合性:实际变化情况一般是几种变动的叠加或组合。
预测时一般设法过滤除去不规则变动,突出反映趋势性和周期性变动。
3.特征识别认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。
(1)随机性:均匀分布、无规则分布,可能符合某统计分布。
(用因变量的散点图和直方图及其包含的正态分布检验随机性,大多数服从正态分布。
)(2)平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数。
样本序列的自相关函数只是时间间隔的函数,与时间起点无关。
其具有对称性,能反映平稳序列的周期性变化。
特征识别利用自相关函数ACF:ρk=γk/γ0其中γk是y t的k阶自协方差,且ρ0=1、-1<ρk<1。
平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋近于0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。
实际上,预测模型大都难以满足这些条件,现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。
4.预测类型(1)点预测:确定唯一的最好预测数值,其给出了时间序列未来发展趋势的一个简单、直接的结果。
但常产生一个非零的预测误差,其不确定程度为点预测值的置信区间。
(2)区间预测:未来预测值的一个区间,即期望序列的实际值以某一概率落入该区间范围内。
区间的长度传递了预测不确定性的程度,区间的中点为点预测值。
(3)密度预测:序列未来预测值的一个完整的概率分布。
根据密度预测,可建立任意置信水平的区间预测,但需要额外的假设和涉及复杂的计算方法。
5.基本步骤(1)分析数据序列的变化特征。
(2)选择模型形式和参数检验。
(3)利用模型进行趋势预测。
(4)评估预测结果并修正模型。
3.3.2随机时间序列系统中某一因素变量的时间序列数据没有确定的变化形式,也不能用时间的确定函数描述,但可以用概率统计方法寻求比较合适的随机模型近似反映其变化规律。
(自变量不直接含有时间变量,但隐含时间因素)1.自回归AR(p)模型(R:模型的名称P:模型的参数)(自己影响自己,但可能存在误差,误差即没有考虑到的因素)(1)模型形式(εt越小越好,但不能为0:ε为0表示只受以前Y的历史的影响不受其他因素影响)y t=φ1y t-1+φ2y t-2+……+φp y t-p+εt式中假设:y t的变化主要与时间序列的历史数据有关,与其它因素无关;εt不同时刻互不相关,εt与y t历史序列不相关。
式中符号:p模型的阶次,滞后的时间周期,通过实验和参数确定;y t当前预测值,与自身过去观测值y t-1、…、y t-p是同一序列不同时刻的随机变量,相互间有线性关系,也反映时间滞后关系;y t-1、y t-2、……、y t-p同一平稳序列过去p个时期的观测值;φ1、φ2、……、φp自回归系数,通过计算得出的权数,表达y t依赖于过去的程度,且这种依赖关系恒定不变;εt随机干扰误差项,是0均值、常方差σ2、独立的白噪声序列,通过估计指定的模型获得。
(2)识别条件当k>p时,有φk=0或φk服从渐近正态分布N(0,1/n)且(|φk|>2/n1/2)的个数≤4.5%,即平稳时间序列的偏相关系数φk为p步截尾,自相关系数r k逐步衰减而不截尾,则序列是AR(p)模型。
实际中,一般AR过程的ACF函数呈单边递减或阻尼振荡,所以用PACF函数判别(从p阶开始的所有偏自相关系数均为0)。
(3)平稳条件一阶:|φ1|<1。
二阶:φ1+φ2<1、φ1-φ2<1、|φ2|<1。
φ越大,自回归过程的波动影响越持久。
(4)模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量相互独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性等造成的困难。
2.移动平均MA(q)模型(1)模型形式y t=εt-θ1εt-1-θ2εt-2-……-θpεt-p(2)模型含义用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值。
AR(p)的假设条件不满足时可以考虑用此形式。
总满足平稳条件,因其中参数θ取值对时间序列的影响没有AR模型中参数p的影响强烈,即这里较大的随机变化不会改变时间序列的方向。
(3)识别条件当k>q时,有自相关系数r k=0或自相关系数r k服从N(0,1/n(1+2∑r2i)1/2)且(|r k|>2/n1/2(1+2∑r2i)1/2)的个数≤4.5%,即平稳时间序列的自相关系数r k为q步截尾,偏相关系数φk逐步衰减而不截尾,则序列是MA(q)模型。
实际中,一般MA过程的PACF函数呈单边递减或阻尼振荡,所以用ACF函数判别(从q阶开始的所有自相关系数均为0)。
(4)可逆条件一阶:|θ1|<1。
二阶:|θ2|<1、θ1+θ2<1。
当满足可逆条件时,MA(q)模型可以转换为AR(p)模型3.自回归移动平均ARMA(p,q)模型(1) 模型形式y t=φ1y t-1+φ2y t-2+……+φp y t-p+εt-θ1εt-1-θ2εt-2-……-θpεt-p式中符号:p和q是模型的自回归阶数和移动平均阶数;φ和θ是不为零的待定系数;εt独立的误差项;y t是平稳、正态、零均值的时间序列。
(2) 模型含义使用两个多项式的比率近似一个较长的AR多项式,即其中p+q 个数比AR(p)模型中阶数p小。
前二种模型分别是该种模型的特例。
一个ARMA过程可能是AR与MA过程、几个AR过程、AR 与ARMA过程的迭加,也可能是测度误差较大的AR过程。
(3) 识别条件平稳时间序列的偏相关系数φk和自相关系数r k均不截尾,但较快收敛到0,则该时间序列可能是ARMA(p,q)模型。
实际问题中,多数要用此模型。
因此建模解模的主要工作是求解p、q和φ、θ的值,检验εt和y t的值。
(4) 模型阶数AIC准则:最小信息准则,同时给出ARMA模型阶数和参数的最佳估计,适用于样本数据较少的问题。
目的是判断预测目标的发展过程与哪一随机过程最为接近。
因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。
具体运用时,在规定范围内使模型阶数从低到高,分别计算AIC值,最后确定使其值最小的阶数是模型的合适阶数。
模型参数最大似然估计时AIC=(n-d)logσ2+2(p+q+2)模型参数最小二乘估计时AIC=nlogσ2+(p+q+1)logn式中:n为样本数,σ2为拟合残差平方和,d、p、q为参数。
其中:p、q范围上线是n较小时取n的比例,n较大时取logn的倍数。
实际应用中p、q一般不超过2。
4.自回归综合移动平均ARIMA(p,d,q)模型(1)模型识别平稳时间序列的偏相关系数φk和自相关系数r k均不截尾,且缓慢衰减收敛,则该时间序列可能是ARIMA(p,d,q)模型。
(2)模型含义模型形式类似ARMA(p,q)模型,但数据必须经过特殊处理。
特别当线性时间序列非平稳时,不能直接利用ARMA(p,q)模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中d一般不超过2。
若时间序列存在周期性波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有暂时影响的时间序列。
即差分处理后新序列符合ARMA(p,q)模型,原序列符合ARIMA(p,d,q)模型。
3.3.3建模解模过程1. 数据检验检验时间序列样本的平稳性、正态性、周期性、零均值,进行必要的数据处理变换。
(1)作直方图:检验正态性、零均值。
按图形Graphs —直方图Histogram 的顺序打开如图3.15所示的对话框。
图3.15将样本数据送入变量Variable 框,选中显示正态曲线Display normal curve 项,点击OK 运行,输出带正态曲线的直方图,如图3.16所示。
样本数据 2.502.001.501.00.500.00-.50-1.00-1.50-2.00-2.50-3.0012108642Std. Dev = 1.30 Mean = -.03N = 48.00图3.16从图中看出:标准差不为1、均值近似为0,可能需要进行数据变换。
(2)作相关图:检验平稳性、周期性。
按图形Graphs—时间序列Time Series—自相关Autocorrelations的顺序打开如图3.17所示的对话框。
图3.17将样本数据送入变量Variable框,选中自相关Autocorrelations和偏自相关Partial Autocorrelations项,暂不选数据转换Transform项,点击设置项Options,出现如图3.18所示对话框。
图3.18因为一般要求时间序列样本数据n>50,滞后周期k<n/4,所以此处控制最大滞后数值Maximum Number of Lags设定为12。
点击继续Continue返回自相关主对话框后,点击OK运行系统,输出自相关图如图3.19所示。
图3.19从图中看出;样本序列数据的自相关系数在某一固定水平线附近摆动,且按周期性逐渐衰减,所以该时间序列基本是平稳的。
(3)数据变换:若时间序列的正态性或平稳性不够好,则需进行数据变换。
常用有差分变换(利用transform—Create Time Series)和对数变换(利用Transform—Compute)进行。