浅谈时间序列的预测(知识点总结)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈时间序列的预测
第一部份、时间序列及其分解
时间序列是同一现象在不同时间上的相继观察值排列而成的序列。
它可以分平稳序列和非平稳序列两大类,平稳是基本上不存在趋势序列。
非平稳序列是包含趋势、季节性或周期性的序列,它可能只含有其中的一部份,也可能是几种成分的组合。
趋势是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动,也称为长期趋势。
时间序列中的趋势可以是线性也可以非线性的。
季节性也称为季节变动,它是时间序列在一年内重复出现的周期性波动
周期性也称循环波动,它是时间序列中呈现出 来的围绕长期趋势的一种波浪形或振荡式变动。
时间序列中除去趋势、周期性和季节性之后的偶然性变动,称为随机性,也称为不规则波动
综合上述时间序列可分为;)()、季节性或季节变动趋势(S T )(I C 动)、随机性或不规则波周期性或循环波动(传统时间序列分析的一
一项主要内容就是把这些成分从时间序列中分离出来,并将它们之间的关系用数学关系予以表达,而后分别进行分析。
按4种成分时间序列的影响方式不同,时间序列可分解为加法模型、乘法模型等。
其中较为常用的是乘法模型,其表现形式t t t t t I C S T Y ⨯⨯⨯= 第二部份、时间序列的描述分析
1、图形描述
作图可以为选择预测模型提供基本依据 2、增长率分析
增长率是对现象在不同时间的变化状况所做的描述。
由于对比的基期不同,增长率有不同的计算方法。
增长率也称增长速度,它是时间序列中报告其观察值与基期观察值之比减1后的结果,用%表示。
由于对比基期不同,增长率可以分为环比增长率和定基增长率。
环比增长率是报告期观察值与前一时期观察值之比减1,说明现象逐期增长变化的程度;定基增长率是报告期观察值与某一固定时期观察值之比减1,说明现象在整个观察期内总的增长变化程度。
设增长率为G ,则环比增长率和定基增长率可表示为;
期的观察值
表示用于对比的固定基在上式中定基增长率;环比增长率;00
00111Y ,,2,11,,2,11n i Y Y Y Y Y G n i Y Y Y Y Y G i
i i i i
i i i i =-=-=
=-=-=---
平均增长率;也称平均增长速度,它是时间序列中逐期环比值的几何平均数减1后的结果,计算公式为;
为环比值的个数表示平均增长率;式中,n G Y Y Y Y Y Y Y Y G n n
n n n 11011201-=-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛=-
关于增长率分析中应注意以下两个问题
1、当时间序列中有观察值出现0或负数时,不宜计算增长率
2、在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析。
第三部份、时间序列预测的程序
对时间序列进行预测包括以下步骤;
1、确定时间序列所包含的成分,也就是确定时间序列的类型
第一、确定趋势成分
确定趋势成分是否存在,可以从绘制时间序列的线图入手。
观察是否存在趋势,以及所存在的趋势是线性的还是非线性的。
判断趋势成分是否存在的另一种方法是利用回归分析拟合一条趋势线,然后对回归系数进行检验。
如果回归系数显著,就可以得出线性趋势显著的结论。
第二、确定季节成分
确定季节成分至少需要两年的数据,而且数据需要按季度、月份、周或天等来记录。
确定季节成份也可以从绘制时间序列的线图入手,但这里需要一种特殊的时间序列图,即年度折叠时间序列图。
绘制该图时,需要将每年的数据分开画在图上,也就是横轴只有一年的长度,每年的数据分别对应纵轴。
如果时间序列只存在季节成分,年度折叠时间序列图中的折线将会有交叉;如果时间序列既含有季节成份又含有趋势,那么年度折叠时间序列图中的折线将不会交叉,而且如果趋势是上升的,后面年度的折线将会高于前面年度的折线,如果趋势是下降的,后面年度的折线将低于前面年度的折线。
2、找出适合此类时间序列的预测方法
关于平稳序列折预测 1、简单平均法
简单平均法适合对较为平稳的时间序列进行预测,即当时间序列没有趋势时,用该方法比较好。
但如果时间序列有趋势或季节成份,该方法预测不准确。
此外简单平均法将远期的数值和近期的数值看做对未来对等重要。
但从预测的角度看,近期的数值要比远期的数值对未来有更大的作用,因此简单平均法预测的结果不够准确。
简单平均是根据过去已有的t 期观察值通过简单平均来预测下一期
的数值。
设时间序列已有的t 期观察值为t Y Y Y ,,21则t+1期的预测值;
()()∑∑+=+++++++=++=+++++=-=+++=+++=1
1
1212
211111
211111111111t i i t t t t t t t t t
i i
t t Y t Y Y Y Y t F t F Y e e t t t Y t Y Y Y t F 期的预测值为;于是,为:期的预测误差算出期的实际值,便可以计期后,有了当到了
2、移动平均法
移动平均法是通过对时间序列逐期递移求得平均数作为预测值的一种预测方法,其方法有简单移动平均法和加权移动平均法。
这里只说简单平均移动平均法。
移动平均法只使用最近k 期的数据,在每次计算移动平均值时,移动的间隔都为k 。
该方法也主要适合对较为平稳的时间序列预测。
应用时,关键是确定合理的移动间隔长度K 。
对于同一个时间序列采用不同的移动步长预测的准确性是不同的。
确定移动步长时,可通过试验的方法,选择一个使均方误差达到最小的移动步长。
k
Y Y Y Y Y Y t k Y Y Y Y Y F t k
Y Y Y Y Y t t k k k t t t k t k t t t
t k t k t t t t
t k t k t t 1
12
1112
11121211)
1(1+-+-+-+-+-+-+-+-+-++++==++++==++++=<< 同样,值为
期的简单移动平均预测可以用它来进行预测形态或趋势。
当然,也的变化就可以描述出时间序列结果,通过这些平滑值)是对时间序列的平滑式(期的移动平均值为:
),则(移动间隔为为下一期的预测值。
设期的数据加以平均,作简单移动平均是将最近(3)指数平滑法
指数平滑法是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t 期的实际观察值与t 期的预测值的加权平均值。
指数平滑法是加权平均的一种特殊形式,观察值时间越远,其权数也跟着呈现指数下降,因而称为指数平滑。
指数平滑法有一次
指数平滑、二次指数平滑等
一次指数平滑法也称为单一指数平滑法,它只有一个平滑系数,而且当观察值离预测时期越久远时,权数变得越小。
一次指数平滑是以一段时期的预测值与观察值的线性组合作为t+1期的预测值。
其预测模型为
())
1011<<-+=+αααα为平滑系数(期的预测值;
为期的实际观察值;为其中t F t Y F Y F t t t t t
用Excel 进行指数平滑预测的操作步骤; 1、选择‘工具’下拉菜单
2、选择‘数据分析’选项,并选择‘指数平滑’然后确定
3、当对话出现时;
在‘输入区域’中输入数据区域
在‘阻尼系数’中输入α-1的值(注:阻尼系数=α-1)
在‘输出区域’中选择预测结果的输出位置(通常选择与第一期数值对应的单元格) 关于趋势型序列的预测 (1)线性趋势预测
线性趋势是指现象随着时间的推移而呈现出稳定增长或下降的线性变化趋势。
模型为;
()
t
b Y b t t n Y t tY n b b b b t b y 102
2
1100
1-=--=
+=∑∑∑∑∑、最小二乘法可以求出
(2)非线性趋势预测
序列中的趋势通常可以认为是由于某种固定的因素作用于同一方向所形成的。
若这些因素随着时间的推移按线性变化,可以对时间序列拟合趋势直线;若呈现某种非线性趋势,则需要拟合适当的趋势曲线。
1、指数曲线
指数曲线用于描述以几何级数递增或递减的现象,即时间序列的观察值t Y 按指数规律变化,或者说时间序列的逐期观察值按一定的增长率增长或衰减。
指数曲线的趋势方程为;
1
12
1111
111lg lg lg lg lg lg lg lg lg lg lg lg ,b b b gb t b t b Y t t b b n Y b b b t b Y b b b b b b Y o o o o o o t o o t o t 、得到后,再取其反对数,即和求出的标准方程如下
和确定方法,得到理,按直线形式的系数然后根据最小二乘法原将两端取对数得、系数为待定系数为找到待定、其中⎪⎩
⎪⎨⎧+=+=+==∑∑∑∑∑
2、修正指数曲线
在一般指数曲线的基础上增长一个常数K ,即为修正指数曲线其趋势方程为;
∑∑∑+=+===
=
=→<<<>≠<≠>+=m
m t t
m
m t t
m
t t t
Y
S
Y S Y S S S S Y Y m k
b b b b b b b b k Y 31
23
21
211321t t 10101010t 3333y ,10,0,0k k 1
0,0,0k k 、、即、、和分别为设观察值的三个局部总个系数。
个局部部和来确定的序列观察值个局部总和分别等于原的值个时期,从而根据预测个部分,每部分有为将时间序列观察值等分是;得。
三和法的基本思路数通常可采用三和法求修正指数曲线中的未知时为增长极限。
即当降低,最终以渐长迅速,随后增长率逐这样一类现象;初期增修正指数曲线用于描述均为待定系数,且、、其中()()()⎥
⎦
⎤⎢⎣⎡
---=⎥⎥⎦
⎤
⎢⎢⎣⎡--=⎪
⎪⎭
⎫
⎝⎛=⎪⎪⎭⎫ ⎝⎛--+=⎪⎪⎭
⎫ ⎝⎛--+=⎪
⎪⎭
⎫
⎝⎛--+=++11m 1k 11---11111111101211112011223111121031111
0211101b b b b S b b b S S b S S S S b b b b b mK S b b b
b mK S b b b b mK S m m
m
m
m m m m
3、Gompertz 曲线
Gompertz 曲线是以英国统计学家和数学家B.Gompertz 命名的。
它的特点是:初期增长缓慢,以后逐渐加快,当达到一定的程度后,增长率又逐渐下降,最后接近一条水平线。
该曲线的两端都有渐近线,其上渐近线为Y=K ,下渐近线为Y=0。
Gompertz 曲线通常用于描述事物的发展由萌芽、成长到饱和的周期过程。
其趋势方程为
()()
()
⎥
⎦
⎤⎢⎣⎡⨯---=⎥⎥⎦
⎤
⎢⎢⎣⎡---=⎪
⎪⎭
⎫ ⎝⎛--==
=
=+=≠<≠<>=∑∑∑+=+==011112111
12011223131
23
21
21100101010100
lg 11
1lg 11lg lg lg lg lg lg lg lg )(lg lg lg 101001b b b b S m k b b b S S b S S S S b Y
S
Y S Y S b k k b b k b b b k Y b b k b b k kb Y m m
m
m
m t t
m
m t t
m
t t t
t b t t
则有、、令;、反对数救得和,取、、确定法,求出用修正指数曲线的常数、、为待定系数。
、、,其中,
4、多阶曲线
多阶曲线主要是对数据的拟合,即一阶多项式、二阶多项式、三阶多项式等的一个模拟。
它主要对多拐点的变化曲线的预测。
5、复合型序列的分解预测
复合型序列是指含有趋势、季节、周期和随机成分的序列。
对这类序列的预测方法通常是将时间序列的各个因素依次分解出来,然后进行预测。
由于周期成分的分析需要有多年的数据,实际中很难得到多年的数据来发现周期成分,因此采用分解模型为t t t t I S T Y ⨯⨯=分解法的预测通常包括以下几个步骤: 1、确定并分离季节成分。
1.1计算季节指数,以确定时间序列中的季节成分。
然后将季节成分从时间序列中分离出去产,即用每一个时间序列观测值除以相应的季节指数,以消除季节性。
季节指数刻画了序列在一个年度内各季度的典型季节特征。
在乘法模型中,季节指数是以其平均数等于100%
为条件而构成的,它反映了某一月份或季度的数值占全年平均数值的大小。
如果现象的发展没有季节变动,则各期的季节指数应等于100%;如果一月份或季度有明显的季节变动,则各期的季节指数应大于或小于100%。
因此,季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定的。
我们用平均趋势剔除法其实施步骤: 第1步;计算移动平均值,并将其结果进行中心化处理,也就是移动平均的结果再进行一次2项移动平均,即得到中心化移动平均值(CMA)
第2步;计算移动平均的比值,也称为季节比率,即将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度平均值 第3步;季节指数调整。
由于各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1,则需要进行调整。
具体方法是;将第2步计算的每个季节比率的平均值除以它们的总平均值。
1.2分离季节性成分。
计算出季节指数后,就可将各实际观察值分别除以相应的季节指数,将季节性成分从时间序列中分离出去。
用公式表示为I T S
I
S T S
Y
⨯=⨯⨯=
2、建立预测模型并进行预测。
对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。
由季节分离求出趋势线性方程,计算出各期的预测值。
3、计算最后的预测值。
用预测值乘以相应的季节指数,得到最终的预测值。
3、对可能的预测方法时行评估,以确定最佳预测方案
评价的方法就是找出预测值与实际值的差距,这个差值就是预测误差。
最优预测方法也不是预测误差达到最小的方法。
预测误差的计算方法有平均误差、平均绝对误差、均方误差、平均百分比误差和平均绝对百分比误差等。
(1)平均误差
为预测值的个数。
式中,)(表示,其计算公式为;用)平均误差()的平均数就是,所有预测误差(,预测值为个观测值设时间序列的第n n
F Y ME ME error mean
F Y F Y i n i i
i i i i i ∑=-=-1,(2)平均绝对误差
n
F Y MAD MAD deviation absolute mean n i i
i
∑=-=1)表示,其计算公式为:
平均误差,用后计算的是将预测误差取绝对值平均绝对误差( (3)均方误差
()n
F Y MSE MSE error square mean n i i
i ∑=-=12
表示:
平均误差,用的正负号后计算的)是通过平方消去误差均方误差( (4)平均百分比误差(MPE )和平均绝对百分比误差(MAPE)
ME 、MAD 和MSE 的大小受时间序列数据的水平和计量单位的影响,有时并不能真正反映预测模型的好坏,它们只有在比较不同模型对同一数据预测时才有意义。
而平均百分比误差和平均百分比误差则不同,它们消除了时间序列数据的水平和计量单位的影响,是反映误差大小
的相对值。
n Y F Y MAPE n Y F Y MPE n i i i i n i i i i ∑∑==⎪⎪⎭⎫ ⎝⎛⨯-=⎪⎪⎭⎫ ⎝⎛⨯-=11100100
4、利用最佳预测方案进行预测。