论文 随机线性模型建模——历年油价预测模型 精品

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课程设计(论文)
课程名称:应用随机过程
设计题目:建模
院系:电子与信息工程学院
班级:通信一班
设计者:
学号:
指导教师:
设计时间:2009-9至2009-12
课程设计任务书
姓名:吴华明院(系):电子与信息技术研究院
专业:信息与通信工程班号:09硕通信一班
任务起至日期:2009 年9 月11 日至2009 年12 月20 日
课程设计题目:随机线性模型建模——历年油价预测模型
——历年油价预测模型
已知技术参数和设计要求:
已知一段时间内全球的原油价格,建立油价的随机线性模型,并对未来时刻的全球油价进行预测。

工作量:
1.查找相应的资料,对随机线性模型的建模过程进行熟悉。

2.查找相关的历年油价的数据,并对数据进行预处理。

3.由已知的样本函数,计算随机线性模型的参数。

4.对随机线性模型的阶数进行判定。

5.建立预测方程,并对未来时刻的全球油价进行预测。

工作计划安排:
1.2009-9~2009-10:对随机线性模型建模的方法进行学习
2.2009-10~2009-11:查找相关的资料,确定建模的数据
3.2009-12:建立随机线性模型,并进行预测
同组设计者及分工:

指导教师签字___________________
年月日教研室主任意见:
教研室主任签字___________________
年月日
*注:此任务书由课程设计指导教师填写。

随机线性模型建模
--历年油价预测模型
摘要:本文主要就序列进行了综合分析,并根据实测的95个数据,通过模型判别和参数估计等手段建立了AR预测模型,并利用该模型对序列下一时刻的值进行了预报。

关键词:随机过程线性模型自相关函数偏相关函数预测
一.线性模型的建立:
确定平稳时间序列线性模型的步骤可归纳为五个步骤,以下结合本文的数据具体介绍建模的过程:
1.数据选择
本次建模,本人采用的数据是历年油价(见表1,共有95个数据)。

本文将利用表中的数据建立油价的随机线性模型,并对t=96100时段的油价进行预测。

表1 历年油价时间序列(单位:美元/桶)
t Y t t Y t t Y t t Y t t Y t
1 19.5900 21 15.5400 41 21.3100 61 13.0000 81 16.8700
2 14.9100 22 21.9400 42 18.8400 62 11.9000 82 16.1300
3 15.7400 23 23.1100 43 24.8400 63 11.7900 83 15.7600
4 15.4000 24 18.6400 44 15.6700 64 12.5500 84 15.6600
5 13.0600 25 14.9400 45 15.5700 65 11.8400 85 15.5400
6 19.0700 26 16.9000 46 12.7300 66 11.2500 86 15.3000
7 15.2800 27 15.4600 47 13.5600 67 11.1500 87 15.0500
8 15.8200 28 11.1500 48 15.5400 68 10.9900 88 14.6900
9 12.7700 29 13.1300 49 17.2200 69 11.7000 89 14.3900
10 12.0500 30 12.4800 50 12.1400 70 14.0100 90 14.1800
11 11.6900 31 12.9500 51 11.0700 71 17.5100 91 13.7000
12 13.8500 32 12.5900 52 12.0200 72 17.2700 92 13.6600
13 13.8500 33 10.5800 53 11.5500 73 16.9000 93 13.2700
14 10.0700 34 10.5800 54 6.9200 74 15.7900 94 13.5600
15 9.1700 35 12.3900 55 10.3300 75 15.4500 95 13.1400
16 10.7900 36 15.5300 56 8.3800 76 6.2400 96 -
17 13.4400 37 13.0600 57 12.1100 77 16.7100 97 -
18 21.1700 38 10.2200 58 11.4600 78 16.7700 98 -
19 18.6400 39 16.3300 59 12.7500 79 16.6400 99 -
20 13.2100 40 19.7200 60 13.3200 80 17.8000 100 -
表2 经过差分运算的时间序列Z t和均值为零的时间序列t t Z t t t Z t t t Z t t
1 5.5100 5.464
2 3
3 1.8100 1.7642 65 0.4900 0.4442
2 -1.1700 -1.2158 34 1.3300 1.2842 66 -0.0600 -0.1058
3 -2.0000 -2.0458 35 -5.6100 -5.6558 67 0.8700 0.8242
4 8.3500 8.3042 36 -0.3700 -0.4158 68 1.6000 1.5542
5 -9.8000 -9.8458 37 8.9500 8.9042 69 1.1900 1.1442
6 4.3300 4.2842 38 -2.7200 -2.7658 70 -3.7400 -3.7858
7 -3.5900 -3.6358 39 -1.8000 -1.8458 71 -0.1300 -0.1758
8 2.3300 2.2842 40 -4.0600 -4.1058 72 -0.7400 -0.7858
9 0.3600 0.3142 41 8.4700 8.4242 73 0.7700 0.7242
10 2.5200 2.4742 42 -15.1700 -15.2158 74 -8.8700 -8.9158
11 -2.1600 -2.2058 43 9.0700 9.0242 75 19.6800 19.6342
12 -3.7800 -3.8258 44 -2.7400 -2.7858 76 -10.4100 -10.4558
13 2.8800 2.8342 45 3.6700 3.6242 77 -0.1900 -0.2358
14 2.5200 2.4742 46 1.1500 1.1042 78 1.2900 1.2442
15 1.0300 0.9842 47 -0.3000 -0.3458 79 -2.0900 -2.1358
16 5.0800 5.0342 48 -6.7600 -6.8058 80 0.1900 0.1442
17 -10.2600 -10.3058 49 4.0100 3.9642 81 0.3700 0.3242
18 -2.9000 -2.9458 50 2.0200 1.9742 82 0.2700 0.2242
19 7.7600 7.7142 51 -1.4200 -1.4658 83 -0.0200 -0.0658
20 4.0700 4.0242 52 -4.1600 -4.2058 84 -0.1200 -0.1658
21 -5.2300 -5.2758 53 8.0400 7.9942 85 -0.0100 -0.0558
22 -5.6400 -5.6858 54 -5.3600 -5.4058 86 -0.1100 -0.1558
23 0.7700 0.7242 55 5.6800 5.6342 87 0.0600 0.0142
24 5.6600 5.6142 56 -4.3800 -4.4258 88 0.0900 0.0442
25 -3.4000 -3.4458 57 1.9400 1.8942 89 -0.2700 -0.3158
26 -2.8700 -2.9158 58 -0.7200 -0.7658 90 0.4400 0.3942
27 6.2900 6.2442 59 -0.8900 -0.9358 91 -0.3500 -0.3958
28 -2.6300 -2.6758 60 -0.7800 -0.8258 92 0.6800 0.6342
29 1.1200 1.0742 61 0.9900 0.9442 93 -0.7100 -0.7558
30 -0.8300 -0.8758 62 0.8700 0.8242 94 - -
31 -1.6500 -1.6958 63 -1.4700 -1.5158 95 - -
32 2.0100 1.9642 64 0.1200 0.0742 96 - -
2.数据预先处理:
该原始时间序列具有不平稳性,采用进行两次差分运算的方法消除趋势性,Z t=(Y t+2- Y t+1)-(Y t+1- Y t),得到新的时间序列Z t,如表2所示,并画出处理前后的图形,如图1所示,可见基本符合平稳随机序列的特征。

10203040
5060708090100
-20-15
-10
-5
5
10
15
20
25
两次差分后的序列图和原数对比图
t
油价:美元/桶
原数据
两次差分后的数据
图1两次差分运算后和原数据的对比图
为了方便数据的处理和分析,期望得到均值为零的时间序列{}的样本序列,利用已知的样本值来计算样本的均值Z ,并做变换= Z t –Z , t = 1,2,3,…,93,得n 个数据,n =93。


中:∑∑====93
1
19311j j n j j Z Z n Z =0.0458
新样本{ , t=1,2, 3,…,93}如表2中栏所示。

其图像如图2所示,可见处理后的序列
取值在0上下波动。

010203040
5060708090100
-20
-15
-10
-5
5
10
15
20
wt 序列随时间变化
t
油价:美元/桶
图2均值为零的时间序列{}的波形
3.样本自协方差函数、自相关函数、偏相关函数的计算:
在计算样本自协方差函数,样本自相关函数,偏相关函数时,,一般取。

在本文中取。

● 样本自协方差:
11221
1,0,1,2,()n k
k k n k n k j j k j k k k n n n ωωωωωωγωω-++-+=+++===<∑
其中 n =93, K =20。

从而得到的相应数值,如下表所示:
表3 和的数值
k k k 0 22.0937 1.0000 7 -1.4630 -0.0662 14 3.0038 0.1360 1 -11.9023 -0.5387 8 0.2794 0.0126 15 -4.1173 -0.1864
2 1.1599 0.0525 9 -0.3239 -0.0147 16 1.0361 0.0469
3 -2.2656 -0.1025 10 2.4863 0.1125 17 0.1318 0.0060
4 3.3771 0.1529 11 -4.2622 -0.1929 18 2.1843
0.0989 5 -2.2179 -0.1004 12 2.8623 0.1296 19 -2.3601 -0.1068
6
1.9383
0.0877
13
-1.1400
-0.0516
20
1.1790
0.0534
● 样本自相关函数:
将求得的自协方差函数带入式子:,k=0,1,2,中,得到与相对应的的数值同样见表3,并绘出相应的样本自相关函数的曲线如图3所示。

02468
101214161820
-0.6
-0.4
-0.2
0.2
0.4
0.6
0.8
1
样本自相关函数点图
k
自相关函数ρk
图3 样本自相关函数
● 样本偏相关函数:
为求出样本的偏相关函数,需要求解如下的Yule-Walker 方程:
⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛--k kk k k k k ρρρϕϕϕ
ρ
ρ
ρρ
ρρρρρρρˆˆˆˆˆˆ1ˆˆˆˆˆˆˆ1ˆˆˆˆ12121121
121211121
得,
⎪⎪
⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛-k kk k k ρρρρϕϕϕˆˆˆˆˆˆˆ21121 ,当k 分别取1,2,3,…,K 时,求出如表4所示(设=1)。

表4 样本偏相关函数的值
k k k k 0 1.0000 6 -0.1109 12 -0.0567 18 0.0281 1 -0.5387 7 -0.0848 13 -0.0767 19 -0.0042 2 -0.3349 8 -0.0967 14 0.1172 20 0.0343 3 -0.3891 9 -0.1000 15 0.0337 4 -0.2087 10 0.0821 16 -0.0755
5
-0.2288
11
-0.1022
17
-0.0793
为了便于分析与比较,同样画出的曲线,见图4.
02468
10
1214161820
-0.6
-0.4-0.2074
00.2074
0.4
0.60.81样本偏相关函数点图
k
偏相关函数
图4 样本偏相关函数图
4.模型识别:
由图3、4或表3、4可以看出样本自相关函数与偏相关函数的取值具有如下特点:
● 样本自相关函数拖尾:
根据样本自相关函数的点图(图3)可见,当k 逐渐增大时,越变越小,故可判断具有拖尾性。

● 样本偏相关函数截尾:
当5k >时,平均20个中至多有一个使,则认为截尾在k=p=5处。

综上,可以判断本模型为AR(5)模型。

5.参数估计:
对于AR(5)模型计算参数估计值,采用矩估计的方法,具体公式如下:
⎪⎪⎪⎪⎪
⎭⎫ ⎝⎛⎪⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛=⎪⎪
⎪⎪⎪⎭⎫ ⎝⎛---p p p p ρρ
ρ
ρ
ρ
ρρρ
ρρρρ
ρρφφ
φˆˆˆ1ˆˆˆˆˆˆˆ1ˆˆˆˆ1
~~~
211
121
1221112121
其中p =5。

将表3中的已知数据值带入上式可得: ⎪⎪
⎪⎪⎪⎪⎭⎫ ⎝⎛-----=⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎪⎪⎪⎭⎫
⎝⎛=⎪⎪⎪⎪⎪⎪⎪⎪⎭

⎝⎛-2283.04208.07355.08719.09780.00.1004-0.1529 0.1025-0.0525 0.5387-0000.10.5387-0.05250.1025-0.15290.5387-0000.10.5387-0.05250.1025-0.05250.5387-0000.10.5387-0.05250.1025-0.05250.5387-0000.10.5387-0.15290.1025-0.05250.5387-0000.1~~~~~154321φφφφφ
从而可得AR(5)模型为:,取t=k+l 。

在上式两边分别取估计值并带入具体数值,整理得此AR(5)模型的预报公式为: ,当k+l-i<n 时,有。

二.模型预测
由前面得到的AR(5)模型的预报公式可对以后几个时段的该地地震等级的值进行预
测。

利用Z 89, Z 90, Z 91, Z 92, Z 93可得下几个时段油价的预测值:
=0.4294
=-0.0602 =0.1945
=-0.1160
= 0.1636
又因为Z t 是由Y t 经过两次差分得到的,即Z t =(Y t+2- Y t+1)-(Y t+1- Y t )
得Y t=Z t-2+2Y t-1- Y t-2,
所以Y96=0.4294+2*13.1400-13.5600=13.1494
Y97==-0.0602+2*13.1494-13.1400=13.0986
Y98==0.1945+2*13.0986-13.1494=13.2423
Y99==-0.1160+2*13.2423-13.0986=13.2700
Y100== 0.1636+2*13.2700-13.2423=13.4613
三.模型评价
本文运用了随机过程的相关知识,通过建立了历年油价的随机线性模型,较好地实践了随机线性模型的建立以及预报这一数学过程。

当然,由于掌握的资料广度和本人的知识水平的限制,只能根据本文的数据进行分析,模型还比较粗糙,该模型还可以通过其它的估计方法进行进一步的完善
四.非线性模型分析
在现实生活中更多的模型并不能很好的符合线性模型,这就需要引入非线性模型的概念。

比如金融时间序列通常经历夹杂着动荡突发的漫长平静期,这种形式的相关性自然地导致了对能够拟合这种波动性的非线性随机过程的考虑。

但由于非线性问题的复杂性,非线性估计难度较大,传统的估计方法存在着一定的缺陷。

非线性估计领域的经典方法是EKF(Extended Kalman Filtering),但EKF本质上是一种粗糙的方法,计算复杂、滤波不稳定。

自EKF提出的近三十年间,众多学者尝试各种方法对非线性估计问题进行了深入的研究,提出了不少新方法、新思路。

建立非线性模型常采用的方法是:在以提出的非线性模型中挑选进行拟合,如果拟合效果好,则采用。

就其实质而言,非线性估计的核心在于近似,当今各种非线性估计方法的不同在于其做近似处理的思想和实现手段的差异上。

近似的本质就是对难以计算的非线性模型施加某种数学变换,变换成线性模型,然后用Bayes估计原理进行估计。

这就是非线性估计理论的基本思想。

参考文献
[1]田波平等;应用随机过程讲义;数学系;2005
[2]George E. P. Box, Gwilym M. Jenkins, Gregory C. Reinsel;顾岚等译;时间序列分析预
测与控制;中国统计出版社;1999
[3] 安鸿志;时间序列分析;华东师范大学出版社;1992
[4]谢衷洁;时间序列分析;北京大学出版社;1990
[5]杨位钦,顾岚;时间序列分析与动态数据建模;北京理工大学出版社;1988。

相关文档
最新文档