预测原理和方法 PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
值。为了计算方便,以误差的平方和最小为标准确定回归模型:
n
n
Q ( yi yˆi )2 ( yi a bxi )2
▪ 对Q分别对a和b求微分:i1
i 1
Q
a
n
2
i 1
( yi
a
bxi )
▪
令微分方程为零(使总误差Qb最小 )2,in1解((方yi 程 组a 得b到xi a) *和xi
模的。假设因变量y与自变量
x 1(, xk=2 ,2…,, 3x,k 4,…)
之间有线性关系,一般多元线性回归模型为
y
b0
b1 x1
b2 x2
…b k
xk u
其中b0 , b1, b 2 ,是…回, b归k 系数,u为随机误差项。
Page 7
多元回归分析
最小二乘法
▪ 对于多元线性回归模型,可以通过矩阵计算参数 b:
时间序列预测 数为
Yt
Yt
Yt1
Ytn1 n
②计算二次移动平均值序列
Mt
Yt
Yt1
Ytn1 n
③进行预测
YtT at btT
由右边的式子可以求得 和at bt
Page 13
at 2Yt M t
bt
2(Yt M t ) n 1
时间序列预测
平滑法预测——移动平均法
▪ 例 某企业销售额的一次和二次移动平均值
分解预测
▪ 为计算各比值的平均值和季节指数,需要将上表的比值再按季度重新排列
年份
2000 2001 2002 2003 2004 2005 平均
季节指数
(×1.0037)
1 —— 0.8989 0.8056 0.7767 0.7205 0.7447 0.7892
0.7922
季度
2 —— 1.1014 1.0365 1.0000 1.0275 1.0269 1.0385
▪ 2、二次指数平滑法的基本计算步骤
① 计算一次指数平滑值序列 Yt Yt (1 )Yt1
② 计算二次指数平滑值序列 M t Yt (1 )M t1
③ 进行预测 YtT at btT
Page 15
at 2Yt M t
bt
(Yt M t ) 1
时间序列预测
平滑法预测——指数平滑法
30
2
38
3
42
4
30
2002-1
29
2
39
3
50
4
35
2003-1
30
2
39
3
51
4
37
2004-1
29
2
42
3
55
4
38
2005-1
31
2
43
3
54
30.00
31.25 32.75 34.00 35.00 34.75 35.00 37.00 38.25 38.50 38.50 38.75 39.25 39.00 39.75 40.75 41.00 41.50 41.75 41.50 42.25
▪ 式中 b是线性回归的估计系数向量。
Page 8
回归分析——非线性回归分析
▪ 对变量进行变换,把非线性问题转换为线性问题, 然后用最小二乘法求解。
▪ 例如:对多项式回归 y c0 c1x c2 x2, c在3 x很3 多c情4 x况4 下,高
次多项式可以更好地变量之间的关系,此时先把方程转换成 线性方程,需要定义如下几个新变量:
比值(Y/CMA)
1.2082 0.8125 0.8989 1.10145 1.2043 0.8602 0.8056 1.0365 1.3029 0.9091 0.7767 1.0000 1.3035 0.9397 0.7205 1.0275 1.3333 0.9129 0.7447 1.0269
时间序列预测
1.0424
30.70
1.2752
29.02
0.8902
29.21
0.7922
37.87
Yˆ 1.0424 t
30.6067 0.356.54592t
1.2752
32.94
0.8902
33.70
0.7922
36.61
1.0424
37.41
1.2752 60
0.8902
39.21 39.32
0.7922 50
应用回归模 型对变量进 行预测
第四步 检验回归模型
回归分析——一元回归分析
一元线性回归是描述两个变量之间线性相关关系的最简单的 回归模型.
y
y a bx
其中,y的方差假定为常数;
和a 都b是回归系数.
0
x
散点图
Pagewk.baidu.com4
一元回归分析—— 最小二乘法
▪ 对应于每一个 x,i y是i 所给数据集的真实输出值,而 是yˆi从模型中得出的响应
Page 10
时间序列预测
▪ 采用什么方法进行预测取决于时间序列所包含的成分。一般来说,任何时 间序列中都会有不规则成分存在,而经济与管理数据中由于数据较少,通 常不考虑周期性成分,因此只剩下趋势成分和季节成分。
Page 11
时间序列预测
平滑法预测 ▪ 如果序列中只含有随机成分,用平滑法进行预测比较合适。 ▪ 主要有移动平动法和指数平滑法等。 ▪ 此类方法是通过对时间序列进行平滑以消除其随机波动,因而称为平滑
▪
Y b ·X U
▪ 式中b {b0 , b1, b,2 ,X ,和bkY}是所给抽样数据集的输入和输出矩阵。识差平方
和 也可以用矩阵表示如下:
▪ ▪ 优化后得
SS E (Y bX )T (Y bX )
SSE 0 (X T X )b X TY b
▪ 最后,向量 b满足矩阵方程式 b ( X T X )1 ( X TY )
▪ 例 某企业的销售额的一次和二次指数平滑值
月份
实际销售额(万元)
一次指数平滑值
0.1
0.3
0.4
1 2 3 4 5 6 7 8 9 10
Page 16
600 800 900 1000 800 700 800 900 700 1000
600
600
600
620
660
680
648
732
768
Page 19
调整系数 = 4/3.985 = 1.0038
时间序列预测
分解预测
1.4
1.1
季节指数
0.8
0.5
0.5
1.5
2.5
3.5
4.5
Page 20
啤酒销售量的旺季是3季度,淡季是1季度。
时间序列预测 年/季度
时间编号
销售量 (Y)
2000.1
1
25
2
2
32
分解预3 测 3
37
4
4
26
2001.1
预测
二、思想和原理
Page 1
预测方法框架
定性方法
Delphi 法 ……
……
线性回归 多元回归
一元线性回归
多元线性回归 对数回归
预 测
广义线性回归
回归分析
泊松回归
方 法
非线性回归 简单平均法
移动平均法
定量方法
平滑法 指数平滑法
时间序列
季节多元回归模型 季节性预测法 季节自回归模型
分解预测
Page 2
Page 17
时间序列预测
分解预测
▪ 例:根据啤酒生产 企业2000-2005 年各季度的销售量 数据,采用分解法 预测2000-2005 年各季度的啤酒销 售量,并预测 2006年各季度的 啤酒销售量。
Page 18
年/季度 销售量(Y) 4个季度移动平均数
2000-1
25
2
32
3
37
4
26
2001-1
4
41
中心化移动平均值 (CMA)
30.625 32.000 33.375 34.500 34.875 34.875 36.000 37.625 38.375 38.500 38.625 39.000 39.125 39.375 40.250 40.875 41.250 41.625 41.625 41.875
(39.1)2 …(169.1)2
≈
3.5
薪
40
20
a55.4(3.5)(9.1)≈ 23.6
0
最小二乘直线的方程估计为 y 23.6 3.5x
0
Page 6
5 10 15 20 25 工作年数
多元回归分析
▪ 多元线性回归是直线回归的扩展,涉及多个预测变量。
响应变量y是作为两个以上预测变量的线性函数来建
837
775
812
850
812
Page 14
时间序列预测
平滑法预测——指数平滑法
▪ 1、基本思想
▪ 用t期实际值 Y与t t期预测值 的Ft加权平均值作为第t+1期的预测值。该方法
是加权平均的一种特殊形式。通过加权平均而给最近的观察值以较大的权 数,而对于离现在较远的观察值则给予较小的权数,也就是更重视最近的 观察值。根据平滑次数的不同,有一次指数平滑,二次指数平滑及高次指 数平滑等。
1.0424
1.2752 40
37.87 37.41 39.99
销售量(万吨)
0.8902
0.7922 30
41.56 36.61
1.0424 20
1.2752
0.8902 10
0.7922 1.0424 1.2752
0 0
40.29
43.13
42.69
法。 ▪ 平滑法既可用于短期预测,也可以用于对时间序列进行平滑以描述序列
的趋势(包括线性趋势和非线性趋势)。
Page 12
时间序列预测
平滑法预测——移动平均法
▪ 1、基本思想
▪ 它是根据时间序列,逐项移动,依次计算包括一定项数的序列平均数,形成一个序 列平均数的时间序列。
▪ 2、基本计算步骤
①计算第一次移动平均值序列。设移动间隔为n(1<n<t),则第t期的一次移动平均
解法进行预测时,需要先找出季节成分并将其从序列中分离出去,然后建立预
测模型再进行预测 Yt Tt St Ct I t
其中,趋势(T)、季节变动(S)、循环波动(C)和不规则波动(I) ▪ 2、基本计算步骤
第1步:确定并分离季节成分;计算季节指数。 第2步:建立预测模型并进行预测。 第3步:计算出最后的预测值;用预测值乘以的季节指数,得到最终的预测值。
趋势预测方法
线性趋势推测 非线性趋势推测 自回归模型预测
回归分析
▪ 定义:分析一个变量与其他一个或几个变量之间的相关关系的 统计方法就称为回归分析。 回归分析的步骤:
第一步
确定因变量 和影响因素 (自变量)
第二步
绘制散点图, 观察变量的 大致关系
第三步
求回归系数, 并建立回归 模型
Page 3
第五步
工作年数x
38
9 13 3
6
11 21 1
16
年薪y(单位:1000美元) 30 57 64 72 36 43 59 90 20 83
解:给定以上数据,计算出
100
x 9.1 y 55.4
将这些值代入最小二乘法的回归系数公式,
80
得到
年 60
b
(39.1)(3055.4)…(169.1)(8355.4)
,x1 x, x2, x2
▪ 代入原先的多项式方程,得到
x3 x3 x4 x4
y c0 c1x1 c2 x2 c3 x3 c4 x4
▪ 多项式回归问题就转化为一个多元线性回归问题,这样就可 以用最小二乘法来解决问题。
Page 9
回归分析——非线性回归分析
▪ 最基本的是要对输入变量或它们的合并项选择合适的转换。 下表列出了对回归模型进行线性化的一些有效的转换。
5
30
2
6
38
3
7
42
4
8
30
2002.1
9
29
2
10
39
3
11
50
4
12
35
2003.1
13
30
2
14
39
3
15
51
4
16
37
2004.1
17
29
2
18
42
3
19
55
4
20
38
2005.1
21
31
2
22
43
3
23
54
Page 21
4
24
41
季节指数 (S)
季节分离后的序列 (Y/S)
0.7922
31.56
)
的b 计算式
n
n
b [ (xi x)(yi y)]/[ (xi x)2 ]
i1
i1
a y bx
▪ 式中x, 分y 别是变量x,y的n个样本的平均值
Page 5
一元回归分析—— 最小二乘法
▪ 例 表2.1给出了一组成对的数据。其中,x表示大学毕业后工作的年数,而y是对应 的年薪。这些二维数据可以用散点图,如图2.2所示。该图暗示两个变量之间存在 线性关系。用方程 y 对a 年b薪x 和工作年数之间的关系建模。
683
812
860
694
808
836
695
776
781
705
783
789
725
818
833
722
782
780
750
847
868
二次指数平滑值 0.3
600 618 652 700 732 745 757 775 777 798
时间序列预测
季节性预测——分解预测
▪ 1、基本思想 ▪ 分解预测是先将时间序列的各个成份依次分解出来,然后再进行预测。采用分
3 1.2082 1.2043 1.3029 1.3035 1.3333 —— 1.2704
1.0424
1.2752
4 0.8125 0.8602 0.9091 0.9397 0.9129 —— 0.8869
Sum=3.985
0.8902
▪ 由于计算过程不可避免误差,需要对计算出的季节变动平均数加以调整
月份 1 2 3 4 5 6 7 8 9 10
实际销售额(万元) 600 800 900 1000 800 700 800 900 700 1000
三个月一次移动平均
766 900 900 833 766 800 800 866
四个月一次移动平均 四个月二次移动平均
825
875
850
825
843
800