对预测模型优劣性评价的方法探讨
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
销售量 ,从而造成浪费 ;如果预测值过低 ,供不应求 ,将因脱销而减少利润 。但一般说来 ,蛋糕
的销售量预测不准所造成的损失随误差的大小而不同 ,也随预测值的偏高或偏低而不同 。假
如每块蛋糕的成本是 0170 元 ,售价为 1100 元 ,如果预测值比实际销售量多 10 块 ,那么所造成
的损失为 :10 ×0170 元 = 7 元 ;如果预测值比实际销售量少 10 块 ,则造成的损失为 10 ×0130
1999 年 3 月 25 日 统计理论与方法
对预测模型优劣性评价的方法探讨 3
杨桂元
摘 要 根据预测的目的建立损失函数 ,来衡量预测误差给管理决策带来的损 失 ,以损失函数取得最小值可以作为评价预测模型最优准则 。文章提出了建立损失 函数和对预测模型进行优劣性评价的一般方法 。
笔者认为 ,评价预测模型的优劣不能单纯从精度考虑 ,还应考虑不同类型的误差会产生不 同的效果 ,对决策造成的损失也是不同的 。无论是“误差平方和最小”还是“误差绝对值之和最 小”作为建立预测模型的最优准则 ,只考虑了误差的大小却没有考虑误差的方向 ,对正 、负误差 所产生的不同后果也没有充分考虑 。假如一位报商要对第二天某种报纸的销售量进行预测 , 以便根据预测值去批发 (或订购) 报纸 。如果他的预测值偏大 ,则必有一部分报纸售不出去 ,由 于报纸的时效性很强 ,出售不出去的报纸只能当作废纸处理 ,报商要蒙受损失 ;如果他的预测
1 n
i
n
∑C
=1
(
yi
-
^yi) 为最优准则建立预测模型
有一定的困难 ,但我们可以用所建立的损失函数进行预测模型的优劣性评价 ,这也是本文建立
损失函数的主要意图 。建立损失函数的目的不仅依此确定最优准则建立预测模型 ,更重要的
是可以用损失函数进行模型的优劣性评价 。根据预测的对象及目的 ,可以建立相应的损失函
i
n
∑C (ei)
=1
=
1
n
∑
n i=1
ei
,则
1 n
n
∑
i=1
e1i
=
4113
,
1 n
n
∑
i=1
e2i
= 4114 ,在以这种
损失函数所决定判断准则之下 ,预测方法 1 稍优于预测方法 2 。
若损失函数为
C=
1 n
i
n
∑C(ei)
=1
=
1 n
i
n
∑ei2
=1
,则
1 n
i
n
∑e21i
=1
=
2413
>
(4)
C4
=
1
n
∑
n i=1
ei yi
=
1
n
∑
n i=1
yi - ^yi yi
,C4 反映了预测模型的平均绝对相对偏差 。
— 12 —
1999 年 3 月 25 日 统计理论与方法
除此之外 ,还有其他的损失函数形式 。我们用一个一般的形式表示 ,就是 :
x2 , …,xm) + e 。记 ^y = f ( x1 ,x2 , …,xm) ,则 y = ^y + e ,从而有 yi = ^yi + ei ,其中 ^yi = f ( x1i ,x2i , …,
xmi) 。于是有 ei = yi - ^yi = yi - f ( x1i ,x2i , …,xmi) 为第 i 期数据的拟合误差 ,i = 1 ,2 , …,n 。对于
误差 ei
,如果带来的损失是 c (ei)
,我们把预测方法在各观测点的平均值 C =
1 n
i
n
∑c
=1
(ei)
称为这种
预测方法的损失函数 。损失函数具有如下特征 : (1) 不对称性 ; (2) 当不出现误差时函数值为
零 ; (3) 函数值恒非负 ,且随着误差绝对值的增大而增大 。后两个特征是一般损失函数必须具
3 本文为全国统计科学研究 (计划) 项目 。 收稿日期 :1998 - 05 - 11
— 11 —
统计与信息论坛 1999 年第 1 期
值偏小 ,他就失去了销售机会 ,但此时报商蒙受的损失一般说来要小于售不出时的损失 。 因此 ,正偏差与负偏差所带来的影响是不同的 。本文探讨对预测模型进行优劣性评价的方法 。 其基本思想是根据预测的目的建立一个损失函数 C(e) (它是预测误差 e 的函数) ,以损失函数 取得最小值为最优准则来对预测模型 (或预测方法) 进行评价 ,比较预测模型的优劣 。
立一般的损失函数 ,使其更具有代表性 ,当损失函数取不同的函数类型时 ,建立模型的最优准
则是不同的 。因此在建立预测模型时 ,可根据预测问题的实际意义 ,构造恰当的损失函数 ,使
建立的预测模型能充分体现预测者的意图 ,以取得更好的预测效果 。但并不是对任何损失函
数都可以建立预测模型 ,使损失函数
C=
备的 ,至于一般损失函数是否对称 ,要根据具体问题而定 。根据所建立的损失函数可以给出选
择预测方法的判别准则 。
判别准则 :根据预测的目的构造损失函数
C=
1 n
i
n
∑c
=1
( ei )
,在可供选择的预测方法中 ,使损
失函数 C 取得最小值的方法就是最优的预测方法 。
根据预测的目的和要求 ,常见的损失函数有以下几种 :
11958i2 (i = 年份 - 1983) ,其预测误差见下表 :
— 13 —
统计与信息论坛 1999 年第 1 期
附表 安徽省 1979~1987 年社会商品零售总额统计表 (单位 :亿元)
年 份 1979
零售额 误差 e1i
6514
1 n
i
n
∑C (ei)
=1
取得最小值
,这是因为
C
=
1 n
i
n
∑C
=1
(ei)
是依
赖于误差的 ,在预测模型没有得出以前不能确定其误差的符号和具体数值 ,对于一般的损失函
数无法给出一个具体的表达式 ,也无法求出其极值 。只有将损失函数具体化以后 ,才有可能求
出预测模型中的参数 ,使损失函数 C =
1 n
-
010384
-
010389
资料来源《: 安徽四十年》,中国统计出版社 ,1989 年 。
从表中可以看出 ,两种预测模型的平均拟合误差分别为 3184 %和 3189 % ,均不超过 5 % ,
都是较好的预测模型 ,但不能绝对说哪一个预测模型优于另一个预测模型 。
若损失函数为 C =
1 n
2151
e1i yi
010384
误差 e2i 0166
e2i yi
010101
1980
7514
2186
010379
6168
010886
1981
8215 - 1117 010142
5189
010741
1982
9218 - 3171 010400
4138
010472
1983
10217 - 8162 010839 - 1145 010141
关键词 预测模型 评价方法 损失函数
一 、引 言
预测是根据以往及现在的已知信息 ,采取一定的方法或技术 ,对事物的未来发展趋势和结 果进行估计或推测 。
假如要以预测结果为基础作出决策 ,那么 ,当预测出现误差时 ,决策就会遭受损失 ,因为决 策不是最优的 ,并且一般来说 ,误差的量级越大所造成的损失也越大 。因此 ,人们在对预测模 型或预测方法进行评价时 ,总是要进行精度分析 。据不完全统计 ,目前有预测方法 200 余种 , 对于同一预测问题使用不同的方法可以建立不同的预测模型 ,那么哪一个模型最适合这个问 题 ,也就是说哪一个预测模型最好呢 ? 这就应该有对预测模型 (或预测方法) 进行优劣性评价 的方法 。关于精度分析和精度评价的方法及文献很多 ,人们在建立预测模型时也充分考虑预 测精度 ,无论是单一的预测方法还是多种预测方法进行组合的组合预测方法 ,无论是静态的预 测模型还是动态的预测模型都把控制预测误差作为主要目标 ,为此建立预测模型的最优准则 有“误差平方和最小”“、误差的绝对值之和最小”等等 。
元 = 3 元 ,因为每块蛋糕的利润是 0130 元 。在这个例子中 ,由误差 ei 所产生的损失可由下式
表示 :
- 017ei ei < 0 c (ei) = 013ei ei Ε 0 最小
这个损失是误差 ei 的函数 , (i = 1 ,2 , …,n) 。 若对某一项预测问题有 n 期数据 (yi , x1i , x2i , …, xmi) ,i = 1 ,2 , … n ,预测模型为 y = f ( x1 ,
二 、损失函数
对于预测问题来说 ,只要有误差就会造成损失 。例如 ,一家糕点厂的老板既不作广告宣
传 ,也不储备成品 ,他出售的蛋糕都是在 24 小时之内加工的 。实际上 ,蛋糕是在晚间加工的 ,
第二天在门市部出售 ,任何滞销的蛋糕都将被扔掉 ,不产生任何经济价值 。现需要预测第二天
的销售量 ,蛋糕的生产量总是和预测值保持一致的 ,如果预测值过高 ,蛋糕的产量显然会大于
i
n
∑C
=1
(
ei
)
达到最小值
。所以损失函数取其他几种形式
时 ,虽然都具有各自的实际意义 ,但往往给预测模型参数的估计带来一定的困难 ,这也导致了
迄今为止还没有以一般意义的损失函数取最小值为最优准则的参数估计方法 。
三 、预测模型的优劣性评价
虽然以一般意义下的损失函数
C=
1 n
i
n
∑C
=1
(ei)
=
i
n
∑C
=1
(ei)
=
1 n
i
n
∑ei2
=1
时 ,就等价于使误差平方和最小 ,即等价
n
n
于 C′= ∑C (ei) = ∑ei2 ,这就是通常的最小二乘法 。迄今为止 ,最小二乘法是建立预测模型最
i=1
i=1
常用的方法之一 。当
C=
1 n
i
n
∑C
=1
(ei)
=
1
n
∑
n i=1
ei
时 ,就等价于使误差绝对值之和最小 ,也就等价
i
n
∑C
=1
(ei)
,其中
C (ei)
=
27ei ei < 0 3ei ei Ε 0
n
n
于 C′= ∑C (ei) = ∑ ei ,这就是通常所说的最小一乘法 。最小一乘法虽然没有最小二乘法应
i=1
i=1
用广泛 ,但它受异常数据的影响较小 ,稳健性较强 ,尽管不能直接用统计方法估计模型中的参
数 ,但可将其化为一个线性规划问题来估计模型中的参数 ,不失为一种重要的建立预测模型的
方法 。因此 ,最小二乘法与最小一乘法所对应的损失函数均是属于特殊情况 。我们希望能建
(1)
C1
=
1 n
i
n
∑ei2
=1
=
1 n
i
n
∑( yi
=1
-
^yi) 2
,C1
反映了预测模型的方差 。
(2) C2 =
1 n
n
∑ei2
i=1
=
1 n
i
n
∑(
=1
yi
-
^yi) 2
,C2
反映了预测模型的标准差 。
(3)
C3
=
1
n
∑
n i=1
ei
=
1
n
∑
n i=1
yi -
^yi
,C3 反映了预测模型的平均绝对偏差 。
1984
11915 - 8191 010746 - 4129 010359
1985
14318 - 4131 010300 - 3155 010247
1986
16917 - 1114 010067 - 5112 010302
1987
20110 3194
010196 - 5121 010259
平均相对误差 -
1 n
i
n
∑e22i
=1
= 2016 ,方法 2 优于方法 1。
若损失函数为 C =
1 n
i
n
∑C (ei)
=1
=
1
n
∑
n i=1
ei yi
,则
1 n
i
n
∑
=1
e1i yi
= 3184 % <
1
n
∑
n i=1
e2i yi
= 3189 % ,
在这种准则之下 ,方法 1 优于方法 2 。
若损失函数为
C如=果1n
(e1i)
<
1 n
i
n
∑C
=1
(e2i)
时
,则根据判别准则
f1
就是较优的预测方法
。
例如 :根据安徽省 1979~1987 年社会商品零售总额 (单位 :亿元) 的统计资料 ,可以分别建
立指数 曲 线 预 测 模 型 f 1 = 11113227e011428i 及 抛 物 线 预 测 模 型 f 2 = 10411469 + 1716833i +
(5)
C =
1 n
i
n
∑C
=1
(ei)
=
1 n
n
∑C ( yi
i=1
-
^yi)
,C 反映了预测模型一般的损失函数 ,它可以是以上
四种形式中的某一种或其他形式 。
当选取确定的损失函数以后 ,建立预测模型的最优准则是 ,选择 f 中的参数 ,使损失函数
C=
1 n
i
n
∑C
=1
(ei)
达到最小值
。若
C
=
1 n
数 ,用损失函数根据判别准则来选择较优 (或较有效) 的预测模型 。设 f1 ,f2 是两种预测方法 ,
当用它们进行 n 期预测时 ,其预测误差分别为 e11 ,e12 , …,e1n ;e21 ,e22 , …,e2n 。对于给定的损失
函数 C =
1 n
Biblioteka Baidu
i
n
∑C
=1
(ei)
,如果
1 n
i
n
∑C
=1