典型负荷预测方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

几种经典的负荷预测方法
短期负荷预测方法从时间上来划分可分为传统和现代的预测方法。

传统的负荷预测方法主要包括时间序列法、回归分析法、状态空间法等,而现代的负荷预测方法主要是应用专家系统理论、模糊理论和神经网络理论来进行短期负荷预测。

§1 时间序列法
时间序列法是将某一现象所发生的数量变化根据时间的先后顺序排列,以揭示这一现象随时间变化的发展规律,从而用以预测现象发展的方向和数量,此类方法在电力行业做中长期规划时是使用最广泛的。

基本步骤为:第一步先对这些数据加以描述,第二步用适当的数理统计方法对这个时间序列加以解释,确定它的数据模型;第三步是对时间序列进行预测;第四步是根据预测结果设法加以控制,以便达到预期的效果,它主要分为指数平滑法和自回归—移动平均模型。

§1.1 指数平滑法
假设时间序列有着某种基本数据模式,而观测值不但体现着这种基本数据模式,又反映着随机变动。

指数平滑法[10]的目标就是采用“修匀”历史数据来区别基本数据模式和随机变动。

这相当于在历史数据中消除极大值或极小值,获得该时间序列的“平滑值”,并以它作为对未来时期的预测值。

一、移动算术平均法
移动算术平均法[11],设当前时期为f 已知时间序列观测值为t
x x x ,,,21 ,假
设按连续n 个时期的观测值计算一个平均数,作为对下一个时期,即(t +1)时期的预测值,用
1
+t F 表示
1+t F ==++---)(1
11n t t t x x x n
∑--=t n t i i x n 11 (1—1)
当n =1时,表示直接用本期观测值
i
x ,作为对下一个时期的预测值1
+t F 。

它的优点是计算简单,缺点是要保存的数据比较多,而且n 的大小不容易确定,它只能用于平稳时间序列。

二、指数平滑法
指数平滑法[12]实际上是从移动算术平均法演变而来的,它也只适用于平稳时间序列,它的优点是不需要保留较多的历史数据,只要有最近的一期的实际观
测值t x
和这期的预测误差)(t t t F x e -=,就可以对未来时期进行预测。

t t t F x F )1(1αα-+=+
(1—2)
其中:α是平滑常数,10<<α。

可以运用最小均方差的原则,自动寻找最佳的平滑常数。

三、线性指数平滑法
当时间序列随时间的发展有不断增加或减少的趋势时,用单指数平滑法预测就不准了,因为这种时间序列不属于平稳过程,线性指数平滑法[13]是针对这类时间序列的一种有效的预测方法,用这种方法预测时,它把平均每一期的增量考虑进去,并不断地作趋势性的调整。

线性指数平滑法的计算过程共分五个步骤: (1)计算t 时期的单指数平滑值'
t S :
'
1')1(--+=t t t S x S αα
(1—3)
式中:t x —t 时期的观测值;
'1-t S —(1-t )时期的单指数平滑值;
α—平滑常数
(2)计算t 时期的双指数平滑值''t S :
''1''')1(--+=t t t S S S αα
(1—4)
(3)计算t 时期的水平值t A :
'''''''2)(t t t t t t S S S S S A -=-+=
(1—5)
(4)计算t 时期的增量t B :
)(1'''t t t S S B --=
αα)(1'''t t t S S B --=α
α
(1—6)
(5)预测m 个时期以后,即)(m t +时期的数值m t F +:
t t m t mB A F +=+
(1—7)
式中:m 是正整数,1≥m
四、二次曲线指数平滑法
有的时间序列虽然有增加或减少的趋势,但不一定是线性的,可能按二次曲线的形状增加或减少。

对于这种时间序列,采用二次曲线指数平滑法不但考虑了线性增长的因素,而且也考虑了二次抛物线的增长因素。

它的计算过程分为七个步骤:
(1)计算t 时期的单指数平滑值'
t S :
'1')1(--+=t t t S x S αα
(1—8)
(2)计算t 时期的双指数平滑值''t S :
''1''')1(--+=t t t S S S αα
(1—9)
(3)计算t 时期的三重指数平滑值'''t S :
'
''1''''')1(--+=t t t S S S αα
(1—10)
(4)计算t 时期的水平值t A :
''''''33t t t t S S S A +-=
(1—11)
(5)计算t 时期的增量t B :
[]'
'''''2
)34()810()56()
1(2t t t t S S S B ααααα-+----=
(1—12)
(6)计算t 时期的抛物线增量t C :
)2()
1(''''''2
2
t t t t S S S C +--=αα (1—13)
(7)预测m 个时期以后,即)(m t +时期的数值m t F +:
22
1
m C mB A F t t t m t ++=+
(1—14)
其中,m 是正整数,1≥m
五、季节性指数平滑法
对于既有季节因素影响、又有趋势因素影响的时间序列进行预测,以上几种平滑法基本上是无效的,而要采用更为高级的指数平滑方法。

季节性指数平滑法[14]的基本原理是要把这种时间序列分解为三个部分:水平因素部分、趋势因素
部分、周期因素部分。

先把这三部分从时间序列中分离出来,然后再合起来进行预测。

由于我们主要研究是短期负荷预测,以日为量度单位,该时间序列具有较强的适用性。

§1.2 自回归—移动平均模型
我们先讨论一些所要用到的概念和定义。

对于时间序列
,
,,,21i x x x 如果它的
均值为常数,协方差函数不随时间的推移而变化,则称之为平稳时间序列。

即:
μ=i Ex (常数)
(1—15)

μ
-=i i x w ,则对于时间序列,
,,,21t w w w 由于它的均值为零,称之为零均
值的平稳时间序列。

自相关函数的定义如下式:
)
()
(2
i i k i k w E w w E +=
ρ (1—16)
偏相关函数的定义如下:
用t w 的前k 个时刻的值来对t w 作最小方差估计。

即要确定,,,21kk k k ααα 使得
[]))((22211k t kk t k t k t w w w w E ---+++-=αααδ 达到最小值。

其中第k 个系数kk α就
称为序列t w w w ,,,21 的偏相关系数
一、三类平稳序列模型 (1)自回归模型(AR 模型[15])
t p t p t t y y y αφφ=----- 11
(1—17)
式中:t α—方差为σ均值为零的白噪声;
p —自回归阶数;
p φφφ,,,21 —模型参数 (2)移动平均模型(MA 模型[16])
q t q t t t y --++=αθαθα 11
(1—18)
式中:q —平滑移动阶数;
q θθθ,,,21 —模型参数
(3)自回归—移动平均模型(ARMA 模型[16])
q t q t t p t p t t y y y ----++=---αθαθαφφ 1111
(1—19)
我们可将上式写为:
t t B y B αθφ)()(=
(1—20) 其中,p p p B B B B φφφφ----= 2211)(
(1—21) q q q B B B B θθθθ +++=2211)(
(1—22)
B 是反向移动算子:
(1—23)
表1 三类平稳序列模型的性质
自相关函数的截尾性是指在q k >后,k ρ全都是零的性质;它的拖尾性是指k
ρ永不为零而又被负指数控制的特性。

同理,偏相关函数的截尾性是指在q k >后,k ρ全都是零的性质,它的拖尾性是指k ρ永不为零而又被负指数控制的特性。

根据上述分析,我们先通过对已知时间序列的平稳性分析,可以确定它是否适用于以上的模型:然后对该序列的自相关函数和偏相关函数进行计算,根据其截尾性或拖尾性来确定采用上述三类模型中的哪一类,并确定模型的阶;最后可采用最小二乘估计来确定模型的参数。

二、非平稳序列模型:ARMA 模型(自回归—差分—滑动平均)
如果t y 是非平稳过程,我们可通过差分转换t d t d y y B ∇=-)1(来将它转换为平稳过程,从而可以采用ARMA 模型,其中d 是获得静态过程的阶数,∇是差分算子。

t t d p B y B B αθφ)()1)((=-
(1—24) 其中:p p p B B B B φφφφ----= 2211)(
(1—25) q q q B B B B θθθθ----= 2211)(
(1—26)
通过上述讨论,可知非平稳序列可以转化成平稳序列,转化的关键在于要确
定阶数d ,确定阶数d 的方法如下:
k
t t k y y B -=
我们先作一阶差分,得到
t
y y y ∇∇∇ ,,32,求出它的自相关函数和偏相关函数,
如果仍然不属于AR 、MA 、ARMA 序列,则继续差分,直到某一个d ,使得
t
d d d d d y y y ∇∇∇++ ,,21属于AR 、MA 、ARMA 三种类型之一为止。

三、自回归—移动平均模型[17] 自回归—移动平均模型的预测步骤为: (1)取定一个样本长度n ,得数据
n
y y y ,,21;
(2)确定阶数d ,设t
t d x y =∇平稳时间序列;
(3)将
t
x 零均值化。

即令
x
x w t t -=,计算
t
w 的
k ρ,kk α;
(4)模式识别,如果不能识别为AR 、MA 、ARMA 中的某一类,则回到(2),加大阶数d ;
(5)参数估计;
(6)模型考验,如果不能通过考验,则回到(4),重新识别。

§2 回归分析法
回归分析[18]也称为解释性预测,它假设一个系统的输入变量和输出变量之间存在着某种因果关系,它认为输入变量的变化会引起系统输出变量的变化。

通过研究输入变量与输出变量之间的关系,建立预测模型,明确相互关系的密切程度,然后以输入变量为依据预测输出变量的变化。

相关关系是指两个变量或若干变量之间的伴随发生的随机关系,至于它们之间是否存在因果关系须由随后的定性来判断。

当确定变量之间存在相关关系时,总希望能依据易于取得的变量预测与之相关的其它变量,只要两个变量或若干变量之间的相互关系可以用某一个拟合的数学关系式加以表示,那么根据这一回归模型与给定的自变量,就可以估计因变量的预测值。

相关分析和回归预测是相辅相成的,只有确定了相关关系,才能拟合回归预测模型,反之,只有建立了回归模型,才能确定相关关系的形式和性质。

预测是否可靠要依赖于回归模型的拟合优度,这就必须对回归模型及其参数做出假设检验,并给出置信区间,以便做出区间预测,并给出可靠度。

研究两个变量之间的相关关系称为单相关,与之对应
的回归预测称为一元回归预测,研究若干个变量与另一个变量之间的相关关系称为复相关,与之对应的回归预测称为多元回归。

如果回归模型的因变量是自变量的一次函数形式,则称为线性回归预测,否则称为非线性回归预测。

回归分析法预测的步骤为: (1)分析确定自变量和因变量;
(2)计算各自变量与因变量之间的相关性,确定合适的自变量;
(3)根据历史数据确定回归方程的参数,并进行假设检验,检验求得的方程是否具有实用价值和可行性;
(4)判断回归方程的可行以后,由自变量计算预测值和置信区。

回归分析法的缺点是要收集较多的观测值,它的预测精度与样本含量有关,所以付出的代价一般比较大。

§2.1 线性一元回归法
线性一元回归法有一个假设前提,认为变量之间存在着线性关系,虽然在实际情况中往往不是这种关系,但可以通过适当的办法把它们转换成线性关系。

线性一元回归模型只考虑两个变量x 和y 之间的线性关系,假设有n 对观测值
)
,(),,(),,(2211n n y x y x y x 要设法建立一个直线方程,使所有的观测值点到这条直
线的距离平方和达到最小,即我们熟知的最小二乘法原则。

假设这条直线方程的表达式如下:
bx a y +=∧
(1—27)
那么每一个观测点距离这条直线的误差:
)(i i i i i bx a y y y e +-=-=∧
(1—28)
现在要确定一组系数),(b a ,使它所对应的误差平方和达到最小,在最小二乘法的原则下,系数a 和b 是唯一确定的,则直线bx a y +=∧
称为线性一元回归方程。

建立了回归方程以后,还必须对它进行显著性检验,把回归系数a 和b 计算出来以后,还要进一步检验这两个系数的显著性,需要采用适当的数理统计方法,在一定的置信程度下来判别a 和b 与零是否存在显著性差异。

回归的标准离差,也称为标准误差估计
n σ:
2
)(1
2
--=
∑=∧
n y y
n
i i i
n σ
(1—29)
回归系数a σ的标准误差:n
n
a σσ= (1—30)
回归系数b σ的标准误差:∑=-=
n
i i
n
b x x
1
2
)(σσ
(1—31)
有了这两个标准误差,就可用t 检验方法判别回归系数a 和b 的显著性,计算:
a
a a
t σ=
;b
b b
t σ=
(1—32)
查“t 数值表”,在自由度2-=n df 时所对应的t 数值,若a t 和b t 大于或等于表
中的t 数值,则有95%的置信度认为a 和b 均与零有显著性差异,否则与零无显著性差异。

在正式用模型进行预测之前,先要对误差项进行自相关分析,以判别它是否具有随机性。

只有是随机误差,并符合平均值为零,方差等于常数的正态分布,才能认为所建立的回归模型能够用于预测。

用时间序列分析法预测出x 变量在各预测点的值,然后再代入回归模型,便可以求出预测值。

§2.2 线性多元回归法
同简单直线回归模型一样,假设可以建立一组线性方程[19],设变量y 和m 个自变量
m
x x x ,,21有关系,又假设已获得n 组观测值)(m n >
),i mi i i y x x x ,,(21 n i ,,2,1 =
利用最小二乘法原则,建立的线性方程如下:
m m x b x b x b a y +++=∧
2211
(1—33)
那么每一个观测值到这条直线的距离就是误差i e :
)(2211m m i i i i x b x b x b a y y y e +++-=-=∧
(1—34)
同样,误差项i e
应属于随机误差,符合平均数为零,方差为常数的正态分布,
误差项之间彼此独立。

对于多变量的情况,同样需要进行相关分析,用于单变量系统的t 检验方法不再适用,而要用F 检验方法来检验回归方程的显著性,用R 表示多变量相关系数,
R 的平方项2R 称为“判定系数”,它表示因变量的变动受到自变量的影响。

(1—35)
定义统计量c F
有以下关系
1
122---=m n R m R F c (1—36)
查“F 数值表”,置信度为95%,第一自由度m df =1,第二自由度12--=m n df ,它所对应F 的数值,若
F
F c ≥,则有95%的置信度认为回归方程是显著的,否则
无显著性,除了对回归方程进行显著性检验之外,还要对回归系数m
b b b a ,,,,21 进
行显著性检验,也就是检验这些系数与零是否有显著性差异。

检验方法类似于简单回归方程的方法,采用t 检验方法。

标准误差估计
n σ:
(1—37)
回归系数a 的标准误差:n
n
a σσ= (1—38)
回归系数j b 的标准误差bj σ:
∑=-=
n
i j ij
n
bj x x
1
2
)(σσ ),,2,1(m j = (1—39)
用t 检验方法,计算a
a a
t σ=
;bj
j
bj b t σ=
),,2,1(m j =
1
)
(1
2
---=
∑=∧
m n y y
n
i i i
n σ∑∑==∧
--=n
i i n
i i y y y y R 1
21
22)()(
查“t 数值表”,自由度1--=m n df ,所对应的t 数值。

若t
t a ≥,所有的t t bj ≥,
则有95%的置信度认为所有的回归系数均与零有显著性差异。

若其中有小于t 数值,则应修改原有的回归方程。

多元回归的主要优点在于它能够通过模型来解释各变量之间的关系,它对因果关系的处理是十分有效的。

同时,它也存在有缺点:
(1)在预测因变量y 之前,必须用时间序列分析法对每一个自变量x 都要加以预测;
(2)计算量大,所需要的历史数据多; (3)要求经常评审模型。

§2.3 非线性回归法
所谓非线性相关,是指因为自变量的变动而引起的因变量的变动是非线性的。

对于一些非线性问题可以采用取对数等的数学方法使之转化为线性问题。

§3 灰色系统法
灰色系统是指部分信息已知、部分信息未知的系统。

灰色系统理论的实质是将无规律的原始数据进行累加生成,得到规律性较强的生成数列再重新建模。

由生成模型得到的数据通过累加生成的逆运算——累减生成得到还原模型,由还原模型作为预测模型。

累加生成方法: 设原始数列如下:
1,2,3,4,5,6,,... 一次累加生成(记为1-AGO ),即令 1,3,6,10,15,21,... 二次累加生成(记为2-AGO ),即令 1,4,10,20,35,56,...
一般地,对非负数列,累加生成次数越多,数列的随机性就弱化得越多。

当累加生成次数足够大时,时间序列便由随机转化为非随机了。

目前在电力负荷预测中经常采用的动态模型是预测模型GM(1,1),即只有一个变量、一阶的GM 模型。

解算步骤为:
设原始数列为X ={x(t),t=1,2,…,n },对此数列作一次累加后形成新的数列 ()∑==t
k k x t X 11)()( (1—40) 其中:(){
}n t x X t ,,2,1,)1()(1 ==。

用一阶累加生成建立GM(1,1)模型,其微分方程为:
(1—41)
其中,a 称为模型的发展系数,它反映()X 1
与()X 0
的发展趋势,μ称为模型的
协调系数,反映了数据间的变化关系。

a 和μ可用下式求得:
[]
C B B B T T
a 1
-=⎥⎦
⎤⎢⎣⎡μ
⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎣⎡+---+--=11))()1(())2()1(()1()1(1
2
)1()1(12
k x k x x x B
⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢
⎢⎣⎡=)()3()2()0()0()0(n x x x C a e a x k x
ak /)/)1(()1(0)
1(μμ+-=+- (1—42)
经累减还原得: )()1()1()1()1()
0(k x k x k x
-+=+ (1—43)
灰色预测模型(GM(1,1))分类:
(1)一次拟合参数模型—即通常的GM(1,1) 模型,通过对原始数据进行累加生成,得到规律性较强的序列,用指数曲线去拟合得到预测值。

(2)两次拟合参数模型—为提高模型精度,根据第一次估计的参数值和原始数据的累加序列对参数进行二次估计,再预测。

(3)GM(1,1)残差模型—为有效地保证GM(1,1)模型的精度,对灰色预测模型所得到的预测值,提取残差序列再进行灰色建模,从而对预测值进行修正。

(4)递推预测模型—将GM(1,1)模型中的参数a ,u 视为随时间t 而变的变数,根据参数a ,u 随时间t 的变化趋势,自动对a ,u 进行修正,进而对原始序列进行动态预测。

(5)新息GM(1,1)模型—将新息数据充实到原始数列中建立GM(1,1) 模型的预测。

所谓新息数据是指与预测时间更接近的时期中的信息。

(6)新息递推预测模型—将新息数据充实到原始数列中并建立灰色递推模型进行预测。

(7)等维新息GM(1,1)模型—该模型的建立同新息 GM(1,1) 模型的建立相似,只是在加入新息()()10+n X 到原数列()0X 中的同时去掉了()()10X ,从而构成了新的与()0X 等维的数列,然后在此基础上进行建模。

(8)等维新息递推模型—该模型的建立同新息递推预测模型的建立相似,只是前者在加入新息()()10+n X 到原数列()0X 中的同时去掉了()()10X ,从而构成了新的与()0X 等维的数列,然后在此基础上进行建模。

(9)组合模型—给定原始数据列,采用灰色系统方法和另一种预测方法同时
进行预测,设()()k X 01ˆ和()()k X 02ˆ分别为两种方法对原始数据列
()()k X 0的拟合值,则称()()()()()()()k X k X k X 02010ˆ1ˆˆρρ-+=为组合GM 模型。

其中,a.0 <ρ<1;b.()()k X 01ˆ和()()k X 02ˆ至少有一个是用灰色预测方法得到的。

§4神经网络法
§4.1神经网络概述
神经网络系统[20]是由大量的、同时也是很简单的处理单元(或称神经元)广泛地互相连接而形成的复杂网络系统。

它反映了人脑功能的许多基本特性,但它并不是人脑神经网络系统的真实写照,而只是对其作某种简化、抽象和模拟,这也是现实情况(当前对脑神经和其智能机理的研究水平)所能做到的,是目前神经网络研究的基本出发点。

一般认为,神经网络系统是一个高度复杂的非线性动力学系统,虽然每个神经元的结构和功能十分简单,但由大量神经元构成的神经网络的行为却是丰富多彩和十分复杂的。

如何把这些神经元构成一个复杂的具有多
方面功能的系统是神经网络理论要研究的问题。

神经网络系统具有一般非线性系统的共性,更主要的是它还具有自己的特点,比如高维性、神经元之间的广泛互联性以及自适应性或自组织性等。

在神经网络中发生的动力学过程有两类:一类称之为快过程;另一类称之为慢过程。

所谓快过程,即是神经网络的计算过程,它是神经网络的活跃状态的模式转变过程。

神经网络在输入的影响下进入一定的状态,由于神经元之间相互联系以及神经元本身的动力学性质,这类外界刺激的兴奋模式会迅速地演变而进入平衡状态。

这样,具有特定结构的神经网络就可以定义一类模式变换,而计算过程就是通过这类模式变换而实现的。

神经网络只有通过学习才能逐步具有上述模式变换的能力,神经网络的学习过程即为慢过程。

图2表示了一个简单的神经网络,其中每个小圆圈表示一个神经元,各个神经元之间通过相互连接形成一个网络拓扑,这个网络拓扑的形式称为神经网络的互连模式。

不同的神经网络模型对神经网络的结果和互连模式都有一定的要求和限制,如不允许它们是多层次的、是全互连的等等。

神经网络以外的部分(即虚线方框以外的部分)可统称为神经网络的环境。

神经网络从其所处的环境中接收信息,对信息进行加工处理之后又返回(或作用)到其所处的环境中去。

图1 神经网络示意图
各个神经元之间的连接并不只是一个单纯的传送信号的通道,而是在每对神经元之间的连接上有一个加权系数,这个加权系数可以加强或减弱上一个神经元的输出对下一个神经元的刺激,这个加权系数通常称为权值。

在神经网络中,修改权值的规则称为学习算法,这也就是说权值并非固定不变的。

相反地,这些权值可以根据经验或学习来改变。

这样,系统就可产生所谓
的“进化”。

同样的,处理单元所表示的内容也是可以变化的,因而也就可以用任何合适的物质来实现。

一个神经网络系统中有许多处理单元,每个处理单元的具体操作都是从与其相邻的其它单元中接受输入,然后产生输出送到与其相邻的单元中去。

神经网络的处理单元可以分为三种类型:输入单元、输出单元和隐含单元。

输入单元是从外界环境接收信息,输出单元则给出神经网络系统对外界环境的作用。

这两种处理单元与外界都有直接的联系。

隐含单元则处于神经网络之中,它不与外界环境产生直接的联系。

它从网络内部接受输入信息,所产生地输出则只作用于神经网络系统的其它处理单元。

隐含单元在神经网络中起着极为重要的作用。

神经网络是由许多处理单元互连而形成的,互连模式反映了神经网络的结构,它决定着这个网络的能力。

在通常情况下,所有来自其它邻近单元的输出乘上相应的权值,再相加起来而得到所有输入的组合再送入处理单元中。

正的权值表示激励输入,而负的权值表示抑制输入,因而用权矩阵可以表达神经网络的互连结构。

§4.2多层前向网络
目前电力负荷的神经网络法ANN 预测模型大多为多层前向网络,这得益于前向网络具有很好的函数逼近能力,因而通过对训练样本的学习,能很好地反映出对象的输入与输出之间复杂的非线性关系,其学习算法为BP 算法。

ANN 模型为前向多层网络,分别为输入层,隐含层和输出层,设该网络共有1+L 层,第1层为
输入层,第L 层为输出层,),,2(L l l =层为隐含层。

第l 层的神经元个数为付l N
,送入网络的训练样本总个数为M ,训练样本号用p 表示。

第l 层第j 个神经元的输出变量为l pj
O 表示,由第l 层的第j 个神经元到第1+l 层的第i 个神经元的权系数用l
ij W 表示,则各神经元的输入—输出关系为:
[]
)
1()1(++=l pi s l pi I f O (1—44) ∑=++-⋅=l
N j l i l pj l ij l pl
O W I
1
)1()
1(θ
(1—45)
式中:;,,2,1L I =对输入层,I
pj O 即为输入变量j x ;
对输出层,)
1(+L pi O 即为输出变量l y ;
)1(+l i θ为第)
(1+l 层第i 个神经元阈值。

若令:
l iN l i l W 1
)1(+=-+θ, 11=+l
pN l O (1—46)
则式(1-46)可表示为:
[
])1()
1(++=l pi
s l pi
I
f O
;∑+=+⋅=1
1
)1(l N j l pj l ij l pl
O W I
(1—47)
上式中,[]
⋅s f 为网络节点函数: [])
/ex p(11
0I I I f s -+=
,00>I
(1—48)
§4.3 BP 算法
BP 算法[21]的学习过程由正向传播和反向传播组成,正向传播过程输入样本从输入层经隐含层处理后传向输出层,每一层神经元的状态只影响下一层神经元的状态。

如果在输出层不能得到期望输出
pi
d ,则转入反向传播,将误差信号沿原
连接通路返回,通过修正各神经元的权系数,使得误差信号最小。

定义误差函数p
E 为期望输出
pi
d 与实际输出
pi
y 。

之间误差的平方和:
∑∑++==-==1
11
212)(2121l l N i pi pi N i pi p y d E ε
(1—49)
我们希望改变网络的各个权系数
l
ij W ,使得p
E 尽可能减小,从而使实际输出值
尽量逼近期望输出值。

这实际上是求误差函数的极小值问题,可采用最陡下降算法,使权系数沿着误差函数的负梯度方向改变。

权系数
l
ij W 的调整量可按下式计算:
l
ij p l ij p W E W ∂∂-=∆α
,0>α,1
1,,2,1,,2,1,,2,1++===i l N j N i L
l
(1—50)
式中:α为学习步幅,随学习过程而变化。

l
ij p W E ∂∂可表示为下列复合微分:
l ij
l pi
l pi
p l ij
p W
I I
E W
E ∂∂=
∂∂=
∂∂++)1()1( (1—51)
由式(1—47)易得:
l pj l ij
l pl
O W
I =∂∂+)1(
(1—52)
令:)1(+∂∂=
l pi
p
l pi
I E δ
(1—53)
将式(1—51)~(1—53)代入式(1—50)得:
l pj l
pi l ij p O W ⋅=∆αδ
(1—54) l ij p l p ij l p ij W W W ∆+=-)1()(
(1—55)
l pj O 已在正向传播过程中计算得到,现进一步求取l
pi
δ。

再一次采用复合微分,由式(1—53)可得:
)1()1()1(+++∂∂⋅
∂∂-
=l pi
l pi
l pi
p l
pi
I
O O
E δ
(1—56)
由式(1—48)易得上式中第二项为:
)1()1()1()1()
1(I O O I
O l pi l pi l pi
l pi
++++-=
∂∂ (1—57)
式(1—56)中右边第一项
)
1(+∂∂l pi
p
O E 应分为两种情况求取:
(1)对于输出层L I =,pi l pi y O =+)
1(,由式(1—49)可得:
pi pi pi pi
p y d y E ε-=--=∂∂)(
(1—58)
将式(1—57)和式(1—58)代入式(1—56)得:
)
1()
1()(I y y I y y y d pi pi pi pi pi pi pi pi -⋅=
--=
εδ (1—59)
(2)对于其它中间隐含层),,2,1(L l =有:
∑∑
++=++++=++⋅-=
∂∂⋅
∂∂=
∂∂)
1()
2(1
)
1()1()1()2(1
)2()
1()(l l N k l ki l pk l pi
l pk
N k l pk
p l pi
p W O
I I
E O
E δ
(1—60)
将式(1—57)和(1—60)代入式(1—56)得:
)1()1(1
)1()
1()
1())(()
1(I O O W
l pi l pi N k l ki
l pk
pi l ++=++-⋅
⋅-=∑+δ
δ (1—61)
可见,计算本层
l p
δ必需用到前一层的)
1(+l p
δ。

因此,误差函数的求解是一个始
于输出层的反向传播递归过程,即通过误差函数反向传播来修正权系数。

经过多个样本的反复训练,并朝减小误差方向修正权系数,最后得到满意的结果。

§5 状态空间法
状态空间法[22],又称为Kalman 滤波法[23],是一种常用的信息处理方法。

改方法通过在实时量测的信息中消除随机干扰和无用信息,滤出较可靠的有用信息。

它是把受扰信号看作一个动态过程,利用噪声的统计特征,把它从受扰信号中消去,从而获得较精确的有用信号。

利用该方法,负荷可作为状态变量来模拟,并通过两个状态空间方程组表达其变化模型。

表达负荷模型的方程组,可表达为:
k k k k W Y Y +=+φ1
(1—62) k k k k V Y H Z +=
(1—63)
式中:k Y —k t 时刻的)1(⨯n 维过程状态向量;
k φ—无强制函数存在时关联k Y 与1+k Y 的)(n n ⨯维状态转移矩阵;
k W —具有已知协方差k Q 的一个)1(⨯n 维白噪声;
k Z —k t 时刻的)1(⨯m 维负荷测量值向量,为无噪声时关联k Y 与k Z 的)
(n m ⨯维矩阵;
k V —)1(⨯m 维负荷量测误差向量,为具有一个已知协方差k R 的维白噪声。

式(1—62)称为状态空间方程,式(1—63)称为量测方程。

向量k W 和k V 的协方差给定为:
⎩⎨⎧≠==)
(0)
(),(k i k i Q W W E k T i k
(1—64)

⎨⎧≠==)(0)
(),(k i k i R V V E k T i k
(1—65)
假定过程噪声k W 和量测噪声k V 互不相关,即对于任意,,k i 有0),(=T i k V V E 在任意k t 时刻,基于直到)1(-k t 为止的知识可以作为过程的估计值。

这个估计值称为先验估计,并用)1(-k k Y 表达。

相应的实际值同该估计值的误差为:
)1()1(---=k k k k k Y Y e (1—66)
该误差向量的协方差矩阵为:
)1()
1()1()(---=k k T
k k k k P e e E (1—67)。

相关文档
最新文档