一般非线性预测模型参数优化的数值方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

 《预测》1997年第1期 ・理论与方法研究・

一般非线性预测模型参数优化的数值方法Ξ

金菊良 杨晓华 储开凤 郦建强

(河海大学 210098) (南京水文水资源所 210024)

摘 要 本文提出了处理一般非线性预测模型参数优化问题的一种通用数值方法——加速基

因算法。该法与其他常用方法的计算结果比

较,优化效果均好于传统方法。

关键词 基因算法 非线性预测模型 参数优化

1 引言

非线性预测模型参数优化(估计)的传统方法存在两方面的不足,一是对模型结构(如可线性化、可微)作了限定[1,2],二是方法受参数优化准则形式制约(如目标规划法、松驰算法)[3],而对实际预测环境、预测目标缺乏足够的考虑,致使其适用性不强,影响了实际预测效果。基于自然选择和自然基因机制的基因算法(Genetic A lgo rithm,简称GA)突破了对模型结构是否线性、连续、可微等各种限制,同时可不受优化准则形式、优化参数数目、约束条件等的束缚,直接在优化准则值的引导下进行全局自适应参数优化,简便实用,是目前处理参数优化问题的一种通用的数值方法。这种方法已引起工程界的广泛应用和研究[4,5]。

我们在应用GA时发现,GA对各种实际预测模型参数变化区间的大小变化的适应能力较差,计算量大,算法自身参数设置技术目前尚无明确准则指导。但利用优秀个体逐步调整模型参数变化区间,可形成一种称为加速基因算法(A ccelerati on Genetic A lgo rithm,简称A GA)的新方法。经大量数值试验和实际应用,表明A GA对GA有明显改进。下面给出A GA的原理、步骤、算法参数设置准则。

2 加速基因算法的原理、步骤及其参数设置

不失一般性,设一般非线性预测模型为p-1阶多项式,模型参数优化准则为极小化下式

f=6m i=1 c1+c2x i+…+c p x p-1i-y i q(1)式中,{c j}为p个待优化参数;{(x i,y i)}为m对自变量、因变量的观测数据;任意实常数q为1时即为最小一乘准则,为2时为最小二乘准则,等等,视实际预测要求而定。

加速基因算法包括如下8步。

步1:模型参数变化空间的离散和二进制编码。设编码长度为l,把模型每个参数的变化区间等分成2l-1个子区间,于是模型参数变化空间被离散成(2l)p个参数格网点。GA中称每个格网点为个体,它对应模型p个参数的一种可能取值状态,并用p个l二进制数表示。这样,模型p个参数的取值状态、格网点、p个二进制数建立了一一对应关系。算法的模型参数优化工作将主要对这些二进制数进行操作运算。

步2:初始父代个体群的随机生成。从上述(2l)p个格网点中均匀随机选取n个点作为初始父代个体群。

步3:父代个体的适应能力评价。把第i个个体代入式(1)得相应的优化准则值f i,f i越小则该个体的适应能力越强。

步4:父代个体的概率选择。把已有父代个体按优化准则值f i从小到大排序。称排序后最前面的几个个体为优秀个体(群)。构造与f i值成反比的函数p i且满足p i>0和p1+p2+…p n=1。从这些父代个体中以概率p i选择第i个个体,共选择两组各n个个体。

步5:父代个体的杂交。由上得到的两组个体两两配对成为n对双亲。将每对双亲的二进制数的任意一段值互换,得到两组子代个体。

步6:子代个体的变异。任取上步中的一组子代个体,将它们的二进制数的任意一段值依某概率(即变异率)进行翻转(原值为0的变为1,反之变为0)。

步7:进化迭代。由上步得到的n个子代个体作为新的父代,算法转入步3进入下一次进化过程,重新评价、选择、杂交和变异,如此循环往复,使优秀个体逼近最优点。

9

4

Ξ收稿日期:1996-11-11

以上7步构成传统的基因算法(GA)。

步8:加速循环。大量研究、应用表明,GA中的杂交、变异的寻优功能随进化迭代次数的增加而迅速减弱,在实际应用中常出现在远离全局最优点的地方GA即停滞寻优工作;GA的计算量大,全局优化速度慢,GA是从(2l)p种模型参数取值状态中找最优,优化结果的精度受编模长度l的控制;GA自身参数设置技术复杂,尚无好的准则指导。特别是当实际预测模型参数的变化区间很大时,上述问题就十分突出,应用GA就极为困难。

受正交设计法[6]的启发,经深入研究GA算法的功能和大量的数值试验与实际应用,我们提出了用第一、第二次进化迭代所产生的优秀个体的参数变化空间作为模型参数新的变化空间,算法转入步1,如此循环往复,优秀个体参数变化空间将逐步收缩,与最优点的距离越来越近,直至最优个体的优化准则值小于某一设定值或达到预定加速(循环)次数,结束整个算法的运行。

以上8步构成加速基因算法(A GA)。其中的算法参数有编码长度l、父代个体数目n、优秀个体数目ns 和变异率ca。

从A GA角度看,ca反映了个体向其它参数格网点随机变迁的概率。因A GA的全局优化能力比GA强, ca越大,优秀个体包围,接近最优点的机会越大,ca一般取定1.0。

l越大参数格网越细,格网点就越多,要求父代个体数目也须相应增大,导致计算量猛增。因A GA在算法步8中能逐步缩小模型参数的变化空间,随着A GA 的运行参数格网自动分细,因此l常取定10。

由A GA原理可知,n个父代个体是按优化准则从(2l)p个参数格网点中的一个随机抽样(相当于一组广义的正交试验),n太小就不能充分探测优化准则函数在最优点附近的足够信息;当n增大而优秀个体数目ns仍维持较小值不变时,优秀个体包围、接近最优点的机会也会减少;A GA的计算量与n2、ns2都成正比, n、ns又不能取得很大。

以往的基因算法认为,当模型参数变化空间很大时,GA的编码长度、父代个体数目也须很大,导致计算量大增,而且算法参数的设置技术也趋复杂化。而这些在加速基因算法中却是不必要的。实际上,由于A GA利用进化迭代过程中产生的优秀个体所包含的优化准则函数在最优点附近各参数方向的变化特性的信息来调整模型参数变化空间的大小,使A GA能同时在p个参数方向寻优且收敛,只要优秀个体数目ns 与父代个体数目n配置合理就能大大增强A GA对实际预测模型参数变化空间的大小变化的适应能力。经大量数值试验和实际应用,初步认为n、ns的配置应满足下式

ns n>n (l 2l)(2)在实际应用时n一般取300或以上,ns相应取10或以上。

笔者对文献〔1〕、〔3〕、〔7〕中的指数模型、双曲线模型、威市尔分布模型、逻辑斯蒂曲线等模型的参数估计应用A GA法来处理,经加速循环5~10次后拟合效果均好于原实例使用的常规方法(具体过程、结果略),这说明,A GA法的确具有优化参数选择的实用功能。

(本文得到河海大学水环院朱元生生教授、刘权授教授和四川联合大学水电学院丁晶教授的热情指点,特此深表谢意!)

参 考 文 献

[1]唐五湘.指数曲线模型参数估计的两步最小二乘

法.预测,1994(6)

[2]陈性生.一类非线性回归模型L S估计的两步逼近

求法.预测,1990(2)

[3]袁修贵.“残差绝对值和最小”准则的目标规划法.

预测,1994(1)

[4]Go ldberg D E.genetic algo rithm s in search,op ti2

m izati on and m ach ine learning.addison2w esly, 1989

[5]W ang Q J.the genetic algo rithm and its app lica2

ti on to calibrating conceputal rainfall_runoff models.w ater resources research,1991,27(9):

2467-2471

[6]金良超.正交设计多指标分析.北京:中国铁道

出版社,1988

[7]司马锡生.皮尔曲线的参数估计.预测,1994

(1)

5

相关文档
最新文档