第五章惩罚函数法详解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⑵相邻两次惩罚函数值的相对变化量已足够小。 设ε2为收敛精度,一般取ε2=10-3-10-4,则需要满足
㈥算法步骤
⑴构造内点惩罚函数
⑵选择可行初始点 ,初始罚因子 ,罚因子降低系 数C,收敛精度 与 ,置k←0
⑶求无约束优化问题,
有最优点 。
⑷当k=0时转步骤⑸,否则转步骤⑹
⑸置k←k+1,
,并转步骤⑶
第五章惩罚函数法
惩罚函数法简介
惩罚函数法是一种使用很广泛、很有效的间接法。 基本原理: 把约束优化问题转化成无约束优化问题来求解。 两个前提条件: 一是不破坏原约束的约束条件 二是最优解必须归结到原约束问题的最优解上去
按照惩罚函数的构成方式,惩罚函数法分为三种: 外点法、内点法、混合法
惩罚函数
r(k) 、m(k)-----罚因子 惩罚项
5.3.4.1 内点法
㈠引例 设有一维不等式约束优化问题的数学模型
S.T. :
由图可见,目标函数的可行域为x≥b,在可行域内目标函数 单调上升,它的最优解显然是
x*=b ,F*=ab
对引例的惩罚函数进行分析,以对内点法有初步认识:
⑴本问题是不等式约束优化问题,故只有一项惩罚项
,一个罚因子 ⑵规定罚因子 为某一正数,当迭代点是在可行域内 时,则惩罚项的值必为正值,因此必有
⑶若对于罚因子的取值由初始的 逐渐变小
时,惩罚函数(x, r(愈k) )逼近于原目标函数F(x),罚
函数曲线越来越接近于原F(x)=ax直线,如图所示,对
应罚函数 (x, r的(k)最) 优点列
束优化问题的最优点x*=b
x不0* , 断x1*趋,近于原约
小结
由以上可见,如果选择一个可行点作初始
点 ,x(0令) 其罚因子 由大r(k变) 小,通过求罚
⑶内点罚函数法的求解过程
为了用惩罚函数
去逼近原目标函数F(x),
则要用F(x)及
构造一个无约束优化问题的数学模型
选取初始点(原约束优化问题的内点) ,初始罚 因子 ,罚因子降低系数C。用无约束优化方法求上式无 约束优化问题的最优解。
所得解为 ;当k在增大的过程中,得到惩罚函数的无 约束最优点列为
而在可行域内部惩罚函数
与原目标函数F(x)很相近,
只在约束边界附近罚函数值才突然增高。这样,使其罚函数
在在约束边界附近出现深沟谷地,罚函数的性态变得恶劣。
如下图,对于有深沟谷地性态差的函数,不仅搜索所需的 时间长,而且很难使迭代点进入最优的邻域,以致极易使 迭代点落入非可行域而导致计算的失败。

r(0)=1~50
点列中各点均在可行域内部,随着k→∞的过程, 点列将趋近于原约束问题的最优解x*。即
=x*
由此可知,内点法的序列无约束最优点 部且趋近于约束最优点x*的。 内点罚函数还可以按如下形式构成
是在可行域内
㈢初始点x(0)的选取
由于内点法的搜索是在可行域内进行,显然初始点必须 是域内可行点。须满足
确定初始点常用如下两种方法 ⑴自定法 即根据设计者的经验或已有的计算资料自行决 定某一可行点作为初始点。 ⑵搜索法 任选一个设计点 为初始点。通过对初始点 约束函数值的检验,按其对每个约束的不满足程度加以调 整,将 点逐步引入到可行域内,成为可行初始点, 这就是搜索法。
1
u1 gu (x)
关于惩罚因子规定为正,即 。且在优化过程中 是减小的,为确保为递减数列,取常数C
r (k) Cr (k1) ,
0<C<1
称系数C为罚因子降低系数
=0 或
p
关于惩罚项 r(k)
,1由于在可行域内有
u1 gu (x)
g,u (x) 0
且 r(永k) 远取正值,故在可行域内惩罚项永为正。 r (k )的值越小则惩罚项的值越小。
函数
的一系(x,列r(k最) ) 优点,
xk* (k 0,1,2, )
显见,无约束最优点序列将逐渐趋近于原约
束优化问题的最优点x*。
㈡内点罚数法的形式及特点
⑴具有不等式约束的优化问题的数学模型
S.T. :
u=1,2……,p
⑵构造如下形式的内点罚函数
p
(x, r (k) ) F (x) r (k)
⑹由终止准则,若满足则转步骤⑺,否则转⑸
⑺,
输出最优解(x*,F*)
入口
给定:x(0) ∈D,r(0),C,ε1,ε2
㈣关于几个参数的选择
⑴初始罚因子r(0)的选取
如果 值选得太大,则在一开始罚函数的惩罚项的 值将远远超出原目标函数的值,因此,它的第一次无约束极 小点将远离原问题的约束最优点。在以后的迭代中,需要很 长时间的搜索才能使序列无约束极小点逐渐向约束最优点逼近。
如果 值选得太小,则在一开始惩罚项的作用甚小,
而且,当x越趋近于约束边界时,由于惩罚项 r(k) 1
增大,所以罚函数 (x, r(的k) )值越大。当x←b时,罚g1函(x)
数的值将趋近于+∞。因此,当初始点取在可行域内,求
函数 (x, r(k)的) 极小值时,只要适当控制搜索步长,
防止迭代点跨入非可行域,则所搜索到的无约束极小点 x*必可保持在可行域内。
由于在约束边界上有
,因此,当设计点趋
于边界时,惩罚项的值将趋于无穷大。由此可知,在可
行域内,始终有
wenku.baidu.com


时 ,却有
,所以整个最
优化的实质就是用罚函数
去逼近原目标函数F(x);
当设计点逐渐由内部趋近于边界时,由于惩罚项无穷 增大,则罚函数也将无穷增大。
从函数图形上来看,犹如在可行域的边界上筑起一 道陡峭的高墙,使迭代点自动保持在可行域内,用此办 法来保证搜索过程自始至终不离开可行域。所以,内点法 也常称为围墙函数法。
⑵递减系数C的选择
罚因子递减系数C的选择,一般认为对算法的成败影响 不大。规定0<C<1。
若C值选得较小,罚因子下降快,可以减少无约束优化 的次数,但因前后两次无约束最优点之间的距离较远,有 可能使后一次无约束优化本身的迭代次数增多,而且使序 列最优点的间隔加大,对约束最优点的逼近不利。
相反,若C值取得较大,则无约束优化次数就要增多。
通常建议取C=0.1--0.5
㈤终止准则
随着罚因子 的值不断减小,罚函数的序列无约 束最优点将越来越趋近于原约束优化问题的最优点。
设惩罚函数
的无约束最优点列为
对应的罚函数值为
终止准则可用下述两者之一 ⑴相邻两次惩罚函数无约束最优点之间的距离已足够的小。
设ε1为收敛精度,一般取ε1=10-4-10-5,则需要满足
相关文档
最新文档