第五章惩罚函数法详解

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

⑵相邻两次惩罚函数值的相对变化量已足够小。设ε2为收敛精度，一般取ε2=10-3-10-4，则需要满足
㈥算法步骤
⑴构造内点惩罚函数
⑵选择可行初始点，初始罚因子，罚因子降低系数C，收敛精度与，置k←0
⑶求无约束优化问题，
有最优点。
⑷当k=0时转步骤⑸，否则转步骤⑹
⑸置k←k+1，
，并转步骤⑶
第五章惩罚函数法
惩罚函数法简介
惩罚函数法是一种使用很广泛、很有效的间接法。基本原理：把约束优化问题转化成无约束优化问题来求解。两个前提条件：一是不破坏原约束的约束条件二是最优解必须归结到原约束问题的最优解上去
按照惩罚函数的构成方式，惩罚函数法分为三种：外点法、内点法、混合法
惩罚函数
r(k) 、m(k)-----罚因子惩罚项
5.3.4.1 内点法
㈠引例设有一维不等式约束优化问题的数学模型
S.T. :
由图可见，目标函数的可行域为x≥b，在可行域内目标函数单调上升，它的最优解显然是
x*=b ，F*=ab
对引例的惩罚函数进行分析，以对内点法有初步认识：
⑴本问题是不等式约束优化问题，故只有一项惩罚项
，一个罚因子 ⑵规定罚因子为某一正数，当迭代点是在可行域内时，则惩罚项的值必为正值，因此必有
⑶若对于罚因子的取值由初始的逐渐变小
时，惩罚函数(x, r(愈k) )逼近于原目标函数F（x），罚
函数曲线越来越接近于原F（x）=ax直线，如图所示，对
应罚函数 (x, r的(k)最) 优点列
束优化问题的最优点x*=b
x不0* , 断x1*趋,近于原约
小结
由以上可见，如果选择一个可行点作初始
点，x(0令) 其罚因子由大r(k变) 小，通过求罚
⑶内点罚函数法的求解过程
为了用惩罚函数
去逼近原目标函数F(x)，
则要用F(x)及
构造一个无约束优化问题的数学模型
选取初始点（原约束优化问题的内点），初始罚因子，罚因子降低系数C。用无约束优化方法求上式无约束优化问题的最优解。
所得解为；当k在增大的过程中，得到惩罚函数的无约束最优点列为
而在可行域内部惩罚函数
与原目标函数F(x)很相近，
只在约束边界附近罚函数值才突然增高。这样，使其罚函数
在在约束边界附近出现深沟谷地，罚函数的性态变得恶劣。
如下图，对于有深沟谷地性态差的函数，不仅搜索所需的时间长，而且很难使迭代点进入最优的邻域，以致极易使迭代点落入非可行域而导致计算的失败。
或
r（0）=1~50
点列中各点均在可行域内部，随着k→∞的过程，点列将趋近于原约束问题的最优解x*。即
=x*
由此可知，内点法的序列无约束最优点部且趋近于约束最优点x*的。内点罚函数还可以按如下形式构成
是在可行域内
㈢初始点x(0)的选取
由于内点法的搜索是在可行域内进行，显然初始点必须是域内可行点。须满足
确定初始点常用如下两种方法 ⑴自定法即根据设计者的经验或已有的计算资料自行决定某一可行点作为初始点。 ⑵搜索法任选一个设计点为初始点。通过对初始点约束函数值的检验，按其对每个约束的不满足程度加以调整，将点逐步引入到可行域内，成为可行初始点，这就是搜索法。
1
u1 gu (x)
关于惩罚因子规定为正，即。且在优化过程中是减小的，为确保为递减数列，取常数C
r (k) Cr (k1) ,
0<C<1
称系数C为罚因子降低系数
=0 或
p
关于惩罚项 r(k)
，1由于在可行域内有
u1 gu (x)
g，u (x) 0
且 r(永k) 远取正值，故在可行域内惩罚项永为正。 r (k )的值越小则惩罚项的值越小。
函数
的一系(x,列r(k最) ) 优点，
xk* (k 0,1,2, )
显见，无约束最优点序列将逐渐趋近于原约
束优化问题的最优点x*。
㈡内点罚数法的形式及特点
⑴具有不等式约束的优化问题的数学模型
S.T. :
u=1，2……，p
⑵构造如下形式的内点罚函数
p
(x, r (k) ) F (x) r (k)
⑹由终止准则，若满足则转步骤⑺，否则转⑸
⑺,
输出最优解(x*,F*)
入口
给定：x(0) ∈D,r(0),C,ε1,ε2
㈣关于几个参数的选择
⑴初始罚因子r(0)的选取
如果值选得太大，则在一开始罚函数的惩罚项的值将远远超出原目标函数的值，因此，它的第一次无约束极小点将远离原问题的约束最优点。在以后的迭代中，需要很长时间的搜索才能使序列无约束极小点逐渐向约束最优点逼近。
如果值选得太小，则在一开始惩罚项的作用甚小，
而且，当x越趋近于约束边界时，由于惩罚项 r(k) 1
增大，所以罚函数 (x, r(的k) )值越大。当x←b时，罚g１函(x)
数的值将趋近于+∞。因此，当初始点取在可行域内，求
函数 (x, r(k)的) 极小值时，只要适当控制搜索步长，
防止迭代点跨入非可行域，则所搜索到的无约束极小点 x*必可保持在可行域内。
由于在约束边界上有
，因此，当设计点趋
于边界时，惩罚项的值将趋于无穷大。由此可知，在可
行域内，始终有
wenku.baidu.com
。
当
时，却有
，所以整个最
优化的实质就是用罚函数
去逼近原目标函数F(x);
当设计点逐渐由内部趋近于边界时，由于惩罚项无穷增大，则罚函数也将无穷增大。
从函数图形上来看，犹如在可行域的边界上筑起一道陡峭的高墙，使迭代点自动保持在可行域内，用此办法来保证搜索过程自始至终不离开可行域。所以，内点法也常称为围墙函数法。
⑵递减系数C的选择
罚因子递减系数C的选择，一般认为对算法的成败影响不大。规定0<C<1。
若C值选得较小，罚因子下降快，可以减少无约束优化的次数，但因前后两次无约束最优点之间的距离较远，有可能使后一次无约束优化本身的迭代次数增多，而且使序列最优点的间隔加大，对约束最优点的逼近不利。
相反，若C值取得较大，则无约束优化次数就要增多。
通常建议取C=0.1--0.5
㈤终止准则
随着罚因子的值不断减小，罚函数的序列无约束最优点将越来越趋近于原约束优化问题的最优点。
设惩罚函数
的无约束最优点列为
对应的罚函数值为
终止准则可用下述两者之一 ⑴相邻两次惩罚函数无约束最优点之间的距离已足够的小。
设ε1为收敛精度，一般取ε1=10-4-10-5，则需要满足