第4章 优性条件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第4章 最优性条件

§4.1 最优性条件的预备知识

1.极小点的定义 无约束问题:

1 (1)

定义1(全局极小点)若存在n

R x ∈使得

n R x x f x f ∈∀≥ ),()(

则称x 为问题(1)的全局极小点。如果有

x x R x x f x f n ≠∈∀>, ),()(

则称x 为问题(1)的严格全局极小点。

定义2 (局部极小点)设n

R x ∈,如果存在0>δ使得

)( ),()(x N x x f x f δ∈∀≥

则称x 为问题(1)的局部极小点。如果有

}/{)( ),()(x x N x x f x f δ∈∀>

则称x 为问题(1)的严格局部极小点。 约束问题:

)(min x f (2)

s.t. m i x g i ,,1,0)(Λ=≥

l j x h j ,,1,0)(Λ==

其中)( ),( ),(x h x g x f j i 都是定义在n

R 上的实值连续函数,且至少有一个是非线性的。

称)(x f 为目标函数,)(x g i 为不等式约束函数,)( x h j 为等式约束函数。

(i) 如果0=m ,称(2)为等式约束优化问题; (ii) 如果0=l ,称(2)为不等式约束优化问题;

(iii) 如果),,1)(( ),,,1)((l j x h m i x g j i ΛΛ==都为线性函数,)(x f 是二次函数,则称(2)为二次规划问题。

若n

R x ∈满足(2)的所有约束条件,称x 为(2)的可行点(或可行解)。 可行集(可行域):⎪⎭⎪

⎬⎫⎪⎩⎪

⎨⎧=≥=≥=.,,1,0)(,,,1,0)(

l j x h m i x g x S j i ΛΛ。

定义3 (全局极小点)设S x ∈使得 S x x f x f ∈∀≥ ),()(

成立,则称x 为问题(2)的全局极小点。如果有

x x S x x f x f ≠∈∀>, ),()(

成立,则称x 为问题(2)的严格全局极小点。

定义4 (局部极小点)设S x ∈,如果存在0>δ使得

S x N x x f x f I )( ),()(δ∈∀≥

成立,则称x 为问题(2)的局部极小点。如果有

x x S x N x x f x f ≠∈∀>,)( ),()(I δ

成立,则称x 为问题(2)的严格局部极小点。 2. 内容安排

■ 求全局极小点一般来说相当困难。实际上可行的只是求一个局部(或严格局部)极小点。故本课程后面所指极小点,通常指求局部极小点。

■ 仅当问题为凸规划(即目标函数)(x f 为凸函数,不等式约束函数m i x g i ,,1 ),(Λ=-为凸函数,等式约束函数l j x h j ,,1 ),(Λ=为线性函数)时,局部极小点才是全局极小点。

■ 按定义验证最优解是不可能的。因此有必要给出只依赖于在x 处目标函数和约束函数信息的、且与定义等价的条件。

这样的条件称其为最优性条件,它们是各种基于梯度算法的理论基础。

§4.2 无约束问题的最优性条件

考虑无约束问题(1),回忆当R x ∈时,即单变量函数极值问题的最优性条件: 必要条件:若R x ∈且)(x f 在x 处取到极值,如果)(x f 在x 可微,则x 为)(x f 的驻点,即满足0)('=x f 。

充分条件:若R x ∈且)(x f 在x 处可微,如果0)('=x f 且0)(''>x f ,则)(x f 在x 处取到极小值;如果0)('=x f 且0)(''

x x

*3:x 为全局极大点; *4:x 为严格局部极大点。

定理1 (一阶必要条件):设n

R x ∈为函数)(x f 在n R 的局部极小点,且)(x f 在x 可微,则0)(=∇x f 。

证明 利用§4.0中的定理1可证。

几何解释:若x 为局部极小点,则)(x f 在x 处不能有下降方向。从而,当0)(≠∇x f 时,

)(x f ∇-为)(x f 在x 处的一个下降方向,故若n R x ∈为函数)(x f 在n R 的极值点,必有0)(=∇x f 。

定理2 (二阶必要条件):设n

R x ∈为函数)(x f 在n R 的局部极小点,且)(x f 在x 二阶可微,则有

0)(=∇x f ,且)(2x f ∇半正定

证明:利用)(x f 在x 的二阶Taylor 展开及局部极小点的定义可得。

几何解释:由x 为局部极小点及0)(=∇x f 所确定。

定理3 (二阶充分条件):设)(x f 是定义在n

R 上的二次可微函数,如果0)(=∇x f ,且

)(2x f ∇正定,则x 为函数)(x f 在n R 的严格局部极小点。

证明 利用)(x f 在x 的二阶Taylor 展开及正定矩阵的定义可得。

注:满足0)(=∇x f 的点称为)(x f 的平稳点或驻点。驻点可能是极大值点,也可能是极小值点,也可能不是极值点。但若目标函数为凸函数,则驻点就是全局极小值点;若目标函数为凹函数,则驻点就是全局极大值点。

定理4 (凸充分性定理):设)(x f 是定义在n

R 上的凸函数,如果0)(=∇x f ,则x 为函数)(x f 在n

R 上的全局极小点。(一阶必要条件+凸性) 证明 利用可微凸函数的一阶判别条件和0)(=∇x f 易证。 例:利用极值条件求解

12

232313

131)(min 2x x x x x f R x --+=∈ 解: 1211-=∂∂x x f ,22

22

2x x x f -=∂∂ 令0)(=∇x f ,即012

1=-x ,0222

2=-x x 。 得到驻点:

⎥⎦⎤⎢⎣⎡=01)1(x ,⎥⎦⎤⎢⎣⎡=21)2(x ,⎥⎦⎤⎢⎣⎡-=01)3(x ,⎥⎦

⎢⎣⎡-=21)4(x

Hesse 矩阵: ⎥

⎤⎢⎣⎡-=∇22002)(21

2

x x x f 在点)

4()

3()

2()

1(,,,x

x x x 处Hesse 矩阵:

相关文档
最新文档