最优化方法第一章(2)

合集下载

最优化方法PPT

最优化方法PPT

共117页第8页
同时太阳系这个"整体"又是它所属的"更大整 体"--银河系的一个组成部分。世界上的具体系统是 纷繁复杂的,必须按照一定的标准,将千差万别的 系统分门别类,以便分析、研究和管理,如:教育 系统、医疗卫生系统、宇航系统、通讯系统等等。 如果系统与外界或它所处的外部环境有物质、能量 和信息的交流,那么这个系统就是一个开放系统, 否则就是一个封闭系统。开放系统具有很强的生命 力,它可能促进经济实力的迅速增长,使落后地区 尽早走上现代化。如改革开放以来已大大增强了我 们的综合国力。而我国的许多边远山区农村,由于 交通不便,相对封闭,还处于比较落后的状态。
会科学和思维科学的相互渗透与交融汇流,产生了 具有高度抽象性和广泛综合性的系统论、控制论和 信息论。
系统论是研究系统的模式、性能、行为和规律 的一门科学。它为人们认识各种系统的组成、结构、 性能、行为和发展规律提供了一般方法论的指导。 系统论的创始人是美籍奥地利理论生物学家和哲学 家路德维格·贝塔朗菲。系统是由若干相互联系的 基本要素构成的,它是具有确定的特性和功能的有 机整体。如太阳系是由太阳及其围绕它运转的行星 (金星、地球、火星、木星等等)和卫星构成的。
从数学上比较一般的观点来看,所谓最优化问题可 以概括为这样一种数学模型:给定一个“函数”,F(X), 以及“自变量”X应满足的一定条件,求X为怎样的值时, F(X)取得其最大值或最小值。这里在函数和自变量两个 词上之所以打上引号,是想强调它们的含意比中学数学 和大学微积分中函数的定义要广泛得多。通常,称F(X) 为“目标函数”,X应满足的条件为“约束条件”。约 束条件一般用一个集合D表示为:X∈D。求目标函数 F(X)在约束条件X∈D下的最小值或最大值问题,就是一 般最优问题的数学模型,它还可以利用数学符号更简洁 地表示成:Min F(X)或Max F(X)。

《最优化方法》课程复习考试

《最优化方法》课程复习考试

《最优化方法》复习提要 第一章 最优化问题与数学预备知识§1. 1 模型无约束最优化问题 12min (),(,,,)T n n f x x x x x R =∈.约束最优化问题(},,2,1,0)(;,,2,1,0)(,|{l j x h m i x g R x x S j i n ===≥∈=∧)min ();...f x s t x S ⎧⎨∈⎩ 即 m i n ();..()0,1,2,,,()0,1,2,,.i j f x s t g x i m h x j l ⎧⎪≥=⎨⎪==⎩其中()f x 称为目标函数,12,,,n x x x 称为决策变量,S 称为可行域,()0(1,2,,),()0(1,2,,)i j g x i m h x j l ≥===称为约束条件.§1. 2 多元函数的梯度、Hesse 矩阵及Taylor 公式定义 设:,n n f R R x R →∈.如果n ∃维向量p ,n x R ∀∆∈,有()()()T f x x f x p x o x +∆-=∆+∆.则称()f x 在点x 处可微,并称()T df x p x =∆为()f x 在点x 处的微分.如果()f x 在点x 处对于12(,,,)T n x x x x =的各分量的偏导数(),1,2,,if x i n x ∂=∂都存在,则称()f x 在点x 处一阶可导,并称向量12()()()()(,,,)Tnf x f x f x f x x x x ∂∂∂∇=∂∂∂ 为()f x 在点x 处一阶导数或梯度.定理1 设:,n n f R R x R →∈.如果()f x 在点x 处可微,则()f x 在点x 处梯度()f x ∇ 存在,并且有()()T df x f x x =∇∆.定义 设:,n n f R R x R →∈.d 是给定的n 维非零向量,de d=.如果 0()()lim()f x e f x R λλλλ→+-∈存在,则称此极限为()f x 在点x 沿方向d 的方向导数,记作()f x d∂∂. 定理2 设:,n n f R R x R →∈.如果()f x 在点x 处可微,则()f x 在点x 处沿任何非零方向d 的方向导数存在,且()()T f x f x e d ∂=∇∂,其中de d=. 定义 设()f x 是n R 上的连续函数,n x R ∈.d 是n 维非零向量.如果0δ∃>,使得(0,)λδ∀∈,有()f x d λ+<(>)()f x .则称d 为()f x 在点x 处的下降(上升)方向.定理3 设:,n n f R R x R →∈,且()f x 在点x 处可微,如果∃非零向量n d R ∈,使得()T f x d ∇<(>)0,则d 是()f x 在点x 处的下降(上升)方向. 定义 设:,n n f R R x R →∈.如果()f x 在点x 处对于自变量12(,,,)T n x x x x =的各分量的二阶偏导数2()(,1,2,,)i j f x i j n x x ∂=∂∂都存在,则称函数()f x 在点x 处二阶可导,并称矩阵22221121222222122222212()()()()()()()()()()n n n n n f x f x f x x x x x x f x f x f x f x x x x x x f x f x f x x x x x x ⎛⎫∂∂∂ ⎪∂∂∂∂∂ ⎪ ⎪∂∂∂ ⎪∇=∂∂∂∂∂ ⎪ ⎪⎪ ⎪∂∂∂⎪∂∂∂∂∂⎝⎭为()f x 在点x 处的二阶导数矩阵或Hesse 矩阵. 定义 设:,n m n h R R x R →∈,记12()((),(),,())T m h x h x h x h x =,如果 ()(1,2,,)i h x i m =在点x 处对于自变量12(,,,)T n x x x x =的各分量的偏导数()(1,2,,;1,2,,)i jh x i m j n x ∂==∂都存在,则称向量函数()h x 在点x 处是一阶可导的,并且称矩阵111122221212()()()()()()()()()()n n m n m m m n h x h x h x xx x h x h x h x x x x h x h x h x h x xx x ⨯∂∂∂⎛⎫ ⎪∂∂∂⎪⎪∂∂∂⎪∂∂∂∇= ⎪ ⎪⎪∂∂∂ ⎪ ⎪∂∂∂⎝⎭为()h x 在点x 处的一阶导数矩阵或Jacobi 矩阵,简记为()h x ∇.例2 设,,n n a R x R b R ∈∈∈,求()T f x a x b =+在任意点x 处的梯度和Hesse 矩阵.解 设1212(,,,),(,,,)TTn n a a a a x x x x ==,则1()nk k k f x a x b ==+∑,因()(1,2,,)k kf x a k n x ∂==∂,故得()f x a ∇=.又因2()0(,1,2,,)i jf x i j n x x ∂==∂∂,则2()f x O ∇=.例3 设n n Q R ⨯∈是对称矩阵,,n b R c R ∈∈,称1()2TT f x x Qx b x c =++为二次函数,求()f x 在任意点x 处的梯度和Hesse 矩阵.解 设1212(),(,,,),(,,,)T T ij n n n n Q q x x x x b b b b ⨯===,则121111(,,,)2n nnn ij i j k k i j k f x x x q x x b x c ====++∑∑∑,从而111111111()()()nn j j j j j j n n n nj j n nj j j j n f x q x b q x x bf x Qx b f x b q x b q x x ====⎛⎫⎛⎫∂⎛⎫+ ⎪ ⎪ ⎪∂⎛⎫ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪∇===+=+ ⎪ ⎪ ⎪ ⎪ ⎪∂⎝⎭ ⎪ ⎪ ⎪+ ⎪ ⎪ ⎪∂⎝⎭⎝⎭⎝⎭∑∑∑∑.再对1()(1,2,,)nij j i j i f x q x b i n x =∂=+=∂∑求偏导得到2()(,1,2,,)ij i jf x q i j n x x ∂==∂∂,于是1112121222212()n n n n nn q q q q q q f x Q q q q ⎛⎫⎪ ⎪∇== ⎪⎪⎝⎭. 例 4 设()()t f x td ϕ=+,其中:n f R R →二阶可导,,,n n x R d R t R ∈∈∈,试求(),()t t ϕϕ'''.解 由多元复合函数微分法知 2()(),()()T T t f x td d t d f x td d ϕϕ'''=∇+=∇+. 定理4 设:,n n f R R x R →∈,且()f x 在点x 的某邻域内具有二阶连续偏导数,则()f x 在点x 处有Taylor 展式21()()()(),(01)2T T f x x f x f x x x f x x x θθ+∆=+∇∆+∆∇+∆∆<<.证明 设()(),[0,1]t f x t x t ϕ=+∆∈,则(0)(),(1)()f x f x x ϕϕ==+∆.按一元函数Taylor 公式()t ϕ在0t =处展开,有21()(0)(0)(),(0)2t t t t ϕϕϕϕθθ'''=++<<.从例4得知2(0)(),()()()T T f x x x f x x x ϕϕθθ'''=∇∆=∆∇+∆∆.令1t =,有21()()()(),(01)2T T f x x f x f x x x f x x x θθ+∆=+∇∆+∆∇+∆∆<<.根据定理1和定理4,我们有如下两个公式()()()()()T f x f x f x x x o x x =+∇-+-,221()()()()()()()()2T T f x f x f x x x x x f x x x o x x =+∇-+-∇-+-.§1. 3 最优化的基本术语定义 设:n f R R →为目标函数,n S R ⊆为可行域,x S ∈.(1) 若x S ∀∈,都有()()f x f x ≥,则称x 为()f x 在S 上的全局(或整体)极小点,或者说,x 是约束最优化问题min ()x Sf x ∈的全局(或整体)最优解,并称()f x为其最优值.(2) 若,x S x x ∀∈≠,都有()()f x f x >,则称x 为()f x 在S 上的严格全局(或整体)极小点.(3) 若x ∃的δ邻域(){}(0)n N x x R x x δδδ=∈-<>使得()x N x S δ∀∈,都有()()f x f x ≥,则称x 为()f x 在S 上的局部极小点,或者说,x 是约束最优化问题min ()x Sf x ∈的局部最优解.(4) 若x ∃的δ邻域()(0)N x δδ>使得(),x N x S x x δ∀∈≠,都有()()f x f x >,则称x 为()f x 在S 上的严格局部极小点.第二章 最优性条件§2.1 无约束最优化问题的最优性条件定理 1 设:n f R R →在点x 处可微,若x 是问题min ()f x 的局部极小点,则()0f x ∇=.定义 设:()n f S R R ⊆→在int x S ∈处可微,若()0f x ∇=,则称x 为()f x 的平稳点.定理2 设:n f R R →在点x 处具有二阶连续偏导数,若x 是问题min ()f x 的局部极小点,则()0f x ∇=,且2()f x ∇半正定.定理3 设:n f R R →在点x 处具有二阶连续偏导数,若()0f x ∇=,且2()f x ∇正定,则x 是问题min ()f x 的严格局部极小点. 注:定理2不是充分条件,定理3不是必要条件.例1 对于无约束最优化问题2312min ()f x x x =-,其中212(,)T x x x R =∈,显然 2212()(2,3),T f x x x x R ∇=-∀∈,令()0f x ∇=,得()f x 的平稳点(0,0)T x =,而且2222020(),()0600f x f x x ⎛⎫⎛⎫∇=∇= ⎪ ⎪-⎝⎭⎝⎭.易见2()f x ∇为半正定矩阵.但是,在x 的任意δ邻域x x δ-<,总可以取到(0,)2T x δ=,使()()f x f x <,即x 不是局部极小点.例2 对于无约束最优化问题42241122min ()2f x x x x x =++,其中212(,)T x x x R =∈, 易知3223112122()(44,44)Tf x x x x x x x ∇=++,从而得平稳点(0,0)T x =,并且 22221212221212001248(),()008412x x x x f x f x x x x x ⎛⎫+⎛⎫∇=∇=⎪ ⎪+⎝⎭⎝⎭. 显然2()f x ∇不是正定矩阵.但是,22212()()f x x x =+在x 处取最小值,即x 为严格局部极小点.例3 求解下面无约束最优化问题332122111min ()33f x x x x x =+--,其中212(,)T x x x R =∈, 解 因为21212222201(),()0222x x f x f x x x x ⎛⎫-⎛⎫∇=∇= ⎪ ⎪--⎝⎭⎝⎭,所以令()0f x ∇=,有2122210,20.x x x ⎧-=⎪⎨-=⎪⎩解此方程组得到()f x 的平稳点(1)(2)(3)(4)1111,,,0202x x x x --⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭.从而2(1)2(2)2020(),()0202f x f x ⎛⎫⎛⎫∇=∇= ⎪ ⎪-⎝⎭⎝⎭,2(3)2(4)2020(),()0202f x f x --⎛⎫⎛⎫∇=∇= ⎪ ⎪-⎝⎭⎝⎭.由于2(1)()f x ∇和2(4)()f x ∇是不定的,因此(1)x 和(4)x 不是极值点.2(3)()f x ∇是负定的,故(3)x 不是极值点,实际上它是极大点.2(2)()f x ∇是正定的,从而(2)x 是严格局部极小点.定理4 设:n f R R →是凸函数,且()f x 在点n x R ∈处可微,若()0f x ∇=,则x 为min ()f x 的全局极小点.推论5 设:n f R R →是凸函数,且()f x 在点n x R ∈处可微.则x 为min ()f x 的全局极小点的充分必要条件是()0f x ∇=. 例 4 试证正定二次函数1()2TT f x x Qx b x c =++有唯一的严格全局极小点1x Q b -=-,其中Q 为n 阶正定矩阵.证明 因为Q 为正定矩阵,且(),n f x Qx b x R ∇=+∀∈,所以得()f x 的唯一平稳点1x Q b -=-.又由于()f x 是严格凸函数,因此由定理4知,x 是()f x 的严格全局极小点.§2.2 等式约束最优化问题的最优性条件定理1 设:n f R R →在点x 处可微,:(1,2,,)n j h R R j l →=在点x 处具有一阶连续偏导数,向量组12(),(),,()l h x h x h x ∇∇∇线性无关.若x 是问题min ();..()0,1,2,,j f x s t h x j l ⎧⎨==⎩的局部极小点,则,1,2,,j v R j l ∃∈=,使得1()()0lj j j f x v h x =∇-∇=∑.称(,)()()T L x v f x v h x =-为Lagrange 函数,其中12()((),(),,())T l h x h x h x h x =.称12(,,,)T l v v v v =为Lagrange 乘子向量.易见(,)x v L L x v L ∇⎛⎫∇= ⎪∇⎝⎭,这里1(,)()(),(,)()lx j j v j L x v f x v h x L x v h x =∇=∇-∇∇=-∑.定理 2 设:n f R R →和:(1,2,,)n j h R R j l →=在点n x R ∈处具有二阶连续偏导数,若l v R ∃∈,使得(,)0x L x v ∇=,并且,,0n z R z ∀∈≠,只要()0,1,2,,T j z h x j l ∇==,便有2(,)0T xx z L x v z ∇>,则x 是问题min ();..()0,1,2,,j f x s t h x j l ⎧⎨==⎩的严格局部极小点.例1 试用最优性条件求解 221212min ();..()80.f x x x s t h x x x ⎧=+⎨=-=⎩解 Lagrange 函数为221212(,)(8)L x v x x v x x =+--,则1221122(,)2(8)x vx L x v x vx x x -⎛⎫⎪∇=- ⎪ ⎪--⎝⎭, 从而得(,)L x v 的平稳点(8,8,2)T 和(8,8,2)T --,对应有(8,8),2T x v ==和(8,8),2T x v =--=.由于221222(,),()222xx x v L x v h x x v--⎛⎫⎛⎫⎛⎫∇==∇= ⎪⎪ ⎪--⎝⎭⎝⎭⎝⎭. 因此1212(){(,)|(,)()0}T M x z z z z h x =∇=121221{(,)|0}T z z z x z x =+= 1212{(,)|}T z z z z ==-.并且(),0z M x z ∀∈≠,有222211221(,)24280T xx z L x v z z z z z z ∇=-+=>.利用定理2,所得的两个可行点(8,8)T x =和(8,8)T x =--都是问题的严格局部极小点.§2.3 不等式约束最优化问题的最优性条件定义 设,,,0n n S R x clS d R d ⊆∈∈≠,若0δ∃>,使得,,(0,)x d S λλδ+∈∀∈, 则称d 为集合S 在点x 处的可行方向. 这里{|,(),0}n clS x x R SN x δδ=∈≠∅∀>.令 {|0,0,,(0,)}D d d x d S δλλδ=≠∃>+∈∀∈使,0{|()0}T F d f x d =∇<.定理 1 设n S R ⊆是非空集合,:,,()f S R x S f x →∈在点x 处可微.若x 是问题min ()x Sf x ∈的局部极小点,则 0F D =∅.对于min ();..()0,1,2,,,i f x s t g x i m ⎧⎨≥=⎩ (1)其中:,:(1,2,,)n n i f R R g R R i m →→=.令(){|()0,1,2,,}i I x i g x i m ===,其中x 是上述问题(1)的可行点.定理 2 设x 是问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(())i g x i I x ∉在点x 处连续,如果x 是问题(1)的局部极小点,则 00F G =∅,其中0{|()0,()}T i G d g x d i I x =∇>∈.定理 3 设x 是问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(())i g x i I x ∉在点x 处连续,若x 是问题(1)的局部极小点,则存在不全为0的非负数0,(())i u u i I x ∈,使0()()()0iii I x u f x u g x ∈∇-∇=∑. (x 称为Fritz John 点)如果()(())i g x i I x ∉在点x 处也可微,则存在不全为0的非负数01,,,m u u u ,使01()()0,()0,1,2,,.mi i i i iu f x u g x u g x i m =⎧∇-∇=⎪⎨⎪==⎩∑ (x 称为Fritz John 点) 例1 设1311222min ();..()(1)0,()0.f x x s t g x x x g x x =-⎧⎪=--≥⎨⎪=≥⎩试判断(1,0)T x =是否为Fritz John 点. 解 因为12100(),(),()011f x g x g x -⎛⎫⎛⎫⎛⎫∇=∇=∇= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭,且(){1,2}I x =,所以为使Fritz John 条件01210000110u u u -⎛⎫⎛⎫⎛⎫⎛⎫--= ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭成立,只有00u =才行.取0120,0u u u α===>即可,因此x 是Fritz John 点.定理 4 设x 是问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(())i g x i I x ∉在点x 处连续,并且()(())i g x i I x ∇∈线性无关.若x 是问题(1)的局部极小点,则存在0(())i u i I x ≥∈,使得()()()0iii I x f x u g x ∈∇-∇=∑. (x 称为K-T 点)如果()(())i g x i I x ∉在点x 处也可微,则存在0(1,2,,)i u i m ≥=,使得1()()0,()0,1,2,,.mi i i i if x ug x u g x i m =⎧∇-∇=⎪⎨⎪==⎩∑ (x 称为K-T 点) 例2 求最优化问题21211222min ()(1);..()20,()0f x x x s t g x x x g x x ⎧=-+⎪=--+≥⎨⎪=≥⎩的K-T 点. 解 因为1122(1)10(),(),()111x f x g x g x --⎛⎫⎛⎫⎛⎫∇=∇=∇= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭,所以K-T 条件为111211222122(1)0,10,(2)0,0,0,0.x u u u u x x u x u u -+=⎧⎪+-=⎪⎪--+=⎨⎪=⎪⎪≥≥⎩ 若20u =,则11u =-,这与10u ≥矛盾.故20u >,从而20x =;若120x -+=,则12u =-,这与10u ≥矛盾.故10u =,从而211,1u x ==; 由于120,0u u ≥≥,且(1,0)T x =为问题的可行点,因此x 是K-T 点. 定理5 设在问题(1)中,()f x 和()(1,2,,)i g x i m -=是凸函数,x 是可行点,并且()f x 和()(())i g x i I x ∈在点x 处可微.若x 是问题(1)的K-T 点,则x 是问题(1)的全局极小点.§2.4 一般约束最优化问题的最优性条件考虑等式和不等式约束最优化问题min ();..()0,1,2,,,()0,1,2,,,i j f x s t g x i m h x j l ⎧⎪≥=⎨⎪==⎩(1) 其中:,:(1,2,,),:(1,2,,)n n n i j f R R g R R i m h R R j l →→=→=.并把问题(1)的可行域记为S .,(){|()0,1,2,,}i x S I x i g x i m ∀∈==.定理 1 设x 为问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(1,2,,)j h x j l =在点x 处具有一阶连续偏导数,()(())i g x i I x ∉在点x 处连续,并且向量组12(),(),,()l h x h x h x ∇∇∇线性无关.若x 是问题(1)的局部极小点,则 00F G H =∅,这里0{|()0}T F d f x d =∇<,0{|()0,()}T i G d g x d i I x =∇>∈,0{|()0,1,2,,}T j H d h x d j l =∇==.定理 2 设x 为问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(1,2,,)j h x j l =在点x 处具有一阶连续偏导数,()(())i g x i I x ∉在点x 处连续.若x 为问题(1)的局部极小点,则存在不全为0的数0,(())i u u i I x ∈和(1,2,,)j v j l =,且0,0(())i u u i I x ≥∈,使0()1()()()0liijji I x j u f x u g x v h x ∈=∇-∇-∇=∑∑. (x 称为Fritz John 点)若()(())i g x i I x ∉在点x 处也可微,则存在不全为0的数0,(1,2,,)i u u i m =和(1,2,,)j v j l =,且0,0(1,2,,)i u u i m ≥=,使011()()()0,()0,1,2,,.m li i j j i j i iu f x u g x v h x u g x i m ==⎧∇-∇-∇=⎪⎨⎪==⎩∑∑ (x 称为Fritz John 点)例1 设2212311222212min ();..()0,()0,()(1)0.f x x x s t g x x x g x x h x x x ⎧=+⎪=-≥⎪⎨=≥⎪⎪=--+=⎩试判断(1,0)T x =是否为Fritz John 点.解 (){2}I x =,且2200(),(),()011f x g x h x ⎛⎫⎛⎫⎛⎫∇=∇=∇= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,且(){1,2}I x =,因此为使Fritz John 条件022*******u u v ⎛⎫⎛⎫⎛⎫⎛⎫--= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭成立,只有00u =才行.所以取020,1,1u u v ===-,即知x 是Fritz John 点.定理 3 设x 为问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(1,2,,)j h x j l =在点x 处具有一阶连续偏导数,()(())i g x i I x ∉在点x 处连续,且向量组()(()),()(1,2,,)i j g x i I x h x j l ∇∈∇=线性无关.若x 是问题(1)的局部极小点,则存在数0(())i u i I x ≥∈和(1,2,,)j v j l =,使()1()()()0liijji I x j f x u g x v h x ∈=∇-∇-∇=∑∑. (x 称为K-T 点)如果()(())i g x i I x ∉在点x 处也可微,则存在数0(1,2,,)i u i m ≥=和(1,2,,)j v j l =,使11()()()0,()0,1,2,,.m li i j j i j i if x ug x vh x u g xi m ==⎧∇-∇-∇=⎪⎨⎪==⎩∑∑ (x 称为K-T 点) 令 1212()((),(),,()),()((),(),,())T T m l g x g x g x g x h x h x h x h x ==,1212(,,,),(,,,)T T m l u u u u v v v v ==,称u 与v 为广义Lagrange 乘子向量或K-T 乘子向量.()()()0,()0,0.T T Tf xg x uh x v u g x u ⎧∇-∇-∇=⎪=⎨⎪≥⎩令(,,)()()()T T L x u v f x u g x v h x =--为广义Lagrange 函数.称(,,)L x u v 为广义Lagrange 函数.则K-T 条件为(,,)0,()0,0.x TL x u v u g x u ∇=⎧⎪=⎨⎪≥⎩定理 4 设在问题(1)中,()f x 和()(1,2,,)i g x i m -=是凸函数,()(1,2,,)j h x j l =是线性函数,x 是可行点,并且()f x 和()(())i g x i I x ∈在点x 处可微.若x 是问题(1)的K-T 点,则x 是问题(1)的全局极小点.例2 求解最优化问题221221212min ()(3)(1);..()0,()230.f x x x s t g x x x h x x x ⎧=-+-⎪=-+≥⎨⎪=+-≥⎩ 解 广义Lagrange 函数为222121212(,,)()()()(3)(1)()(23)L x u v f x ug x vh x x x u x x v x x =--=-+---+-+-.因为111(,,)2(3)22L x u v x ux v x ∂=-+-∂,22(,,)2(1)L x u v x u v x ∂=---∂.所以K-T 条件及约束条件为112212212122(3)220,2(1)0,()0,0,230,0.x ux v x u v u x x x x x x u -+-=⎧⎪---=⎪⎪-+=⎪⎨-+≥⎪⎪+-=⎪≥⎪⎩ 下面分两种情况讨论. (1) 设0u =,则有12122(3)20,2(1)0,230.x v x v x x --=⎧⎪--=⎨⎪+-=⎩ 由此可解得12718,,555x x v ===-,但71(,)55T x =不是可行点,因而不是K-T 点.(2) 设0u >,则有112212122(3)220,2(1)0,0,230.x ux v x u v x x x x -+-=⎧⎪---=⎪⎨-+=⎪⎪+-=⎩ 由此可得211230x x --+=,解得11x =或13x =-。

最优化方法第一章最优化问题与凸分析基础

最优化方法第一章最优化问题与凸分析基础
性质: 1) 凸集的交集是凸集;(并集一般不是) 2) 凸集的内点集是凸集; 3) 凸集的闭包是凸集。
4.2 凸函数
定义: 设集合 S Rn 为凸集,函数 f :SR, 若 x(1), x(2) S, ( 0 , 1 ) ,均有
f( x(1)+(1- ) x(2) ) ≤f(x(1))+(1- )f(x(2)) , 则称 f(x) 为凸集 S 上的凸函数。
hi x 0 等式约束
称满足所有约束条件的向量 x为可行解,或可行点,全体
可行点的集合称为可行集,记为D 。
D {x | hi x 0, i 1, 2, m, g j x 0,
j 1, 2, p, x Rn } 若 hi ( x), g j ( x) 是连续函数,则D 是闭集。
2.3 Hesse矩阵
Hesse 矩阵:多元函数 f (x) 关于 x 的二阶偏导
数矩阵
2
f
X
x12
2
f
X
f
X
2 f X
x1 x2
2
f
X
x1xn
2 f X
x2x1
2 f X
x22
2 f X
x2 xn
2
f
X
xnx1
2
f
X
xnx2
2
f
X
xn2
例:求目标函数 f (x) x12 x22 x32 2x1x2 2x2x3 3x3 的梯度和Hesse矩阵。
若进一步有上面不等式以严格不等式成立,则称
f(x) 为凸集 S 上的严格凸函数。 当- f(x) 为凸函数(严格凸函数)时,则称 f(x) 为
凹函数(严格凹函数)。
严格凸函数

最优化方法 1第一章

最优化方法 1第一章
xyz 2 (3a yz ) 0, 2 xyz 2 (3 a zx) 0, 2 xyz 2 (3 a xy ) 0.
2 2
比较以上三式可得 3a yz 3a zx 3a xy 从而x=y=z=a,右侧面积固定的长方 体的最大体积客观存在,因此侧面积固定 的长方体中以正方体体积最大.
j 1
18
按经典极值问题解法可能出现不能解决的情况:
(1)当变量个数增加且方程组又是非线性,求解此方程 只有在相当特殊情况下才能人工解出.通常高等数学中的 求极值问题的变量个数一般不超过三个. (2)当限制条件出现不等式,无论变量数多少,按经典 极值方法求解根本无法解决. 要解决上述问题,直到本世纪50年代最优化理论建立 以及电子计算机的迅速发展才为求解各种最优化问题提供 了雄厚的基础和有效手段.而且最优化方法作为一门崭新 的应用学科,有关理论和方法有待于进一步发展与完善。
解设长方体的长宽高分别为体积为则依题意知体积为限制条件为由拉格朗日乘数法考虑函数xyzvvfxyzxyz??2260xyzyzxzxya??????62222?13令62222axyzxyzxyzzyxf??????202020xyzfyzyzfxzzxfxyxy??????????????????由题意可知应是正数由此将上面三个等式分别乘以并利用条件得到222230230230xyzayzxyzazxxyzaxy?????????????????
2 x1 5 x 2 40
x1 0 , x2 0
即求
max f ( x1 , x 2 ) x1 x 2 ,
2 x1 5 x2 40, x1 0,x2 0.
16
第一个例子代表无约束极值问题: 一般地可表示为 min f ( x1 , x 2 , , x n )或 max f ( x1 , x 2 , , x n ) n 这里 f ( x1 , x 2 , , x n ) 是定义在 R 上的可微函数. 求极值的方法是从如下含有n个未知数的非线性方程组

最优化方法及其matlab程序设计习题答案

最优化方法及其matlab程序设计习题答案

证明:根据严格凸函数定义证明。
定义:对任意x ̸= y,及任意实数λ ∈ (0, 1)都有f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y).
充分条件:∀x, y ∈ ℜn, 有f (x + y) ≤ f (x) + f (y)
对任意x ̸= y,及任意实数λ ∈ (0, 1)都有f (λx+(1−λ)y) ≤ f (λx)+f ((1−λ)y)
8
k= 2 (2)阻尼牛顿法 function He=Hesstwo(x) n=length(x); He=zeros(n,n); He=[8, 0; 0, 2]; ≫ x0=[0,1]’;[x val k]=dampnm(’funtwo1’,’gfuntwo1’,’Hesstwo’,x0) x= 1 2 val = -8 k= 1 第3题. function f=fun(x) f = (x(1) − 2)4 + (x(1) − 2 ∗ x(2))2; function gf=gfun(x) gf = [4 ∗ (x(1) − 2)3 + 2 ∗ (x(1) − 2 ∗ x(2)), −4 ∗ (x(1) − 2 ∗ x(2))]′; ≫clear all; ≫x0=[0 3]’;[v,val,k]=grad(’fun’,’gfun’,x0)
(1

λ)y)=
1 2
(λx
+
(1

λ)y)T
G(λx
+
(1

λ)y)
+
bT
(λx
+
(1

λ)y)
λf
(x)

最优化方法(刘)第一章

最优化方法(刘)第一章
f x 1 y cT x 1 y cT x 1 cT y f x 1 f y
所以 c T x 是凸函数. 类似可以证明 c T x 是凹函数.
凸函数的几何性质
对一元函数 f x , 在几何上f x1 1 f x2
下面的图形给出了凸函数 f x, y x 3x y
4 2
4
y 2 xy 的等值线的图形,可以看出水平集是凸集
凸函数的判定
定理1:设 f x 是定义在凸集 D R n 上,x, y D , 令 t f tx 1 t y , t 0,1, 则: (1) f x 是凸集 D 上的凸函数的充要条件是对 任意的x, y D ,一元函数 t 为 0,1上的凸函数. (2)设 x, y D , x y, 若 t 在 0,1 上为严格 凸函数, f x 在 D 上为严格凸函数. 则
例1: 证明超球 x r 为凸集.
0 证明: x , y 为超球中的任意两点, 1, 设
则有:
x 1 y
x 1 y
r 1 r r 即点 x 1 y 属于超球
所以超球为凸集.
凸集的性质
(1) 有限个(可以改成无限)凸集的交集 为凸集. (2) 设 D 是凸集, 是一实数, 则下面的 集合是凸集: D y y x , x D (3)设 D1 , D2 是凸集, D1 , D2 的和集 则
相关定义(P7—P8)
定义1.1 可行解 满足约束条(1.2)和(1.3)
的x称为可行解,也称为可行点或容许点。
定义1.2 可行域 全体可行解构成的集合 称为可行域,也称为容许集,记为F,即:

最优化理论 第一章

最优化理论 第一章

或稳定性等要求; 边界约束——只是对设计变量的取值范围加以限制的约 对轴段长度的限定范围就属于边界约束。
束称作边界约束。例如,允许机床主轴选择的尺寸范围,
(a)二变量问题的约束线
图1-2 优化问题中的约束面(或约束线)
(b) 三变量问题的约束面
可行域 : 在优化问题中,满足所有约束条件的点所构成的 集合。 如图1-3上画出了满足两项约束条件g1(X)=x12+x22—16 ≤ 0和g2 (X)=2—x2≤0的二维设计问题的可行域D,它位于x2=2的上面和 圆 x12+x22=16的圆弧ABC下面并包括线段AC和圆弧ABC在内。
2.约束条件
优化问题中有些是工程上所不能接受的,在优化中
对优化变量取值有一些限制条件,这些限制条件称作 约束条件,简称约束。 约束又可按其数学表达形式分成等式约束和不 等式约束两种类型: (1)等式约束
h( x ) 0 g ( x) 0
(2)不等式约束
根据约束的性质可以把它们区分成: 性能约束——针对性能要求而提出的限制条件称作性能 约束。例如,选择某些结构必须满足受力的强度、刚度
求优化变量向量
使目标函数
满足约束条件 :
X [ x1 , x2 , , xn ] f ( X ) min
g j (X ) 0
T
( j 1, 2,
, m)
hk ( X ) 0
(k 1,2, , l )
n
min f ( X ) f ( x1,x2, ,xn ), X R s.t. g j ( X ) 0 j 1,2, , m hk ( X ) 0 k 1,2, , l
一个优化问题可以用一组基本参数的数值来表示, 在优化过程中进行选择并最终必须确定的各项独立 的基本参数,称作优化变量,又叫做决策变量。

《最优化方法》课程教学大纲

《最优化方法》课程教学大纲

最优化方法》课程教学大纲课程编号:100004英文名称:Optimizatio n Methods一、课程说明1. 课程类别理工科学位基础课程2. 适应专业及课程性质理、工、经、管类各专业,必修文、法类各专业,选修3. 课程目的(1 )使学生掌握最优化问题的建模、无约束最优化及约束最优化问题的理论和各种算法;(2)使学生了解二次规划与线性分式规划的一些特殊算法;(3)提高学生应用数学理论与方法分析、解决实际问题的能力以及计算机应用能力。

4. 学分与学时学分2,学时405. 建议先修课程微积分、线性代数、Matlab语言6. 推荐教材或参考书目推荐教材:(1)《非线性最优化》(第一版).谢政、李建平、汤泽滢主编.国防科技大学出版社.2003年.孙(第一版)参考文瑜、徐成贤、朱德通主编.高等教育出版社.2004年(2)《最优化方法》书目:(第一版).胡适耕、施保昌主编.华中理工大学出版社.2000年(1)《最优化原理》(2)《运筹学》》(修订版).《运筹学》教材编写组主编.清华大学出版社.1990年7. 教学方法与手段(1)教学方法:启发式(2)教学手段:多媒体演示、演讲与板书相结合8. 考核及成绩评定考核方式:考试成绩评定:考试课(1)平时成绩占20%形式有:考勤、课堂测验、作业完成情况(2)考试成绩占80%形式有:笔试(开卷)。

9. 课外自学要求(1)课前预习;(2)课后复习;(3)多上机实现各种常用优化算法。

二、课程教学基本内容及要求第一章最优化问题与数学预备知识基本内容:(1 )最优化的概念;(2)经典最优化中两种类型的问题--无约束极值问题、具有等式约束的极值问题的求解方法;(3)最优化问题的模型及分类;(4)向量函数微分学的有关知识;5)最优化的基本术语。

基本要求:(1)理解最优化的概念;(2)掌握经典最优化中两种类型的问题--无约束极值问题、具有等式约束的极值问题的求解方法;(3)了解最优化问题的模型及分类;(4)掌握向量函数微分学的有关知识;(5)了解最优化的基本术语。

最优化方法教案

最优化方法教案

第一章最优化问题及数学预备知识最优化分支:线性规划,整数规划,几何规划,非线性规划,动态规划。

又称规划论。

应用最优化方法解决问题时一般有以下几个特点:1. 实用性强2. 采用定量分析的科学手段3. 计算量大,必须借助于计算机4. 理论涉及面广应用领域:工业,农业,交通运输,能源开发,经济计划,企业管理,军事作战……。

§1.1 最优化问题实例最优化问题:追求最优目标的数学问题。

经典最优化理论:(1) 无约束极值问题:),,,(opt 21n x x x f(),,,(m in 21n x x x f 或),,,(m ax 21n x x x f )其中,),,,(21n x x x f 是定义在n 维空间上的可微函数。

解法(求极值点):求驻点,即满足⎪⎪⎩⎪⎪⎨⎧='='='0),,(0),,(0),,(11121n x n x n x x x f x x f x x f n并验证这些驻点是否极值点。

(2) 约束极值问题:),,,(opt 21n x x x fs.t. )(,,2,1,0),,,(21n l l j x x x h n j <==解法:采用Lagrange 乘子法,即将问题转化为求Lagrange 函数),,(),,,(),,;,,,(1121121n j j lj n l n x x h x x x f x x x L λλλ∑=+=的无约束极值问题。

近代最优化理论的实例:例1 (生产计划问题) 设某工厂有3种资源B 1,B 2,B 3,数量各为b 1,b 2,b 3,要生产10种产品A 1,…,A 10 。

每生产一个单位的A j 需要消耗B i 的量为a ij ,根据合同规定,产品A j 的量不少于d j ,再设A j 的单价为c j 。

问如何安排生产计划,才能既完成合同,又使总收入最多?(线性规划问题)数学模型:设A j 的计划产量为 j x ,z 为总产值。

最优化计算方法第1章

最优化计算方法第1章
的。 二次规划:目标函数为二次函数,约束条件中的函数为线
性的。
根据函数性质分类 动态与静态 随机与确定 单目标与多目标
路漫漫其悠远
最优化计算方法第1章
优化模型的分类
解法的分类
解析方法:利用函数的分析性质去构造迭代公式,使之收敛 到极值点。
直接方法:按一定的数学原理,用尽量少的计算量,直接比 较函数值的大小。
• 等式约束优化问题
• 不等式约束优化问题
路漫漫其悠远
最优化计算方法第1章
优化模型的分类
根据问题的不同特点分类 一般的约束优化问题 标准形式
1) 2)
路漫漫其悠远
最优化计算方法第1章
优化模型的分类
根据函数类型分类
线性规划:目标函数、约束条件都是线性的 非线性规划:目标函数、约束条件中的函数不全是线性
路漫漫其悠远
,使得 称 为问题(P)的局部
,使得 称 为问
最优化计算方法第1章
最优解与极值点
严格局部 极小点
• 最优化技术与数学模型所包括的知识点很多,选取了一些 实用的方法。
路漫漫其悠远
最优化计算方法第1章
课程简介
从工程应用的角度出发,注重工程优化的基本思想和 方法的阐述。
内容主要包括: 线性规划、非线性规划、约束优化、无约束优化等, 并对如何建立数学模型、如何选择优化方法和提高优 化效率作了适当的介绍。
足环保要求的条件下,每厂各应处理多少工业污水,使这 两个工厂处理工业污水的费用最小.
工厂1
工厂2
路漫漫其悠远
500万m3
200万m3
最优化计算方法第1章
最优化问题举例
变量:x1、x2----分别代表工厂1和工厂2处理污水的数量(万m3)

最优化方法 第二版 孙文瑜 部分课后答案

最优化方法 第二版 孙文瑜 部分课后答案

0 的边界点;
2. 考虑下述约束最优化问题
min x1
s.t.
x21 + (x2 − 2)2 x21 1,
3,
画出问题的可行域和目标函数的等位线,并由此确定问题的所有局部最优解和全局最优解.
解: 可行域和等位线如下
1
x2
(1,2 2)
( 3,2)
(0,2)
3 1
(1,2 2)
1 3 x1
全等局位最线优:解f (x:1)x1==k;−√局3部, x最2 =优2解. :x1
T = {x|f (x) α}
为函数 f (x) 关于实数 α 的水平集. 证明对任意实数 α,集合 T 是凸集. 证: 对于 ∀x1, x2 ∈ T ,根据 T 的定义则有 f (x1) α, f (x2) α. 由于 D 是凸集,则对于 ∀λ ∈ [0, 1],必 有
λx1 + (1 − λ)x2 ∈ D 又由于 f (x) 是 D 上的凸函数,则有
f (λx∗ + (1 − λ)y) λf (x∗) + (1 − λ)f (y) λf (x∗) + (1 − λ)f (x∗) = f (x∗)
5
这表明在 x∗ 的任意小的邻域内都存在函数值小于 f (x∗) 的可行点,这与 x∗ 是局部最优解相矛盾,则 x∗ 是一个全局最优解. 再证 x∗ 是唯一的:由于目标函数是严格凸的,设 x∗ ̸= y∗ 都是全局最优解,则 f (x∗) = f (y∗). 由严格凸 函数的定义,而 ∀λ ∈ (0, 1),有
λx1 + (1 − λ)y1 + λx2 + (1 − λ)y2 = λ(x1 + x2) + (1 − λ)(y1 + y2) λ+1−λ=1

陈宝林最优化课后习题标准答案第一章

陈宝林最优化课后习题标准答案第一章

目录>»丨〔和IHg第1章第3章引亩《»..线性《超的at*性质aw10SUB«7*M9>第i»a|] 1 第12«503章第口章第时章运肅问99解A 巻a«a,■爭无妁来fi忧化萌>»方體KU可行力问法fi*惩n两厳运《«二次舉划题解&»规划简介Afi]£9110]I1Z11«1551«220*引言题解I.期靛瓷黄址卜'啊各里合处凸thG) 』门|斗+益*耳1』|一七耳】];CZI 5=((j-|,r,l|x,5^lk|||,) t13〕5=Kx, rj-pl ff+ rf^lOJ.vE HF" 5 中忏《网2” = [::;=九严十u—U'»* 4(】一幼Jfg =JjCL T;"+“一JU J■严]亠孑九严亠H - ]-JU#弹+2>;'*n-u - AH.ip +2j^t*'>>A+ (L-iJ -1. [XrS"+il-A^F']-Dbr;" 4 门-jOf$]=A<j-/' 一斗「7 + 仁一—上严》十门一U=I.晴此・4・” +41—和护"W 百.配气是丹fl:⑵tt咔s +任蛊宀=[:订和占三「Ar戶+ H-丄2卩""皿十门一Abr⑷-Arr + H - JUH"鼻严 + {】一”卡"耳4| T I'" l+Cl-Al I 理T0|4严+KI -AJ^r I,t3> ft®合S 中JE fa N =drV 4口一肋屛" 肚5十H —胡上伸-_J L I4" -1- (1 —A)-T■評由漣进异I[丄理‘十口一1"芒丁 + 口卄U十口一小閉r-^卅倔+2扛 1 -Drf 1” + H - xFd/» +Ff;川ZQ-JBj■屮T営+ fl—"卅上・'=¥ [L严+理鬥+ 11 —a[討严+K严]+星】一门段卅y4 缶『MT 首1诃4K)H-iF 亠&门一;0|>严十+w + hF']W 十J04 I —A V 十2加门=A) -10..因此;11*"+口一打¥’'总氣甜5定凸集.“ 15^「匸胄*星一卜凸樂・户艮/舷故+证明下列彙命幻展》:中的凸集:3二M I £ e 歐"二“* * e cb 具屮A雄给症的wXp宴处阵.证对ft盍幅点及标个数*e[叭订+ffi据偵合&的定义,存在趴*使屮'-V I-g ・ w此泄市 4 m 十"一i W' -Mpj 十< 1 - A、■¥: - h[2i 十门-2 承1由I- c是凸栗.必侖和十Uf 廉tr*囚此3"十门一JU尹t乩战姣垦凸臬.丸证叨下刊架合目是凸集IS = " I JT =相*,申•} *具屮心是M X M?)!]眸」倉底讣€・\a 对任恵的工“*严匕号£每十蟲疋[0・1存^^和小自]我严=*,・+**=*”《此打址"、十G—JO£"=八[甘】十、I —>1) jj J115 I ( I —XJ jj^O R Ax"、十{L—A W 丘他即.'S是凸束.4. aS足ST中一F井空档集*证财时毎一r整数kA氛若量小*严•….严WS则为扎工w乩■ = 1蔑中绻+彳m +…十:上=11為^0冷=】•筈•…M)・证用数学口纳法■岂Jfc-2时.由凸锻的宦又知上戒显蕊hSL立.a 时结沦破宜*当jt=/H + L时*冇2入严=0屮+ ―严“=虑人)£ 亠严+人"十.-' E -■ g 2人:■ = 1■-M其中工A, = 1.根据■」纳法假设.J = 1x= £ 严e sI乞血I'wL由于$>+j =1. H tt I £2■卜+4+i 匚S, W荃iF・匚SJ” 丁星r *="亠 1 时a *■・・■» 」■■(fctliMtJL.kftfftfts仪A jfemjffl tft.Eiuxjt更障rter•证闇卜牛fta恰有一牛有靡SU 叫WBfsbfUAtb吋華空J W.乘范3 r€B-filter,a itjT 于北r u—fl.W誓pAtkAr定W・得-f. > >0jt*r反之離ft.* T A A层出Xrt feft』匸咗,M卜処W1 +墓糧恰材一牛附《累貌■if=r.乘蒂2疳,3#,却凋甚ftjES",jx 0, ei>0响*kM總殒卜dluA定理・右X£帕IK4l-,・r」刑*2«丄#b亦山.小Pnr” T ih H «卡「#b办HP»T>0 X B.t" -n MO_;L G* r'-jf >0Al & ・d Jt 0m > flxn.T. it fl Aj<8,r*jr>0^»,tt -t'1 -2 1OJii)H 陽轴让肝耀理■胃需建「)=G J 詩w£». 1»T±.H ^J -O «” I-2-1' 1hl=r^iLJL.I 1, LviJ0 k -d对此住性方^细旳>#广电陆做和靜仃变拱・-1 -1 千1 卩 -1 ■■1-I ■3"■-21 1 b -1 5—- 'O' i -5] b*1 9{z -2,■S'輕筑性方fe 酣胪j =『的孫故逐阵甘堆广距眸的秋干带”同劇;无解.即屮$ =「讣注•无馨一 柚fi yhrb..生專*&rW ・』K :>0咄札d.儿*T :上.+U 6一JR 弋S K JI + IS AO-17 -11怔 K^hrdai. ■只4 S-*<J * - *1 # flfe W h Jtft 上f l J - 17 3 - 1 - 11JfcthW .V <; 4XI .*= J1 0 —5■C 1—414 - 176 — IC 屈訝| 9冲*■ H =5』fti.WftA 仃=0*”」^■丰«绘理.Kit 的耳導式组无*一9.划厲卞列補百世否为內彌(1) 屮刃・■!■ J =H — 2>| J-| +ji -hri +』* I (2) J( J| .J-a>=J-| -1J| Ji +_d *^r, +J -J t UJ j/(牛」和=3. — 矢 2+4*1+曲F ; (41 f"i ・Jv¥=nE -5F^ (i) /"[・片・f 」=jri n +Z J ^—ftj-,j,. 2 -2'-1 2.詁=一芒归| -J^fj+1-r, +L ・45, -叫卄f 諾》宀「2 十『严F 2 -H (Ti^ f] nh+r f Z+e"i*"i(.1 ijA 半iE 建葩痒・WA NR ft 凸睛fe.2〕寻・广5严吋—旳&-"八屮=和-上1卄一2严5・・ ¥■—宀*一“15・・TJt II™竝阵协/为1:定懈(r.*Fh ■皐足丹醺»・ 厲、屮“的U L »M ;矩ff 为4= 1 -61 2 0_« a 1为半戏定siff-a A TI 晦a.W (1)・ r E -41(JI _r,>+4j, + e-i*-i ,'"■" IrA ] 1?-护----- *■ ■+0 0z1-'A 0 07k-fi n4.0 ■3 2-J<k 041 一〒10-J, .J,>«1&—JC J f —J {)L= {<□:] ,urt> (- ll< J,<1 . -1<LL/Gv^,>«F^.s 上的CMft?W ^==flj-ii'( -I*—-tf 1. 詁^= -At*—I) 1 需圭gm 蛊厂衆;w ・0e』g —g定帶阵”丙此尹:士…““^;是S 上ifi».IJ- itfl /仃卜=扌卫7£十》" HLlfi 凸満R 的紀妄Stu 扯1E 富. aiSfe 严W 凸崗 St 撷据定挥 LI. U.Mtt 盘鼻零Wii X 丛i=U •蕊揖/(x> > /<•)+/(JI = J to )-1- Fj(flpjf-|- yH v^/(q>r-|-D(( I Jf II').咖(]1氏和低》成阳yjfT沪 N AJT F W I II Jf 11*1 > Q.Eh.4 正宅一幷证充升性■设*砥定,冲(t*阳十不网点X 脑,■(整中悦宅啤*有P>i = JlZH-W<7i>(jr-7l— 討piyc,)<r-7)枫》定腹 U4用屛=yAu+&q 是产暮栉1^瓯n=T 也!5上不绘丰疋定坪阵"如帝点的He«ie 塚阵民L : _ ;]心u.说丿星泄乂fr■上凸rtBf "曲.・・・上“楚直卅W J SL岛阖严・小是*鱼&* RiS足珀斗歸4■“七1.=1・衽圈*7U,JC^''+A,J^P +*“+丄』"1<;鬲丿[屮",4际屮列+兀川工3人<用It愷!n站儀一气*=2W.«島凸rttt的定史.虞ft/U, J*" 4J,J*" ) 巧亠為X JT*").港b=«曲斥等式就立.气*=川+1 Ihff yu,r'^+4t?*^ + '» +JLJ»5+ 丄t”*"!-zf 1>/亠0” 4- ■>'++-4^K' 1 + i.., r**'4t.i 'f V J I V I丿、/ j・d U"- -rrl—■!■- J H -I_iL_r" 斗十+2_p,0 £二以「■I 4| "■由T /(JI 是+ = 定i*市H-L■ta/((Si-)JI + 人亠1'| +*i/S・i工p-l 』■!H八 W -#-/ (」14 申一/ y 1+- + 4」I严>.I A, S A,以■*J・■}J T1£ 人上A-W1/If +石h”十…十九十『十”》瑤囘+也列屮"》+…"Ui丿WHeju=«T十1时.祈等或也虞.3:.从■側证.”U. ia/er±A^Arttt.tffl t taKf 味贞jE・4tft暫定简ftkffbwist—切成jfE ■・」〔■)为帚札逻用(^込摆一设门和4芒丘社律有全时ftJtlfhJift连0莖電ysn 程过点屮'利r的fiit上任》「点屮”虚那『■4皿+ "—八严・,A e <flJ>.£廿3”)+〔1 = :VXH”JS3W门一:打心心】=丿2心川»-(2)看只*片f>J(j'''l,(fi于f 5)甦凸旃S*密冇H 和4“一打”"<"2“} 4(1 -X)JCjf't"><Vtx'*> + u -jjjuy = Nd” h 护ffi_Si 宓* 常 fi.14.说f «定£血玄I■.的rt**如》对弼一点『€庄吐征ttF旳有F(ffl=”“人#1尊f为lEJfJfc■話衽歸歐上WE齐£病tt丿为凸編救的Stilt杵ft.荊lift ?". ■屮匚期.布/2口斗茎jKJJ 4fZ】J”证itiiF*«ft. ai弈氏稱ft “川是珂iritt*划时fT*ft点齐■*诩宜補16$/(+*"■ + jF")- y 和F" + *屮》.代人«式fl+"*朴+屮巧£卡川工叫4 旳/<厅卩 4 Jr小)C Mth")4 N0' X轉诫A饼世一设正弄施减K /( n时(土恵的严•上P t * «工HhP 4 )=cy<ri)-1-/(4 *■).则Itfta的FS卢・e■武及UFftAW他・1〕•密<1/Ui'N + H-DfD 卜忑/Uf 'h 4恵H-的+ H = 4#""〕* WJt円“堡・■上的凸希甦.13 as提》中是症tft S上的5陷ft一苦对it a的E M'.H" e呂艮軒一节tit W.lh尉筍Z^u*" +(1 -跆,中)£ m*M|j<r''b./lje^*" >r 刪*上为w凸函《.flcaifl* fi屮Hift凸厦百上的WA萸?t.xfi川"*S上的严总《»w小成・《G也是川tw 严tt全十成.2 阳aa*.iJtFE严帘炖«»小血.即ff需F的垃jvdiD.tfFia牛才匡百门M占、flx/Cli/XQAf止、.疊-科星严《全«»心虎萍虹盘H£S」士?■怪时Sl>引g EBiL rtl F屮叮唯凸ft S上W报凸横tt■対(1,丄€&讥1}暫/{jLr+ <1 一肋71 疽屮时充分小时入.卫^ + 11—4塚^£门口4?几这勻亍是严4、戊tt矛ff*W此后也量严tt仝冃掃惟点.!♦. as出■旧一牛車空幷卄51訂层定文4W上的闻n靈甫數,如卑对fl宜W恵屮”* 尹皂i,A(T''•->'*'P刃W)qo a*川”” 4」9心.捌獻0星«凸«».aaXJh «/<riBff &tt s上的怙fl陷ft. H对慕,?匚鸟有町(F)三忸《?星S上的扇爲》+丘.GF 由丁 /以、&歼丹«$上的ft內祭»・»伽凸定丈■时rtfi的生S-F卜T /<x>>/(;).W此t星£・JA;f上制罢Wfe小点-。

最优化计算方法第1章

最优化计算方法第1章
•数学模型: 对现实事物或问题的数学抽象或描述。
•最优化问题的数学模型与分类
•数学模型的建立
• 建立数学模型时要尽可能简单,而且要能完整地描 述所研究的系统。
• 过于简单的数学模型所得到的结果可能不符合实际情 况;而过于详细复杂的模型又给分析计算带来困难。 • 具体建立怎样的数学模型需要丰富的经验和熟练的技 巧。 •
线性规划:目标函数、约束条件都是线性的 非线性规划:目标函数、约束条件中的函数不全是线性
的。 二次规划:目标函数为二次函数,约束条件中的函数为线
• 最优化技术与数学模型所包括的知识点很多,选取了一些 实用的方法。
课程简介
从工程应用的角度出发,注重工程优化的基本思想和 方法的阐述。
内容主要包括: 线性规划、非线性规划、约束优化、无约束优化等, 并对如何建立数学模型、如何选择优化方法和提高优 化效率作了适当的介绍。
课程任务
讲授工程优化的基本理论和方法,要求通过本课程的学 习,具有应用工程优化方法解决实际问题的技能,并为以后 的学习和工作打好基础。
的约束下求决
策变量x,使函数
达到极
其中: 为决策变量 为已知参数
小min;若求极大max,相当于一个 min(-f)。
为随机因素
为(一般或广义)函数
•建立优化模型的三要素
•决策变量和参数
• 决策变量是由数学模型的解确定的未知数。参数表示 系统的控制变量,有确定性的也有随机性的。
约束或限制条件
由于现实系统的客观物质条件限制,模型必须包括 把决策变量限制在它们可行值之内的约束条件,而这通常 是用约束的数学函数形式来表示的。
最优化计算方法第1章
2020年5月31日星期日
为什么要学习工程优化
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

不同的规则对应着不同的最优化方法。 综上所述,无约束问题下降算法的基本迭代格式如下: ⑴选定初始点 x0,置 k 0 。 ⑵按某种规则确定下降方向 pk 。 f ( xk tk pk ) f ( xk ). ⑶按某种规则确定 t k ,使得
和 f ( xk 1 ) ;否则,置 k: k 1 转⑵。
n 1
2 * x Q1b 是它的唯一极小点。
利用上节和本节的定理不难说明下面的两个论断。 1 T T i)对于正定二次函数 f ( x ) x Qx b x c ,
ii)若多元函数在极小点处的Hesse矩阵是正定的,则 在这个极小点附近其等值面近似地呈现为同心椭球面族。 推证如下:i)首先求出二次函数的驻点。令
是点 z ls( x, p) 相矛盾。 处的下降方向, 这都与 故必有 f ( z )T p 0 。
z
(1.46)的几何意义是明显的。

搜索得到的极小点,则(1.46)指出,梯度 f ( z ) 必与 又因为 f ( z ) 与目标函数过点 z 搜索方向向量 p 正交。 f 的等值面(等直线) ( x ) f ( z ) 正交,所以搜索方向向量 p与这个等值面(等直线)在点 z 处相切。
f ( xk tk pk ) min f ( xk tpk ) (1.43)
t
按这种方法确定的步长因子称为最优步长因子。这种 选取方法是很自然的。既然下降方向已经确定,就应该沿 这个方向找到使目标函数取极小值的点。
t
同时这又是容易办到的,因为 (t ) f ( xk tpk ) 是以 t
xk 和 xk 1 已经很 从图中可以看到,相邻两个迭代点
*
也必然很小。因此,如果加上
f ( xk 1 ) f ( xk ) 2
(1.52)
这个条件,那么可靠性就会加强。上图2指出了只采 用(1.52)也是不可靠的。虽然 f k 1 与 f k 相差很小,可 是相应的两个迭代点 xk 1 和 xk 却相距很远,它们距极 * 小点 x 也很远。 需要注意的是,实际应用中,由于 xk 和 f k 所取的量 纲有时太大,这时如果仍然以(1.51)和(1.52)作为终 止准则就太严格了。结果要么是用更多的计算才能使得 (1.51)和(1.52)得到满足,而这是不划算的;要么是 永远不能满足。解决这个问题的办法是,先对 xk 和 f k 作无量纲处理,然后再结合(1.51)和(1.52),给出
x
1.7 极小点的判定条件 函数 f ( x ) 在局部极小点满足什么条件?反之,满足 什么条件的点是 f ( x )的局部极小点? * n 1 定理1.15 设 f : D R R 具有一阶连续偏导数,x * D 的内点。若 x 是 f ( x ) 的局部极小点,则 是 * f ( x ) 0 (1.40) 注意,条件式(1.40)不是充分的,仅仅是必要的。 T 例如, f x1, x2 x1x2 在点 x 0, 0 处的梯度是
xk 1 xk 1 xk 1 f k 1 f k 2 fk 1
z ls( x, p) ,则
直线搜索的一个重要性质。 定理 1.19 设目标函数 f ( x ) 具有一阶连续偏导数。若
T f ( z ) p 0 f ( z )T p 0 ,则 证 使用反证法。假设
T f ( z ) p 0 (1.47) 或 T f ( z ) p 0 (1.48) (1.47)表明 p 是点 z 处的下降方向,(1.48)表明 p
方程。这正是我们所要说明的。
1.8 算法及有关概念 1. 下降迭代算法 在集合 X 上的迭代算法是指:开始,选定一个初始点 x0 X ,置 k 0 。然后按某种规则 A ,把第 k 次迭代点 xk 映射为新的一点 xk 1 X,记为 xk 1 A( xk ) ,并置 k k 1. 这称为完成了第 k 1 次迭代。这个过程无限地进行下去, 就会产生一个点列 {xk }。因此,规则 A 称为算法。 若点列 {xk } 收敛于 X ,则称算法 A 在 X 上是收敛的; A 否则,称算法 A 在 X上是发散的。特别地 ,当 X是最优化 问题(1.6)的容许集时,若除满足计算终止准则的迭代点 外,对于每个 k ,都有 f ( xk 1 ) f ( xk ),则称 A 为下降迭代
f 0, 0 0, 0 但是点
T
x
是这个双曲抛物面的鞍点,而
不是极小点。 根据定理1.15与推论1.13, 容易得到凸规划问题全局极小 点的一个一阶充分且必要条件。
推论1.16
C 设 f : C Rn R1 是可微凸函数,
x * C 。则 是非空开凸集,
* 充要条件是 f ( x ) 0 .
t k 称为步长因子。
不过,计算机只能进行有限次迭代。因此,一般说来, 数值计算不能求到精确解,而只能得到近似解。当迭代点 满足事先给定的精度要求时,就终止计算,并把这个迭代 点当作问题的最优解。
下降方向 pk 的选取规则;一个是步长因子 t k 的选取规则。
在上数述迭代过程中,有两个规则需要确定:一个是
f ( x ) 是充分 ii)设 x 是多元函数的极小点,并设 * *
充分小。把 f ( x )
* * T * 1 * T 2 * * * 2 f ( x ) f ( x ) f ( x ) ( x x ) ( x x ) f ( x )( x x ) o( x x ) 2 *
* x 是(1.36)的全局极小点的
n 1
定义1.17 设 f : D R R * ,则 * 称为 f ( x ) 的驻点。 f ( x ) 0 x 驻点包括极大值点、极小值点和鞍点。
x* C 若 可微,
f : D Rn R1 具有二阶连续偏导数, 定理1.17 设 * * 。若 2 * 正定,则 *是 x C ,且 f ( x ) 0 f (x) f (x ) x
x 是极小点而消失,再略去
(1.42)
第四项,那么二次曲面
1 f ( x * ) ( x x * )T f ( x * )( x x * ) 2 就是等值面 f ( x ) 的近似曲面。
* 按假设,f ( x )
是正定的,因此,
* (1.42)是以 x 为中心的椭球面
为变量的一元函数。 求一元函数极小点的迭代法称为直线搜索或一维搜 索。许多最优化方法都采用将多维问题转化为一维问题的 处理技术。因此可以说,一维搜索是最优化方法的一个重 要支柱。这种方法的优点是,它使目标函数值在搜索方向 上下降得最多;缺点是,计算量较大。在第3章的3.1节中 将全面介绍直线搜索。 为简便起见,今后用记号 z ls( x, p) (1.44) 方向对目标函数 f ( x ) 作直线 表示从点 x 出发沿 p 。在目标函数 f ( x ) 确定的条件下, 搜索得到极小点 z (1.44)等价于 f ( x t0 pk ) min f ( x tpk ), t (1.45) z x t0 p
f ( x) Qx b 0,
因为 Q 是正定矩阵,所以解出唯一驻点为
* 1 x Q b.
(1.41)
* x 因此根据推论1.13可以断定, 是唯一的极小点。
*
靠近极小点 x 的一个等值面, 即 x x * 在点 x 处按Tay源自or公式展开,得到 上式右端第二项因为
t
按这种方法确定的步长因子称为最优步长因子。这种 选取方法是很自然的。既然下降方向已经确定,就应该沿 这个方向找到使目标函数取极小值的点。
2. 直线搜索及其性质 在搜索方向 pk 已经确定的前提下,选取步长因子的 方法有多种。例如,取步长因子为某个常数。但在实际计 算中,最常用的方法是直线搜索(又称一维搜索), 即选取 t k ,使得
z
x 出发沿 p 方向对目标函数 f ( x ) 作直线 是从点
3. 计算终止准则 设某个算法产生的点列 {xk } 收敛于(1.6)的最优解 * x 。现在的问题是:在计算机上计算时,计算到哪一个 迭代点才有把握地说它就是所求问题的(近似)最解? * 显然,当 xk x 小于预先给定的误差限时就可以 * 认为 xk 就是所求的最优解。但事实上 x 是未知的,因而 * * 无法计算 xk x 。不过,由极限理论知道,当 xk x * 与 xk 1 x 都很小时, xk 1 xk 也必然很小。于是,在 数值计算中,可以用 xk 1 xk 1 (1.51) 作为计算终止的一个判定条件,其中 1是预先给定的计算 终止的界限,今后称为终止限。 但是,用(1.51)作为终止准则是不可靠的,因为 xk 1 xk 很小并不能保证 xk x * 很小。
许多最优化方法都采用将多维问题转化为一维问题的 处理方式。下面以无约束问题为例,说明采用这种方式时 的下降算法的基本迭代格式。
设第 k 次迭代点 xk 已求得。若它不满足终止准则, 那么在该点必存在下降方向 p 。对于可微目标函数,即 T 是满足 f ( xk ) p 0 的 p 。按某种规则选取一个 p ,例如
xk 1 xk tk pk ,使得 上确定一个新点
pk ,再沿这个方向适当地前进一步,即在直线 x xk tpk
f ( xk 1 ) f ( xk tk pk ) f ( xk )
这就完成了第 k 1 迭代。上式中的 pk 称为搜索方向,
的严格局部极小点。
一般来说,这个定理仅具有理论意义。因为对于复杂 的目标函数,Hesse矩阵不易求得,其正定性也很难判定。
相关文档
最新文档