最优化计算方法-第2章(基本理论)
最优化方法第二章_线搜索算法_最速下降法

f x1 , x2 c, c>0,
2
改写为:
x12 2c 1
2 x2
2c 2
2
1
二、最速下降法
x2
这是以
2c
1
和
2c
2
为半轴的椭圆
2c
2c
2
2
从下面的分析可见 两个特征值的相对
x1
大小决定最速下降法的收敛性。
(1)当 1 2 时,等值线变为圆
2 2
4 f x , 2
2 x1 2 x2 4 f ( x) , 2 x1 +4x2
4 d = f x , 2
0 0
=40 2 20 3 令 0= ' ( ) 80 20, 得 0 =1/4,
一
一维搜索
二 三 四
下 降 算 法
五
最速下降法 Newton法 共轭梯度法
多尺度法 (拟Newton法)
二、最速下降法 假设 f 连续可微,取 线搜索方向
k
d f ( x )
k
步长k 由精确一维搜索得到。 从而得到第 k+1次迭代点,即
f ( x k k d k ) min f ( x k d k )
(推论)在收敛定理的假设下,若f (x)为凸函数,则最速下降 法或在有限迭代步后达到最小点;或得到点列 x k ,它的任 何聚点都是 f (x)的全局最小点。
二、最速下降法
最速下降法特征:相邻两次迭代的方向互相垂直。
令
( ) f ( x d ), 利用精确一维搜索,可得
系统工程导论 第二章系统工程的基础理论与方法论 第一节系统最优化理论

n 。最后,也要考虑到xij
的产品数量属性,即 xij 0,i 1, 2, m, j 1, 2, n ,因此,该运
输方案可由以下模型求解得到:
2.1 系统最优化理论
mn
min
cij xij
i 1 j 1
(2-3)
n
s.t. xij ai ,i 1, 2, m j 1 m xij bj , j 1, 2, n i 1 xij 0,i 1, 2, m, j 1, 2, n
2.1 系统最优化理论
mn
解
首先,在假设运输量为
xij
的条件下其总的运费为 i 1
j 1
cij
xij
。
其次,要考虑到从任意产地运出的量要等于该产地的产量,即
n
xij ai ,i 1, 2,
j 1
m 。第三,还要考虑到运到任意销地的量要等
m
于该销地能销出的量,即 xij bi , j 1, 2, i 1
不同的方案、设计、措施以达到最优目的。(2)目标函数,如例
2-1
中的 max
, 10x1 18x2
例
2-2
中的min
mn
cij xij
。目标函数通常是决策变
i 1 j 1
量的函数,表达了“何为最优”的准则和目标,规定了优化问题
的实际意义。
2.1 系统最优化理论
(3)约束条件,如例 2-1 和例 2-2 中由“s.t”规定的部分。 约束条件指决策变量取值时受到的各种资源和条件的限制,表 达了一种“有条件优化”的概念,通常为决策变量的等式或不 等式方程。如果决策变量的取值是连续的,且目标函数和约束 条件都是决策变量的线性函数,则称为线性规划问题。如果决 策变量的取值为整数点,则称为整数规划问题;如果部分决策 变量取值连续而其余取值为整数,则称为混合整数规划问题; 如果目标函数和约束条件中存在任何的非线性因子,则称为非 线性规划问题。
北航最优化方法最新最全答案2015版

将此问题化成线性规划.
minimize f (x)
x∈Rn
subject to Ax = b
x ≥ 0.
5
解: 引入变量 t ,所给问题等价于
minimize t subject to f (x) = t,
Ax = b, x ≥ 0.
考虑问题
minimize t
subject to f (x) ≤ t, Ax = b,
4. 单纯形法的练习:习题2.10,习题2.11,习题2.12,习题2.13,习题2.20(说明单纯形 法的效率的一般性例子中,自变量为三个时所得问题),习题2.21(说明单纯形法采用最小 相对费用系数进基原则确定进基变量时,如果所求解问题是退化的,则单纯形法会出现 循环!),习题2.31.
5. 两阶段法的练习:习题2.14-习题2.16;大 M 法的练习:习题2.18.
2u1 − 2v1 + u3 − v3 = 3, ui, vi, s ≥ 0, i = 1, 2, 3.
方法2: 引入非负变量 t1, t2, t3 ,将原问题转化成等价问题
minimize t1 + t2 + t3 subject to x + y ≤ 1,
2x + z = 3, |x| = t1, |y| = t2, |z| = t3.
(c)
minimize subject to
x1 + 4x2 + x3 x1 − 2x2 + x3 = 4 x1 − x3 = 1
x2 ≥ 0, x3 ≥ 0.
解:
(c) 由于变量 x1 无限制,可利用约束 x1 = x3 + 1 对其消去. 因此,得其标准形
最优化方法:第2章 线性规划

Z=CBB-1b+(σm+1,
σm+k ,
xm+1
σn
)
CB B-1b+σ m+k
xn
因为 m+k 0,故当λ→+∞时,Z→+∞。
用初等变换求改进了的基本可行解
假设B是线性规划 maxZ=CX,AX=b,X 0的可行基,则
AX=b
(BN)
XB XN
b
(I,B-1 N)
➢ 若在化标准形式前,m个约束方程都是“≤”的形式, 那么在化标准形时只需在一个约束不等式左端都加上一个松弛变 量xn+i (i=12…m)。
➢ 若在化标准形式前,约束方程中有“≥”不等式, 那么在化标准形时除了在方程式左端减去剩余变量使不等式变 成等式以外,还必须在左端再加上一个非负新变量,称为 人工变量.
单纯形法简介
考虑到如下线性规划问题 maxZ=CX AX=b X 0
其中A一个m×n矩阵,且秩为m,b总可以被调整为一 个m维非负列向量,C为n维行向量,X为n维列向量。
根据线性规划基本定理: 如果可行域D={ X∈Rn / AX=b,X≥0}非空有界, 则D上的最优目标函数值Z=CX一定可以在D的一个顶 点上达到。 这个重要的定理启发了Dantzig的单纯形法, 即将寻优的目标集中在D的各个顶点上。
非基变量所对应的价值系数子向量。
要判定 Z=CBB-1b 是否已经达到最大值,只需将
XB =B-1b-B-1NX N 代入目标函数,使目标函数用非基变量
表示,即:
Z=CX=(CBCN
)
XB XN
=CBXB +CNXN =CB (B-1b-B-1NXN )+CNXN
最优化设计 课后习题答案

最优化方法-习题解答张彦斌计算机学院2014年10月20日Contents1第一章最优化理论基础-P13习题1(1)、2(3)(4)、3、412第二章线搜索算法-P27习题2、4、643第三章最速下降法和牛顿法P41习题1,2,374第四章共轭梯度法P51习题1,3,6(1)105第五章拟牛顿法P73-2126第六章信赖域方法P86-8147第七章非线性最小二乘问题P98-1,2,6188第八章最优性条件P112-1,2,5,6239第九章罚函数法P132,1-(1)、2-(1)、3-(3),62610第十一章二次规划习题11P178-1(1),5291第一章最优化理论基础-P13习题1(1)、2(3)(4)、3、4 1.验证下列各集合是凸集:(1)S={(x1,x2)|2x1+x2≥1,x1−2x2≥1};需要验证:根据凸集的定义,对任意的x(x1,x2),y(y1,y2)∈S及任意的实数λ∈[0,1],都有λx+(1−λ)y∈S.即,(λx1+(1−λ)y1,λx2+(1−λ)y2)∈S证:由x(x1,x2),y(y1,y2)∈S得到,{2x1+x2≥1,x1−2x2≥12y1+y2≥1,y1−2y2≥1(1)1把(1)中的两个式子对应的左右两部分分别乘以λ和1−λ,然后再相加,即得λ(2x1+x2)+(1−λ)(2y1+y2)≥1,λ(x1−2x2)+(1−λ)(y1−2y2)≥1(2)合并同类项,2(λx1+(1−λ)y1)+(λx2+(1−λ)y2)≥1,(λx1+(1−λ)y1)−2(λx2+(1−λ)y2)≥1(3)证毕.2.判断下列函数为凸(凹)函数或严格凸(凹)函数:(3)f(x)=x21−2x1x2+x22+2x1+3x2首先二阶导数连续可微,根据定理1.5,f在凸集上是(I)凸函数的充分必要条件是∇2f(x)对一切x为半正定;(II)严格凸函数的充分条件是∇2f(x)对一切x为正定。
最优化计算方法(工程优化)第1章

最优化在物质运输、自动控制、机械设计、采矿冶金、经 济管理等科学技术各领域中有广泛应用。下面举几个简单的实 例。
例1:把半径为1的实心金属球熔化后,铸成一个实心圆柱体, 问圆柱体取什么尺寸才能使它的表面积最小?
解:决定圆柱体表面积大小有两个决策变量:圆柱体底面半 径r、高h。
问题的约束条件是所铸圆柱体重量与球重相等。即
优化模型的分类
根据问题的不同特点分类
一般的约束优化问题
标准形式
min
xRn
f
x
s.t. gi x 0, i 1, 2, , m
1) gi x 0 -gi x 0
2)
hi
x
0
hi x 0
-hi
x
0
优化模型的分类
根据函数类型分类
线性规划:目标函数、约束条件都是线性的 非线性规划:目标函数、约束条件中的函数不全是线性
yi
a1
1
a3
ln 1
a2 exp
xi
a4 a5
最优化问题举例
例3已:知有从一v旅i 到行团v j从的v旅0费出为发要cij遍,游问城应市如何v1安, v排2 行,..程.,使vn总 ,
费用最小?
模型:
变量—是否从i第个城市到第j个城市
xij 1, 0;
约束—每个城市只能到达一次、离开一次
因此,我们在学习本课程时要尽可能了解如何 由实际问题形成最优化的数学模型。
数学模型: 对现实事物或问题的数学抽象或描述。
最优化问题的数学模型与分类
数学模型的建立
建立数学模型时要尽可能简单,而且要能完整地描 述所研究的系统。
过于简单的数学模型所得到的结果可能不符合实际情 况;而过于详细复杂的模型又给分析计算带来困难。
最优化计算方法(工程优化)复习

0.618法(黄金分割法)
0.618法是求单峰函数极值的一种试探法,有的书上也称为区 间收缩法。 在搜索区间[a,b]上插入两个点,将分为三个子区间,通过比较 2个插入点的函数值的大小,可删去左边或者右边区间,使搜索 区 间缩短。重复上述过程,使搜索区间不断缩短,当区间缩短到一 定程度时,区间上各点都可以作为极小点的近似。
1 5 t (舍去负值) 2
0.618法(黄金分割法)
黄金分割法(0.618 法)的优缺点 优点:不要求函数可微,且每次迭代只需计算一 个函数值,计算量小,程序简单 缺点:收敛速度慢。
0.618法----算例
例 :试用0.618法求目标函数 f ( x) x3 2 x 1 的最优解。 给定初始区间[0,2],收敛精度 =0.002.
严格凹函数 严格凸函数 凸函数
凸函数的判定定理
定理(一阶条件): 设D Rn 为非空凸集,函数 f :DR 在
D 上可微,则
(1) f在D上为凸函数 任意x,yD,恒有 f (y) ≥ f (x)+ f T(x)(y-x) (1) (2) f在D上为严格凸函数 任意x≠yD,恒有 f (y) > f (x)+ f T(x)(y-x) . (2)
证明
凸函数的判定定理
定理(二阶条件): 设D Rn 为含有内点的非空凸集, 函数 f :DR在 D 上二次可微,则 a) f在D上为凸函数 xD,2f (x) 半正定; b) 若 xD,2f (x) 正定,则f在D上为严格凸函数。
回忆:一个矩阵半正定充要条件是所有主子式非负; 一个矩阵正定充要条件是所有顺序主子式为正。
0.618法(黄金分割法)
定理:设 f:R→R 在[a, b ]上是单峰函数, a≤ x1 < x2 ≤b 。 那么 1°若 f (x1)≥ f (x2),则 x* ∈[x1 , b] ,如左下图 2°若 f (x1)< f (x2) ,则 x* ∈[a, x2 ], 如右下图 缩短区间的第一个原则---去坏留好原则
最优化方法第二章_非线性最小二乘

k 0.75, 0.25 k 0.75, k 0.25,
T
从而,求解该问题的牛顿法为
xk 1 xk ( J ( xk )T J ( xk ) s ( xk )) 1 J ( xk )T r ( xk )
上式局部二阶收敛,但计算量大!
二、Gauss-Newton法 Gauss-Newton法 忽略难于计算的高阶项 s ( xk )
1 mk ( x) r ( xk )T r ( xk ) ( J ( x)T r ( xk ))T ( x xk ) 2 1 ( x xk )T ( J ( xk )T J ( xk ))( x xk ) 2
二、Gauss-Newton法 Gauss-Newton法的优缺点 对于零残量问题(即 r ( x* ) 0 ),具有局部二阶收敛速度。
对于小残量问题(即残差较小,或者接近于线性 ),具
有较快的局部收敛速度。 对于线性最小二乘问题,一步达到极小值点。 对于不是很严重的大残量问题,有较慢的收敛速度。
r ( x) r ( xk ) J ( xk )( x xk ) M k ( x)
从而求解线性最小二乘问题
1 min M k ( x) 2
由线性最小二乘理论知
2
xk 1 xk ( J ( xk ) J ( xk )) J ( xk ) r ( xk )
T T
1
xk d k
如果雅克比矩阵不满秩,下降方向取为最速下降方向。
采用带阻尼的G-N法,保证函数值下降(方法总体收敛)。
xk 1 xk k ( J ( xk ) J ( xk )) J ( xk ) r ( xk )
第2章 最优化的基本理论和基本方法 最优性条件 2.2 有约束优化(第5次课 等式约束优化,作业问题讲解)

11
2x1 2x2
1
0
c1(x) = 2 - x12 - x2 2 = 0 解得x1=-1,x2 =-1,λ1=-1/2;
x1=1,x2 =1,λ1=1/2 。它们是可能的局部解。
图解:
c1(x)
O
c1(x*)
f(x*) x*
f(x)
f(x) = x1 + x2 = -2
先满足 一阶 必要 条件
i 1
如果对所有 z Z(x*),z 0 有 zT x2L(x*,*)z 0
则 x=x*为问题的局部解。
例 min f(x) = x1 + x2
st c1(x) = 2 - x12 - x2 2 = 0
已经求出了 可能的局部解
2 f (x) 0
2c1(x)
i,i= 1, 2, ..., l为拉格朗日乘子(或乘数)。
拉格朗日乘子法
l
xL(x, ) f (x) i ci (x) 0
i 1
ci(x) = 0, i=1, 2, ..., l 。 空格
解上述方程组,得x*即是可能的局部解。
(式一是L(x, λ)对各个xi 的偏导数为0, λ视为常数)
zTx2L(x*,*) z 0
【这里
l
2 x
L(
x*,
*)
2
f
(
x*)
i* 2ci (x*)
i 1
】
Z(x*) {z | z Rn,ci (x*)T z 0,i 1,2, ,l}
局部解的充分条件 (选学)
定理 对于等式约束最优化问题
最优化第2章 精确线搜索

{
精确线性搜索
==>进退法、黄金分割法、二次插值逼近法
非精确线性搜索
==>Wolfe准则、Armijo准则
定义: 单峰函数
设 f ( x ) 是区间 [ a , b ] 上的一元函数,x 是 f ( x ) 在 [ a , b ] 上的极小点,且对任意的 x1 , x2 [ a , b ], x1 x2 , 有 (a)当 x 2 x 时, f ( x1 ) f ( x2 ); (b)当 x1 x 时,f ( x1 ) f ( x2 ) .
• 黄金分割点约等于0.618:1 是指分一线段为两部分,使得原来线段的长跟较长的那部分的比为黄 金分割的点。线段上有两个这样的点。 • 利用线段上的两黄金分割点,可作出正五角星,正五边形。
•
•
• •
黄金分割广泛用在建筑设计、美术、音乐、艺术等方面。
如在设计工艺品或日用品的宽和长时,常设计成宽与长的比近似为
0.618,这样易引起美感; 在拍照时,常把主要景物摄在接近于画面的黄金分割点处,会显得
更加协调、悦目;
舞台上报幕员报幕时总是站在近于舞台的黄金分割点处,这样音响 效果就比较好,而且显得自然大方;
•
• •
气温在人体正常体温的黄金分割点上23℃左右时,恰是人的身心最
适度的温度; 就连植物界也有采用黄金分割的地方,如果从一棵嫩枝的顶端向 下看,就会看到叶子是按照黄金分割的规律排列着的; 人体有许多黄金分割点
直到区间长度小到一定程度,此时区间上各点的函数
值均接近极小值。
[s,phis,k,ds,dphi,S]=qmin(inline('s^2-sin(s)'),0,1,1e-4,1e-6)
最优化理论与算法 第2章 凸分析

集合,记为coneS. 若S凸,则 coneS=K(S) ∪{0}
2020/12/20
最优化理论
9
2. 凸集与凸函数
Df 2.5 非空凸集中的点 x 称为极点,若 x=x1+(1-)x2 ,
(0,1) , x1 ,x2 S, 则 x=x1=x2.换言之,x不能表示成S中两个不
4
2. 凸集与凸函数
m
Df 2.2 给定m个向量, x1,..., xm Rn,以及满足 i 1的 i1
非负实数i R,i 1,.., m,称向量1x1 ... mxm 为 {x1,..., xm}的凸组合.
Th2.1 集合S Rn是凸集,当且仅当S包含其中任意有限个 元素的凸组合,即对m R {1, 2,...},任意的x1,..., xm Rn,
则 P conv{xk | k K} cone{d j | j J}
x
R
n
x k xk jd j
kK
jJ
k 1, k 0, k K , j 0, j J
kK
(3)指标集J是空集当且仅当P是有界集合,即多胞形.
2020/12/20
最优化理论
13
2. 凸集与凸函数
2020/12/20
最优化理论
2
2. 凸集与凸函数
例2.1 超平面H {x pT x }为凸集,其中p为n维列 向量,为实数。此外,下面相对于法向量p的半空 间都是凸集 :
正的闭半空间H {x pT x } 负的闭半空间H - {x pT x } 正的开半空间H {x pT x } 负的开半空间H - {x pT x }
工程优化第2章

严格l .opt .
严格g .opt .
l .opt .
严格局部极小点 局部极小点 非严格局部极小点 极小点 全局极小点 严格全局极小点 非严格全局极小点
由以上定义,可得到两个简单定理: Th1:问题(p)的任意全局极小值点必为局部 极小值点。 Th2:若目标f(x)和g(x)都为定义域上的连续 函数,则: (1)问题(p)的容许解集R为闭集。 (2)问题(p)的最优解集R为闭集。
T T
f (x) = f (x*)+ f (x*)(x-x*) + (1/2)(x-x*) H (x )(x-x*)
(5)多元函数的极值 二元函数 Th1(必要条件)(可微的极值点为驻点): 1 D R2 ) (D-定义域) 设f(x,y): D→R (
(1) x0 , y0 为D的一个内点; (2) f(x,y)在 x0 , y0 可微; (3) x0 , y0 为f(x,y)的极值点; 则: 在 x0 , y0 处, f f 0
n
3、多元函数及其导数
(1) n元函数:f (x): R R 线性函数:f (x) = cTx + b = ci xi + b 二次函数:f (x) = (1/2) xTQx + cTx + b = (1/2)i j aij xi xj + ci xi + b m 向量值线性函数:F(x) = Ax + d R 其中 A为 mn矩阵,d为m维向量 T F(x)=( f1(x), f2(x), … , fm(x) ) 记 aiT为A的第i行向量,fi(x) = aiTx+di
尼科尔森《微观经济理论—基本原理与扩展》(第9版)课后习题详解

尼科尔森《微观经济理论—基本原理与扩展》(第9版)课后习题详解第1篇引言第1章经济模型本章没有课后习题。
本章是全书的一个导言,主要要求读者对微观经济模型有一个整体了解,然后在以后各章的学习中逐渐深化认识。
第2章最优化的数学表达1.假设。
(1)计算偏导数,。
(2)求出上述偏导数在,处的值。
(3)写出的全微分。
(4)计算时的值——这意味着当保持不变时,与的替代关系是什么?(5)验证:当,时,。
(6)当保持时,且偏离,时,和的变化率是多少?(7)更一般的,当时,该函数的等高线是什么形状的?该等高线的斜率是多少?解:(1)对于函数,其关于和的偏导数分别为:,(2)当,时,(1)中的偏微分值分别为:,(3)的全微分为:(4)当时,由(3)可知:,从而可以解得:。
(5)将,代入的表达式,可得:。
(6)由(4)可得,在,处,当保持不变,即时,有:(7)当时,该函数变为:,因而该等高线是一个中心在原点的椭圆。
由(4)可知,该等高线在(,)处的斜率为:。
2.假定公司的总收益取决于产量(),即总收益函数为:;总成本也取决于产量():。
(1)为了使利润()最大化,公司的产量水平应该是多少?利润是多少?(2)验证:在(1)中的产量水平下,利润最大化的二阶条件是满足的。
(3)此处求得的解满足“边际收益等于边际成本”的准则吗?请加以解释。
解:(1)由已知可得该公司的利润函数为:利润最大化的一阶条件为:从而可以解得利润最大化的产量为:;相应的最大化的利润为:。
(2)在处,利润最大化的二阶条件为:,因而满足利润最大化的二阶条件。
(3)在处,边际收益为:;边际成本为:;因而有,即“边际收益等于边际成本”准则满足。
3.假设。
如果与的和是1,求此约束下的最大值。
利用代入消元法和拉格朗日乘数法两种方法来求解此问题。
解:(1)代入消元法由可得:,将其代入可得:。
从而有:,可以解得:。
从而,。
(2)拉格朗日乘数法的最大值问题为:构造拉格朗日函数为:一阶条件为:从而可以解得:,因而有:。
第2章 最优化的基本理论和基本方法 最优性条件 22 一般约束优化 库塔定理和库塔条件汇总

第5式称为互补松弛条件,针对不等式约束的(实际 上对等式约束也成立,但把等式情况包括进来是多余的)。
第1式中的和式对应等式约束和不等式约束两部分.
满足库恩-塔克条件的点x*简称为K-T点。
例 求k-T点(p252)
求约束优化问题 min f (x) x12 x2 st c1(x) x12 x22 9 0
问题:min f(x), x∈Rn
(2-1)
st ci(x1, x2, ..., xn) = 0, iE ci(x1, x2, ..., xn) 0, iI
其中E和I分别表示等式和不等式约束的指标集,
E={ 1, 2, ..., l }
I={ l+1, l+2, ..., l+m }
E I = (空集)
考虑问题的局部解。考虑最优性条件。
看两个例子:不等式约束。
例1
min f(x) = x1 + x2
st c1(x) = x12 + x2 2 - 2 ≤ 0
例1
min f(x) = x1 + x2 st c1(x) = x12 + x2 2 - 2 ≤ 0
1. 由图解法, x*为最优解, 当然也是局部解。 2. 局部解x*在D的边界上, 约束C1起作用: c1(x*) = 0。
可知x2= +3或 -3。前者不满足c2约束。故x2=-3. 所以,x=(0,-3))T 为。
f=0 f=-5
对于凸优化问题
定理 如果问题(2-1)为一个凸优化问题(即 可行域D是凸集,目标函数f是D上的凸函数), 又设目标函数f(x)和约束函数ci(x)都存在一阶 连续偏导数,则问题的K-T点是问题的最优解。
清华大学研究生公共课讲义 最优化理论与算法(第2版)

定义
设 为 非 空 凸 集 , ,若 不
能表示成 中两个不同点的凸组合;换言之,若假
设
一
)
,
图
必推得
,则 称 是凸集 的极点
按此定义,图
中 ,图 ) 中 多 边 形 的 顶 点
,
和 不 是 极 点 图( 中 圆 周 上 的 点 均 为 极 点
和 是极点,而
由图
可以看出,在给定的两个凸集中,任何一点都能表示成极点的凸组合 这
因此要求
参数的选择还必须保证在负荷 的作用下钢管不发生弯曲,这就要求压应力不
超过临界应力 临界应力可由
公 式 算 出:
其中 是已知的弹性模量 按此要求应有
根据以上分析,桁架的最优设计问题,就是求重量函数 在 上 述 个约束条件下的极小
点问题 它的数学模型是
第 4 页
例
选址问题
设 有 个 市 场 ,第 个市场的位置为
乘
数法
年法国数学家
研究了函数值沿什么方向下降最快的问题,提出最速下
降法
年前苏联数学家
提出了解决下料问题和运输问题这两种线
性规划问题的求解方法 人们关于最优化问题的研究工作,随着历史的发展不断深入 但
是,任何科学的进步,都受到历史条件的限制,直至 世纪 年代,最优化这个古老课题
并未形成独立的有系统的学科
在 上 连 续 ,记 作
再设 为开集,如果在每一点
,对所有
连 续 ,则 称 ,偏 导
数
存在且连续,则称 在开集 上连续 可微,记作
如果在每一点
对所有
和
,二 阶 偏 导 数
存在且连续,则称 在 开 集 上 二 次
连 续 可 微 ,记 作 函数 在 处的 梯度为 维 列 向 量:
陈宝林最优化课后习题答案 第二章

陈宝林最优化课后习题答案第二章2.1 简答题1.最优化问题的基本模型是什么?最优化问题的基本模型是数学规划模型。
数学规划模型主要由目标函数、约束条件和决策变量组成,通过最大化或最小化目标函数,同时满足约束条件来寻求最优解。
2.什么是线性规划问题?线性规划(Linear Programming)是一类特殊的数学规划问题,其目标函数和约束条件都是线性的情况下,被称为线性规划问题。
线性规划问题可以用线性方程组和线性不等式组来表示,并且满足一定的约束条件。
3.什么是优化问题的可行解?优化问题的可行解是指满足约束条件的解。
在一个最优化问题中,除了要找到最优解外,还需要保证这个解满足所有的约束条件。
4.什么是最优解?最优解是在所有可行解中,使目标函数达到最大或最小值的解。
最优解可以通过求解优化问题的解析解、数值解或者近似解得出。
2.2 计算题1.使用单纯形法求解下列线性规划问题:max z = 5x1 + 6x2s.t.2x1 + x2 <= 8x1 + x2 <= 5x1, x2 >= 0单纯形法是一种用于求解线性规划问题的有效算法。
下面是使用单纯形法求解该线性规划问题的步骤:Step 1:初始化单纯形表。
x1x2s1s2bz-5-6000s1-2-110-8s2-1-101-5Step 2:选取入基变量和出基变量。
选取入基变量为x1,出基变量为s1。
Step 3:基变换。
将x1从入基变量变为出基变量,将s1从出基变量变为入基变量。
x1x2s1s2bz0-115040s111/2-104s201/2111Step 4:判断是否达到最优解。
如果目标函数的系数都为非负数,则达到最优解,并停止计算。
Step 5:计算新的单纯形表。
x1x2s1s2bz0-25/23/25/235/2x11/21/4-1/203/2s2-1/21/43/21/21/2Step 6:重复步骤2-5,直到达到最优解。
最优化问题第二章 例题101123

第二章 线性规划关于用单纯形法解线性规划:1. 单纯形法涉及两个规则:(1)进基规则——判别数大于零,保证函数值不升;(2)退基规则——最小比值,保证新解的容许性.2. 书面通常采用表上作业——单纯形表形式解题.3. 单纯形法解线性规划(书面)4. 单纯形法本质上是求解具有标准容许基且右端项非负的.典纯形表,单纯形法于是可以启动. 过程如下:.000T T T T TT T TBNB NB NI Nb I Nb INb c c c N c c b z σ⎡⎡⎡⎤⎤⎤⎢⎢⎢⎥⎥⎥→=⎢⎢⎢⎥⎥⎥⎢⎢⎢⎥⎥⎥---⎦⎦⎦⎣⎣⎣5. 一般来说,解线性规划主要分两大步:第一步,将线性规划化为标准形式(当线性规划为标准形式时不需要这一步);这里所说的标准形式是指极小化问题,主约束是右端项非负的等式约束,且变量非负.第二步,对线性规划的标准形式启动两阶段单纯形法(当线性规划的标准形式是典范线性规划时不需要第一阶段,直接进入第二阶段). 第一阶段的目的是变换出与主约束等价的G-J 方程组,第二阶段是解与原线性规划等价的标准线性规划,即解原线性规划.6. 单纯形法的基本理论定理2.9(最优性准则) 在标准线性规划中, 若所有变量关于容许基B 的判别数皆非正,则关于基B 的基本容许解是最优解.定理2.11(单纯形法基本定理) 对于标准线性规划min ;.. , 0,T c x s t Ax b x ⎫⎪=⎬⎪≥⎭(1) 假设:ⅰ)B 是容许基,关于B 的基本容许解是非退化的,即10b B b -=>; ⅱ)非基变量l x 的判别数0l σ>;ⅲ)10l l a B a -=≤,k 是用公式(2.36)确定的一个行标;ⅳ)用l a 替换中的k a ,而其余基向量不变,构成矩阵B '.那么,B '是容许基,且关于B '的基本容许解的目标函数值小于关于B 的基本容许解的目标函数值.定理2.12 在标准线性规划(1)中,假设: ⅰ)B 是容许基;ⅱ)非基本变量l x 的判别数0>l σ;ⅲ)10l l a B a -=≤.那么线性规划(1)存在可以使目标函数值任意减小的容许解.推论2.14 典范线性规划或者存在最优基本容许解,或者解无界. 7. 注意事项. 在例题中说明.例 求解线性规划13 123123min 5 21;.. 62, 21, 0,1,2,3.j x x s t x x x x x x x j +-+≥++≥≥=解 引入变量45,x x ,将其化为标准形13 12341235min 5 21;.. 6 2, 2 1, 0,1,,5j x x s t x x x x x x x x x j +-+-=++-=≥=(** 这里所说线性规划的标准形是指,求极小问题、右端项非负、变量非负)第一阶段 增加人工变量76,x x ,解辅助LP 问题671234612357min ;.. 6 2, 2 1, 0,1,,7.x x s t x x x x x x x x x x x j +-+-+=++-+=≥=7x 1 1 2 0 -1 0 1 1 c -0 0 0 0 0 -1 -1 61x x 0 -2 1 1 2 0 -1 0 1 x第一阶段结束,得到辅助问题的最优值为0,最优解11,0,,0,0,0,024⎡⎤⎢⎥⎣⎦,从而得到与原问题等价的标准线性规划的一个基本可行解011,0,,0,024Tx ⎡⎤=⎢⎥⎣⎦.(**辅助LP 问题是一个总有最优解的典范线性规划问题,即不会发生解无界. 若最优值大于零,则表明原问题无解;若最优值等于零,则最终一定会得到与标准形式的主约束变量时,以让人工变量退基为第一选择,其次考虑计算的难易程度.) (**选判别数小于零的变量进基,可保证函数值不升;选比值最小元素所对应的变量退基,可保证新解的容许性.)第二阶段 3x 41从而得到原问题的最优解*11,0,24x ⎡⎤=⎢⎥⎣⎦,其最优值为431.(**第二阶段求解过程中,若存在某判别数0>l σ,但0l a ≤,则原问题解无界;否则,若0l σ∀>,但0l a ≤不成立,则原问题一定有最优解.)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章基础知识1向量的内积x x x Tn x 12(,,,)= 12(,,,)y y y =Tn y 1122x y x y x y ==+++TTn ny x x y 2.1 泰勒公式Ax向量的范数x x x nx 22212||||=+++ Tx x=2、二次型()=Tf x x Axx ≠0Tx Ax >3、正定矩阵Tx Ax <0T x Ax ≤0Tx Ax ≥称A 为正定矩阵记为0A >称A 为半正定矩阵记为0A ≥称A 为半负定矩阵记为0A ≤称A 为负定矩阵记为0A <关于矩阵的正定、负定判断有如下定理:定理0A >A 110a >111221220a a a a >11110n n nna a a a > (1)的充要条件是:的各阶顺序主子式全大于零,, 0A ≥A (2) 的充分条件是:的各阶主子式全大于等于零110a<111221220a a a a >A<A(3)的充要条件是:的奇数阶顺序主子式全小于零,偶数阶顺序主子式全大于零,111213212223 3132330a a aa a a a a a <11121314212223243132333441424344a a a aa a a aa a a aa a a a>A≤A(4)的充分条件是:的奇数阶主子式全小于等于零,偶数阶主子式全大于等于零,例1 判断矩阵522260204-⎡⎤⎢⎥=-⎢⎥-⎢⎥⎣⎦A 的正定性.一阶顺序主子式为:1150a =-<二阶顺序主子式为:111221225226026a a a a -==>-三阶顺序主子式为:||800A =-<解因为的A 所以为负定矩阵。
A例2 判断矩阵的正定性.1222502020⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦A 解因为矩阵的三个顺序主子式分别为12212|1|10,10,2500252020=>=>=一阶主子式为:二阶主子式为:1,5,201210,25=>12160,220=>501000,020=>()f x 在x 点处的梯度12()()()()(),,,Tn f x f x f x f g x x x ∂∂∂⎡⎤∇==⎢⎥∂∂∂⎣⎦x x 0c ∇=()T∇=b x b()2T∇=x Ax Ax 其中T=A A ()2T ∇=x x x4、梯度常见的公式例1 123236z x x x =++236z ⎡⎤⎢⎥∇=⎢⎥⎢⎥⎣⎦例2 221212234z x x x x =++12124446x x z x x +⎡⎤∇=⎢⎥+⎣⎦5、Hesse 矩阵,22221211222222122222212()()()()()()()()()()()nn n n n f x f x f x x x x x x f x f x f x x x x x f H x f x f x f x x x x x x ⎡⎤∂∂∂⎢⎥∂∂∂∂∂⎢⎥⎢⎥∂∂∂⎢⎥∂∂∂∂∇==∂⎢⎥⎢⎥⎢⎥∂∂∂⎢⎥⎢⎥∂∂∂∂∂⎣⎦x x 2c ∇=2()0T∇=b x 2()2T ∇=x Ax A (其中T=A A )例1 123236z x x x =++236z ⎡⎤⎢⎥∇=⎢⎥⎢⎥⎣⎦例2221212234z x x x x =++12124446x x z x x +⎡⎤∇=⎢⎥+⎣⎦2000000000z ⎡⎤⎢⎥∇=⎢⎥⎢⎥⎣⎦24446z ⎡⎤∇=⎢⎥⎣⎦例2 321212234z x x x x =++212126446x x z x x ⎡⎤+∇=⎢⎥+⎣⎦1212446x z ⎡⎤∇=⎢⎥函数矩阵常量矩阵例6 已知二阶可导,1,R t R ∈∈n p ,()()t f t ϕ=+x p ,求(),()t t ϕϕ'''()f u S R ∈⊂,n u x 解设12(,,,)Tn p p p = p 12(,,,)T n u u u =, u 12(,,,),Tn x x x = x 1122(,,,)n n f x tp x tp x tp =+++ ()t ϕ=()f t +x p ()t ϕ'=1()f t u ∂+∂x p 11()d x tp dt +()n f t u ∂+∂x p ()n n d x tp dt +++ 1()f t u ∂+=∂x p 2()f t u ∂++∂x p 2p 1p ++ ()n f t u ∂+∂x p n p12()()(),,,n f t f t f t u u u ⎡⎤∂+∂+∂+=⎢⎥∂∂∂⎣⎦ x p x p x p 12n p p p ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦T ()f t =∇+x p p ()t ϕ''(())d t dt ϕ'=1()n i i id f t p dt u =∂+=∂∑x p 1()n i i i d f t p dt u =⎡⎤∂+=⎢⎥∂⎣⎦∑x p 2()f t =∇+T p x p p1()n i i i d f t p dt u =⎡⎤∂+=⎢⎥∂⎣⎦∑x p 211()n n i j i j i j f t p p u u ==∂+=∂∂∑∑x p 1n i ==∑21()()n j j i j f t p u u =∂+∂∂∑x p i p定理1(一阶泰勒公式)设内连续可微,则0()U ∀∈x x 有0000()()()()()T f f f o =+∇-+-x x x x x x x 或00()()()()T f f f =+∇-x x ξx x 其中00().θ=+-ξx x x (01)θ<<.定理2(二阶泰勒公式)设n 元函数()()n f R ∈x x 在0()U x 有内二阶连续可微,则0()U ∀∈x x 有0000200021()()()()()()()(||||)2T T f f f f o =+∇-+-∇-+-x x x x x x x x x x x x 0000201()()()()()()()T T f f f f =+∇-+-∇-x x x x x x x ξx x 或6、泰勒公式n 元函数在()()n f R ∈x x 0()U x()f x 若为二次函数00002001()()()()()()()2T T f f f f =+∇-+-∇-x x x x x x x x x x ()f x 若为非二次函数00002001()()()()()()()2T T f f f f ≈+∇-+-∇-x x x x x x x x x x12(,,,)T n nh h h R =∈h x h α+xh 7 方向导数与最速下降方向设有单位向量可微函数()f x x 在点沿h 方向的方向导数定义为0()()()lim f f h f ααα+→∂+-=∂x x xh 0()()(||||)lim Tf o αααα+→∇+=x h h 0(||||)()lim T o f ααα+→=∇+h x h ()T f =∇x h||()||cos((),)f f =∇∇x x h对于方向导数有以下的结论:,则h 为()f x 在点的上升方向()0f ∂>∂x h (1)若,则h 为()f x 在点的下降方向()0f ∂<∂x h (2)若()0f ∇=x (3)若则对任何方向h ,有()0f ∂=∂x h(4)若()0f ∇≠x ,则()f ∂∂x h 取得最小值,此时()||()||f f ∂=-∇∂x x h 取得最大值,此时()||()||f f ∂=∇∂x x h ()f ∂∂x h ()||()||f f ∇=∇x h x 时,当()||()||f f ∇=-∇x h x 时,当由此可知:()f ∇x 方向为()f x 在点x 处函数值增加最快的方向,处的最速上升方向;(1)称为函数()f x 在点x ()f -∇x 方向为()f x 在点x 处函数值减少最快的方向,处的最速下降方向;(2)称为函数()f x 在点x8、等高线定义设有二元函数(,)z f x y =,若令(,)f x y c=它代表函数值为C 的点连成的曲线,故将曲线称为二元函数的等高线或等值线。
(,)f x y c =(,)z f x y =性质:(1)二次函数在极值点附近的等高线是准确的同心椭圆族,极值点正好是椭圆的共同中心。
非二次函数在极值点附近的等高线是近似的同心椭圆族,极值点正好是椭圆的共同中心。
因此求函数的极值,从几何上来讲,就是求等高线族中同心椭圆组的共同中心。
(2)函数在某点的梯度方向与过该点等高线在该点的切线垂直。
§2.2 优化问题的最优性条件min (),n f R ∈x x 1. 无约束优化问题定理2.1 (一阶必要条件)()f x 在一次可微;x (2) 为的局部极值点,则()0f ∇=x (1)函数x ()f x 定理2.2. (充分条件)()0f ∇=x (3)Hesse 矩阵2()0f ∇>x ()。
则()f x 在二次可微;x (1)函数2()0f ∇<x (2)例1求函数332122111()33f x x x x =+--x 的极值点。
212221()2x f x x ⎡⎤-∇=⎢⎥-⎣⎦x 12220()022xf x ⎡⎤∇=⎢⎥-⎣⎦x 解令()0f ∇=x 212221020x x x ⎧-=⎪⎨-=⎪⎩31241111,,,0202--⎡⎤⎡⎤⎡⎤⎡⎤====⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦x x x x 解得驻点为从而四个驻点的Hesse 矩阵分别为12222020(),()0202f f ⎡⎤⎡⎤∇=∇=⎢⎥⎢⎥-⎣⎦⎣⎦x x 34222020(),()0202f f --⎡⎤⎡⎤∇=∇=⎢⎥⎢⎥-⎣⎦⎣⎦x x 因为22()0f ∇>x ,所以2x 是极小值点;32()0f ∇<x ,所以3x 是极大值点;因为42()f ∇x 不定的,所以4x 不是极值点因为12()f ∇x 不定的,所以1x 不是极值点因为定义设x 是规划(NP )一个可行点,若非零向量d满足:当时,,0>∃δ(0,)λδ∈R λ+∈x d 则称为集d R x 处的一个可行方向(feasible direction )合在点2 约束优化问题的最优性条件min ()..()0,1,2,,i f s t g i m ⎧⎨≥=⎩ x x (NP )定理2.3(必要条件)(1)为是规划(NP )一个可行点,x (2)函数()f x 在点处可微;x (3)是的一个极小值点x ()f x 则对于点处的任何可行方向有:x d ()0T f ∇≥x d 定理2.4(必要条件)(1)为是规划(NP )一个内点,x (2)函数()f x 在点处可微;x (3)是的一个极小值点x ()f x 则()f ∇=0x定理2.5(边界点为极小点充分条件)(3)对于点处的任何可行方向有:h *x ()0T f ∇≥x*h (1)为是边界点,*x D (2)函数()f x 在点处二次可微;*x (4)*()0(0)H x ><(不定)是的严格局部极小值点(极大值点)()f x 则*x (鞍点)():',nf x D R D R →⊂设§ 2.3 凸集与凸函数一、概念凸集:12(1),(01)x x K ααα+-∈≤≤12,,x x K ∀∈12,x x 两点连线上的点K 称为凸集凸组合:10,,1,m αα≤≤ 11m αα++= 11mm x x xαα=++ 1,,,m x x K ∈ 1,,mαα 存在称为的凸组合1,,m x xa b a b 凸函数凹函数1x 2x 1x 2x 1P 2P p ))(,(111x f x p ))(,(222x f x p =p α1p )1(α-+2p 21)1((x x αα-+))()1()(,21x f x f αα-+))1((21x x f αα-+)()1()(21x f x f αα-+<二、凸函数凸函数凹函数a b a b二、凸函数定义2.2.1 设凸集12,,n S R S ⊂∀∈x x [0,1]α∀∈恒有1212((1))()(1)()f f f αααα+-≤+-x x x x 称()f x 为在S 上的凸函数或121212,,0,0,1S αααα∀∈∀≥≥+=x x 恒有12121212()()()f f f αααα+≤+x x x x 定义2.2.2 凸集1212,,,n S R S ⊂∀∈≠x x x x 恒有12121212()()()f f f αααα+<+x x x x 称()f x 为在S 上的严格凸函数定义2.4.3 设凸集12,,nS R S ⊂∀∈x x [0,1]α∀∈恒有1212((1))()(1)()f f f αααα+-≥+-x x x x 称()f x 为在S 上的凹函数或121212,,0,0,1S αααα∀∈∀≥≥+=x x 恒有12121212()()()f f f αααα+≥+x x x x 定义2.4.4 凸集1212,,,n S R S ⊂∀∈≠x x x x恒有12121212()()()f f f αααα+>+x x x x 称()f x 为在S 上的严格凹函数三、凸函数的判断定理2.2.1 (一阶条件)设nS R ⊂为非空开凸集,()f x 为定义在S 上的可微函数,则在上为凸函数的充分必要条件是()f x S ()()()(),,Tf f f S≥+∇-∀∈y x x y x x y ()()()(),,,Tf f f S >+∇-∀∈≠y x x y x x y x y定理2.2.2 (一阶条件)设nS R ⊂为非空凸集,()f x 为定义在S 上的可微函数,则在上为严格凸函数的充分必要条件是()f x Sab凸函数0x p1x 切线方程:))(()(000x x x f x f y -'=-))(()(000x x x f x f y -'+=))(()(000x x x f x f -'+)(1x f ≥定理2.4.5 (二阶条件)设nS R ⊂为非空开凸集,()f x 为定义在S 上的二阶可微函数,则在上为凸函数的充要条件是()f x S 定理2.4.6 (二阶条件)设nS R ⊂为非空开凸集,()f x 为定义在S 上的二次可微函数,2()0,f S∇≥∀∈x x 如果2()0,f S∇>∀∈x x 则在上为严格凸函数()f x S例2 判断下列函数的凹凸性。