第章用变分法求解最优控制问题(PPT 精品)
优化理论课件(变分法与最优控制理论)
优化理论课件(2)第二部分动态优化:变分法和最优控制理论变分法是处理动态优化的古典方法,现在较少使用,在蒋中一的书中,变分法的思路可用来解释庞特里亚金最大值原理(一阶条件)。
本部分内容主要来自蒋中一《动态最优化基础》。
目录一、什么是动态优化? (3)(一)动态优化问题的基本要素 (4)(二)泛函及其相关概念 (4)(三)可变终结点 (5)(四)横截条件 (6)(五)目标泛函 (6)二、变分法 (7)(一)基本问题:固定终结点问题 (7)(1)基本问题及其假定 (7)(2)一阶条件:欧拉方程 (8)(二)推广:多状态变量与高阶导数 (10)(1)多状态变量 (10)(2)高阶导数 (10)(三)可变端点问题 (10)(1)一般性横截条件 (11)(2)垂直终结线问题 (12)(3)水平终结线问题 (12)(4)终结曲线问题,即错误!不能通过编辑域代码创建对象。
(12)(5)截断的垂直终结线问题 (12)(6)截断的水平终结线问题 (13)(7)多变量和高阶导数情形 (13)(四)二阶条件(充分条件) (14)(1)固定端点问题的二阶条件及其二次型检验 (14)(2)凹凸性充分条件 (14)(3)变分 (15)(五)无限期界问题 (16)(1)收敛性 (16)(2)横截条件 (17)(3)充分条件 (17)(六)带约束的优化问题 (17)(1)等式约束 (17)(2)不等式约束 (18)(3)积分约束(等周问题) (19)三、最优控制理论 (20)(一)最优控制理论导论 (20)(二)最大值原理及其横截条件 (21)(1)最简单问题及最大值原理(一阶必要条件) (21)(2)最大值原理的理论基础及其横截条件 (23)(3)自控问题的汉密尔顿函数不变性 (26)(4)推广到多变量 (26)(三)最大值原理的经济学解释及现值的汉密尔顿函数 (27)(1)最大值原理的经济学解释 (27)(2)现值的汉密尔顿函数 (28)(四)充分条件(二阶条件) (29)(1)曼加萨林定理 (29)(2)阿罗条件 (31)(五)无限期界问题 (31)(1)横截条件与反例 (32)(2)作为充分条件一部分的横截条件 (32)(六)有约束的最优控制问题 (33)(1)涉及控制变量的约束 (33)(2)状态空间约束 (39)四、拉姆齐模型 (43)(一)相关理论发展背景 (43)(二)最简单的拉姆齐模型及其动力系统 (45)(三)微分方程定性稳定性判别方法简介 (47)(1)稳定性与渐进稳定性 (47)(2)稳定性判别基本定理 (48)(2)平面动力系统的奇点 (49)一、什么是动态优化?例:一个企业将原料从初始状态A通过五道工序,变为总结状态Z,每个阶段的选择对应一个阶段的成本,如何选择路径使得总成本最小化?从这个例子中可以看到:首先,动态强调的是时期之间的联系,而不仅仅是有时间的顺序;其次,这里也包含了Bellman方程的基本原理。
第6章 用变分法求解最优控制问题
§6-2 泛函与变分的基本概念
3.泛函的变分 ● 泛函的增量 由自变量函数 x(t ) 的变分 x(t ) 引起泛函 J [ x(t )]的增量
J J [ x* (t ) x(t )] J [ x* (t )] 为泛函 J [ x(t )] 的增量。
f {x(t f ); g1[ x(t f )] 0, g 2 [ x(t f )] 0}
3. 容许控制 控制量受客观条件限制所能取值得范围。
U {u (t ); ( x, u ) 0} u (t ) U
§6-1 最优控制问题的一般提法
4. 性能指标 tf L[ x(t ), u (t ), t ]dt (1)积分型性能指标: J t0 反映控制过程中对系统性能的要求。
在容许控制集合 U 中,寻找控制向量 u (t ) U , t [t0 , t f ] ,使系统由 给定的初始状态出发,在 t t0 时刻转移到规定的目标集,并使性能 tf 指标: J [ x(t ), t ] L[ x(t ), u (t ), t ]dt
f f
取得极小值。
t0
1 2
若 x(t ) t 有
t x ( t ) e 若 有
§6-2 泛函与变分的基本概念
2.泛函自变量的变分 泛函 J [ x(t )] 的自变量函数 x(t ) 与标称函数 x* (t )之间的差值函数
x x(t ) x(t ) x* (t ) 称为泛函自变量的变分,记作 x(t )或 x 。 x(t ) x (t ) B 设 x (t ) 为 x(t ) 的容许曲线,即 x(t ) x (t ) x* (t ) (t ) x* (t ) 令 0 1 A 则 x* (t ) x* (t ) (t ) x (t ) t 这样: x(t ) (t ) x(t ) x* (t ) (t ) x* (t ) x(t )
最优控制课件(第二章)-2010
其差值记为:
x(t ) x1 (t ) x2 (t )
则称
与
x (t )为自变量函数的变分。
t t1 t2 称为自变量的微分相对应
10
§2.1 变分法的基本概念
泛函的变分
当自变量函数 x(t )有变分
x (t )时,连续泛函
J [ x(t )] 的增量可以表示为:
J J [ x(t ) x(t )] J [ x(t )] J [ x(t ), x(t )] [ x(t ), x(t )] x(t )
J 是 x (t ) 的线性泛函,若 其中,
x(t ) 0时,有
* x ( t ) x (t ) x(t ) * * (t ) x (t ) x (t ) x
20
§2.2 无约束条件的泛函极值问题
* (t ) x (t ),t J {L ( x * (t ) x(t ), x
t0 tf
25
最速降线问题结论:最速降曲线是一族经过原点 的一段摆线(旋轮线)
x r ( sin ) y r (1 cos )
26
§2.2 无约束条件的泛函极值问题
2.泛函的自变量函数为向量函数的情况
将上面对 x(t ) 是标量函数时所得到的公式推广到 是n维向量函数的情况,这时,性能泛函为
J J [ x(t )] J [ x* (t )] 0 或 J J [ x(t )] J [ x* (t )] 0
则泛函 J [ x(t )] 在曲线 x x* (t ) 上达到极值。 x
高等教育《最优控制理论》课件 第一章
& xL xL & x M xM
x = xL − xM
则拦截器与目标的相对运动方程为:
& & v = xL − xM
F (t ) m(t ) F (t ) & m=− c & x=v
& v = a (t ) +
其中a(t)是除控制加速度外的固有相对加速度,是已知的。 初始条件为: x (t 0 ) = x 0
1-2 最优控制问题的实例
例1.1月球上的软着陆问题 飞船靠其发动机产生一与月球重力方向相反的推力 u(t),以使飞船在月球表面实现软着陆,要寻求发动 机推力的最优控制规律,以便使燃料的消耗为最少。 设飞船质量为m(t),高度为h(t),垂直速度为v(t),发 动机推力为u(t),月球表面的重力加速度为常数g。设 不带燃料的飞船质量为M, 初始燃料的总质量为 F.初始高度为h0,初始的垂直速度为v0,那么飞船的 运动方程式可以表示为:
5:最优控制的提法 已知受控系统的状态方程及给定的初态
& X (t ) = f ( X (t ), u (t ), t )
X (t 0 ) = X (0)
规定的目标集为M,求一容许控制u(t)∈U,t∈ [t0,tf],使系统从给定的初态出发, 在tf >t0时刻转移到目标集M,并使性能指标
J = θ(x (t f ), t f ) ∫ F(x(t ), u (t ), t ) dt +
3:容许控制 在实际控制问题中,大多数控制量受客观条件的限制,只能在一定范围内取 值,这种限制通常可以用如下不等式约束来表示:
0 ≤ u (t ) ≤ u max
或 ui ≤ α
i = 1,2L p
最优控制理论-最优控制中的变分法
0
(1-3)
ˆ) lim J ( x) J ( x
0
易见
2016/4/2
ˆ (t ), lim x(t ) x
0
6
b a u (t )v(t )dt
b a u (t )dv(t )
b u (t )v(t ) |a
b a v(t )du (t )
将式(1-2)对求导数,并利用式(1-3)可得
J ( x) L x L x dt 0 t [ 0 0 x x tf ˆ, x ˆ, t ) ˆ, x ˆ, t ) L( x L( x { (t ) (t ) }dt 0 t0 x x
tf
第一章
最优控制中的变分法
2016/4/2
1
主要内容:
• 固定端点的变分问题 • 变动端点的变分问题 • 等式约束条件下的变分问题 • 小结
2016/4/2
2
§1-1 固定端点的变分问题
所谓固定端点问题,是指状态空间中轨线(或轨迹)的 起点和终点都是预定的。 例:设有某航空班机从A城飞往B城,试寻求一个控制,使 飞机消耗的燃料最少。 在飞机起飞和降落的时刻,标志其飞行状态的量,如 位移(或角位移)、速度(或角速度)等,都是确定的。目标 是要寻找一控制规律,用以控制喷气发动机推力的大小和 方向,使飞机沿最优轨线航行,以期所消耗的燃料最少。 显然无论飞机沿什么轨线飞行,其始态和终态都是固 定的,用状态空间的话来说,飞机的任一轨线都必须通过 2016/4/2同一起点和同一终点。 3
t[ y ( x )] 0 f
ˆ (t ) (t ) ,当ε 在0与1间变动 即x
时表示通过A,B两点间的一束轨线,
最优控制理论PPT课件-48页PPT精品文档
u t R p 为 控 制 向 量 , 且 u t 在 t 0 , t f 上 分 段 连 续 ;
f R n 为 连 续 向 量 函 数 , x t 连 续 可 微
2.初态和终态: xt0,xtf S目标集
3.容许控制 : ut — 控 制 域
§6-2 最优控制中的变分法
现
代 泛函变分的求法
控
制 理 论
定理: J x 的变 J J 分 x x | 0, (0 1 )
性质:1 .F 1 F 2 F 1 F 2
2 .F 1 F 2 F 1 F 2 F 2 F 1
理 论
L x t,x r x t,x
其L 中 xt,x— J的线性函数
rxt,x— J的高阶无穷小
则L 称 xt,x为泛 Jxt函 的一阶变 J 分
泛函变分是泛函增量的线性主部
Modern Control Theory
Page: 9
2 1 2a1ta2
ua1ta2
这里 a1、a2 为常数
由 x2 udt 得: x2t1 2a1t2a2ta3
Modern Control Theory
Page: 21
§ 6-4 有约束条件下的泛函数极值问题
现
代 控
由 x1 x2dt 得:x 1 t 1 6 a 1 t3 1 2 a 2 t2 a 3 t a 4
现
代 控
当 t0 和 tf给 定 时 , x t0 和 x tf 是 否 定 还 是 自 由 , 可 分 四 种
制 情 况 :
理 论 (1) 固定始端和终端
x(t)
即 x t 0 和 x t f 给 定 x t 0 0 ,x t f 0
变分法与最优控制
t
一阶相近
当函数x(t)与 x0(t)之差的绝对值以及它们的一 阶导数 x(t ) 和 x0 (t ) 之差的绝对值,即
x(t ) x0 (t ) 和 x(t ) x0 (t )
x x(t) x0(t)
t1 t t2
都很小,称函数x(t)与函数x0(t)是一阶相近的。
求解综合型(波尔扎)问题
2.2 无约束最优化问题
1、无约束固定端点泛函极值必要条件
问题 2-1 无约束固定终端泛函极值问题为:
其中, L[ x(t ), x(t ), t ] 及x(t)在[t0,tf]上连续可微, t0及tf 固定,x(t0)= x0,x(tf)= xf, x(t ) R n
求满足上式的极值轨线x*(t)。
边界条件
定理2-5 若给定曲线x(t)的始端x(t0)= x0和终端x(tf)= xf, 则泛函
J [ x(t )] L[ x(t ), x(t ), t ]dt
t0 tf
达到极值的必要条件是,曲线x(t)满足欧拉方程
欧拉(Euler)方程
d Lx L x 0 或 dt
泛函的变分 当宗量x(t)有变分时,泛函的增量可以表示为
J [ x(t )] J [ x(t ) x(t )] J [ x(t )] L[ x(t ),x(t )] r[ x(t ),x(t )]
线性 主部
其中,L[x(t),x(t)]是关于x(t)的线性连续泛函;
虑各种阻力的影响,问应取怎样 的路径,才能使所经历的时间最 短?
结论:最速降线是一条圆滚线。
在A、B两点所在的竖直 平面内选择一坐标系, 如上图所示。 A 点为坐 标原点,水平线为 x 轴, 铅垂线为y轴。
最优控制全部PPT课件
给定一个线性系统,其平衡状态X(0)=0,设计的目的是保持系统处于平衡状态,即 这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。
线性调节器的性能指标为:
J
tf t0
n
xi 2 (t)dt
i 1
加权后的性能指标为:
J
tf t0
n
qi xi 2 (t)dt
i1
对u(t)有约束的性能指标为: J t f 1 [ X T (t)QX (t) uT (t)Ru(t)]dt
上述由控制约束所规定的点集称为控制域U,凡在t0-tf上有定义,且在控制域U 内取值的每一个控制函数u(t)均称为容许控制。
4:性能指标
通常情况下,最优控制问题的性能指标形如:
J
(x(t f ),t f)
tf t0
F(x(t),u(t),t)dt
其中第一项是接近目标集程度,即末态控制精度的度量,称为末值型性能指标。
第6页/共184页
从工程实际考虑,约束条件为 0 F(t) maxF(t)
如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指标:
J
tf t0
[c1
F (t )]d t
为最小
综上所述,所谓最优防天拦截问题,即选择满足约束条件的控制F(t),驱使系统从初始 状态出发的解,在某个时刻满足终端条件,且使性能指标为极值(极小值)。
第14页/共184页
5:线性跟踪器
若要求状态X(t)跟踪或尽可能接近目标轨迹Xd(t),则这种系统称为状态跟踪器,其相 应的性能指标为:
J
tf t0
1 [ X (t) 2
Xd
(t )] T
Q[ X (t)
用变分法求解最优控制问题
与以前不同的是,在动态问题中拉格朗日乘子 向量(t) 是时间函数。
在最优控制中经常将 (t )称为伴随变量,协态(协状 态向量)或共轭状态。引入 (t) 后可作出下面的增 广泛函
Ja X (t f ),t f
tf t0
FX ,U,t T (t) f (X ,U,t) X
对上式第二项作分部积分,按公式
可得
t f t0
udv uv
tf t0
t f vdu
t0
J
tf t0
F x
d dt
(
F x
)xdt
F x
x
tf t0
(5-2)
J取极值的必要条件是 J 等于零。因 x是 任意的,要使(5-2)中第一项(积分项)为 零,必有
x* (t) sht sh1
例5-2 求使指标
J 1 (x 2 x3 )dt 0
取极值的轨迹 x* (t) ,并要求 x* (0) 0 ,但对 x* (1) 没有限制。
解 这是终端自由的情况。欧拉—拉格朗日方程为
d (2x 3x 2 ) 0 dt即2x Fra bibliotek 3x 2 常数
d dt
(
F X
)
dt
X
T
F X
tf t0
向量欧拉——拉格朗日方程为
F X
d dt
(
F X
)
0
式中
F
x1
F
F X
x
2
F
变分法与最优控制87页PPT
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
变分法与最优控制
•
46、寓形宇内复几时,曷不委心任去 留。
•
பைடு நூலகம்
47、采菊东篱下,悠然见南山。
•
48、啸傲东轩下,聊复得此生。
•
49、勤学如春起之苗,不见其增,日 有所长 。
•
50、环堵萧然,不蔽风日;短褐穿结 ,箪瓢 屡空, 晏如也 。
谢谢你的阅读
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§6-2 泛函与变分的基本概念
2.泛函自变量的变分 泛函 J[x(t)] 的自变量函数 x ( t ) 与标称函数 x * ( t ) 之间的差值函数 称为泛函自变量的变分,记作 x(t)或 x
* x x ( t ) x ( t ) x ( t )
。
x (t )
x (t )
§6-1 最优控制问题的一般提法
最优控制问题的提法就是怎样把一个最优控制问题抽象为数学问题。
一. 最优控制问题的实例
例1:最速升降问题 设有一物体M,作垂直升降运动。假定物体M内部 有一控制器,可以产生一个作用力 u ( t ) 控制物体 上下运动。作用力满足约束条件 u(t) C。 若物体在 t t 0 时,离地面的高度为 h 0 ,垂直 运动的速度为 v 0 。寻找作用力 u ( t ) ,使物体最 快地到达地面,且到达地面的速度为零。 建模:受控系统的状态方程(数学模型) 令x ( t ) h ( t ) , x ( t ) h ( t ) v ( t ) 1 2
{ x ( t ); g [ x ( t )] 0 ,g [ x ( t )] 0 } f f 1 f 2 f
3. 容许控制 控制量受客观条件限制所能取值得范围。
U { u ( t ) ; ( x , u ) 0 } u(t) U
§6-1 最优控制问题的一般提法
4. 性能指标 tf [ x ( t), u ( t), t] dt (1)积分型性能指标: J L t 0 反映控制过程中对系统性能的要求。
第六章 用变分法求解最优控制问题
最优控制理论所要解决的问题: 按照控制对象的动态特性,选择一个容许控制,使得被控对象按照技 术要求运行,并使给定的性能指标达到最优值。 最优控制的数学问题: 从数学观点来看,最优控制问题就是求解一类带有约束条件的泛函极 值问题。
最优控制的基本内容: 经典变分法; 极小值原理; 动态规划;
( t ) U ,t [ t ,t 在容许控制集合 U 中,寻找控制向量 u ,使系统由 0 f] 给定的初始状态出发,在 t t 0 时刻转移到规定的目标集,并使性能 t f 指标: J [ x ( t t L [ x ( t ), u ( t ), t ] dt f), f]
[ x ( tf ), tf ] (2)终值型性能指标:J 反映了系统状态在终端时刻的性能。
J [ x ( t t L [ x ( t ), u ( t ), t ] dt (3)复合型性能指标: f), f] t 0 反映了控制过程和终端时刻对系统性能的要求。
t f
[ x ( t ), t ] 、 L [ x ( t ), u ( t ), t ] 若: 为二次型函数,则复合型性能指 f f 标可表示为二次型性能指标:
二. 最优控制问题的一般提法 用数学语言描述最优控制问题,应包括以下几个方面的内容: 1. 受控系统的数学模型 用状态方程描述:x ( t ) f [ x ( t ), u ( t ), t ]
பைடு நூலகம்
2. 受控系统的始端和终端条件,即状态方程的边界条件 对最优控制问题始端条件通常是已知的:x(t0) x0 终端条件可以用一个目标集表示:
t 1 1 f T T T J x ( t ) Px ( t ) [ x ( t ) Qx ( t ) u ( t ) Ru ( t )] dt f f t 0 2 2
§6-1 最优控制问题的一般提法
最优控制问题的一般提法: 已知受控系统的状态方程
及给定的始端条件 和规定的目标集
x ( t ) f [ x ( t ), u ( t ), t ] x(t0) x0 { x ( t ); g [ x ( t )] 0 ,g [ x ( t )] 0 } f f 1 f 2 f
J J [ x ( )] J [ x ( t )]
J[x(t)] 中的 x (t ) 应理解为某一特定函数的整体,而不是对应于 t 的
函数值。 例泛函: 若 x(t) t 有
t x ( t ) e 若 有
dx ( t ) J ( x( t ) t ) dt 0 dt 1 5 2 J ( t t) dt 0 6 2 1 e 2 t t J ( e t e ) dt 1 0 2
u (t )
M
g
h (t )
§6-1 最优控制问题的一般提法
t) 系统的状态方程为: dx 1( x2(t) dt dx t) u(t) 2( g dt m (61 )
初始条件为:
x ( t ) h , x ( t ) v 1 0 0 2 0 0
现在的问题是,寻找一个 u ( t ) ,且满足 u(t) C ,使物体在最短时间内由 状态 (h0 , v0 ) ,转移到 (0, 0) 。
§6-1 最优控制问题的一般提法
问题例1:对于给定的动态系统(6-1),寻找满足约束条件 u(t) C 的最优控制 u ( t ) ,使性能指标
J dt tf t0
t0
tf
取得极小值,且满足如下约束条件:
x1 ( t f ) 0 x 2 (t f ) 0
§6-1 最优控制问题的一般提法
B
设 x (t ) 为 x ( t ) 的容许曲线,即
* x ( t ) x ( t ) ( t )
取得极小值。
t 0
最优控制问题是在多种约束条件下寻找控制 u * ( t ) ,使某个性能指标 J (t) 、 u (t) 的函数,即泛函。最优控制 取得极小值。由于 J 为函数 x 问题可归结为求某个泛函的条件极值问题。
§6-2 泛函与变分的基本概念
一. 泛函与泛函的变分 1. 泛函的定义 对于某一类函数集合{ x (t )} 中的每一个函数 x ( t ),均有一个确定的数 J 与之对应,则称 J 为依赖于函数 x (t ) 的泛函,记作