11讲 最优控制-极小值-总结及习题讲解
最优控制习题及参考问题详解
标准文档1 2f最优控制习题及参考答案习题 1 求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫(x2 +1)dt t 0解: 由已知条件知: t 0 = 0 , t f = 1d由欧拉方程得: (2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x *(t ) = t +1习题 2 求性能指标: J = ∫ 1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。
解:由上题得: x *(t ) = C t + C由 x (0) = 0 得: C 2 = 0∂L由∂xt =t f= 2x (t f ) = 2C 1 t =t = 0 t于是: x *(t ) = 0【分析讨论】对于任意的 x (0) = x 0 ,x (1) 自由。
2 0 1∫⎩ λ = −λ有: C = x , C = 0 ,即: x *(t ) = x 其几何意义: x (1) 自由意味着终点在虚线上任意点。
习题 3 已知系统的状态方程为: x1 (t ) = x2 (t ) , x 2 (t ) = u (t )边界条件为: x 1 (0) = x 2 (0) = 1 , x 1 (3) = x 2 (3) = 0 ,31 试求使性能指标 J =u 2(t )dt 2取极小值的最优控制 u *(t ) 以及最优轨线 x *(t ) 。
⎡ x ⎤解:由已知条件知: f = ⎢ 2⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λT f H = 1u 2 + λ x + λ u⎧λ = 0由协态方程: ⎨ 12 121 22⎧λ = C① 得: ⎨11⎩λ2 = −C 1t + C 2②∂H由控制方程: ∂u= u + λ2 = 0得: u = −λ2 = C 1t − C 2 ③由状态方程: x 2 = u = C 1t − C 2得: x (t ) = 1C t 2− C t + C④22 由状态方程: x 1 = x 21 2 3得: x (t ) = 1C t 3− 1C t 2+ C t + C⑤16 122 3 41 ∫⎪⎩=−=−⎡1⎤ ⎡0⎤将 x (0) = ⎪ ⎪ , x (3) = ⎪0⎪ 代入④,⑤,⎣1⎦ ⎣ ⎦10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t − 29 , C 2 = 2 , C 3 = C 4 = 1 9x *(t ) = 5 t 3 −t 2 + t +127 x *(t ) = 5 t 2 − 2t +1 29习题 4 已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。
11 最优控制1
t0 tf
这是一种积分型泛函,在变分法中这类 问题称为拉格朗日问题。
(2)终值型性能指标
J [ x(t f ), t f ]
在变分法中称为迈耶尔问题。
(3)复合型性能指标。
J [ x(t f ), t f ] F[ x(t ), u(t ), t ]dt
最优控制问题提法
最优控制的问题就是:从所有可供选择 的容许控制中寻找一个最优控制 u (t ) 使状态由x(t 0 )经过一定时间转移到目标集 S,并且沿此轨线转移时,使相应的性能 指标达到极值。
*
任何一个最优控制问题均应包 含以下内容
系统数学模型 边界条件与目标集 容许控制 性能指标
t0
tf
举例
已知人造地球卫星姿态控制系统的状态方程 为 (t ) 0 1 x(t ) 0u (t ) x 0 0 1
1 2 2 性能泛函取为 J 2 0 u (t )dt
边界条件
1 x(0) 1
0 x(2) 0
J ( x) F[ x(t ), x(t ), t ]dt
t0
tf
J ( x) F [ x(t ), x(t ), t ]dt
t0
tf
t * ( t f ) f
t0 t* f
F [ x * (t ) (t ), x * (t ) (t ), t ]dt
求使性能泛函取极值的极值轨线和极值控制
F [ x * (t ) (t ), x * (t ) (t ), t ]dt
第七章极小值原理与典型最优控_...
31
在某些情况下,S矩阵的某些元素大到足 以引起计算上的困难,在此情况下,用 逆Riccati方程求解。 令
P(t ) P (t ) I
P(t ) P 1 (t ) P(t ) P 1 (t ) 0
1
(11)
(12)
32
则逆Riccati方程为
P 1 (t ) A(t ) P 1 (t ) P 1 (t ) AT (t ) B(t ) R 1 (t ) BT (t ) P 1 (t )Q(t ) P 1 (t ) 1 P (t f ) S 1
H x
11
也可以写成
H[ x(t ), u(t ), (t ), t ] min H[ x(t ), v(t ), (t ), t ],
H x f ( x, u , t )
H x
v
12
满足边界条件
x(t 0 ) x 0
33
•最优反馈控制结构
R (t ) B(t )
1
x(t ) A(t ) x(t ) B(t )u(t )
P(t)
34
•P(t)的计算
由
将Riccati方程写成差分格式
P (t t ) P (t ) t[ P (t ) A(t ) AT (t ) P (t ) P (t ) B (t ) R 1 (t ) B T (t ) P (t ) Q (t )
J min
J min 0, 且t0为任意
P(t ) 0
37
•无限时间调节器问题
1 T J [ x (t )Q (t ) x(t ) u T (t ) R (t )u (t )]dt Min 2 t0 u (t ) x(t ) A(t ) x(t ) B (t )u (t ) s.t. x(t0 ) x0
最优控制极小值原理
④在最优轨线末端哈密顿函数应满足
H
[
x*
(t
* f
),
(t*f
),
u*
(t*f
),
t
* f
]
[
x*
(t
* f
t f
),
t*f
]
⑤沿最优轨线哈密顿函数变化率
H[x*(t),(t),u*(t),t] H[x*(t f ),(t f ),u*(t f ),t f ]
tf t
H(x,,u, )d
定理3-2与定理3-1的区别:P61
当 t f自由时
H (x*(tt*f ),u*(tt*f ), (tt*f )) 0
第三章 极小值原理及其应用 3.1 连续系统的极小值原理
最小值原理只是最优控制所满足的必要条件。 但对于线性系统
x&(t) A(t)x(t) B(t)u(t)
,
a11(t) L
A(t)
M
O
an1(t) L
a1n (t)
g
H
x(t)
g
(t)
H
x
式中哈密顿函数 H (x, u, λ) L(x, u) λT (t)f (x, u)
② x(t) 及 (t) 满足边界条件
x(t0 ) x0
(t f ) 0
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
③哈密顿函数相对最优控制为极小值
H[x*(t), (t),u*(t)] min H[x*(t), (t),u(t)] u(t )
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
2、积分型性能指标问题
定理3-3:
min J (u) tf L[x(t),u(t)]dt
11讲 最优控制-极小值-总结及习题讲解
能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
33
最优控制——极小值原理 3.4 极小值原理的典型应用
月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用
时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29
5 最优控制-极小值原理
正常(或平凡)情况、奇异(或非平凡) 正常(或平凡)情况、奇异(或非平凡)情况
Bang-Bang控制原理 控制原理 是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t ), ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立 除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件 极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
(50) ) (51) ) (52) )
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律: 哈密顿函数沿最优轨线随时间的变化规律:
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出 用变分法求解最优控制时, 用变分法求解最优控制时,认 不受限制。 为控制向量 u(t )不受限制。但是 实际的系统, 实际的系统,控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。 某种限制的。
因此, 因此,应用控制方程 ∂H = 0
哈工大现代控制理论基础第十一章 最优控制
11.1.1 最优控制问题的两个例子
[例1] 飞船的月球软着陆问题。 如图所示,飞船 靠其发动机产生一个与月球重力方向相反的推力 , 使得飞船到月球表面时速度为零, 即实现软着陆。 要求设计推力函数 ,使得发动机燃料消耗最少。
月球
[解]
设飞船的质量为 , 其高度和垂直速度分别为 和 ,月球的重力加速度为常数 ,飞船的自身 质量及所带燃料分别为 和 。
其中, 目标集 可表示为 性能指标 可表示为 其中 和 为连续可导的标量函数。
11.2 应用变分法求解无约束条件 的最优控制问题
11.2.1 泛函与变分
一. 泛函与泛函算子
所谓泛函,简单地说就是函数的函数,定义如下:
设
为给定的某类函数,如果对于这类函数中的
每一个函数,有某个数 与之相对应, 则称 为这类
哈工大现代控制理论基 础第十一章 最优控制
2020年4月24日星期五
11.1 最优控制问题的一般提法
最优控制研究的主要问题: 根据已建立的被控 对象的数学模型, 选择一个容许控制律, 使得被控 对象按照预定的规律运动,并使某一个性能指标达到 最大或最小。
从数学的观点来看, 最优控制问题是求解一类 带有约束条件的泛函极值问题, 属于变分学范畴。
经典的变分法只能解决控制无约束的问题, 即容许控制属于开集的一类最优控制问题。 然而, 工程中的控制常常是有约束的, 即容许控制是属于 闭集的。为了解决这个问题, 20世纪50年代,美国 学者贝尔曼和苏联科学院院士庞德里亚金分别独立 地拓展了经典变分法, 分别给出了动态规划方法和 极大值原理。 它们构成了最优控制的理论基础。
证明略
泛函变分的规则 泛函的变分是一种线性映射, 满足下列性质:
1 2 3 4
最优控制最小值原理
2-1 连续系统的最小值原理
问题 2-1 设系统的状态方程是
x f [x(t),u(t),t]
(2-1)
其中 f 是 n 维连续可微的向量函数;状态 x(t) Rn,其初态已
知是
x(t0 ) x0
终态应满足边界条件
(2-2)
[x(t f ),t f ] 0 其中 是 r 维连续可微的向量函数,r n;
tf t0
{L(x,
w,t)
T[
f
(x,
w,t)
x]
T[g(x,
w,t)
z2]}dt
(2-8)
的极值。
为 简 便 计 , 令
H(x,,w ,t)L(x,w ,t)Tf(x,w ,t)
(2-9)
(x,x,w,w ,z,z,,,t) H(x,,w ,t)TxT[g(x,w ,t)z2]
(2-10)
8
于 是 (2-8)式 可 写 成
J(u) [x(tf)t,f]vT[x(tf)t,f]
tt0f (x,x ,w ,w ,z,z,,,t)dt
(2-11)
现 在 求 广 义 性 能 指 标 (2-11)的 一 阶 变 分 :
JJtfJxJwJz
(2-12)
式 中 Jtf, Jx, Jw, Jz分 别 是 由 于tf , x , w和z的 微 变
tf t0
(x,x,w,w ,z,z,,,t)d
=0
分步积分
J w
t f
t0
(wT
w
w T
w )dt
wT
(t
)
w
t
t
f
t f wT t0
d dt
w
dt
最优控制理论及应用讲解
第4章 动态规划
求解动态最优化问题的两种基本方法:极小值原理和动态规划。
动态规划:是一种分级最优化方法,其连续形式与极小值原理相 辅相成,深化了最优控制的研究。
Optimal Control Theory & its Application
主要内容
1
多级决策过程和最优性原理
2
离散控制系统的动态规划
3
连续控制系统的动态规划
4 动态规划与变分法、极小值原理的关系
5
本章小结
Optimal Control Theory
Dong Jie 2012. All rights reserved.
Dong Jie 2012. All rights reserved.
Date: 09.05.2019 File: OC_CH4.7
Optimal Control Theory & its Application
Optimal Control Theory
Dong Jie 2012. All rights reserved.
特点:1)将一个多阶段决策问题化为多个单阶段决策问题,易于分析 2)每阶段评估只与前一阶段结果有关,计算量减小
Optimal Control Theory
Dong Jie 2012. All rights reserved.
Date: 09.05.2019 File: OC_CH4.5
Optimal Control Theory & its Application
最优控制习题及参考答案
1 2f最优控制习题及参考答案习题 1 求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫ (x2 +1)dt t 0解: 由已知条件知: t 0 = 0 , t f = 1d由欧拉方程得: (2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x *(t ) = t +1习题 2 求性能指标: J =∫1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。
解:由上题得: x *(t ) = C t + Cx * (t )由 x (0) = 0 得: C 2 = 0∂L由∂xt =t f= 2x (t f ) = 2C 1 t =t= 0 t于是: x *(t ) = 0【分析讨论】对于任意的 x (0) = x 0 ,x (1) 自由。
20 1 0 ∫ ⎩ λ= −λ有: C = x , C = 0 ,即: x *(t ) = x 其几何意义: x (1) 自由意味着终点在虚线上任意点。
习题 3 已知系统的状态方程为: x1 (t ) = x2 (t ) , x 2 (t ) = u (t )边界条件为: x 1 (0) = x 2 (0) = 1 , x 1 (3) = x 2(3) = 0 ,31 试求使性能指标 J =u 2(t)dt2取极小值的最优控制 u * (t ) 以及最优轨线 x *(t ) 。
⎡ x ⎤解:由已知条件知: f = ⎢ 2⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λT fH = 1u 2 + λ x+ λ u⎧λ = 0 由协态方程: ⎨ 12 1 21 22⎧λ = C① 得: ⎨11⎩λ2 = −C 1t + C 2②∂H由控制方程: ∂u= u + λ2 = 0得: u = −λ2 = C 1t − C 2 ③由状态方程: x 2 = u = C 1t − C 2得: x (t ) = 1C t 2− C t + C ④22由状态方程: x 1 = x 21 2 3得: x (t ) = 1 C t 3− 1C t 2+ C t + C ⑤16 122 3 41⎪⎩=− ∫⎡1⎤ ⎡0⎤将 x (0) = ⎪ ⎪ , x (3) = ⎪0⎪ 代入④,⑤,⎣1⎦ ⎣ ⎦10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t− 29, C 2 = 2 , C 3 = C 4 = 1 9x * (t ) = 5 t 3−t 2 + t +1 27 x *(t ) = 5 t 2 − 2t +1 29习题 4 已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。
最优控制习题及参考答案
12f最优控制习题及参考答案习题 1 求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫(x2 +1)dt t 0解: 由已知条件知: t 0 = 0 , t f = 1d由欧拉方程得: (2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x * (t ) = t +1习题 2 求性能指标: J = ∫ 1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。
解:由上题得: x *(t ) = C t + C由 x (0) = 0 得: C 2 = 0∂L由∂xt =t f= 2x (t f ) = 2C 1 t =t = 0 t于是: x * (t ) = 0【分析讨论】对于任意的 x (0) = x 0 ,x (1) 自由。
2 0 1 0∫ ⎩ λ= −λ 有: C = x , C = 0 ,即: x *(t ) = x其几何意义: x (1) 自由意味着终点在虚线上任意点。
习题 3 已知系统的状态方程为: x1 (t ) = x2 (t ) , x 2 (t ) = u (t )边界条件为: x 1 (0) = x 2 (0) = 1 , x 1 (3) = x 2 (3) = 0 ,31 试求使性能指标 J = 0 u 2(t )dt2取极小值的最优控制 u * (t ) 以及最优轨线 x * (t ) 。
⎡ x ⎤ 解:由已知条件知: f = ⎢ 2 ⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λT fH = 1u 2 + λ x + λ u⎧λ = 0由协态方程: ⎨12 121 22⎧λ = C① 得: ⎨11⎩λ2 = −C 1t + C 2 ②∂H由控制方程: ∂u= u + λ2 = 0得: u = −λ2 = C 1t − C 2③由状态方程: x 2 = u = C 1t − C 2得: x (t ) = 1C t 2− C t + C④22由状态方程: x 1 = x 21 23得: x (t ) = 1C t 3 − 1C t 2 + C t + C⑤16122 341 ⎪ ⎩=− =− ∫ ⎡1⎤⎡0⎤将 x (0) = ⎢ ⎥ , x (3) = ⎢0⎥ 代入④,⑤, ⎣1⎦⎣ ⎦ 10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t − 29 , C 2 = 2 , C 3 = C 4 = 1 9x * (t ) = 5 t 3 −t 2 + t +127 x *(t ) = 5 t 2 − 2t +1 2 9习题 4 已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。
最优控制极小值
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
(2·1—11) 方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导 出的欧拉方程,分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件,式中n维矢量 λ (t )叫做协状态矢量 方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵, 即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和 分别是r维和q维的。根据泛函取极值的必要条件,J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
(2.1—2) 、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
(2.1—4) 该函数称做哈米尔等函数。利用这个函数,方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt
最 优 控 制 教 案第三章 极小值原理及其应用
① 正则方程
x(t
)
=
∂H ∂λ
λ(t) = − ∂H ∂x
② 横截条件
x(t0 ) = x0
Ψ ⎡⎣x(t f ),t f ⎤⎦ = 0
λ (t
f
)
=
∂ϕ ∂x(t f
)
+
∂ΨT ∂x(t f
)
V
(t
f
)
③ 在最优轨线上,与最优控制 u*相对应的 H 函数取绝对极小值
H (x*,u*, λ) = min H (x*, u, λ) u∈Ω
=
1 4
,
x1
=
u1
=
1 2
(1 +
c1 )t
−
1 2
c2
x 2
=
x1
+
1 4
x1
=
1 4
(1 +
c1)t 2
−
1 2
c2t
+
c3
x 2
=
1 4
(1 +
c1)t 2
−
1 2
c2t
+
c3
+
1 4
x2
=
1 12
(1 +
c1 )t 3
−
1 4
c2t 2
+
(c3
+
1 )t 4
+
c4
x1(0) = 0 ⇒ c3 = 0 x2 (0) = 0 c4 = 0
x1(0) = 1 ⇒ c1 = 2 ⇒ x1 = 2e−t −1
x2 (0) = 0 c2 = 2
x2 = −2e−t − t − 2
最优控制例题讲解
最优控制例题讲解
最优控制是指在给定动态系统的控制框架下,通过选择合适的控制策略,使得系统在给定性能指标下达到最优状态。
最优控制问题可以形式化为一个数学优化问题,其中包括一个目标函数和一组约束条件。
下面我们来讲解一个最优控制的例题。
假设有一个无人机需要完成一次空中任务,该任务包括从起点飞行到终点,并在途中避开障碍物。
我们的目标是使得无人机在完成任务的同时,最小化能量消耗,即最小化无人机的飞行时间。
为了解决这个问题,我们可以建立一个动力学模型来描述无人机的运动,例如使用牛顿第二定律和运动学方程。
然后,我们可以引入一个控制变量,如推力或俯仰角,来改变无人机的运动。
在建立动力学模型后,我们可以定义一个目标函数,如飞行时间的积分。
然后,我们可以引入一些约束条件,如无人机的运动范围、速度限制、避障约束等。
接下来,我们可以使用优化算法来求解这个最优控制问题,如动态规划、最优控制理论中的泛函最优化方法(如Pontryagin最大值原理)或者数值优化方法(如非线性规划、强化学习等)。
通过求解最优控制问题,我们可以得到一个最优控制策略,即在每个时间步选择最优的控制输入,以使得无人机在完成任务的同时最小化能量消耗。
然后,我们可以将该控制策略应用于实际的无人机系统中,从而实现最优控制。
需要注意的是,最优控制问题的求解通常需要考虑多个因素,如系统动力学、性能指标、约束条件等,并且可能涉及到复杂的数学推导和计算。
因此,在实际应用中,通常需要结合具体问题的特点,选择合适的建模方法和优化算法来求解最优控制问题。
最优控制 第四章 极小值原理及其应用2
)( * ) ( * )(z z * ) 0 * z
0
T
T ) ( x x* ) x
-λ
*
E ( x* , x, , z , * , * , t ) * x { ( x* , x* , * , z * , * , * , t ) * x*} H ( x* , * , , t ) H ( x* , * , * , t ) 0 H ( x* , * , u , t ) H ( x* , * , u * , t )
第四章 极小值原理及其应用
用古典变分法解最优控制问题时,假定u(t)不受限制,从而得到最优控制应满足
H 0 u
实际上在工程问题中,控制变量总有一定的限制.
设控制变量被限制在某一闭集内 即u(t)满足 G[ x(t ), u (t ), t ] 0
u
满足限制条件的u(t)称为容许控制,由于δu不能是任意的,
H 0 u
这一条件不成立,而代之以与最优控制相对应的函数为绝对极小,其次是正则 方程略有改变,仅当G中不包含x时, 方程才不改变.
11
当 t0和x(t0)给定,根据tf给定或自由, x(tf)给定,自由或受约束等不同情况下所导 出的最优解必要条件列表如下: 终 端 状 态 固
性能指标
正则方程
12
性能指标
终 端 状 态
正则方程
极值条件
边界条件与横 截条件
x ( t 0 ) x0 x (t f ) x f
tf 给 定
tf
t0
J 固 F [ x, u , t ]dt
定 自 由
H H x G ( )T x H F ( x, u , t ) T f ( x, u , t ) x 若 G (u , t ) 0 H 则 x
10讲 最优控制-极小值-燃料能量最优
能源与动力学院系统控制与仿真研究室
15
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
31
最优控制——极小值原理 3.4 极小值原理的典型应用
时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
32
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
33
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
v h g
月球
k 0
能源与动力学院系统控制与仿真研究室
23
最优控制——极小值原理 3.4 极小值原理的典型应用
x 2 1 x 1 x 2 u g x3 3 x 1 u k
能源与动力学院系统控制与仿真研究室 24
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
10
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
肖玲斐 lf i @ lfxiao@ d
最优控制第2章 极小值原理
2015-03-24
20
u
*
(t
)
=
⎧ −1, ⎪⎨−0.5λ2
(t
λ2 (t ), | λ2
)> (t)
2 |≤
2
(∗)
⎪⎩ 1, λ2 (t) < −2
由伴随方程 λ& = −∂H / ∂x 得到:
求解得到:
λ&1(t) = 0, λ&2 (t) = −λ1(t)
λ1(t) = c1, λ2 (t) = −c1t + c2 本例tf自由,因此H函数在最优终端时刻 t*f满足横截条件:
2015-03-24
17
分分析析::
要使 H[x*, u, λ*, t] 达到极小,就要 (1 − λ*)u达到极小 。由控 制约束 0.5 ≤ u ≤ 1 可得,最优控制为:
u *(t)
=
⎧ 1, ⎨⎩0.5,
λ >1 λ <1
由 λ (t) = e1−t − 1易知,当ts=0.307时,λ * (ts ) = 1 ,故最优 控制为:
2015-03-24
3
定理1(极小值原理)对于上述最优控制问题,选取哈密 顿函数为:
H = L( x,u,t) + λT (t) f [x(t), u(t), t]
则实现最优控制的必要条件:
(1) 最优状态x*和最优协态 λ* 满足正则方程:
x&(t) =
∂H ∂λ
=
f [ x(t), u(t), t]
则伴随方程 λ& = −∂H / ∂x为:
λ& = − ∂H = −1 − λ ∂x
15
2015-03-24
最优控制第六章极小值原理
J1
Ψ
x T
Ψ x
Φ t f
N T t f
tt f
t f
d xT
tf
Φ
x
N T x
Ψ x
t t
f
wT
Ψ w tt f
zT
Ψ z
tt f
t f
t0
xT
uU
此外,协态方程也略有改变,仅当g函数中不包 括x时,方程才与前面一致。
第三个条件,即式(46),描述了H函数终值 H tt f
与tf的关系,可用于确定tf的值。在定理推导过程中 看出,该条件是由于tf变动而产生的,因此当终端时 刻固定时,该条件将不复存在。
第四个、五个条件,即式(47)~式(48),将为正则 方程式(41)~式(43)提供数量足够(2n个)的边值条件。
xt0 x0
Nxt f ,t f 0
(48)
这就是著名的极小值原理。
下面对定理作些说明: 1) 定理的第一、第二个条件,即式(41)~式
(44),普遍适用于求解各种类型的最优控制问题, 且与边界条件形式或终端时刻自由与否无关。其
中,第二个条件:min H x*, *,u,t H x*, *,u*,t uU
t0
(39)
取哈密尔顿函数为
H Lx,u,t T f x,u,t
(40)
则实现最优控制的必要条件是,最优控制u*、
最优轨迹x*和最优协态矢量λ*满足下列关系式:
1) 沿最优轨线满足正则方程
x H
(41)
H g T
最优控制习题及参考问题详解
标准文档1 2f最优控制习题及参考答案习题 1 求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫(x2 +1)dt t 0解: 由已知条件知: t 0 = 0 , t f = 1d由欧拉方程得: (2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x *(t ) = t +1习题 2 求性能指标: J = ∫ 1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。
解:由上题得: x *(t ) = C t + C由 x (0) = 0 得: C 2 = 0∂L由∂xt =t f= 2x (t f ) = 2C 1 t =t = 0 t于是: x *(t ) = 0【分析讨论】对于任意的 x (0) = x 0 ,x (1) 自由。
2 0 1∫⎩ λ = −λ有: C = x , C = 0 ,即: x *(t ) = x 其几何意义: x (1) 自由意味着终点在虚线上任意点。
习题 3 已知系统的状态方程为: x1 (t ) = x2 (t ) , x 2 (t ) = u (t )边界条件为: x 1 (0) = x 2 (0) = 1 , x 1 (3) = x 2 (3) = 0 ,31 试求使性能指标 J =u 2(t )dt 2取极小值的最优控制 u *(t ) 以及最优轨线 x *(t ) 。
⎡ x ⎤解:由已知条件知: f = ⎢ 2⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λT f H = 1u 2 + λ x + λ u⎧λ = 0由协态方程: ⎨ 12 121 22⎧λ = C① 得: ⎨11⎩λ2 = −C 1t + C 2②∂H由控制方程: ∂u= u + λ2 = 0得: u = −λ2 = C 1t − C 2 ③由状态方程: x 2 = u = C 1t − C 2得: x (t ) = 1C t 2− C t + C④22 由状态方程: x 1 = x 21 2 3得: x (t ) = 1C t 3− 1C t 2+ C t + C⑤16 122 3 41 ∫⎪⎩=−=−⎡1⎤ ⎡0⎤将 x (0) = ⎪ ⎪ , x (3) = ⎪0⎪ 代入④,⑤,⎣1⎦ ⎣ ⎦10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t − 29 , C 2 = 2 , C 3 = C 4 = 1 9x *(t ) = 5 t 3 −t 2 + t +127 x *(t ) = 5 t 2 − 2t +1 29习题 4 已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。
最优控制(最小值原理)1
最优控制最优控制——————最小值原理最小值原理七 几种典型的几种典型的工程工程工程应用应用 1.时间最优控制时间最优控制问题,是可以运用极小值原理求解的一个常见的工程实际问题。
如果性能指标是系统有初态转移到目标集的运动时间,则使转移时间为最短的控制称为时间最优控制,或称最速控制。
本节主要介绍线形定常系统的时间最优控制分析法及其应用。
1.1 一类非线性系统的时间最优控制先把需要解决的问题叙述如下:[问题3-1] 移动目标集的一类非线性系统的时间最优控制问题为()1min ,1,2,,fj t u t t J dt j m ≤==∫⋯..s t ① [][]00()(),(),(),()xt f x t t B x t t u t x t x =+=ɺ ② (),0f f x t t ψ =式中()n x t R ∈,()m u t R ∈;()f •和()B •维数适当,其各元对()x t 和t 连续可微;移动目标集()r R ψ•∈,其各元对()f x t 和f t 连续可微,f t 是状态轨线与移动目标集相遇的末端时刻。
显然,问题3-1属于时变条件、积分型性能指标、f t 自由和末端约束的最优控制问题。
根据极小值原理,令哈密顿函数[][]{}(,,,)1()(),(),()T H x u t t f x t t B x t t u t λλ=++ (3-136)正则方程为:[][]()(),(),()Hxt f x t t B x t t u t λ∂==+∂ɺ (3-137) [](),()()()()()TTB x t t u t H ft t t x xx t λλλ ∂∂∂=−=−−∂∂∂ɺ (3-138)边界条件及横截条件为00()x t x = (3-139)(),0f f x t t ψ = (3-140)()()T f f t x t ψλγ∂=∂ (3-141)极小值条件:***1()(),()(),()T T t f x t t t B x t t u t λλ ++{}**1min 1()(),()(),()j T T u t f x t t t B x t t u t λλ≤ =++ 或者[]{}*1()(),()min ()(),()j T T u t B x t t u t t B x t t u t λλ≤ = (3-142)因而得:**()sgn (,)()T u t B x t t λ =− (3-143)式中sgn()•为符号函数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29
最优控制——极小值原理 3.4 极小值原理的典型应用
给定时间内燃料消耗为最少的控制问题
连续系统的极小值原理 •引例 •连续定常系统极小值原理 •极小值原理与变分法求最优控制的比较 •极小值原理求解最优控制的步骤 •连续时变系统的极小值原理
能源与动力学院系统控制与仿真研究室
3
最优控制——极小值原理 本章内容回顾
离散系统的极小值原理 •离散系统 •离散系统的欧拉方程 •离散极小值原理 •离散极小值原理与连续极小值原理的比较 •离散系统最优控制问题的数值计算
能量最优控制
能源与动力学院系统控制与仿真研究室
39
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
40
最优控制——极小值原理 3.4 极小值原理的室
41
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
42
思考题
3.1 火箭最大射程问题
能源与动力学院系统控制与仿真研究室
43
思考题
3.2 电梯最速上升最优控制
能源与动力学院系统控制与仿真研究室
44
思考题
3.3 简谐振动系统的时间最优控制
能源与动力学院系统控制与仿真研究室
45
肖玲斐 lf i @ lfxiao@ d
36
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
37
最优控制——极小值原理 3.4 极小值原理的典型应用
sgn 2 , u 0 0,
2 1 2 1
能源与动力学院系统控制与仿真研究室
38
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
4
最优控制——极小值原理 本章内容回顾
几类典型最优控制
•时间最短 •燃料最少 •能量最小 •时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
5
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
6
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
10
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
11
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
12
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
肖玲斐 lf i @ lfxiao@ d
最优控制——极小值原理 最 控制 值原 本章内容回顾
连续系统的极小值原理 离散系统的极小值原理 几类典型最优控制
•时间最短 •燃料最少 •能量最小 •时间-燃料最优控制
能源与动力学院系统控制与仿真研究室 2
最优控制——极小值原理 本章内容回顾
33
最优控制——极小值原理 3.4 极小值原理的典型应用
月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用
时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
对于标量系统的最优控制
能源与动力学院系统控制与仿真研究室
19
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
连续时变系统的极小值原理
能源与动力学院系统控制与仿真研究室
20
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
30
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
31
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
32
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
21
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
H (t ) x
能源与动力学院系统控制与仿真研究室
22
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
23
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
24
最优控制——极小值原理 3.3 离散系统极小值原理
离离散系系统极小小值原原理
能源与动力学院系统控制与仿真研究室 25
最优控制——极小值原理 3.4 极小值原理的典型应用
线性定常系统时间最优控制问题的提法
能源与动力学院系统控制与仿真研究室
26
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
13
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
14
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
15
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理