最优控制第 章 极小值原理

合集下载

最优控制极小值原理

最优控制极小值原理

④在最优轨线末端哈密顿函数应满足
H
[
x*
(t
* f
),
(t*f
),
u*
(t*f
),
t
* f
]
[
x*
(t
* f
t f
),
t*f
]
⑤沿最优轨线哈密顿函数变化率
H[x*(t),(t),u*(t),t] H[x*(t f ),(t f ),u*(t f ),t f ]
tf t
H(x,,u, )d
定理3-2与定理3-1的区别:P61
当 t f自由时
H (x*(tt*f ),u*(tt*f ), (tt*f )) 0
第三章 极小值原理及其应用 3.1 连续系统的极小值原理
最小值原理只是最优控制所满足的必要条件。 但对于线性系统
x&(t) A(t)x(t) B(t)u(t)

a11(t) L
A(t)
M
O
an1(t) L
a1n (t)
g
H
x(t)
g
(t)
H
x
式中哈密顿函数 H (x, u, λ) L(x, u) λT (t)f (x, u)
② x(t) 及 (t) 满足边界条件
x(t0 ) x0
(t f ) 0
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
③哈密顿函数相对最优控制为极小值
H[x*(t), (t),u*(t)] min H[x*(t), (t),u(t)] u(t )
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
2、积分型性能指标问题
定理3-3:
min J (u) tf L[x(t),u(t)]dt

第04章:极小值原理及其应用

第04章:极小值原理及其应用
1
其中 o( ) 表示二阶以上的微量。
3
t1 t t f
这时又有 U U ,系统的状态方程为
X f ( X ,U , t )
而状态变量 X (t ) 的变分满足方程
f X |U U * X X
(4-9)
引入变量 (t ) 及哈密顿函数 H
H ( X ,U , , t ) T f ( X ,U , t )
G H (t f ) t f t f
T
(4-20)
* * X 5 在最优轨线 (t ) 和最优控制 U (t ) 上哈密
顿函数取极小值
min H ( X , ,U , t ) H ( X , ,U , t ) (4-21) U
将上面的结果与用古典变分法所得的结果((3-34) ~(3-38)式)对比可见,只是将 H 0 这个 U 条件用(4-21)代替,其它无变化。 应该指出,当
(4-1)
初始条件为
X (t0 ) X 0
(4-2)
控制向量 U (t ) R m,并受下面的约束
U
(4-3)
末值状态必须满足的约束条件为
G X ( t ), t 0 f f
性能指标函数为
T J X ( t ), t G f f X (t f ), t f
已知 t1 [t0 , t f ] 中的任意时刻,并以 当 0 时,上式变为 T f ( X ,U , t )] T f ( X ,U , t ) ,
U
U
U 表示 U ,
t [t0 , t f ] ,
或用哈密顿函数 H 的表达式(4-10)表示可得

最优控制

最优控制

j 1,2......r
g:p ×1维函数向量
t f : 自由


dt t f t0
t0
tf
问题:寻求最优控制u*(t),使系统由初态到终态, 目标函数J 为最小
步骤: ⑴列写哈密顿函数 H x(t ), u (t ), (t ), t

应用最小值原理进行问题的求解
1 T (t ) f x(t ), t Bx(t ), t u (t ) 1 T (t ) f x(t ), t T (t ) Bx(t ), t u (t )
q:r ×1维向量函数
_
H [ X (t ), (t ), U (t )] max H [ X * (t ), (t ), u (t )]
* * u (t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。
4、 极小值原来是求取最优控制的必要条件,非充分条件。
即:满足极小值原理不一定J取极小值,需进一步判断。
[
g T [ X (t f , t f )] X (t f )
]
tf
g T ( ) 0 t f t f
3、与 U * (t ) 对应的哈密顿函数H取极小值。
H [ X * (t ), U * (t ), * (t ), t ] min H [ X * (t ), U (t ), * (t ), t ]
0
tf
J [U ] H
u0 u u 2
U 0 U1 0 1
U
U2
u
若采用经典变分: H 0,U * U1; 实际应为U * U 0。极小值原理。

最优控制理论及应用

最优控制理论及应用

的控制律,使被控对象按预定要求运行,并使给
定的某一性能指标达到极小值(或极大值)
2019年3月10日
2
最优控制理论与应用
二 最优控制问题 1 例子 飞船软着陆问题 宇宙飞船在月球表面着陆
时速度必须为零,即软着陆,这要靠发动机的推
力变化来完成。问题是如何选择一个推力方案,
使燃料消耗最小。
m 飞船的质量,h 高度,v 垂直速度, g 月球重力加速度常数,M 飞船自身质量 F 燃料的质量
最优控制理论与应用
最优控制理论与应用
第一章 最优控制问题的一般概念 第二章 最优控制的变分方法 第三章 极小值原理及其应用 第四章 线性二次型问题的最优控制 第五章 动态规划
2019年3月10日
1
最优控制理论与应用
第一章 最优控制问题的一般概念
一 基本概念
最优控制理论中心问题:
给定一个控制系统(
已建立的被控对象的数学模型),选择一个容许
2019年3月10日
24
最优控制理论与应用
2.2 欧拉方程
(2)有等式约束泛函极值的必要条件 定理2.4 设有如下泛函极值问题:
min J ( x( )) g( x, x, t )dt
x(t ) t0 tf
s.t.
f ( x, x, t ) 0
其中, f=0为系统运动的微分方程,g(x,x,t)及x(t)在[t 0 ,t f ] 上连续可微,t 0 及t f 给定。 x,x,f R n 已知x(t 0 ) x 0 , x(t f ) x f , x(t) n , 则极值轨线x * (t) 满足如下欧拉方程
控制约束
0 u(t ) umax
任务:满足控制约束条件下,求发动机推力的 最优变化律,使登月舱由初始出发点到达目标处 (末态),并使性能指标达到极值(燃耗量最小)

现代控制理论极小值原理

现代控制理论极小值原理

x*
0
x0,*
N
x* N ,N x N
同理,对不同的边界情况,只需选取相应的边界条件及横截条件,条件1、2不变。 当控制变量不受限制时,则条件2与控制方程
等效。
H
x* k ,u* k ,** k uk
1,k
0
第24页/共62页
第三节 极小值原理解最短时间控制问题
一般情况下,非线性受控系统的最短时间控制问题的解析解是很困难的,本节 只讨论线性定常受控系统的最短时间控制问题导弹舵面的打开时间。
比较上述极小值原理与变分法所得的结果,可以发现两者的差别仅在⑵。 极小值原理的严格证明很复杂,下面的证明将重于物理概念的阐述,尽量避免烦琐 的数学推导。 设系统动态方程为:
xt f xt,ut,t
(8-7)
边控界制条变x件量为t f :受有x界t闭0,集为约简x束0单,起即见,假设u终t端时刻 及终端状态 utU
t0
我们应用极小值原理来求解。这时哈密尔顿函数为
H x,u,t 1 T tAxt T tBut
故得正则方程为
x* t Ax* t Bu* t * t AT* t
第27页/共62页
根据极小值原理可得
1 *T t Ax* t *T tBu* t 1 *T t Ax* t *T tBut

本章介绍的极小值原理是控制变量 受限制的u情t况下求解最优控制问题的有力工
具。它是由苏联学者庞特里亚金于1956年提出的。极小值原理从变分法引伸而来, 它的结论与古典变分法的结论极为相似,但由于它能应用于控制变量 受边界限 制的情况,并不要求哈密尔顿函数H对u连续可微,因此其适用范围扩大了。
ut
L.S.Pontryagin

最优控制第2章 极小值原理

最优控制第2章 极小值原理

(1) 最优状态x*和最优协态 λ* 满足正则方程:
x&(t) =
∂H ∂λ
=
f [ x(t), u(t), t]
λ& = − ∂H
∂x
2015-03-24
10
(2) 在最优状态x*和最优控制u*上哈密顿函数取极小值:
H
(
x
*
(t ),
u
*
(t ),
λ*(t),
t)
=
min
u∈U
H[x
*
(t ),
u(t ),
2015-03-24
20
u
*
(t
)
=
⎧ −1, ⎪⎨−0.5λ2
(t
λ2 (t ), | λ2
)> (t)
2 |≤
2
(∗)
⎪⎩ 1, λ2 (t) < −2
由伴随方程 λ& = −∂H / ∂x 得到:
求解得到:
λ&1(t) = 0, λ&2 (t) = −λ1(t)
λ1(t) = c1, λ2 (t) = −c1t + c2 本例tf自由,因此H函数在最优终端时刻 t*f满足横截条件:
e t −1 H
=
λT
f
(.)
=
λ1(− x1
+
u)
+
λ2 x1
由极小值原理,最优控制应使哈密顿函数取极小值:
H ( x* , u* , λ* , t ) = min H[ x* , u, λ* , t] u∈U
= -m1≤uin≤1{λ1(− x1* + u) + λ2 x1* }
2015-03-24

11讲 最优控制-极小值-总结及习题讲解

11讲 最优控制-极小值-总结及习题讲解

能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理

极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
33
最优控制——极小值原理 3.4 极小值原理的典型应用

月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用

时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29

5 最优控制-极小值原理

5 最优控制-极小值原理
* j
正常(或平凡)情况、奇异(或非平凡) 正常(或平凡)情况、奇异(或非平凡)情况
Bang-Bang控制原理 控制原理 是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t ), ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立 除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件 极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
(50) ) (51) ) (52) )
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律: 哈密顿函数沿最优轨线随时间的变化规律:
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出 用变分法求解最优控制时, 用变分法求解最优控制时,认 不受限制。 为控制向量 u(t )不受限制。但是 实际的系统, 实际的系统,控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。 某种限制的。
因此, 因此,应用控制方程 ∂H = 0

第七章极小值原理与典型最优控_...

第七章极小值原理与典型最优控_...
N[ x(t f ), t f ] 0
N T H (t f ) ( )v, t t f t f t f
N T (t f ) ( )v, t t f x x
13

极小值原理与变分学

区别在于极值条件不同 极小值原理的极值条件是 Hamilton 函数

x - n 维向量, f - n 维向量函数

u – m 维控制向量函数
容许控制
u Rm


- 是一给定的有界集合

假定终端时间 t f 满足 N[ x(t f ), t f ] 0
4
假设 f 对于 x , u 具有连续的偏导数
这种光滑性假定,对于任何分段连续的函数 u 保证了存在唯一的属于式(1)的容许轨线 x 可定义容许控制函数集合是这类分段连续的函数 并假定对于一个容许的 u 和给定的初始条件 , x(t 0 ) 在所考虑的控制区域内,式( 1)确定了一个唯一 的容许解
T
8

特性指标为
J [ x(t ), t ] t t
tf
t t f
0
(t )}dt {H [ x(t ),u(t ), (t ), t ] (t ) x
T t0
9

积分可得
J { [ x(t ), t ] (t ) x(t )
T
t t f t t0
H 0 u(t ) R 1 (t ) BT (t ) (t ) u
A(t ) x B(t )u x
x(t 0 ) x 0
(t f ) Sx(t f )
27

确定闭环控制

假设 则得

极小值原理最优控制 现代控制理论 教学PPT课件

极小值原理最优控制 现代控制理论 教学PPT课件
极小值原理
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u , x(0) 1
求 u ,要求 u 1,并使
1
J 0 x(t)dt
取最小值。 解 使用变分法求解,取哈密顿函数
H x (x u)
则有
H x 1, (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时,可以采用离散变分法求解离散系统的最优控制问题,得到离 散极值的必要条件,即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0

x(t0 ) 是固定的,即 ( x
x) t t0
0 ;如果 t1 与 x(t1) 也是不变的,则
(x
x) t t1
0 ;若
根据则方程 因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件,得
1(1)
x1(1)

最优控制最小值原理

最优控制最小值原理
4
2-1 连续系统的最小值原理
问题 2-1 设系统的状态方程是
x f [x(t),u(t),t]
(2-1)
其中 f 是 n 维连续可微的向量函数;状态 x(t) Rn,其初态已
知是
x(t0 ) x0
终态应满足边界条件
(2-2)
[x(t f ),t f ] 0 其中 是 r 维连续可微的向量函数,r n;
tf t0
{L(x,
w,t)
T[
f
(x,
w,t)
x]
T[g(x,
w,t)
z2]}dt
(2-8)
的极值。
为 简 便 计 , 令
H(x,,w ,t)L(x,w ,t)Tf(x,w ,t)
(2-9)
(x,x,w,w ,z,z,,,t) H(x,,w ,t)TxT[g(x,w ,t)z2]
(2-10)
8
于 是 (2-8)式 可 写 成
J(u) [x(tf)t,f]vT[x(tf)t,f]
tt0f (x,x ,w ,w ,z,z,,,t)dt
(2-11)
现 在 求 广 义 性 能 指 标 (2-11)的 一 阶 变 分 :
JJtfJxJwJz
(2-12)
式 中 Jtf, Jx, Jw, Jz分 别 是 由 于tf , x , w和z的 微 变
tf t0
(x,x,w,w ,z,z,,,t)d
=0
分步积分
J w
t f
t0
(wT
w
w T
w )dt
wT
(t
)
w
t
t
f
t f wT t0
d dt
w
dt

教材第3章极小值原理

教材第3章极小值原理

(3—13) (3—14)
∫ δ J t f
=∂ ∂tf
⎢⎣⎡Φ + μ T N +
tf tf

tf
Ψdt
⎤ ⎥⎦
t=t f
δ
tf
=
⎡ ⎢ ⎢⎣
∂Φ ∂t f
+ ∂N T ∂t f
⎤ μ + Ψ⎥ δ t f
⎥⎦ t =t f
(3—15)
[ ] ∫ δ
Jx
=d
xT (t f
)∂ ∂x
Φ + μT N
dt
∫ δ
Jw
=
δ
wT
(t
f
)
∂Ψ ∂ w
t=t f

tf t0
δ
wT
d dt
∂Ψ ∂ w
dt
∫ δ
Jz

zT
(t f
)
∂Ψ ∂ z
t=t f

tf t0
δ
zT
d dt
∂Ψ ∂ z
dt
把式(3—15)~式(3—19)代入式(3—11)整理可得
(3—17) (3—18) (3—19)
δ J '=δ Jt f +δ Jx +δ Jw +δ Jz
x = f [x(t) , u(t) , t]
x(t) ∈ Rn
(3—44)
始端条件为
x(t0 ) = x0
终端约束为
(3—45)
N [x(t f ) , t f ] = 0 N ∈ Rm m ≤ n
控制约束为
,t f 待定
(3—46)
g[x(t) , u(t) , t] ≥ 0 u(t) ∈ Rr g ∈ Rl l ≤ r ≤ n

最优控制极小值

最优控制极小值
ɺ x= ∂H = f [ x, u , t ] ∂λ
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
(2·1—11) 方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导 出的欧拉方程,分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件,式中n维矢量 λ (t )叫做协状态矢量 方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵, 即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和 分别是r维和q维的。根据泛函取极值的必要条件,J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
(2.1—2) 、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
(2.1—4) 该函数称做哈米尔等函数。利用这个函数,方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt

极小值原理——精选推荐

极小值原理——精选推荐

§ 7. 3 极小值原理极小值原理是前苏联数学家庞特里亚金首提. 是变分法的延伸和推广,亦称极大值原理是解决控制和状态受约束最优控制问题的有力工具. 极小值原理的一种表述及其应用(不证) 1. 极小值原理 定理7.3 设==00()[(),(),],()xt f x t u t t x t x , 指标=+⎰0[(),(),]d [()]Tt J F x t u t t t S x T ,约束∈()()u t U 容许控制集,Hamilton 函数=+(,,,)[,,][,,]TH x u λt F x u t λf x u t ,则*()u t 是最优控制的必要条件是:*()u t 和相应的*()x t , *()λt 满足系统方程,∂=∂H x λ; (7.16)伴随方程,∂=-∂H λx; (7.17) 极值条件,******≤∈[,,,][,,,],,H x u λt H x u λt u u U ;(7.18)边界条件,∂=∂()()x T SλT x 。

(7.19)对(7.12)~(7.15’),改变的只是极值条件和边界条件。

说明:1) 只有*()u t 才能使Hamilton 函数为全局最小(故名)若无控制约束, 则有∂∂=/0H u .2)边值条件自然含=00()x t x →确定状态和伴随向量. 3)非充要条件。

对线性系统,条件是充要的。

4)解题步骤类似§2中用变分法<1> 作Hamilton 函数→极值条件→待定u (t ); <2> 若伴随方程中无x ,则求出λ;<3>若待定最优控制中不含x →即已求得()u t ;(否则就要解规范方程组),<4>求出,x J **(若要计算)。

2. 自由终端状态的最优控制举例例 7.5 求状态方程为==,(0)1xu x , 指标为=⎰1min ()d J x t t ,控制约束为()[1,1]u t ∈-,的最优控制。

10讲 最优控制-极小值-燃料能量最优

10讲 最优控制-极小值-燃料能量最优

能源与动力学院系统控制与仿真研究室
15
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
31
最优控制——极小值原理 3.4 极小值原理的典型应用

时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
32
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
33
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
v h g
月球
k 0
能源与动力学院系统控制与仿真研究室
23
最优控制——极小值原理 3.4 极小值原理的典型应用
x 2 1 x 1 x 2 u g x3 3 x 1 u k
能源与动力学院系统控制与仿真研究室 24
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
10
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
肖玲斐 lf i @ lfxiao@ d

极小值原理及其应用

极小值原理及其应用
线 x* (t) ,必存在非零的 n 维向量函数 (t),使得
① x(t) 及 (t)满足下述正则方程:
x(t) H
(5-1)
(t) H
x
式中哈密顿函数
(5-2)
H (x,u, ) T (t) f (x,u) (5-3)
② x(t) 及 (t)满足边界条件:
x(t0 ) x0
(t
f
)
(5-73)
因此,定理5-2中凡包含 及其导数的地方,都要

~
相应地替代,从而有
~
(t
f
)
[ x(t
x(t f
f )] )
[ x(t
x(t f
f )] )
T [x(t f
x(t f )
)]
(5-74)
以及
H[x* (t f * ), (t f * ), u* (t f ), t f * ]
2 (t) c2
式中 c1 和 c2为待定常数
由横截条件(5- 4)得
1(t f
)
t f 1
x1 (1)
0
2 (t f
)
t f 1
x2 (1)
1
解出 c1 e1, c2 1 ,故有
1(t) 1 et1
由极小值条件(5-13),得
u*(t) sgn{1(t)} 不难发现:1(0) 1 e1 0, 1(1) 0
x为* (为t) 为相应的最优轨线,则必存在非零常向量 及 n 维向量函数 (t) ,使得 x*(t), u*(t), t f * 和 (t) 满足如下必要条件:
① x(t) 及 (t)满足下述正则方程:
x(t) H
式中哈密顿函数
(t) H

极小值原理

极小值原理
解:为简单计,取 2。问题是要确定最优控 u * (0), u * (1); N 制 最优轨迹x* (1),x* (2)及最优性能泛函 * 2 [ x(0)],先考虑最后一 J 步,即由状态 (1),转移到x(2)这一步。如果采用控制 (1),则有 x u 1 2 1 2 1 2 1 x(2) x(1) u (1), J1[ x(1)] u (1) Cx (2) u (1) c[ x(1) u (1)]2 2 2 2 2 最优控制u (1)应使由状态x(1)出发时J1[ x(1)]为最小,故有 J1[ x(1)] u (1) c[ x(1) u (1)] 0 u (1) cx(1) * c x(1) * x(1) 因此得u * (1) , J 1[ x(1)] , x (2) 1 c 2 1 c 1 c 实际上,它们都是这一 段初始状态x(1)的函数。
综上可得: c 最优控制为u (0) x ( 0) 1 2c c c * u (1) x(1) x(0) 1 c 1 2c 最优轨迹为x* (0) x0
*ห้องสมุดไป่ตู้
1 c x (1) x(0) 1 2c 1 1 x* (2) x(1) x(0) 1 c 1 2c
2)求 (t )以确定u的切换点 H 由协态方程 (1 )得+=- ,其解为=- +Ce t 1 1 x 当t f 1时 (t f ) (1) 0, C e, 故切换点:令 1, 得t 1 ln 2 0.307
二、补充说明
1、式H [ x* (t ), u * (t ), * (t ), t ] H [ x* (t ), u (t ), * (t ), t ] 说明当u (t )和u (t )都从容许的有界集中取 值时,

最优控制(最小值原理)1

最优控制(最小值原理)1

最优控制最优控制——————最小值原理最小值原理七 几种典型的几种典型的工程工程工程应用应用 1.时间最优控制时间最优控制问题,是可以运用极小值原理求解的一个常见的工程实际问题。

如果性能指标是系统有初态转移到目标集的运动时间,则使转移时间为最短的控制称为时间最优控制,或称最速控制。

本节主要介绍线形定常系统的时间最优控制分析法及其应用。

1.1 一类非线性系统的时间最优控制先把需要解决的问题叙述如下:[问题3-1] 移动目标集的一类非线性系统的时间最优控制问题为()1min ,1,2,,fj t u t t J dt j m ≤==∫⋯..s t ① [][]00()(),(),(),()xt f x t t B x t t u t x t x =+=ɺ ② (),0f f x t t ψ =式中()n x t R ∈,()m u t R ∈;()f •和()B •维数适当,其各元对()x t 和t 连续可微;移动目标集()r R ψ•∈,其各元对()f x t 和f t 连续可微,f t 是状态轨线与移动目标集相遇的末端时刻。

显然,问题3-1属于时变条件、积分型性能指标、f t 自由和末端约束的最优控制问题。

根据极小值原理,令哈密顿函数[][]{}(,,,)1()(),(),()T H x u t t f x t t B x t t u t λλ=++ (3-136)正则方程为:[][]()(),(),()Hxt f x t t B x t t u t λ∂==+∂ɺ (3-137) [](),()()()()()TTB x t t u t H ft t t x xx t λλλ ∂∂∂=−=−−∂∂∂ɺ (3-138)边界条件及横截条件为00()x t x = (3-139)(),0f f x t t ψ = (3-140)()()T f f t x t ψλγ∂=∂ (3-141)极小值条件:***1()(),()(),()T T t f x t t t B x t t u t λλ ++{}**1min 1()(),()(),()j T T u t f x t t t B x t t u t λλ≤ =++ 或者[]{}*1()(),()min ()(),()j T T u t B x t t u t t B x t t u t λλ≤ = (3-142)因而得:**()sgn (,)()T u t B x t t λ =− (3-143)式中sgn()•为符号函数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

则伴随方程 λ& = −∂H / ∂x为:
λ& = − ∂H = −1 − λ ∂x
15
2015-03-24
16
λ(t f
)
满足的横截条件
λ(t f
)
=
∂θ[x(t ∂x(t f
f )] )
为:
λ (1) = ∂θ = 0 ∂x(1)
求解得到:
λ (t) = e1−t − 1
H = (1 + λ )x + (1 − λ )u
e t −1 H
=
λT
f
(.)
=
λ1(− x1
+
u)
+
λ2 x1
由极小值原理,最优控制应使哈密顿函数取极小值:
H ( x* , u* , λ* , t ) = min H[ x* , u, λ* , t] u∈U
= -m1≤uin≤1{λ1(− x1* + u) + λ2 x1* }
2015-03-24
考虑鲍尔扎型性能指标:
∫ J = θ[ x(t f ), t f ] +
t f L( x,u,t) d t
t0
(3)
目标:寻求最优容许控制使系统从 x(t0) 转移到 x(tf ),
并使J 取极小值。
2015-03-24
3
定理1(极小值原理)对于上述最优控制问题,选取哈密 顿函数为:
H = L( x,u,t) + λT (t) f [x(t), u(t), t]
间t和tf时,条件(4)简化为H(tf)=0;
2015-03-24
6
1
极极小小值值原原理理的的其其它它形形式式::
¾ 最优控制u*(t)保证哈密顿函数取全局极小值,所谓“极小 值原理”一词正源于此。因为求性能指标J的极小值与求 -J的极大值等价,因此在有些文献中亦称“极大值原理”。
1. 终态自由、性能指标为终端型(梅耶型): J = θ[ x(t f )]
哈密尔顿函数为:
¾ 极小值原理给出的只是最优控制应该满足的必要条件。亦
H = λT (t) f [ x(t ), u(t), t]
即,满足极小值原理的控制是否真能使性能指标泛函J取最 小值,尚待进一步判定。如果由实际问题的物理意义已经 能够判定所论问题的解是存在的,而由极小值原理求出的
则实现最优控制的必要条件为: (1) 最优状态x*和最优协态 λ* 满足正则方程:
∫ J = t f u2 (t) d t 0
为极小的最优控制u*(t)和最优状态x*(t)。
终端时刻自由、末态固定、有约束的最优控制问题。
解:构造哈密顿函数:
条件(4) 起作用,条件(3)不成立
H = u2 + λ1x2 + λ2u = (u + 0.5λ2 )2 + λ1x2 − 0.25λ22
由极小值原理,最优控制应使哈密顿函数取极小值:
¾ 条件(2)表明:对 ∀t ∈[t0,t f ],u(t)取遍控制域 Ω中的所有可行 解,能使哈密顿函数H取全局极小值的容许控制u*(t)就是 所求的最优控制;
¾ 条件(3)仅当末态x(tf)自由时使用;
¾ 条件(4)仅当终端时刻tf自由时使用;
¾ 当系统为定常系统,即问题中所涉及的相应函数不显含时
14
因此,该问题的最优控制和最优轨线为:
⎧ u*(t) = −1
⎪ ⎨
x1*
=
2e−t
−1
⎪ ⎩
x2*
=
−2e−t

t
+
2
最优性能指标为:
J* = x * (1) = 0.2642
2015-03-24
例2. 设系统的状态方程为:
x& (t) = x(t) − u(t), x(0) = 5
控制约束为:0.5 ≤ u ≤ 1,试求使性能指标:
= −λ1 x1* + λ2 x1* + -m1≤uin≤1(λ1u)
13
分分析析::
-m1≤uin≤1(λ1u)
由于u的上界为1,下界为-1,因此,当 λ1 > 0时应取 u*(t) = −1 当 λ1 < 0 时应取 u*(t) = 1 。由于 λ1(t ) = 1 − et−1 > 0 , 所以有:
+ +
1, 0.5,
t
∈[0, 0.307] t ∈[0.307, 1]
由x(0)=5,得c1=4,从而: x * (t) = 4et + 1, t ∈[0, 0.307]
再由状态的连续性可求出c2=4.37,于是得到最优状态轨线:
x
*
(t
)
=
⎧⎪ 4et + 1, t ∈ ⎨⎪⎩4.37et + 0.5,
u*
,
λ
*,
t
* f
)
=
− ∂θ [x(t)] ∂t f
t
* f
2015-03-24
9
2. 终态自由、性能指标为积分型(拉格朗日型):
∫ J = t f φ( x,u,t )d t t0
哈密尔顿函数为:
H = φ( x, u, t) + λT (t) f [ x(t ), u(t), t]
则实现最优控制的必要条件:
则实现最优控制的必要条件:
(1) 最优状态x*和最优协态 λ* 满足正则方程:
x&(t) =
∂H ∂λ
=
f [ x(t), u(t), t]
λ& = − ∂H ∂x
(2) 在最优状态x*和最优控制u*上哈密顿函数取极小值:
H
(
x
*
(t ),
u
*
(t ),
λ*(t),
t)
=
min
u∈U
H[x
*
(t ),
H
(
x
*
(t
),
u
*
(t ),
λ*(t),
t)
=
min
u∈U
H[x
*
(t ),
u(t ),
λ*(t),
t ],
∀t
∈[t0
,
t
f
]
(3)协态 λ(t f )满足横截条件:
λ(t
f
)
=
∂θ [ x(t ∂x(t f
f )] )
(4) 当tf自由时,H函数在最优终端时刻 t*f满足的横截条件:
H
( x* ,
u(t
),
λ*(t),
t ],
∀t
∈[t0
,
t
f
]
2015-03-24
4
(3)协态 λ(t f )满足横截条件(当末态固定时无这个条件):
λ(t f
)
=
∂θ ∂x(t f
)
+νT
∂N ∂x(t f
)
其中 v是另一个拉格朗日乘子。
(4) 当tf自由时,H函数在最优终端时刻 t*f满足的横截条件:
H
(t
2015-03-24
20
u
*
(t
)
=
⎧ −1, ⎪⎨−0.5λ2
(t
λ2 (t ), | λ2
)> (t)
2 |≤
2
(∗)
⎪⎩ 1, λ2 (t) < −2
由伴随方程 λ& = −∂H / ∂x 得到:
求解得到:
λ&1(t) = 0, λ&2 (t) = −λ1(t)
λ1(t) = c1, λ2 (t) = −c1t + c2 本例tf自由,因此H函数在最优终端时刻 t*f满足横截条件:
= =
− x1 x1
+
u ,
x(0) = (1, 0)T
终端型
控制约束为:−1 ≤ u ≤ 1 ,求u(t)使:min J = x2 (1) (梅耶型)
终端时刻固定、末态自由、有约束的最优控制问题。
解: 构造哈密顿函数:
条件(4)不起作用
H = λT f (.) = λ1(− x1 + u) + λ2 x1 则伴随方程 λ& = −∂H / ∂x 为:
J = ∫01[ x(t) + u(t)]d t 积分型(拉格朗日型)
为极小的最优控制u*(t)和最优状态x*(t)。
终端时刻固定、末态自由、有约束的积分型最优控制问题
解: 构造哈密顿函数:
条件(4)不起作用
H = x + u + λ ( x − u) = (1 + λ ) x + (1 − λ )u
λ*(t),
t ],
∀t
∈[t0
,
t
f
]
(3)协态 λ(t f )满足横截条件: λ(t f ) = 0
(4) H函数在最优轨线终点处的值满足:
H
(
x*
,
u*
,
λ*
,
t
f
)
=
⎧ 0, ⎩⎨const,
当t f自由时 当t f 固定时
2015-03-24
11
例1. 设系统的状态方程为:
⎧ ⎨ ⎩
x&1 x& 2
2015-03-24
17
分分析析::
要使 H[x*, u, λ*, t] 达到极小,就要 (1 − λ*)u达到极小 。由控 制约束 0.5 ≤ u ≤ 1 可得,最优控制为:
u *(t)
=
⎧ 1, ⎨⎩0.5,
λ >1 λ <1
相关文档
最新文档