最优控制_第六章_极小值原理

合集下载

第六章最优控制2012

，使J 为极小。
一、性能指标及分类性能指标函数(又称目标函数、性能泛函)，最优控制
问题可归结为求性能指标的极值问题。按照实际控制性能常见：
⑴ 最短时间问题：
拦截导弹最短时间控制
⑵ 最小消耗问题：控制量u(t)与燃料消耗量成正比
导弹最小燃料控制
(3) 线性调节器问题：考虑在平衡位置 x=0附近的状态调节
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向量及控制向量在整个动态过程中都满足性能要求。
⑵ 终值型性能指标:
卫星的指向控制
在变分法中称为迈耶尔问题。只要求状态在过程终端时满足一定要求，而对状态及控制量在整个动态过程中的演变不作要求。
⑶ 复合型性能指标：
卫星的指向和稳定控制
的变分是指两个函数间的差
问题：何为两个函数的差？两个函数距离接近？
K阶近似度
定义：设是线性赋范空间上的连续泛函，其增量可表示为
其中，
是关于的线性连续泛函，
是关于的高
阶无穷小。则
称为泛函的变分。
泛函的变分等于
3、泛函变分的规则 1） 2） 3） 4）
变分的导数等于导数的变分
4、泛函的极值
寻求在
上的最优控制
或
，以将系统状
态从
转移到 x(t f ) 或 x(t f ) 的一个集合，并使性能指标
最优。其中
是 x 、u 和t 的连续函数
最优控制问题就是求解一类带有约束条件的条件泛函极值问题。
泛函与变分法
一、泛函与变分
1、泛函的基本定义：对于某个函数集合中的每一个函数，变量J 都有一个
在变分法中称为波尔札问题。它要求状态在过程终端时满足一定要求，而且状态向量及控制向量在整个动态过程中都应满足一定要求。

最优控制

j 1,2......r
g：p ×1维函数向量
t f : 自由

dt t f t0
t0
tf
问题：寻求最优控制u*(t)，使系统由初态到终态，目标函数J 为最小
步骤： ⑴列写哈密顿函数 H x(t ), u (t ), (t ), t

应用最小值原理进行问题的求解
1 T (t ) f x(t ), t Bx(t ), t u (t ) 1 T (t ) f x(t ), t T (t ) Bx(t ), t u (t )
q:r ×1维向量函数
_
H [ X (t ), (t ), U (t )] max H [ X * (t ), (t ), u (t )]
* * u (t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求，因此应用拓宽。
4、极小值原来是求取最优控制的必要条件，非充分条件。
即：满足极小值原理不一定J取极小值,需进一步判断。
[
g T [ X (t f , t f )] X (t f )
]
tf
g T ( ) 0 t f t f
3、与 U * (t ) 对应的哈密顿函数H取极小值。
H [ X * (t ), U * (t ), * (t ), t ] min H [ X * (t ), U (t ), * (t ), t ]
0
tf
J [U ] H
u0 u u 2
U 0 U1 0 1
U
U2
u
若采用经典变分： H 0,U * U1; 实际应为U * U 0。极小值原理。

现代控制理论最优控制

所以它的导数在 = 时应为零，即

[∗ + ]቟
=

=
由变分引理

[∗

+ ]ቕ
=
= ∗
=
得证
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题
引理：如果函数() 在区间 ∈ [ , ]上是连Βιβλιοθήκη 的，而且对于只满足某些一般条件的任意

[ + ]቟

=
+ ]ቕ
=
∆ +
= lim
ቤ
∆→
∆
=
+ −
= lim
→

′

1
1 2

቟
= lim { ඐ +

+}
2
→
2
− ∗
<
则称泛函在∗ 处是连续的。
其中， , ∗ 表示在函数空间中与∗ 之间的距离:

泛函的变分
, ∗ = max − ∗
≤≤
泛函增量∆ 的线性主部称为泛函的一阶变分，简称泛函的变分，记作

选定的函数()有‫)()( ׬‬

= , 则在区间 ∈ [ , ]上有： () ≡
一欧拉方程
讨论一个固定端点时间，固定端点状态的无约束条件变分问题。
问题: 考虑泛函为

ሶ
= න [ , (),
]

ሶ
式中在 ∈ [ , ]上连续， [ , (),

11讲最优控制-极小值-总结及习题讲解

能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理

极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
33
最优控制——极小值原理 3.4 极小值原理的典型应用

月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用

时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29

现代控制理论课件-第六章极小值原理

⑴ 满足正则方程
x*
k
1
H
x*
k
，u* k ，* k 1
k
1，k
f x* k ，u* k ，k
*
k
H
x*
k
，u* k ，* xk
k
1，k
⑵ 相对于最优控制，哈密尔顿函数达极小值，即
H x* k ，u* k ，* k 1，k H x* k ，uk ，* k 1，k
⑶ 及满足以下边界条件及横截条件
x*
0
x0，*
N
x* N ，N x N
同理，对不同的边界情况，只需选取相应的边界条件及横截条件，条件1、2不变。当控制变量不受限制时，则条件2与控制方程
等效。
H
x*
k ，u* k ，* uk
k
1，kபைடு நூலகம்
0
§ 6.3 极小值原理解最短时间控制问题
一般情况下，非线性受控系统的最短时间控制问题的解析解是很困难的，本节只讨论线性定常受控系统的最短时间控制问题。
比较上述极小值原理与变分法所得的结果，可以发现两者的差别仅在⑵。极小值原理的严格证明很复杂，下面的证明将重于物理概念的阐述，尽量避免烦琐的数学推导。设系统动态方程为：
xt f xt，ut，t
边界条件为：xt0 x0 ，为简单起见，假设终端时刻 t f
及终端状态 x t f 均为自由。控制变量 ut 受有界闭集约束，即 utU
性能指标为：
J x
tf
，t f
tf t0
F
xt，ut，t dt
则使性能指标 J 达到极小的最优控制 u* t 及最优状态轨线 x* t 必须满足以下条件：

5 最优控制-极小值原理

* j
正常（或平凡）情况、奇异（或非平凡）正常（或平凡）情况、奇异（或非平凡）情况
Bang-Bang控制原理控制原理是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t )， ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
（50））（51））（52））
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律：哈密顿函数沿最优轨线随时间的变化规律：
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出用变分法求解最优控制时，用变分法求解最优控制时，认不受限制。为控制向量 u(t )不受限制。但是实际的系统，实际的系统，控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。某种限制的。
因此，因此，应用控制方程 ∂H = 0

极小值原理最优控制现代控制理论教学PPT课件

极小值原理
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u ， x(0) 1
求 u ，要求 u 1，并使
1
J 0 x(t)dt
取最小值。解使用变分法求解，取哈密顿函数
H x (x u)
则有
H x 1， (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时，可以采用离散变分法求解离散系统的最优控制问题，得到离散极值的必要条件，即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0
与
x(t0 ) 是固定的，即 ( x
x) t t0
0 ；如果 t1 与 x(t1) 也是不变的，则
(x
x) t t1
0 ；若
根据则方程因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件，得
1(1)
x1(1)

第六章最优控制(2) 现代控制理论

x1(t)
x10
x20t
1t2 2
消去时间变量 t , 可得相应的最优轨线方程为
x1(t)
1 2
x22
(t)
C
(6-256)
在图6-16中用实线表示。
14
由于x2(t)=x20+t随t增大, 故最优轨线行进的方向自下而上, 如曲线上箭头所示。
15
当 u= -1 时, 状态方程的解为
x2 (t) x20 t
在R-上在+上
在R+上到达原点
u 1,1 u 1 u 1, 1 u 0
19
进一步, 可综合为
u 1 当(x1, x2 ) R u 1 当(x1, x2 ) R
u 0 当(x1, x2 ) 0
若将开关曲线方程写成
h (x1, x2 )
x1
1 2
x2
x2
0
则最优控制律可表示成
x2 (t) u(t)
或写成矩阵形式
x(t)
0 0
1 0
x(t)
10u(t
)
初始条件 x(t0) x0
(6-248)
终端条件 x(t f ) 0
控制约束 1 u(t) 1, (t0 t t f )
性能指标
J
t f
t0
1 dt
求最优控制 u*(t) ，把系统从初态转移到终态，使
x1(t)
x10
x20t
1 2t2Fra bibliotek相应的最优轨线方程为
x1(t)
1 2
x22
(t)
C
在图6-16中用虚线表示。由于x2(t)随t减小, 故曲线箭头方向自上而下。

现代控制理论第六章

式中,δx(t) 为宗量函数x(t)的变分, L[x(t), δx(t)] 是 δx(t) 的线性连续泛函,o[ x(t), δx(t)] 是关于 δx(t) 的高阶无穷小,则定义泛函增量的线性主部
δJ = L[ x(t), δ x(t)]
(6-19)
为泛函 J[ x(t)] 的变分，记作 δJ 。若泛函有变分，则称该泛函可微。
物体的升降速度，则上式可写成状态方程
& x1 (t) = x2 (t)
& x2 (t) = u(t) − mg
x 其初始条件是 x1 (t0 ) = x10 ， 2 (t0 ) = x20 。现需寻找一个能使物体以最短时间从初态 ( x10,x20 ) 到达终态 (0,0)的控制u(t)。定义系统的性能指标为
1. 始端时刻和终端时刻固定时的泛函极值问题
首先讨论不仅初始时刻 t0 、终端时刻 t f 固定,而且初始状态 x(t 0 ) = x0 、终端状态 x(tf ) = xf固定这一最简单情况下无约束条件的泛函极值问题(最优控制的最优控制的基本问题)。基本问题
J = ∫ dt = t f − t0
tf t0
t 式中, t0为起始时刻， f 为终止时刻。要求时间最短，即使性能指标J最小，这样求得的控制即为最优控制 u *(t) 。
2. 搅拌槽问题设有一盛放液体的连续搅拌槽，如图6-2所示。槽内装有不停转动着的搅拌器S，使液体经常处于完全混合状态，槽中原放 0o C 的液体。现需将其温度升高，为此在入口处送进一定量的液体，其温度为u(t)，出口处流出等量的液体，以保持槽内液
由式(6-20)得
∂ (J[x(t) + εδx(t)]) = ∂ ∫tt0f [x(t) + εδx(t)]2 dt ∂ε ∂ε ε =0

最优控制极小值

ɺ x= ∂H = f [ x, u , t ] ∂λ
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
（2·1—11）方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导出的欧拉方程，分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件，式中n维矢量 λ (t )叫做协状态矢量方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵，即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和分别是r维和q维的。根据泛函取极值的必要条件，J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
（2.1—2）、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
（2.1—4）该函数称做哈米尔等函数。利用这个函数，方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt

极小值原理——精选推荐

§ 7. 3 极小值原理极小值原理是前苏联数学家庞特里亚金首提. 是变分法的延伸和推广,亦称极大值原理是解决控制和状态受约束最优控制问题的有力工具. 极小值原理的一种表述及其应用(不证) 1. 极小值原理定理7.3 设==00()[(),(),],()xt f x t u t t x t x ，指标=+⎰0[(),(),]d [()]Tt J F x t u t t t S x T ，约束∈()()u t U 容许控制集，Hamilton 函数=+(,,,)[,,][,,]TH x u λt F x u t λf x u t ，则*()u t 是最优控制的必要条件是:*()u t 和相应的*()x t , *()λt 满足系统方程，∂=∂H x λ； (7.16)伴随方程，∂=-∂H λx； (7.17) 极值条件，******≤∈[,,,][,,,],,H x u λt H x u λt u u U ；(7.18)边界条件，∂=∂()()x T SλT x 。

(7.19)对(7.12)~(7.15’)，改变的只是极值条件和边界条件。

说明：1) 只有*()u t 才能使Hamilton 函数为全局最小(故名)若无控制约束, 则有∂∂=/0H u .2)边值条件自然含=00()x t x →确定状态和伴随向量. 3)非充要条件。

对线性系统，条件是充要的。

4)解题步骤类似§2中用变分法<1> 作Hamilton 函数→极值条件→待定u (t )； <2> 若伴随方程中无x ，则求出λ；<3>若待定最优控制中不含x →即已求得()u t ；(否则就要解规范方程组)，<4>求出,x J **(若要计算)。

2. 自由终端状态的最优控制举例例 7.5 求状态方程为==,(0)1xu x ，指标为=⎰1min ()d J x t t ，控制约束为()[1,1]u t ∈-，的最优控制。

最优控制第六章极小值原理

以 w u，w * u*代入上式，便得
H x*, *,u,t H x*, *,u*,t
(35)
上式表明，如果哈密尔顿函数H看成 utU 的
函数，那么最优轨迹上与最优控制u*(t)相对应的
H将取绝对极小值(即最小值)。这是极小值原理的
一个重要结论。
定理设系统状态方程为
xt0 x0
Nxt f ,t f 0
(48)
这就是著名的极小值原理。
下面对定理作些说明： 1) 定理的第一、第二个条件，即式(41)～式
(44)，普遍适用于求解各种类型的最优控制问题，且与边界条件形式或终端时刻自由与否无关。其
中，第二个条件：min H x*, *,u,t H x*, *,u*,t uU
(45)
u u
3) H函数在最优轨迹终点处的值决定于
H

Φ
T
N

0
(46)
t f
t f tt f
4) 协态终值满足横截条件
t f
Φ

x
t
f
N T
x t f

tt f
(47)
5) 满足边界条件
J1

Ψ

x T
Ψ x

Φ t f

N T t f

tt f
t f
d xT
tf
Φ

x

N T x

Ψ x
t t
f
wT
Ψ w tt f
zT
Ψ z
tt f

10讲最优控制-极小值-燃料能量最优

能源与动力学院系统控制与仿真研究室
15
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
31
最优控制——极小值原理 3.4 极小值原理的典型应用

时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
32
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
33
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
v h g
月球
k 0
能源与动力学院系统控制与仿真研究室
23
最优控制——极小值原理 3.4 极小值原理的典型应用
x 2 1 x 1 x 2 u g x3 3 x 1 u k
能源与动力学院系统控制与仿真研究室 24
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
10
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
肖玲斐 lf i @ lfxiao@ d

王孝武主编《现代控制理论基础》(第3版)第6章课件

2
由伴随方程 H 0
x
const
(t
f
)
x(t
f
)
1 2
cx2 (t
f
)
cx(t
f
)
因为 const
(t) (t f ) cx(t f )
由控制方程
H u 0
u
即
u* (t) cx(t f )
将 u* 代入状态方程 x u cx(t f )
解为 x(t) cx(t f )(t t0 ) c1
（7）
其中，x 为n 维状态向量； u 为r 维控制向量； f 为n 维向量函数。
要求在控制空间中寻求一个最优控制向量 u(t)，使以下性能指标
J [x(t f )] t f L(x, u,t) d t t0
沿最优轨线 x(t)取极小值。
（8）
（性能指标如（8）式所示的最优控制问题，是变分法中的波尔扎问题）
当 t t0 时，代入上式，求得 c1 x(t0 ) ，所以
x(t) cx(t f )(t t0 ) x(t0 )
当 t t f 时，
x(t
f
)
1
x(t0 ) (t f
t0
)
最优性能指标为
J
*
1 2
cx2
(t
f
)
1 2
tf t0
u2 d t 1 cx2 (t0 ) 2 1 c(t f t0 )
（10）
则 J [x(t f )] t f [H (x, u, λ,t) λT (t)x]d t
t0
[x(t f )] t f H (x, u, λ,t) d t t f λT (t)x d t
t0

最优控制第6章最优控制的计算方法

则(6-7)变为
δJ = φ[ X (t f ) + δX (t f ), t f ] − φ[ X (t f ), t f ] + ∫ {H [ X + δX , U + δU , X , t ]
t0
tf
− H [ X , U , λ , t ] − λ [ f ( X + δX , U + δU , t ) − f ( X , U , t )]}dt
δJ = J [U + δU ] − J [U ] = φ[ X (t f ) + δX (t f ), t f ] − φ[ X (t f ), t f ]
+ ∫ F [ X + δX , U + δU , t ] − F [ X , U , t ]dt
t0 tf
(6-7)
哈密顿函数为：
H [ X , λ , U , t ] = F [ X , U , t ] + λT f [ X , U , t ]
§6.1 直接法
一、梯度法
给定系统的状态方程：
& = f [ X (t ), U (t ), t ] X
初始条件：
(6-1) (6-2)
X (t 0 ) = t0
以及性能泛函： J [U (t )] = φ[ X (t f ), t f ] + 终端时刻 t f 给定， X (t f ) 自由。
∫
tf
t f ∂H ∂φ T t ] δX (t f ) − [λT (t )δX ]t0f + ∫ [ ] δUdt t0 ∂U ∂X (t f ) T
(6-11)
考虑边界条件则(6-11)变为

极小值原理

解：为简单计，取 2。问题是要确定最优控 u * (0), u * (1); N 制最优轨迹x* (1)，x* (2)及最优性能泛函 * 2 [ x(0)],先考虑最后一 J 步，即由状态 (1)，转移到x(2)这一步。如果采用控制 (1),则有 x u 1 2 1 2 1 2 1 x(2) x(1) u (1), J1[ x(1)] u (1) Cx (2) u (1) c[ x(1) u (1)]2 2 2 2 2 最优控制u (1)应使由状态x(1)出发时J1[ x(1)]为最小，故有 J1[ x(1)] u (1) c[ x(1) u (1)] 0 u (1) cx(1) * c x(1) * x(1) 因此得u * (1) , J 1[ x(1)] , x (2) 1 c 2 1 c 1 c 实际上，它们都是这一段初始状态x(1)的函数。
综上可得： c 最优控制为u (0) x ( 0) 1 2c c c * u (1) x(1) x(0) 1 c 1 2c 最优轨迹为x* (0) x0
*ห้องสมุดไป่ตู้
1 c x (1) x(0) 1 2c 1 1 x* (2) x(1) x(0) 1 c 1 2c
2）求 (t )以确定u的切换点 H 由协态方程 (1 )得＋＝－，其解为＝－＋Ce t 1 1 x 当t f 1时 (t f ) (1) 0, C e, 故切换点：令 1, 得t 1 ln 2 0.307
二、补充说明
1、式H [ x* (t ), u * (t ), * (t ), t ] H [ x* (t ), u (t ), * (t ), t ] 说明当u (t )和u (t )都从容许的有界集中取值时，

现代控制理论第6章最优控制(录像)2(极小值 [1]加了二次型

由min H x , ,u,t H x , ,u ,t uU
min H
uU
min uT BT
u( t ) SGN( BT )
得：
ui( t )sgn ( BT ) i ,i1,2, ,r
1 a 0
其中函数sgn a
0
a0
1 a 0
a为向量时用SGN表示。
总目录返回上一页下一页
6.8 极小值原理
经典变分法
x Hx,u, ,t , Hx,u, ,t , Hx,u, ,t 0
x
u
状态方程
伴随方程
控制方程
应用范围：
u无约束, 且H对u连续可微难满足
一般 ui Mi ( i 1,2 m ) 更一般控制u(t)受不等式约束：
gxt ,u(t),t 0
总目录返回上一页下一页
t
u 切换时刻
总目录返回上一页下一页
6.10.2 状态轨线及开关曲线
x* t 12.3
1
0 0.307
1
0.5
t 0 0.307
6.44
5
1 t 0 0.307 1 t
总目录返回上一页下一页
例6.8.2 已知系统 x1t x1t ut x10 1
x2 t x1t
x2 0 0
其中 ut 1 ，若x t f 自由，求u* t 使
J x2 1 min
由正则方程组： x Ax Bu
H AT
x
(
t
)
e
AT t
(
0
)
e
AT t 0
u( t ) SGN( BT ) SGN( BT e ATt0 )
1.时间控制是Bang-Bang控制,即开关控制；

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

* * * * * * * * *

*Βιβλιοθήκη TΨ x Ψ x , ,
* *
*
, w, z *T x Ψ x * , * , * , x * , w* , z * *T x * 0 ,x

即 E H x * , * , w, t H x * , * , w* , t 0
若g中不包含x，则为
(42)
H x
(43)
2) 在最优轨迹上，与最优控制u*相应的函数取
绝对极小值，即
min H x , , u, t H x , , u , t
* * * * * uU

(44)
或
H x * , * , u, t H x * , * , u * , t
Ψ Φ N T T J 1 Ψ x t f x t f t f t t f
Φ N T Ψ T T Ψ d x t f w x x t t w x f Ψ z z

Φ N T Ψ T 故 J x d x t f x x t t x f
Ψ x x
T
t t f
t f
tf
t0
Ψ d Ψ x d t (13) x d t x
Φ N T T T Ψ d x t f x x t t x x f
t t f

tf
t0
Ψ d Ψ x dt x d t x
T
注意到 d x t f x t f x t f t f
tf t0

(4)
式中，Φ和L——连续可微的矢量函数 tf——待定终端时刻。最优控制问题就是要寻求最优容许控制u(t)在满足上列条件下，使J为极小。
与前面讨论过的等式约束条件最优控制问题作
一比较，可知它们之间的主要差别在于：这里的控
制u(t)是属于有界闭集U，受到不等式g[x(t), x(t),t]≥0 约束。为了把这样的不等式约束问题转化为等式约束问题，采取以下两个措施：
1) 欧拉方程
Ψ d Ψ 0 x d t x Ψ d Ψ 0 即 w d t w Ψ d Ψ 0 即 z d t z d Ψ 0 d t w d Ψ 0 d t z
(17)
(18)
(19)
2) 横截条件
Ψ Φ N T Ψ xT 0 x t f t f t t f
N xt f , t f 0
式中N——q维连续可微的矢量函数，q≤n。

(2)
控制 ut R r 受不等式约束
gxt , ut , t 0
式中g——l维连续可微的矢量函数，l≤r。
(3)
性能泛函
J Φ xt f , t f Lxt , u t , t d t
(20)
Φ N T Ψ 0 x x t t x f
(21)
Ψ w Ψ z
0
t t f
(22)
0
t t f
(23)
Ψ ，便得到将 Ψ 代入式(17)，并注意到 x
1) 欧拉方程
H g x x
的必要条件。为使最优解为极小，则还必须满足维
尔特拉斯 E 函数沿最优轨迹为非负的条件，即
E Ψ x , w , z , x, w, z Ψ x , w , z , x , w , z
* * * * * * * * *
xx

* T

Ψ w* w x
gxt , ut , t 0
在这种情况下，控制方程 H u 0 已不成立，所以不能再用变分法来处理最优控制问题。
一、连续系统的极小值原理
设系统状态方程为
xt f xt , ut , t
(1)
初始条件为x(t0)=x0，终态x(tf)满足终端约束方程
tf t0

(39)
取哈密尔顿函数为
H Lx, u, t f x, u, t
T
(40)
则实现最优控制的必要条件是，最优控制u*、
最优轨迹x*和最优协态矢量λ*满足下列关系式：
1) 沿最优轨线满足正则方程
H x
(41)
H g T x x
恒有
Ψ Ψ 0 w z
(32)
Ψ 3) 若将 Ψ 代入 0 ，则得 w
H g T 0 w w
即
H g T u u
这表明在有不等式约束情况下，沿最优轨迹
H 0 这个条件已不成立。 u
值得指出的是，式(24)～式(30)只给出了最优解
T
t t f
t t f

tf
t0
T Ψ d Ψ T d Ψ T d Ψ w z x d t (16) x d t x d t w d t z
由于δtf、δxT(tf)、δx、δw、δz都是任意的，于是由δJ1=0可得增广性能泛函取极值的必要条件，是下列各关系式成立。
(47)
5) 满足边界条件
xt 0 x0
N xt f , t f 0
这就是著名的极小值原理。

(48)
下面对定理作些说明： 1) 定理的第一、第二个条件，即式(41)～式 (44)，普遍适用于求解各种类型的最优控制问题，且与边界条件形式或终端时刻自由与否无关。其
T tf t0

(10)
现在求增广性能泛函J1的一次变分
J1 J t J x J w J z
f
(11)
式中 J t f、δJx、δJw、δJz分别是由于tf、x、w、z 作微小变化所引起的J1的变分。
J t
f
t f
Φ T N t f t f Ψ d t t f t f t t f
T
(24)
d H g T d t w w
0
(25)
d T z 0 dt

(26)
2) 横截条件
Φ N T H 0 t f t f t t f
(27)
Φ N T 0 x x t t f H g T w w 0 t t f
为简便计，令
Ψ x, x, w, , , z, t H x, w, , t T x T g x, w, t z 2
(9)

于是J1可写成
J 1 Φ xt f , t f N xt f , t f Ψ x, x, w, , , z, t d t

T
Ψ * zz w

T
Ψ 0 z
(33)
Ψ Ψ Ψ 0， 0，和由于沿最优轨线有 w x z
z 2 g x, w, t ，所以上式可写成并且
Ψ x , , , x, w, z Ψ x , , , x , w , z x x
H g u u
T

(45)
沿最优轨迹，有
3) H 函数在最优轨迹终点处的值决定于
Φ T N 0 H t f t f t t f
4) 协态终值满足横截条件
(46)
Φ N T t f xt f xt f t t f
(12)
Φ N T Ψ t f t f t f t t f
T J x d x t f Φ N x
T

t t f

tf
t0
T Ψ T Ψ x x dt x x
tf t0

H x, w, , t T x T g x, w, t z 2 d t (7)
的极值问题。

哈密尔顿函数为
H x, w, , t Lx, w, t f x, w, t
T
(8)
T
Ψ J w w t f w
T
t t f

tf
t0
d Ψ w dt d t w
T
(14)
Ψ J z z t f z
T
t t f

tf
t0
d Ψ z dt d t z
T
(15)
把式(12)～式(15)代入式(11)，最后得

(34)
u ， * u * w 以w 代入上式，便得
H x , , u, t H x , , u , t
* * * * *

(35)
上式表明，如果哈密尔顿函数H看成 ut U 的
函数，那么最优轨迹上与最优控制u*(t)相对应的
H将取绝对极小值(即最小值)。这是极小值原理的一个重要结论。
1) 引入一个新的r维控制变量w(t)，令
wt ut , wt 0 0
(5)
虽然u(t)不连续，但w(t)是连续的。若u(t)分段连续，则u(t)是分段光滑连续系统。

最优控制_第六章_极小值原理

第六章 最优控制2012

最优控制

现代控制理论 最优控制

11讲 最优控制-极小值-总结及习题讲解

现代控制理论课件-第六章 极小值原理