最优控制_第六章_极小值原理
第六章 最优控制2012
,使J 为极小。
一、性能指标及分类 性能指标函数(又称目标函数、性能泛函),最优控制
问题可归结为求性能指标的极值问题。按照实际控制性能 常见:
⑴ 最短时间问题:
拦截导弹最短时间控制
⑵ 最小消耗问题:控制量u(t)与燃料消耗量成正比
导弹最小燃料控制
(3) 线性调节器问题:考虑在平衡位置 x=0附近的状态调节
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向 量及控制向量在整个动态过程中都满足性能要求。
⑵ 终值型性能指标:
卫星的指向控制
在变分法中称为迈耶尔问题。只要求状态在过程终端时 满足一定要求,而对状态及控制量在整个动态过程中的演变 不作要求。
⑶ 复合型性能指标:
卫星的指向和 稳定控制
的变分是指两个函数间的差
问题:何为两个函数的差?两个函数距离接近?
K阶近似度
定义:设 是线性赋范空间 上的连续泛函,其增量可表示为
其中,
是关于 的线性连续泛函,
是关于 的高
阶无穷小。则
称为泛函 的变分。
泛函的变分等于
3、泛函变分的规则 1) 2) 3) 4)
变分的导数等于导数的变分
4、泛函的极值
寻求在
上的最优控制
或
,以将系统状
态从
转移到 x(t f ) 或 x(t f ) 的一个集合,并使性能指标
最优。其中
是 x 、u 和t 的连续函数
最优控制问题就是求解一类带有约束条件的条件泛函极值问 题。
泛函与变分法
一、泛函与变分
1、泛函的基本定义: 对于某个函数集合 中的每一个函数 ,变量J 都有一个
在变分法中称为波尔札问题。它要求状态在过程终端 时满足一定要求,而且状态向量及控制向量在整个动态过 程中都应满足一定要求。
最优控制
j 1,2......r
g:p ×1维函数向量
t f : 自由
dt t f t0
t0
tf
问题:寻求最优控制u*(t),使系统由初态到终态, 目标函数J 为最小
步骤: ⑴列写哈密顿函数 H x(t ), u (t ), (t ), t
应用最小值原理进行问题的求解
1 T (t ) f x(t ), t Bx(t ), t u (t ) 1 T (t ) f x(t ), t T (t ) Bx(t ), t u (t )
q:r ×1维向量函数
_
H [ X (t ), (t ), U (t )] max H [ X * (t ), (t ), u (t )]
* * u (t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。
4、 极小值原来是求取最优控制的必要条件,非充分条件。
即:满足极小值原理不一定J取极小值,需进一步判断。
[
g T [ X (t f , t f )] X (t f )
]
tf
g T ( ) 0 t f t f
3、与 U * (t ) 对应的哈密顿函数H取极小值。
H [ X * (t ), U * (t ), * (t ), t ] min H [ X * (t ), U (t ), * (t ), t ]
0
tf
J [U ] H
u0 u u 2
U 0 U1 0 1
U
U2
u
若采用经典变分: H 0,U * U1; 实际应为U * U 0。极小值原理。
现代控制理论 最优控制
[∗ + ]
=
=
由变分引理
[∗
+ ]ቕ
=
= ∗
=
得证
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题
引理:如果函数() 在区间 ∈ [ , ]上是连Βιβλιοθήκη 的,而且对于只满足某些一般条件的任意
[ + ]
=
+ ]ቕ
=
∆ +
= lim
ቤ
∆→
∆
=
+ −
= lim
→
′
1
1 2
= lim { ඐ +
+}
2
→
2
− ∗
<
则称泛函 在∗ 处是连续的。
其中, , ∗ 表示在函数空间中 与∗ 之间的距离:
泛函的变分
, ∗ = max − ∗
≤≤
泛函 增量∆ 的线性主部称为泛函的一阶变分,简称泛函的变分,记作
选定的函数()有)()(
= , 则在区间 ∈ [ , ]上有: () ≡
一 欧拉方程
讨论一个固定端点时间,固定端点状态的无约束条件变分问题。
问题: 考虑泛函为
ሶ
= න [ , (),
]
ሶ
式中 在 ∈ [ , ]上连续, [ , (),
11讲 最优控制-极小值-总结及习题讲解
能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
33
最优控制——极小值原理 3.4 极小值原理的典型应用
月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用
时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29
现代控制理论课件-第六章 极小值原理
⑴ 满足正则方程
x*
k
1
H
x*
k
,u* k ,* k 1
k
1,k
f x* k ,u* k ,k
*
k
H
x*
k
,u* k ,* xk
k
1,k
⑵ 相对于最优控制,哈密尔顿函数达极小值,即
H x* k ,u* k ,* k 1,k H x* k ,uk ,* k 1,k
⑶ 及满足以下边界条件及横截条件
x*
0
x0,*
N
x* N ,N x N
同理,对不同的边界情况,只需选取相应的边界条 件及横截条件,条件1、2不变。当控制变量不受限 制时,则条件2与控制方程
等效。
H
x*
k ,u* k ,* uk
k
1,kபைடு நூலகம்
0
§ 6.3 极小值原理解最短时间控制问题
一般情况下,非线性受控系统的最短时间控制问题的 解析解是很困难的,本节只讨论线性定常受控系统的 最短时间控制问题。
比较上述极小值原理与变分法所得的结果,可以发现 两者的差别仅在⑵。 极小值原理的严格证明很复杂,下面的证明将重于物 理概念的阐述,尽量避免烦琐的数学推导。 设系统动态方程为:
xt f xt,ut,t
边界条件为:xt0 x0 ,为简单起见,假设终端时刻 t f
及终端状态 x t f 均为自由。控制变量 ut 受有界闭集 约束,即 utU
性能指标为:
J x
tf
,t f
tf t0
F
xt,ut,t dt
则使性能指标 J 达到极小的最优控制 u* t 及最优状态 轨线 x* t 必须满足以下条件:
5 最优控制-极小值原理
正常(或平凡)情况、奇异(或非平凡) 正常(或平凡)情况、奇异(或非平凡)情况
Bang-Bang控制原理 控制原理 是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t ), ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立 除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件 极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
(50) ) (51) ) (52) )
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律: 哈密顿函数沿最优轨线随时间的变化规律:
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出 用变分法求解最优控制时, 用变分法求解最优控制时,认 不受限制。 为控制向量 u(t )不受限制。但是 实际的系统, 实际的系统,控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。 某种限制的。
因此, 因此,应用控制方程 ∂H = 0
极小值原理最优控制 现代控制理论 教学PPT课件
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u , x(0) 1
求 u ,要求 u 1,并使
1
J 0 x(t)dt
取最小值。 解 使用变分法求解,取哈密顿函数
H x (x u)
则有
H x 1, (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时,可以采用离散变分法求解离散系统的最优控制问题,得到离 散极值的必要条件,即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0
与
x(t0 ) 是固定的,即 ( x
x) t t0
0 ;如果 t1 与 x(t1) 也是不变的,则
(x
x) t t1
0 ;若
根据则方程 因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件,得
1(1)
x1(1)
第六章 最优控制(2) 现代控制理论
x1(t)
x10
x20t
1t2 2
消去时间变量 t , 可得相应的最优轨线方程为
x1(t)
1 2
x22
(t)
C
(6-256)
在图6-16中用实线表示。
14
由于x2(t)=x20+t随t增大, 故最优轨线行进的方向自 下而上, 如曲线上箭头所示。
15
当 u= -1 时, 状态方程的解为
x2 (t) x20 t
在R-上 在+上
在R+上 到达原点
u 1,1 u 1 u 1, 1 u 0
19
进一步, 可综合为
u 1 当(x1, x2 ) R u 1 当(x1, x2 ) R
u 0 当(x1, x2 ) 0
若将开关曲线方程写成
h (x1, x2 )
x1
1 2
x2
x2
0
则最优控制律可表示成
x2 (t) u(t)
或写成矩阵形式
x(t)
0 0
1 0
x(t)
10u(t
)
初始条件 x(t0) x0
(6-248)
终端条件 x(t f ) 0
控制约束 1 u(t) 1, (t0 t t f )
性能指标
J
t f
t0
1 dt
求 最 优 控 制 u*(t) , 把 系 统 从 初 态 转 移 到 终 态 , 使
x1(t)
x10
x20t
1 2t2Fra bibliotek相应的最优轨线方程为
x1(t)
1 2
x22
(t)
C
在图6-16中用虚线表示。由于x2(t)随t减小, 故 曲线箭头方向自上而下。
现代控制理论第六章
式中,δx(t) 为宗量函数x(t)的变分, L[x(t), δx(t)] 是 δx(t) 的线性连续泛函,o[ x(t), δx(t)] 是关于 δx(t) 的高阶无穷 小,则定义泛函增量的线性主部
δJ = L[ x(t), δ x(t)]
(6-19)
为泛函 J[ x(t)] 的变分,记作 δJ 。若泛函有变分,则 称该泛函可微。
物体的升降速度,则上式可写成状态方程
& x1 (t) = x2 (t)
& x2 (t) = u(t) − mg
x 其初始条件是 x1 (t0 ) = x10 , 2 (t0 ) = x20 。现需寻找 一个能使物体以最短时间从初态 ( x10,x20 ) 到达终态 (0,0)的控制u(t)。定义系统的性能指标为
1. 始端时刻和终端时刻固定时的泛函极值问题
首先讨论不仅初始时刻 t0 、终端时刻 t f 固定,而 且初始状态 x(t 0 ) = x0 、终端状态 x(tf ) = xf固定这一最 简单情况下无约束条件的泛函极值问题(最优控制的 最优控制的 基本问题)。 基本问题
J = ∫ dt = t f − t0
tf t0
t 式中, t0为起始时刻, f 为终止时刻。要求时间最短, 即使性能指标J最小,这样求得的控制即为最优控制 u *(t) 。
2. 搅拌槽问题 设有一盛放液体的连续 搅拌槽,如图6-2所示。槽内 装有不停转动着的搅拌器S, 使液体经常处于完全混合状 态,槽中原放 0o C 的液体。 现需将其温度升高,为此在 入口处送进一定量的液体, 其温度为u(t),出口处流出 等量的液体,以保持槽内液
由式(6-20)得
∂ (J[x(t) + εδx(t)]) = ∂ ∫tt0f [x(t) + εδx(t)]2 dt ∂ε ∂ε ε =0
最优控制极小值
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
(2·1—11) 方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导 出的欧拉方程,分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件,式中n维矢量 λ (t )叫做协状态矢量 方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵, 即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和 分别是r维和q维的。根据泛函取极值的必要条件,J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
(2.1—2) 、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
(2.1—4) 该函数称做哈米尔等函数。利用这个函数,方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt
极小值原理——精选推荐
§ 7. 3 极小值原理极小值原理是前苏联数学家庞特里亚金首提. 是变分法的延伸和推广,亦称极大值原理是解决控制和状态受约束最优控制问题的有力工具. 极小值原理的一种表述及其应用(不证) 1. 极小值原理 定理7.3 设==00()[(),(),],()xt f x t u t t x t x , 指标=+⎰0[(),(),]d [()]Tt J F x t u t t t S x T ,约束∈()()u t U 容许控制集,Hamilton 函数=+(,,,)[,,][,,]TH x u λt F x u t λf x u t ,则*()u t 是最优控制的必要条件是:*()u t 和相应的*()x t , *()λt 满足系统方程,∂=∂H x λ; (7.16)伴随方程,∂=-∂H λx; (7.17) 极值条件,******≤∈[,,,][,,,],,H x u λt H x u λt u u U ;(7.18)边界条件,∂=∂()()x T SλT x 。
(7.19)对(7.12)~(7.15’),改变的只是极值条件和边界条件。
说明:1) 只有*()u t 才能使Hamilton 函数为全局最小(故名)若无控制约束, 则有∂∂=/0H u .2)边值条件自然含=00()x t x →确定状态和伴随向量. 3)非充要条件。
对线性系统,条件是充要的。
4)解题步骤类似§2中用变分法<1> 作Hamilton 函数→极值条件→待定u (t ); <2> 若伴随方程中无x ,则求出λ;<3>若待定最优控制中不含x →即已求得()u t ;(否则就要解规范方程组),<4>求出,x J **(若要计算)。
2. 自由终端状态的最优控制举例例 7.5 求状态方程为==,(0)1xu x , 指标为=⎰1min ()d J x t t ,控制约束为()[1,1]u t ∈-,的最优控制。
最优控制第六章极小值原理
以 w u,w * u*代入上式,便得
H x*, *,u,t H x*, *,u*,t
(35)
上式表明,如果哈密尔顿函数H看成 utU 的
函数,那么最优轨迹上与最优控制u*(t)相对应的
H将取绝对极小值(即最小值)。这是极小值原理的
一个重要结论。
定理 设系统状态方程为
xt0 x0
Nxt f ,t f 0
(48)
这就是著名的极小值原理。
下面对定理作些说明: 1) 定理的第一、第二个条件,即式(41)~式
(44),普遍适用于求解各种类型的最优控制问题, 且与边界条件形式或终端时刻自由与否无关。其
中,第二个条件:min H x*, *,u,t H x*, *,u*,t uU
(45)
u u
3) H函数在最优轨迹终点处的值决定于
H
Φ
T
N
0
(46)
t f
t f tt f
4) 协态终值满足横截条件
t f
Φ
x
t
f
N T
x t f
tt f
(47)
5) 满足边界条件
J1
Ψ
x T
Ψ x
Φ t f
N T t f
tt f
t f
d xT
tf
Φ
x
N T x
Ψ x
t t
f
wT
Ψ w tt f
zT
Ψ z
tt f
10讲 最优控制-极小值-燃料能量最优
能源与动力学院系统控制与仿真研究室
15
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
31
最优控制——极小值原理 3.4 极小值原理的典型应用
时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
32
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
33
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
v h g
月球
k 0
能源与动力学院系统控制与仿真研究室
23
最优控制——极小值原理 3.4 极小值原理的典型应用
x 2 1 x 1 x 2 u g x3 3 x 1 u k
能源与动力学院系统控制与仿真研究室 24
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
10
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
肖玲斐 lf i @ lfxiao@ d
王孝武主编《现代控制理论基础》(第3版)第6章课件
由伴随方程 H 0
x
const
(t
f
)
x(t
f
)
1 2
cx2 (t
f
)
cx(t
f
)
因为 const
(t) (t f ) cx(t f )
由控制方程
H u 0
u
即
u* (t) cx(t f )
将 u* 代入状态方程 x u cx(t f )
解为 x(t) cx(t f )(t t0 ) c1
(7)
其中,x 为n 维状态向量; u 为r 维控制向量; f 为n 维向量函数。
要求在控制空间中寻求一个最优控制向量 u(t),使以下性能指标
J [x(t f )] t f L(x, u,t) d t t0
沿最优轨线 x(t)取极小值。
(8)
(性能指标如(8)式所示的最优控制问题,是变分法中的波尔扎 问题)
当 t t0 时,代入上式,求得 c1 x(t0 ) ,所以
x(t) cx(t f )(t t0 ) x(t0 )
当 t t f 时,
x(t
f
)
1
x(t0 ) (t f
t0
)
最优性能指标为
J
*
1 2
cx2
(t
f
)
1 2
tf t0
u2 d t 1 cx2 (t0 ) 2 1 c(t f t0 )
(10)
则 J [x(t f )] t f [H (x, u, λ,t) λT (t)x]d t
t0
[x(t f )] t f H (x, u, λ,t) d t t f λT (t)x d t
t0
最优控制 第6章 最优控制的计算方法
δJ = φ[ X (t f ) + δX (t f ), t f ] − φ[ X (t f ), t f ] + ∫ {H [ X + δX , U + δU , X , t ]
t0
tf
− H [ X , U , λ , t ] − λ [ f ( X + δX , U + δU , t ) − f ( X , U , t )]}dt
δJ = J [U + δU ] − J [U ] = φ[ X (t f ) + δX (t f ), t f ] − φ[ X (t f ), t f ]
+ ∫ F [ X + δX , U + δU , t ] − F [ X , U , t ]dt
t0 tf
(6-7)
哈密顿函数为:
H [ X , λ , U , t ] = F [ X , U , t ] + λT f [ X , U , t ]
§6.1 直接法
一、梯度法
给定系统的状态方程:
& = f [ X (t ), U (t ), t ] X
初始条件:
(6-1) (6-2)
X (t 0 ) = t0
以及性能泛函: J [U (t )] = φ[ X (t f ), t f ] + 终端时刻 t f 给定, X (t f ) 自由。
∫
tf
t f ∂H ∂φ T t ] δX (t f ) − [λT (t )δX ]t0f + ∫ [ ] δUdt t0 ∂U ∂X (t f ) T
(6-11)
考虑边界条件 则(6-11)变为
极小值原理
综上可得: c 最优控制为u (0) x ( 0) 1 2c c c * u (1) x(1) x(0) 1 c 1 2c 最优轨迹为x* (0) x0
*ห้องสมุดไป่ตู้
1 c x (1) x(0) 1 2c 1 1 x* (2) x(1) x(0) 1 c 1 2c
2)求 (t )以确定u的切换点 H 由协态方程 (1 )得+=- ,其解为=- +Ce t 1 1 x 当t f 1时 (t f ) (1) 0, C e, 故切换点:令 1, 得t 1 ln 2 0.307
二、补充说明
1、式H [ x* (t ), u * (t ), * (t ), t ] H [ x* (t ), u (t ), * (t ), t ] 说明当u (t )和u (t )都从容许的有界集中取 值时,
现代控制理论 第6章 最优控制(录像)2(极小值 [1]加了二次型
min H
uU
min uT BT
u( t ) SGN( BT )
得:
ui( t )sgn ( BT ) i ,i1,2, ,r
1 a 0
其中函数sgn a
0
a0
1 a 0
a为向量时用SGN表示。
总目录 返回 上一页 下一页
6.8 极小值原理
经典变分法
x Hx,u, ,t , Hx,u, ,t , Hx,u, ,t 0
x
u
状态方程
伴随方程
控制方程
应用范围:
u无约束, 且H对u连续可微 难满足
一般 ui Mi ( i 1,2 m ) 更一般控制u(t)受不等式约束:
gxt ,u(t),t 0
总目录 返回 上一页 下一页
t
u 切换时刻
总目录 返回 上一页 下一页
6.10.2 状态轨线及开关曲线
x* t 12.3
1
0 0.307
1
0.5
t 0 0.307
6.44
5
1 t 0 0.307 1 t
总目录 返回 上一页 下一页
例6.8.2 已知系统 x1t x1t ut x10 1
x2 t x1t
x2 0 0
其中 ut 1 ,若x t f 自由,求u* t 使
J x2 1 min
由正则方程组: x Ax Bu
H AT
x
(
t
)
e
AT t
(
0
)
e
AT t 0
u( t ) SGN( BT ) SGN( BT e ATt0 )
1.时间控制是Bang-Bang控制,即开关控制;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
*Βιβλιοθήκη TΨ x Ψ x , ,
* *
*
, w, z *T x Ψ x * , * , * , x * , w* , z * *T x * 0 ,x
即 E H x * , * , w, t H x * , * , w* , t 0
若g中不包含x,则为
(42)
H x
(43)
2) 在最优轨迹上,与最优控制u*相应的函数取
绝对极小值,即
min H x , , u, t H x , , u , t
* * * * * uU
(44)
或
H x * , * , u, t H x * , * , u * , t
Ψ Φ N T T J 1 Ψ x t f x t f t f t t f
Φ N T Ψ T T Ψ d x t f w x x t t w x f Ψ z z
Φ N T Ψ T 故 J x d x t f x x t t x f
Ψ x x
T
t t f
t f
tf
t0
Ψ d Ψ x d t (13) x d t x
Φ N T T T Ψ d x t f x x t t x x f
t t f
tf
t0
Ψ d Ψ x dt x d t x
T
注意到 d x t f x t f x t f t f
tf t0
(4)
式中,Φ和L——连续可微的矢量函数 tf——待定终端时刻。 最优控制问题就是要寻求最优容许控制u(t)在 满足上列条件下,使J为极小。
与前面讨论过的等式约束条件最优控制问题作
一比较,可知它们之间的主要差别在于:这里的控
制u(t)是属于有界闭集U,受到不等式g[x(t), x(t),t]≥0 约束。为了把这样的不等式约束问题转化为等式约 束问题,采取以下两个措施:
1) 欧拉方程
Ψ d Ψ 0 x d t x Ψ d Ψ 0 即 w d t w Ψ d Ψ 0 即 z d t z d Ψ 0 d t w d Ψ 0 d t z
(17)
(18)
(19)
2) 横截条件
Ψ Φ N T Ψ xT 0 x t f t f t t f
N xt f , t f 0
式中N——q维连续可微的矢量函数,q≤n。
(2)
控制 ut R r 受不等式约束
gxt , ut , t 0
式中g——l维连续可微的矢量函数,l≤r。
(3)
性能泛函
J Φ xt f , t f Lxt , u t , t d t
(20)
Φ N T Ψ 0 x x t t x f
(21)
Ψ w Ψ z
0
t t f
(22)
0
t t f
(23)
Ψ ,便得到 将 Ψ 代入式(17),并注意到 x
1) 欧拉方程
H g x x
的必要条件。为使最优解为极小,则还必须满足维
尔特拉斯 E 函数沿最优轨迹为非负的条件,即
E Ψ x , w , z , x, w, z Ψ x , w , z , x , w , z
* * * * * * * * *
xx
* T
Ψ w* w x
gxt , ut , t 0
在这种情况下,控制方程 H u 0 已不成立, 所以不能再用变分法来处理最优控制问题。
一、连续系统的极小值原理
设系统状态方程为
xt f xt , ut , t
(1)
初始条件为x(t0)=x0,终态x(tf)满足终端约束方程
tf t0
(39)
取哈密尔顿函数为
H Lx, u, t f x, u, t
T
(40)
则实现最优控制的必要条件是,最优控制u*、
最优轨迹x*和最优协态矢量λ*满足下列关系式:
1) 沿最优轨线满足正则方程
H x
(41)
H g T x x
恒有
Ψ Ψ 0 w z
(32)
Ψ 3) 若将 Ψ 代入 0 ,则得 w
H g T 0 w w
即
H g T u u
这表明在有不等式约束情况下,沿最优轨迹
H 0 这个条件已不成立。 u
值得指出的是,式(24)~式(30)只给出了最优解
T
t t f
t t f
tf
t0
T Ψ d Ψ T d Ψ T d Ψ w z x d t (16) x d t x d t w d t z
由于δtf、δxT(tf)、δx、δw、δz都是任意的, 于是由δJ1=0可得增广性能泛函取极值的必要条件, 是下列各关系式成立。
(47)
5) 满足边界条件
xt 0 x0
N xt f , t f 0
这就是著名的极小值原理。
(48)
下面对定理作些说明: 1) 定理的第一、第二个条件,即式(41)~式 (44),普遍适用于求解各种类型的最优控制问题, 且与边界条件形式或终端时刻自由与否无关。其
T tf t0
(10)
现在求增广性能泛函J1的一次变分
J1 J t J x J w J z
f
(11)
式中 J t f、δJx、δJw、δJz分别是由于tf、x、w、z 作微小变化所引起的J1的变分。
J t
f
t f
Φ T N t f t f Ψ d t t f t f t t f
T
(24)
d H g T d t w w
0
(25)
d T z 0 dt
(26)
2) 横截条件
Φ N T H 0 t f t f t t f
(27)
Φ N T 0 x x t t f H g T w w 0 t t f
为简便计,令
Ψ x, x, w, , , z, t H x, w, , t T x T g x, w, t z 2
(9)
于是J1可写成
J 1 Φ xt f , t f N xt f , t f Ψ x, x, w, , , z, t d t
T
Ψ * zz w
T
Ψ 0 z
(33)
Ψ Ψ Ψ 0, 0, 和 由于沿最优轨线有 w x z
z 2 g x, w, t ,所以上式可写成 并且
Ψ x , , , x, w, z Ψ x , , , x , w , z x x
H g u u
T
(45)
沿最优轨迹,有
3) H 函数在最优轨迹终点处的值决定于
Φ T N 0 H t f t f t t f
4) 协态终值满足横截条件
(46)
Φ N T t f xt f xt f t t f
(12)
Φ N T Ψ t f t f t f t t f
T J x d x t f Φ N x
T
t t f
tf
t0
T Ψ T Ψ x x dt x x
tf t0
H x, w, , t T x T g x, w, t z 2 d t (7)
的极值问题。
哈密尔顿函数为
H x, w, , t Lx, w, t f x, w, t
T
(8)
T
Ψ J w w t f w
T
t t f
tf
t0
d Ψ w dt d t w
T
(14)
Ψ J z z t f z
T
t t f
tf
t0
d Ψ z dt d t z
T
(15)
把式(12)~式(15)代入式(11),最后得
(34)
u , * u * w 以w 代入上式,便得
H x , , u, t H x , , u , t
* * * * *
(35)
上式表明,如果哈密尔顿函数H看成 ut U 的
函数,那么最优轨迹上与最优控制u*(t)相对应的
H将取绝对极小值(即最小值)。这是极小值原理的 一个重要结论。
1) 引入一个新的r维控制变量w(t),令
wt ut , wt 0 0
(5)
虽然u(t)不连续,但w(t)是连续的。若u(t)分段 连续,则u(t)是分段光滑连续系统。