最优控制第四章极小值原理及其应用.ppt
合集下载
最优控制理论课件
8
最优控制问题
1.1 两个例子
例1.1 飞船软着陆问题
软着陆 过程开 始时刻 t 为零
h& v
v& u g m
m& K u
m 飞船的质量 h 高度 v 垂直速度 g 月球重力加速度常数 M 飞船自身质量 F 燃料的质量 K 为常数
初始状态 h(0) h0 v(0) v0 m(0)MF
f(x(t),u(t),t) 为n维向量函数
22.03.2020
现代控制理论
24
最优控制问题
1.2 问题描述
(1) 状态方程 一般形式为
x&(t) f (x(t),u(t),t)
x(t) Rn
x(t)|tt0 x0
为n维状态向量
u(t) Rr
为r 维控制向量
f(x(t),u(t),t) 为n维向量函数
求解最优控制的变分方法
泛函与函数的几何解释
22.03.2020
现代控制理论
50
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
22.03.2020
现代控制理论
51
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
泛函的增量 J ( x ( g ) ) J ( x ( g ) x ) J ( x ( g ) ) L ( x , x ) r ( x , x )
J x ( T ) ,y ( T ) ,x & ( T ) ,y & ( T ) x & ( T )
控制
(t)
22.03.2020
现代控制理论
最优控制
j 1,2......r
g:p ×1维函数向量
t f : 自由
dt t f t0
t0
tf
问题:寻求最优控制u*(t),使系统由初态到终态, 目标函数J 为最小
步骤: ⑴列写哈密顿函数 H x(t ), u (t ), (t ), t
应用最小值原理进行问题的求解
1 T (t ) f x(t ), t Bx(t ), t u (t ) 1 T (t ) f x(t ), t T (t ) Bx(t ), t u (t )
q:r ×1维向量函数
_
H [ X (t ), (t ), U (t )] max H [ X * (t ), (t ), u (t )]
* * u (t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。
4、 极小值原来是求取最优控制的必要条件,非充分条件。
即:满足极小值原理不一定J取极小值,需进一步判断。
[
g T [ X (t f , t f )] X (t f )
]
tf
g T ( ) 0 t f t f
3、与 U * (t ) 对应的哈密顿函数H取极小值。
H [ X * (t ), U * (t ), * (t ), t ] min H [ X * (t ), U (t ), * (t ), t ]
0
tf
J [U ] H
u0 u u 2
U 0 U1 0 1
U
U2
u
若采用经典变分: H 0,U * U1; 实际应为U * U 0。极小值原理。
现代控制理论极小值原理
x*
0
x0,*
N
x* N ,N x N
同理,对不同的边界情况,只需选取相应的边界条件及横截条件,条件1、2不变。 当控制变量不受限制时,则条件2与控制方程
等效。
H
x* k ,u* k ,** k uk
1,k
0
第24页/共62页
第三节 极小值原理解最短时间控制问题
一般情况下,非线性受控系统的最短时间控制问题的解析解是很困难的,本节 只讨论线性定常受控系统的最短时间控制问题导弹舵面的打开时间。
比较上述极小值原理与变分法所得的结果,可以发现两者的差别仅在⑵。 极小值原理的严格证明很复杂,下面的证明将重于物理概念的阐述,尽量避免烦琐 的数学推导。 设系统动态方程为:
xt f xt,ut,t
(8-7)
边控界制条变x件量为t f :受有x界t闭0,集为约简x束0单,起即见,假设u终t端时刻 及终端状态 utU
t0
我们应用极小值原理来求解。这时哈密尔顿函数为
H x,u,t 1 T tAxt T tBut
故得正则方程为
x* t Ax* t Bu* t * t AT* t
第27页/共62页
根据极小值原理可得
1 *T t Ax* t *T tBu* t 1 *T t Ax* t *T tBut
即
本章介绍的极小值原理是控制变量 受限制的u情t况下求解最优控制问题的有力工
具。它是由苏联学者庞特里亚金于1956年提出的。极小值原理从变分法引伸而来, 它的结论与古典变分法的结论极为相似,但由于它能应用于控制变量 受边界限 制的情况,并不要求哈密尔顿函数H对u连续可微,因此其适用范围扩大了。
ut
L.S.Pontryagin
极小值原理最优控制 现代控制理论 教学PPT课件
极小值原理
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u , x(0) 1
求 u ,要求 u 1,并使
1
J 0 x(t)dt
取最小值。 解 使用变分法求解,取哈密顿函数
H x (x u)
则有
H x 1, (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时,可以采用离散变分法求解离散系统的最优控制问题,得到离 散极值的必要条件,即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0
与
x(t0 ) 是固定的,即 ( x
x) t t0
0 ;如果 t1 与 x(t1) 也是不变的,则
(x
x) t t1
0 ;若
根据则方程 因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件,得
1(1)
x1(1)
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u , x(0) 1
求 u ,要求 u 1,并使
1
J 0 x(t)dt
取最小值。 解 使用变分法求解,取哈密顿函数
H x (x u)
则有
H x 1, (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时,可以采用离散变分法求解离散系统的最优控制问题,得到离 散极值的必要条件,即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0
与
x(t0 ) 是固定的,即 ( x
x) t t0
0 ;如果 t1 与 x(t1) 也是不变的,则
(x
x) t t1
0 ;若
根据则方程 因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件,得
1(1)
x1(1)
最优控制ppt课件
称 J (X ) 在 XX*处有极值(极大值或极小值)。
精品课件
定理(变分预备定理):设 ( t )
是时间区间
[t0, t1]上连续的n维向量( t函) 数,
的连续n维向量函数(t,0)且(t1)0
有
t1
T
(t)(t)dt
,若
0
t0
是任意
则必有
(t)0,t[t0,t1]
精品课件
4.1.2 欧拉方程
LX,XrX,X
这里,LX,X 是X 的线性泛函,rX,X 是关于 X
的 高阶无穷小,则
JLX,X
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
精品课件
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。
定理 设J[x]是线性赋范空间Rn上的连续泛函
返回主目录
精品课件
在动态系统最优控制问题中,性能指标是 一个泛函,性能指标最优即泛函达到极值。解决泛 函极值问题的有力工具是变分法。所以下面就来列 出变分法中的一些主要结果,大部分不加证明,但 读者可对照微分学中的结果来理解。
精品课件
4.1.1 泛函与变分
先来给出下面的一些定义。
1、泛函: 如果对某一类函数X(t)中的每一个函
(1) (L1 L2 ) L1 L2
(2) ( L1L2 ) L2 L1 L1 L2
b
b
(3) a L[ x, x, t]dt a L[ x, x, t]dt
(4) dx d x
dt dt 精品课件
举例:
可见,计算泛函的变分如同计算函数的微分一样。
精品课件
6、泛函的极值:若存在 0 ,对满足的 X X* 一切X,J(X)J(X*)具有同一符号,则
精品课件
定理(变分预备定理):设 ( t )
是时间区间
[t0, t1]上连续的n维向量( t函) 数,
的连续n维向量函数(t,0)且(t1)0
有
t1
T
(t)(t)dt
,若
0
t0
是任意
则必有
(t)0,t[t0,t1]
精品课件
4.1.2 欧拉方程
LX,XrX,X
这里,LX,X 是X 的线性泛函,rX,X 是关于 X
的 高阶无穷小,则
JLX,X
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
精品课件
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。
定理 设J[x]是线性赋范空间Rn上的连续泛函
返回主目录
精品课件
在动态系统最优控制问题中,性能指标是 一个泛函,性能指标最优即泛函达到极值。解决泛 函极值问题的有力工具是变分法。所以下面就来列 出变分法中的一些主要结果,大部分不加证明,但 读者可对照微分学中的结果来理解。
精品课件
4.1.1 泛函与变分
先来给出下面的一些定义。
1、泛函: 如果对某一类函数X(t)中的每一个函
(1) (L1 L2 ) L1 L2
(2) ( L1L2 ) L2 L1 L1 L2
b
b
(3) a L[ x, x, t]dt a L[ x, x, t]dt
(4) dx d x
dt dt 精品课件
举例:
可见,计算泛函的变分如同计算函数的微分一样。
精品课件
6、泛函的极值:若存在 0 ,对满足的 X X* 一切X,J(X)J(X*)具有同一符号,则
最优控制
已知x(t0)=x0, 拉方程和横截条件
* x x(tf)=xf ,则极值曲线 (t ) 应满足如下欧
F d F ( )0 x dt x F F ( )t t f x(t f ) ( )t t0 x(t0 ) 0 x x
其中,
T (t ), t ) L(( x(t ), x(t ), , t )) g ( x(t ), x(t ), t ) f ( x(t ), x
如果t0也自由、x(t0)受约束,即沿着曲线g(t) 则应满足以下横截条件
x(t0 ) g (t0 ) x(t f ) c(t f ) * * T L L ( x , x , t ) ( g x ) 0 t 0 x * * T L L ( x , x , t ) ( c x ) 0 t f x
vdu
t0
tf
J ( )xdt x t t x x dt x
F
d F
F
tf
(4)
0
J取极值的必要条件是 J 等于零。因 x 是 任意的,要使(3-2)中第一项(积分项)为 零,必有
F d F ( )0 x dt x
4.1.1
标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面就来列出变 分法中的一些主要结果,大部分不加证明,但读者 可对照微分学中的结果来理解。
4.1.1 泛函与变分
先来给出下面的一些定义。 1、泛函: 如果对某一类函数X (t )中的每一个函 数 X (t ),有一个实数值J 与之相对应,则称J 为依赖于 函数 X (t ) 的泛函,记为
最优控制ppt第四章
第四章 极小值原理及其应用
4.1 经典变分法的局限性 4.2 连续系统的极小值原理 4.3 最短时间控制问题 4.4 最少燃料控制问题 4.5 离散系统的极小值原理 4.6 小结
4.1 经典变分法的局限性
上面我们用经典变分法解最优控制问题时,得出了 最优性的必要条件
H 0 U
在得出这个条件时,作了下面的假定:
两式相减可得这一段的 X (t)
t
X (t)
[ f (X ,U U,t) f (X ,U ,t)]dt
(4-6)
t1
可以对 X (t) 的大小作估计
X (t)
max t1 tt1
f (X ,U U,t)
f (X ,U ,t) (t t1 )
由于 是微量,所以 X (t) 也是微量,因而在精确
到一阶微量的情况下,下式成立
f (X ,U
U )
f (X ,U
U ) f
X
|X X
X
(4-7)
将式(4-7)代入(4-6),并注意到微量 X 在
微小时间间隔上的积分是高阶微量,即得
X (t) t [ f (X ,U U,t) f (X ,U ,t)]dt t1
X (t0 ) X 0
(4-2)
控制向量 U (t) Rm,并受下面的约束
U
(4-3)
末值状态必须满足的约束条件为
G X (t f ),t f 0
性能指标函数为
J X (t f ),t f TG X (t f ),t f
其中 Rn 为待定列向量。
(4-4) (4-5)
H
H
H
u*
u u* u0
u u*
u
(a)
4.1 经典变分法的局限性 4.2 连续系统的极小值原理 4.3 最短时间控制问题 4.4 最少燃料控制问题 4.5 离散系统的极小值原理 4.6 小结
4.1 经典变分法的局限性
上面我们用经典变分法解最优控制问题时,得出了 最优性的必要条件
H 0 U
在得出这个条件时,作了下面的假定:
两式相减可得这一段的 X (t)
t
X (t)
[ f (X ,U U,t) f (X ,U ,t)]dt
(4-6)
t1
可以对 X (t) 的大小作估计
X (t)
max t1 tt1
f (X ,U U,t)
f (X ,U ,t) (t t1 )
由于 是微量,所以 X (t) 也是微量,因而在精确
到一阶微量的情况下,下式成立
f (X ,U
U )
f (X ,U
U ) f
X
|X X
X
(4-7)
将式(4-7)代入(4-6),并注意到微量 X 在
微小时间间隔上的积分是高阶微量,即得
X (t) t [ f (X ,U U,t) f (X ,U ,t)]dt t1
X (t0 ) X 0
(4-2)
控制向量 U (t) Rm,并受下面的约束
U
(4-3)
末值状态必须满足的约束条件为
G X (t f ),t f 0
性能指标函数为
J X (t f ),t f TG X (t f ),t f
其中 Rn 为待定列向量。
(4-4) (4-5)
H
H
H
u*
u u* u0
u u*
u
(a)
最优控制极小值
ɺ x= ∂H = f [ x, u , t ] ∂λ
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
(2·1—11) 方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导 出的欧拉方程,分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件,式中n维矢量 λ (t )叫做协状态矢量 方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵, 即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和 分别是r维和q维的。根据泛函取极值的必要条件,J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
(2.1—2) 、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
(2.1—4) 该函数称做哈米尔等函数。利用这个函数,方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
(2·1—11) 方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导 出的欧拉方程,分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件,式中n维矢量 λ (t )叫做协状态矢量 方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵, 即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和 分别是r维和q维的。根据泛函取极值的必要条件,J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
(2.1—2) 、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
(2.1—4) 该函数称做哈米尔等函数。利用这个函数,方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt
第4章 最优控制理论
t0
t* f t f
t f 很小,第二项可用积分中值定理
, t dt F x* t f , x * * t f , t f * t f J x F x* , x
t0 tf t* f
t* f
F x
J
1 T T x ( t ) x ( t ) Q x ( t ) x ( t ) u Ru dt d d 2 t0
二次型性能指标,工程中应用最为广泛
• 性能指标,泛函,即函数的函数
按数学形式
积分型 拉格朗日问题 终值型 迈耶耳问题 混合型 波尔扎问题
* *
tf
x
t0
f * , t d F x* , x * , t *, t F x* , x dJ F x* , x dt d 0 t x dt x x t 0
t
tf
0
t0 t f 0 以及极值条件
2.固定边界的泛函极值
t , t dt 积分型,Langrange问题 设泛函 J x F x t , x
xR
tf t0
分部积分法
udv uv
a b
b
b a
vdu
a b b
b
在 t0 , t f 连续二次可导
xt0 x0 xt f x f
2015年11月
§4.0 概述
研究:针对一个控制系统(被控对象),在给定一个性能指标下,
如何选择控制规律,使性能指标达到最优(极小)。
• 问题描述
动态系统: 初始状态:
如何选取容许控制域或最优控制
t* f t f
t f 很小,第二项可用积分中值定理
, t dt F x* t f , x * * t f , t f * t f J x F x* , x
t0 tf t* f
t* f
F x
J
1 T T x ( t ) x ( t ) Q x ( t ) x ( t ) u Ru dt d d 2 t0
二次型性能指标,工程中应用最为广泛
• 性能指标,泛函,即函数的函数
按数学形式
积分型 拉格朗日问题 终值型 迈耶耳问题 混合型 波尔扎问题
* *
tf
x
t0
f * , t d F x* , x * , t *, t F x* , x dJ F x* , x dt d 0 t x dt x x t 0
t
tf
0
t0 t f 0 以及极值条件
2.固定边界的泛函极值
t , t dt 积分型,Langrange问题 设泛函 J x F x t , x
xR
tf t0
分部积分法
udv uv
a b
b
b a
vdu
a b b
b
在 t0 , t f 连续二次可导
xt0 x0 xt f x f
2015年11月
§4.0 概述
研究:针对一个控制系统(被控对象),在给定一个性能指标下,
如何选择控制规律,使性能指标达到最优(极小)。
• 问题描述
动态系统: 初始状态:
如何选取容许控制域或最优控制
高等教育《最优控制理论》课件 第四章
f
t0
& { F [ x ( t ), ω ( t ), t ]
& & & & + λ T [ f ( x , ω , t ) − x ] + Γ T [ G ( x , ω , t ) − Z 2 ]} dt
令哈密而顿函数为
& & & H ( x , ω , λ , t ) = F ( x , ω , t ) + λT f ( x , ω , t )
拉格朗日纯量函数
& & & & & & & Φ ( x , x , ω , z , λ , Γ , t ) = H ( x , ω , λ , t ) − λT x + Γ T [G ( x , ω , t ) − Z 2 ]
则
t
J a = θ [ x ( t f ), t f ] + v M [ x ( t f ), t f ] +
M为q 维连续可微向量函数, q ≤ n 性能指标:
J = θ [ x ( t f ), t f ] +
∫
t
f
t0
F [ x ( t ), u ( t ), t ] dt
最优控制问题就是要寻找最优容许控制u(t)使J为极小
令
& ω (t ) = u (t ) ω (t 0 ) = 0
Z T (t ) = [ z1 (t ), z 2 (t ),L z m (t )] & 且 [ Z (t )]2 = G[ x(t ), u (t ), t ] Z (t0 ) = 0
M [ x ( t f ), t f ] = 0
最优控制
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。 定理 设J[x]是线性赋范空间Rn上的连续泛函, 若在x= x0处J[x]可微,则J[x]的变分为
J [ x0 , x] J [ x0 x]
(t ) Rn 是待定拉格朗日乘子。 为拉格朗日函数,
4.1.3 横截条件
(1)
末端时刻固定时的横截条件
F ( ) t t f x(t f ) 0 x
当tf 固定时,在x(t0)=x0 固定时,横截条件为
x(t0)=x0
如果末端状态也固定x(tf)=xf 时,边界条件退化为x(t0)=x0, x(tf)= xf ;当末端状态自由时,横截条件为
4、自变量函数的变分: 自变量函数 X (t )的变分 X X 是指同属于函数类X (t )中两个函数X 1 (t ) 、 2 (t ) 之差
X X 1 (t ) X 2 (t )
这里, t 看作为参数。当 X (t ) 为一维函数时,X 可用图4-1来表示。
图4-1 自变量函数的变分
x(t ) x * (t ) x(t )
于是泛函J 的增量 J 可计算如下(以下将*号省去)
J
tf t0
tf t0
F x x, x x, t F x, x, t dt
F F x x o ( x)2 ,( x)2 dt x x
H ( x, u, , t ) L( x, u, t ) T (t ) f ( x, u, t )
(15)
它称为哈密顿(Hamilton)函数,在最优控制中 起着重要的作用。
最优控制全部PPT课件
给定一个线性系统,其平衡状态X(0)=0,设计的目的是保持系统处于平衡状态,即 这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。
线性调节器的性能指标为:
J
tf t0
n
xi 2 (t)dt
i 1
加权后的性能指标为:
J
tf t0
n
qi xi 2 (t)dt
i1
对u(t)有约束的性能指标为: J t f 1 [ X T (t)QX (t) uT (t)Ru(t)]dt
上述由控制约束所规定的点集称为控制域U,凡在t0-tf上有定义,且在控制域U 内取值的每一个控制函数u(t)均称为容许控制。
4:性能指标
通常情况下,最优控制问题的性能指标形如:
J
(x(t f ),t f)
tf t0
F(x(t),u(t),t)dt
其中第一项是接近目标集程度,即末态控制精度的度量,称为末值型性能指标。
第6页/共184页
从工程实际考虑,约束条件为 0 F(t) maxF(t)
如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指标:
J
tf t0
[c1
F (t )]d t
为最小
综上所述,所谓最优防天拦截问题,即选择满足约束条件的控制F(t),驱使系统从初始 状态出发的解,在某个时刻满足终端条件,且使性能指标为极值(极小值)。
第14页/共184页
5:线性跟踪器
若要求状态X(t)跟踪或尽可能接近目标轨迹Xd(t),则这种系统称为状态跟踪器,其相 应的性能指标为:
J
tf t0
1 [ X (t) 2
Xd
(t )] T
Q[ X (t)
chapter4_极小值原理及其应用
n X( t)R
(4-1)
初始条件
X ( t0) X 0
(4-2)
m U ( t ) R 控制向量 ,并受下面的约束
U
(4-3)
终端约束
G X ( t t 0 f), f
指标函数
(4-4)
J X ( t t ( X , U , t ) dt (4-5) f), f F
(4-4)
(4-5)
其中
R
n
为待定列向量。
在本节中,假设函数 fi ( X ,U , t ) ,
X (t f )
f X
i
, , X (t f ), t f
存在且连续,并假定容许控制 U ( t ) 是在控 制域内取值的任何分段连续函数。这时如果选定了某 一容许控制 U ( t ) ,则容易证明在任意的初始条件 下,方程(4-1)唯一的确定了系统状态的 变化规律 X ( t ) ,且 X ( t ) 是连续的和分段可微的。在 t f 这些条件下,我们就定常系统、末值型性能指标、 固定、末端受约束情况下给出极小值原理的简单证明。
庞特里亚金极大值原理却将最优控制与控制域内所 有可能的值进行比较,因而得出结论,在整个控制 域内最优控制使哈密顿函数 H 成为绝对极小值。 正是这个性质使得庞特里亚金极大值原理成为寻找 最优控制的有力工具。但是这样, U ( t ) 的改变量 U 必须看成有限量,而不再是微量。如果让改变的时 间很短,则由此引起的最优轨线的改变 X 仍是微 量,性能指标的增量 J 也是微量,因而对各关系式 的数学处理仍是比较容易的。
g U ( t ), t 0
当 U (t ) 属于有界闭集,U (t ) 在边界上取值时,U 就不是任意的了,因为无法向边界外取值,这时 就不一定是最优解的必要条件。考察由 图4-1所表示的几种情况,图中横轴上每一点都表 示一个标量控制函数 u,其容许取值范围为 。
(4-1)
初始条件
X ( t0) X 0
(4-2)
m U ( t ) R 控制向量 ,并受下面的约束
U
(4-3)
终端约束
G X ( t t 0 f), f
指标函数
(4-4)
J X ( t t ( X , U , t ) dt (4-5) f), f F
(4-4)
(4-5)
其中
R
n
为待定列向量。
在本节中,假设函数 fi ( X ,U , t ) ,
X (t f )
f X
i
, , X (t f ), t f
存在且连续,并假定容许控制 U ( t ) 是在控 制域内取值的任何分段连续函数。这时如果选定了某 一容许控制 U ( t ) ,则容易证明在任意的初始条件 下,方程(4-1)唯一的确定了系统状态的 变化规律 X ( t ) ,且 X ( t ) 是连续的和分段可微的。在 t f 这些条件下,我们就定常系统、末值型性能指标、 固定、末端受约束情况下给出极小值原理的简单证明。
庞特里亚金极大值原理却将最优控制与控制域内所 有可能的值进行比较,因而得出结论,在整个控制 域内最优控制使哈密顿函数 H 成为绝对极小值。 正是这个性质使得庞特里亚金极大值原理成为寻找 最优控制的有力工具。但是这样, U ( t ) 的改变量 U 必须看成有限量,而不再是微量。如果让改变的时 间很短,则由此引起的最优轨线的改变 X 仍是微 量,性能指标的增量 J 也是微量,因而对各关系式 的数学处理仍是比较容易的。
g U ( t ), t 0
当 U (t ) 属于有界闭集,U (t ) 在边界上取值时,U 就不是任意的了,因为无法向边界外取值,这时 就不一定是最优解的必要条件。考察由 图4-1所表示的几种情况,图中横轴上每一点都表 示一个标量控制函数 u,其容许取值范围为 。
极小值原理
解:为简单计,取 2。问题是要确定最优控 u * (0), u * (1); N 制 最优轨迹x* (1),x* (2)及最优性能泛函 * 2 [ x(0)],先考虑最后一 J 步,即由状态 (1),转移到x(2)这一步。如果采用控制 (1),则有 x u 1 2 1 2 1 2 1 x(2) x(1) u (1), J1[ x(1)] u (1) Cx (2) u (1) c[ x(1) u (1)]2 2 2 2 2 最优控制u (1)应使由状态x(1)出发时J1[ x(1)]为最小,故有 J1[ x(1)] u (1) c[ x(1) u (1)] 0 u (1) cx(1) * c x(1) * x(1) 因此得u * (1) , J 1[ x(1)] , x (2) 1 c 2 1 c 1 c 实际上,它们都是这一 段初始状态x(1)的函数。
综上可得: c 最优控制为u (0) x ( 0) 1 2c c c * u (1) x(1) x(0) 1 c 1 2c 最优轨迹为x* (0) x0
*ห้องสมุดไป่ตู้
1 c x (1) x(0) 1 2c 1 1 x* (2) x(1) x(0) 1 c 1 2c
2)求 (t )以确定u的切换点 H 由协态方程 (1 )得+=- ,其解为=- +Ce t 1 1 x 当t f 1时 (t f ) (1) 0, C e, 故切换点:令 1, 得t 1 ln 2 0.307
二、补充说明
1、式H [ x* (t ), u * (t ), * (t ), t ] H [ x* (t ), u (t ), * (t ), t ] 说明当u (t )和u (t )都从容许的有界集中取 值时,
综上可得: c 最优控制为u (0) x ( 0) 1 2c c c * u (1) x(1) x(0) 1 c 1 2c 最优轨迹为x* (0) x0
*ห้องสมุดไป่ตู้
1 c x (1) x(0) 1 2c 1 1 x* (2) x(1) x(0) 1 c 1 2c
2)求 (t )以确定u的切换点 H 由协态方程 (1 )得+=- ,其解为=- +Ce t 1 1 x 当t f 1时 (t f ) (1) 0, C e, 故切换点:令 1, 得t 1 ln 2 0.307
二、补充说明
1、式H [ x* (t ), u * (t ), * (t ), t ] H [ x* (t ), u (t ), * (t ), t ] 说明当u (t )和u (t )都从容许的有界集中取 值时,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
M [x(t f ), t f ] 0
M为q 维连续可微向量函数, q n
性能指标:
J [x(t f ),t f ]
t f F[x(t),u(t),t]dt
t0
最优控制问题就是要寻找最优容许控制u(t)使J为极小
令
(t) u(t) (t0 ) 0
Z T (t) [z1(t), z2 (t),zm (t)] 且[Z(t)]2 G[x(t),u(t),t] Z (t0 ) 0
4-1.连续时间系统的极小值原理
设系统状态方程为:
x(t) f [x(t),u(t),t]
初始条件 x(t0 ) x(0) , x Rn , u R p , Ω为有界闭集,不等式约束为
G[x(t),u(t),t] 0, G为m维连续可微的向量函数, m p
系统从x0转移到终端状态x(tf),tf未给定,终端状态x(tf)满足等式约束
拉格朗日纯量函数
(x, x, , z, , ,t) H (x, , ,t) T x T [G(x, ,t) Z 2 ]
则
Ja [x(t f ),t f ] vT M[x(t f ),t f ]
t f (x, x, , z, , , t)dt
t0
4
对Jα取一阶变分得
Ja
[
t
vT
则最优控制u*(t),最优轨线x*(t)和最优伴随向量λ*(t)必须满足下列条件:
(1).沿最优轨线满足正则方程:
x H
H ( G )T
x x
式中Γ是与时间t无关的拉格朗日乘子向量,其维数与G相同,若G中不包含x,则:
(2)横截条件及边界条件:
H
x
(t
f
)
[
x
M (
x
)T
v]t t
x
d dt
x
0
d dt
0
d dt
z
0
5
横截条件:
[H
t
vT
M t ]t t f *
0
[
x
( M )T v x
x ]t t f *
0
t t f *
0
z
t t f *
0
把Φ的表达式代入欧拉方程:
横截条件:
H ( G )T
x x
d dt
0
d dt
z
0
H
(t
f
*)
[
t
vT
于是,系统方程为:
x f (x, ,t) Z 2 G(x, ,t)
x(t0 ) x0 z(t0 ) 0 (t0 ) 0
终端时刻tf 未给定,终端约束 M [x(t f ), t f ] 0
要求确定最优控制 u 使性能指标
为极小
J [x(t f ),t f ]
t f F[x(t), (t),t]dt
M t ]t t f *
(t
f
*)
[
x
( M x
)T
v] t t
f
*
由欧拉方程和横截条件知,最优轨线
z
0
*
z*
0
6
以上为使性能指标Jα取极值的必要条件,为使性能指标为极小,还必须满足维尔斯 特拉斯函数沿最优轨线非负的条件,即:
E (x*, x, , z, *, *,Βιβλιοθήκη )-λ*(x*
,
x*
M t
] t tt f *
f
[ x
( )T
x
vT
M x
] t t
f
*
x(t
f
*
)
(t
f
*)
z
z(t
f
*)
t f * [( d ) x ( d )T ( d )T z]dt
t0 x dt x
dt
dt z
令 J a 0 可得增广性能指标泛函取极值的必要条件为
欧拉方程
第四章 极小值原理及其应用
用古典变分法解最优控制问题时,假定u(t)不受限制,从而得到最优控制应满足 H 0 u
实际上在工程问题中,控制变量总有一定的限制.
设控制变量被限制在某一闭集内 u
即u(t)满足 G[x(t),u(t),t] 0
满足限制条件的u(t)称为容许控制,由于δu不能是任意的, H 0 的条件已不存在 u
上式表明,沿最优轨线函数H相对最优控制u*(t)取绝对极小值,这是极小值原理的一 个重要结论.
7
由
0
H
(
G
)T
0
H ( G )T
u
u
上式表明,在有不等式约束的情况下,沿最优轨线 H 0 不再成立 u
8
定理:(极小值原理)
设系统的状态方程为
x(t) f [x(t),u(t),t]
控制u(t)是有第一类间断点的分段连续函数,属于p维空间中的有界闭集Ω,满足不 等式约束:
,
*
,
z*
,
*
,
*
,
t
)
(
x
)T
(
x
x*
)
(
*
)(
*)
(
z*
)(z
z* )
0
0
0
或: E (x*, x, , z, *, *, t) *T x
{(x*, x*, *, z*, *, *, t) *x*}
H (x*, *, , t) H (x*, *, *, t) 0
即: H (x*, *, u, t) H (x*, *, u*, t)
u
u
上述条件与不等式约束下的最优控制的必要条件相比较,横截条件及端点边
界条件没有改变,仅
H 0 u
这一条件不成立,而代之以与最优控制相对应的函数为绝对极小,其次是正则 方程略有改变,仅当G中不包含x时, 方程才不改变.
11
当 t0和x(t0)给定,根据tf给定或自由, x(tf)给定,自由或受约束等不同情况下所导 出的最优解必要条件列表如下:
f
[H (x, u, , t)
t
( M t
)T
v]t t f
0
x(t0 ) x0
M [x(t f ),t f ] 0
10
(3)在最优轨线x*(t)上与最优控制u*(t)相对应的H函数取绝对极小值,即
H (x*, *, u*, t) H (x*, *, u, t)
并且沿最优轨线,下式成立
H ( G )T
G[x(t),u(t),t] 0
在终端时刻tf 未知的情况下,为使状态自初态 x(t0 ) x0 转移到满足边界条件
M [x(t f ), t f ] 0的终态,并使性能指标
J [x(t f ),t f ]
t f F[x(t),u(t),t]dt
t0
达极小值.设哈密而顿函数为 H F (x,u,t) T f (x,u,t)
t0
3
引入拉格朗日乘子向量λ及Γ,写出增广性能指标泛函
J a [ x(t f ),t f ] vT M [ x(t f ),t f ]
t f {F[ x(t), (t),t]
t0
T [ f (x, , t) x] T [G( x, , t) Z 2 ]}dt
令哈密而顿函数为
H (x, , ,t) F (x, ,t) T f (x, ,t)
M为q 维连续可微向量函数, q n
性能指标:
J [x(t f ),t f ]
t f F[x(t),u(t),t]dt
t0
最优控制问题就是要寻找最优容许控制u(t)使J为极小
令
(t) u(t) (t0 ) 0
Z T (t) [z1(t), z2 (t),zm (t)] 且[Z(t)]2 G[x(t),u(t),t] Z (t0 ) 0
4-1.连续时间系统的极小值原理
设系统状态方程为:
x(t) f [x(t),u(t),t]
初始条件 x(t0 ) x(0) , x Rn , u R p , Ω为有界闭集,不等式约束为
G[x(t),u(t),t] 0, G为m维连续可微的向量函数, m p
系统从x0转移到终端状态x(tf),tf未给定,终端状态x(tf)满足等式约束
拉格朗日纯量函数
(x, x, , z, , ,t) H (x, , ,t) T x T [G(x, ,t) Z 2 ]
则
Ja [x(t f ),t f ] vT M[x(t f ),t f ]
t f (x, x, , z, , , t)dt
t0
4
对Jα取一阶变分得
Ja
[
t
vT
则最优控制u*(t),最优轨线x*(t)和最优伴随向量λ*(t)必须满足下列条件:
(1).沿最优轨线满足正则方程:
x H
H ( G )T
x x
式中Γ是与时间t无关的拉格朗日乘子向量,其维数与G相同,若G中不包含x,则:
(2)横截条件及边界条件:
H
x
(t
f
)
[
x
M (
x
)T
v]t t
x
d dt
x
0
d dt
0
d dt
z
0
5
横截条件:
[H
t
vT
M t ]t t f *
0
[
x
( M )T v x
x ]t t f *
0
t t f *
0
z
t t f *
0
把Φ的表达式代入欧拉方程:
横截条件:
H ( G )T
x x
d dt
0
d dt
z
0
H
(t
f
*)
[
t
vT
于是,系统方程为:
x f (x, ,t) Z 2 G(x, ,t)
x(t0 ) x0 z(t0 ) 0 (t0 ) 0
终端时刻tf 未给定,终端约束 M [x(t f ), t f ] 0
要求确定最优控制 u 使性能指标
为极小
J [x(t f ),t f ]
t f F[x(t), (t),t]dt
M t ]t t f *
(t
f
*)
[
x
( M x
)T
v] t t
f
*
由欧拉方程和横截条件知,最优轨线
z
0
*
z*
0
6
以上为使性能指标Jα取极值的必要条件,为使性能指标为极小,还必须满足维尔斯 特拉斯函数沿最优轨线非负的条件,即:
E (x*, x, , z, *, *,Βιβλιοθήκη )-λ*(x*
,
x*
M t
] t tt f *
f
[ x
( )T
x
vT
M x
] t t
f
*
x(t
f
*
)
(t
f
*)
z
z(t
f
*)
t f * [( d ) x ( d )T ( d )T z]dt
t0 x dt x
dt
dt z
令 J a 0 可得增广性能指标泛函取极值的必要条件为
欧拉方程
第四章 极小值原理及其应用
用古典变分法解最优控制问题时,假定u(t)不受限制,从而得到最优控制应满足 H 0 u
实际上在工程问题中,控制变量总有一定的限制.
设控制变量被限制在某一闭集内 u
即u(t)满足 G[x(t),u(t),t] 0
满足限制条件的u(t)称为容许控制,由于δu不能是任意的, H 0 的条件已不存在 u
上式表明,沿最优轨线函数H相对最优控制u*(t)取绝对极小值,这是极小值原理的一 个重要结论.
7
由
0
H
(
G
)T
0
H ( G )T
u
u
上式表明,在有不等式约束的情况下,沿最优轨线 H 0 不再成立 u
8
定理:(极小值原理)
设系统的状态方程为
x(t) f [x(t),u(t),t]
控制u(t)是有第一类间断点的分段连续函数,属于p维空间中的有界闭集Ω,满足不 等式约束:
,
*
,
z*
,
*
,
*
,
t
)
(
x
)T
(
x
x*
)
(
*
)(
*)
(
z*
)(z
z* )
0
0
0
或: E (x*, x, , z, *, *, t) *T x
{(x*, x*, *, z*, *, *, t) *x*}
H (x*, *, , t) H (x*, *, *, t) 0
即: H (x*, *, u, t) H (x*, *, u*, t)
u
u
上述条件与不等式约束下的最优控制的必要条件相比较,横截条件及端点边
界条件没有改变,仅
H 0 u
这一条件不成立,而代之以与最优控制相对应的函数为绝对极小,其次是正则 方程略有改变,仅当G中不包含x时, 方程才不改变.
11
当 t0和x(t0)给定,根据tf给定或自由, x(tf)给定,自由或受约束等不同情况下所导 出的最优解必要条件列表如下:
f
[H (x, u, , t)
t
( M t
)T
v]t t f
0
x(t0 ) x0
M [x(t f ),t f ] 0
10
(3)在最优轨线x*(t)上与最优控制u*(t)相对应的H函数取绝对极小值,即
H (x*, *, u*, t) H (x*, *, u, t)
并且沿最优轨线,下式成立
H ( G )T
G[x(t),u(t),t] 0
在终端时刻tf 未知的情况下,为使状态自初态 x(t0 ) x0 转移到满足边界条件
M [x(t f ), t f ] 0的终态,并使性能指标
J [x(t f ),t f ]
t f F[x(t),u(t),t]dt
t0
达极小值.设哈密而顿函数为 H F (x,u,t) T f (x,u,t)
t0
3
引入拉格朗日乘子向量λ及Γ,写出增广性能指标泛函
J a [ x(t f ),t f ] vT M [ x(t f ),t f ]
t f {F[ x(t), (t),t]
t0
T [ f (x, , t) x] T [G( x, , t) Z 2 ]}dt
令哈密而顿函数为
H (x, , ,t) F (x, ,t) T f (x, ,t)