现代控制理论基础图文 (7)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
L d L 2x 2x 0 x d t x
可解得x(t)=C1et+C2e-t,将边界条件代入得 x0=C1+C2
xf=C1etf+C2e-tf 解出积分常数
x f (x, u,t),
x(t) t t0
x(t0 ),
x(t) tt f
x(t f )
(6-29)
其中,x为n维状态向量;u为r维控制向量;f为n维向量函数。
要求在控制空间中寻求一个最优控制向量u*,将系统从x(t0)
转移到x(tf)使以下性能指标
J tf L(x, u,t) d t t0
例6-3 系统状态方程为 x u ,以x0和xf为边界,求u*(t)
使下列性能泛函取最小值。
J tf ( x2 u2 ) d t 0
第6章 最 优 控 制
解:将方程 x u 代入性能泛函有
J tf ( x2 u2 ) d t tf ( x2 x2 ) d t
0
0
在此 L[x, x] x2 x2 ,故欧拉方程
式(6-28)说明哈密顿函数对控制有极值,称为最优控制 问题的极值条件,式(6-25)称为伴随方程。这样前面的推导 就将最优控制问题转化为求解微分方程的两点边界值问题。
第6章 最 优 控 制
例6-2 已知系统状态方程x ax u, x(0) x0,tf 固定,
x方(t程f)自和由横。截试条写件出。为a, 使r为J常(x)数 。12 0t f (x2 r2u2 )为最小值的欧拉
第6章 最 优 控 制
第6章 最 优 控 制
6.1 最优控制问题概述 6.2 用变分法求解最优控制问题 6.3 极小值原理 6.4 用动态规划法求解最优控制问题 6.5 线性二次型最优控制调节器 6.6 MATLAB在系统最优控制中的应用
第6章 最 优 控 制
6.1 最优控制问题概述
6.1.1 引言 什么是最优控制呢?下面举例说明。 例6-1 飞船的月球软着陆问题。飞船从宇宙中飞到月球
边界条件为
r2 (x ax) ar2 (x ax) x 0
(1) x(0)=x0;
(2)
由
百度文库
L x tf
r2(x ax) tf
0
,得 (x ax) tf 0
。
联立求解上述方程可求出u*(t)和x*(t)。
第6章 最 优 控 制
6.2.3 末值时刻和末端状态固定情况下的最优控制 非线性时变系统状态方程为
min J[x] tf L(x, x,t)d t
x(t)
t0
(6-14)
其中, L(x, x,t) 及x(t)在[t0,tf]上连续可微,t0和tf给定,已 知x(t0)=x0,x(tf)=xf,则极值轨迹x*(t)满足如下欧拉方程:
及横截条件
L d L 0 x d t x
(6-15)
L
T
x
轨迹xd(t),有
J 1 tf 2 t0
x t xd tT Q x t xd t uT t Rut
dt
(6-8)
F
x
t, ut,t
1 2
x t xd tT Q x t xd t uT t Rut
第6章 最 优 控 制 (4) 、(5)两类性能指标统称为二次型性能指标,这是工 程实践中应用最广的一类性能指标。
第6章 最 优 控 制
图6-1 飞船着陆示意图
第6章 最 优 控 制
自t=0时刻开始飞船进入着陆过程。其运动方程为
h v
v
f m
g
m kf
其中k为一常数。要求控制飞船从初始状态
h(0) h0, v(0) v0, m(0) M F
出发,于某一时刻tf实现软着陆,即 h(tf)=0,v(tf)=0
H ( x, u, λ,t) L( x, u,t) λT (t) f ( x, u, t)
则
J φ[x(t f )] tf [H (x, u, λ,t) λT(t)x]d t t0
φ[x(t f )] tf H (x, u, λ,t) d t tf λT(t)x d t
t0
t0
tf
x(t
f
)
L x
T
x(t0) 0
t0
(6-16)
注意: 满足欧拉方程是必要条件,不是充分条件。
第6章 最 优 控 制
如果x代表一个控制系统的输出,那么积分式(6-16)就是 系统全部性能的一个指标,而衡量性能的标准就在于使这个 积分最小化。由于控制问题多种多样,性能指标也有多种, 变分问题也就各不相同。对此,我们分别加以讨论。
第6章 最 优 控 制
控制过程中推力f(t)不能超过发动机所能提供的最大推力fmax, 即
0≤f(t)≤fmax 满足上述限制,使飞船实现软着陆的推力程序f(t)不止 一种,其中消耗燃料最少者才是最佳推力程序,问题可归结 为求
为最大的数学问题。
J=m(tf)
第6章 最 优 控 制
6.1.2 最优控制问题的提法 由上面的具体实例可知,为了解决最优控制问题,必须
沿最优轨迹x(t)取极小值。
引入拉格朗日乘子
1(t) λ(t) 2 (t)
n
(t
)
(6-18) (6-19)
第6章 最 优 控 制
将性能指标式(6-18)改写为其等价形式
J φ[x(t f )] tf {L(x, u,t) λT(t)[ f (x, u,t) x]}d t t0
定义哈密顿函数
所以泛函的变分等于
J L[x, x] J x(t) x
0
(6-10)
第6章 最 优 控 制
3. 泛函的极值
设J[x(t)]是在线性赋泛空间Rn上某个子集D中的线性连
续泛函,x0∈D,若在x0的某邻域内有
U (x0, ) x x x0 , x Rn
(6-11)
如果在 x U (x0, ) D 时,均有 J[x] J[x] J[x0 ] 0 或 J[x] J[x] J[x0 ] 0
寻找一个最优控制u*(t),使状态x(t)由x(t0)经过一定时间转 移到目标集S,并且沿此轨迹转移时,使相应的性能指标达
到极值(极大或极小)。
第6章 最 优 控 制
6.1.3 性能指标的分类 最优控制问题可归结为求性能指标的极值问题。指标函
数(又称价值函数、目标函数、性能泛函)按照实际控制性能 的要求大致可以分为:
对式(6-22)中的第三项进行分部积分,得
J φ[x(tf )]
tf H(x, u, λ,t) d t λT(t) x tf
t0
t0
tf λT(t)x d t
t0
当泛函J取极值时,其一次变分等于零,即δJ=0。
(6-20) (6-21) (6-22)
(6-23)
第6章 最 优 控 制
求出J的一次变分并令其为零。
第6章 最 优 控 制
设动态系统的状态方程:x t f x t,ut,t (6-1)
初始状态: x(t0)=x0
目标集: x(tf)∈S
控制域: utU Rm
性能指标:J x
tf
,t f
tf t0
F x t,ut,t dtt
(6-2)
最优控制的问题就是: 从所有可供选择的允许控制中
λ H L f λ x x x
(6-25)
第6章 最 优 控 制
以及
φ λ(t f ) x(t f )
此时式(6-24)可简化为
J
tf t0
H u
T
udt
0
由于δu是任意的变分,所以要满足式(6-27)只有
(6-26) (6-27)
H L f λ 0 u u u
(6-28)
例如:
3
J[x] 0 x(t) d t
(其中,x(t)为连续可积函数)
当x(t)=t时,有J=4.5;当x(t)=et时,有J=e3-1。
第6章 最 优 控 制
2. 泛函的变分 设J[x(t)]是线性赋泛空间Rn上的连续泛函,其增量可表 示为
ΔJ[x]=J[x+δx]-J[x]=L[x,δx]+r[x,δx] (6-9) 其中,L[x,δx]是关于δx的线性连续泛函,r[x,δx]是关于δx 的高阶无穷小,则δJ=L[x,δx]称为泛函J[x(t)]的变分。
解:将状态方程代入J消去u, 得到
其中
J (x) 1 t f [(x2 r2 (x ax)2 ]dt
20
L 1 [x2 r2 (x ax)2 ] 2
根据
L x
d dt
L x
0,得到
x r2 (x ax)(a) d [r2 (x ax)] 0 dt
第6章 最 优 控 制
故极值条件的欧拉方程为
第6章 最 优 控 制
6.2.2 末值时刻固定、末值状态自由情况下的最优控制 非线性时变系统状态方程为
x f (x, u,t), x(t) tt0 x(t0 )
(6-17)
其中,x为n维状态向量;u为r维控制向量;f为n维向量函数。
要求在控制空间中寻求一个最优控制向量u(t),使以下性能指
标
J φ[x(t f )] tf L(x, u,t) d t t0
表面,靠其发动机产生一与月球重力方向相反的推力f,赖 以控制飞船实现软着陆(落到月球表面上时速度为零)。要求 选择一最好发动机推力程序f(t),使燃料消耗最少。
解:如图6-1所示,设飞船质量为m,它的高度和垂直 速度分别为h和v。月球的重力加速度可视为常数g,飞船的 自身质量及所带燃料分别为M和F。
T
J
φ
x(t
f
)
x(t f ) λT (t f ) x(t f )
tf t0
H x
T
x
H u
T
u
λT
xd t
0
将上式改写成
T
J
φ x(t f
)
λ(t
f
)
x(t f )
tf t0
H x
T
λ
x
H u
T
u
d
t
0
(6-24)
由于λ(t)未加限制,可以选择λ(t)使上式中δx和δx(tf)的系数等 于零。于是有
(6-12)
则称J[x(t)]在x0处达到极大值或极小值。
定理6-1 设J[x(t)]是在线性赋泛空间Rn上某个开子集D中定
义的可微泛函,且在x=x0处达到极值,则泛函J[x(t)]在x=x0处
必有
J[x0, x] 0
(6-13)
证明从略。
第6章 最 优 控 制
4. 欧拉方程
定理6-2 设有如下泛函极值问题:
建立描述受控运动过程的运动方程,给出控制变量的允许取 值范围,指定运动过程的初始状态和目标状态,并且规定一 个评价运动过程品质优劣的性能指标。通常,性能指标的好 坏取决于所选择的控制函数和相应的运动状态。系统的运动 状态受到运动方程的约束,而控制函数只能在允许的范围内 选取。因此,从数学上看,最优控制问题可以表述为: 在 运动方程和允许控制范围的约束下,对以控制函数和运动状 态为变量的性能指标函数(称为泛函)求取极值(极大值或极小 值)。抽象为共同的数学模型,可以得到最优控制问题的一 般性提法。
λT
x d t
令性能指标J的一次变分等于零,得
J
tf t0
H x
λT
x
H u
T
udt
0
选择 λ(t) ,使其满足 λ H
x
J
tf t0
H u
T
udt
0
(6-32) (6-33) (6-34)
在末端状态固定情况下,不是任意的。若系统能控,仍然有
控制方程 H 0 u
第6章 最 优 控 制
(1) 最短时间问题
J t f t0
tf dt,
t0
F x t,ut,t 1
(2) 最小燃料消耗问题
J
tf t0
ut dt,
F x t,ut ,t
u t
(3) 最小能量控制问题
J tf u2 td t, t0
F x t,u t,t u2 t
(6-3) (6-4) (6-5)
第6章 最 优 控 制
(4) 线性调节器问题
n
J
i 1
x t f 2
t0 i
t
dt
x t f n
2
t0 i1 i
t
dt
(6-6)
或者有
J
tf t0
1 2
xT
tQx t
uT
t
Rut d t
(6-7)
F
x
t
,
u
t
,
t
1 2
xT
t
Qx
t
uT
t
Ru
t
(5) 状态跟踪器问题: 如果在过程中要求状态x(t)跟踪目标
第6章 最 优 控 制
6.2 用变分法求解最优控制问题
6.2.1 泛函与变分 1. 泛函的基本定义 如果对于某个函数集合{x(t)}中的每一个函数x(t),变量
J 都有一个值与之对应,则称变量J为依赖于函数x(t)的泛函, 记作J[x(t)]。可见,泛函为标量,可以理解为“函数 的函数”。
第6章 最 优 控 制
沿最优轨迹x(t)取极小值。
(6-30)
引入哈密顿函数
J
tf t0
H (x, u,
λ, t )
λT
x dt
(6-31)
第6章 最 优 控 制
对式(6-31)右边第2项进行分部积分,可以得到
J λT (t0 )x(t0) λT (t f )x(t f )
tf t0
H ( x,
u,
λ, t)