第七章 最优控制

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


同济大学汽车学院 2010
线性系统无限时间状态调节器
• 线性系统二次型性能指标的最优控制是状态的线性反馈,但反馈增益是时变 的,即使是定常系统也是如此。
Ax Bu x
1 T J x Qx u T Ru dt 2 0
– 如果其中矩阵Q、R为常数阵,且为正定时,其最优控制为:
升降机快速降百度文库问题
1 x 2 x 2 u g x
x1 t 0 0 x 2 t 0 0 P
ut M
M g
J 0f dt t f
使升降机在最短时间内由给定的初始状态转移到零状态。
x2
u=-M F A u=-M
g (t0 ) g (t0 )
yr (t )
C T (t )Q(t )
u -

G T (t )
g (t )
B(t ) R 1 (t ) B T (t )
+ +
u

G (t )
x
C (t )
y
同济大学汽车学院 2010
权系数矩阵的选取
同济大学汽车学院 2010
权系数矩阵的选取
同济大学汽车学院 2010
同济大学 汽车学院
College of Automotive, Tongji University
钟再敏
最优控制
Optimized Control 现代控制理论基础7
目录
1. 2. 3. 4.
最优控制问题的表述 最优控制问题举例 二次型性能指标的最优控制 最优跟踪问题
同济大学汽车学院 2010
最优控制问题的表述
J K x t f , t f tt f L x, u, t dt J K x t , t f f 0
• 最优控制问题的表述:
在对象运动方程为 x f x,u, t 的约束下,能够找到一个容许控制u u t 它要满足对控制的约束条件和指定的时间区间边界条件,将系统由初始状态 X0转移到终值状态Xf,使性能指标J为极小(或极大) u u t 开环 u u x 闭环
1 x 2 x 2 u x
J
3 1 2 1 2 2 3 1 0 x1 3 2 x2 2 x12 4 x2 2 x1 x2 u 2 dt 2 2 2


时间区间为[0,3],求最优控制u*,使J为最小。
u R 1 B T P t x 20 2 P 12 t x1 2 P 22 t x 2
1 x 2 x 2 u g x
x1 t 0 0 x 2 t 0 0 P
ut M
M g
J 0f dt t f
使升降机在最短时间内由给定的初始状态转移到零状态。
t
同济大学汽车学院 2010
最优控制问题的举例
J 1 T 1 x f Fx f 2 2
x
tf t0
T
Qt x u T R t u dt

其中,Q,R,F均为半正定,Q—要求的过渡过程最快,R—对控制能量的限 制,F—对终端偏差、即稳态控制精度的限制。
R 1 (t ) B T (t )
A(t )x B(t )u x


R 1 (t ) B T (t )
A(t )x B(t )u x
P(t )
x
t Pt At AT t Pt Pt Bt R 1 t BT t Pt Qt 0 P
同济大学汽车学院 2010
二次型性能指标的最优控制举例
线性系统无限时间状态调节器
• 线性系统二次型性能指标的最优控制是状态的线性反馈,但反馈增益是时变 的,即使是定常系统也是如此。
Ax Bu x
1 T J x Qx u T Ru dt 2 0
– 如果其中矩阵Q、R为常数阵,且为正定时,其最优控制为:


ˆx u R 1 B T P
-
x(t0 ) * u A(t )x B (t )u x R 1 (t ) B T (t )
P (t )
C (t )
y
AT PBR 1 B T
t Pt At AT t Pt Pt Bt R 1 t BT Pt C T t Qt Ct 0 P
ˆ A AT P ˆ P ˆ BR1 BT P ˆ Q 0 P
ˆ 1 P 12 ˆ P22 a 2 P ˆ 11 a 2 b
u t x1 t a 2 x2 t
同济大学汽车学院 2010
最优跟踪器问题
• 以前的讨论都是系统加一扰动(或设定)已运行于稳定状态,当突然去掉 扰动(或设定)时,使二次型性能指标为最小的最优控制。 • 所谓跟踪问题就是寻找最优控制规律,使系统的实际输出,在给定的时间 区间内,尽量接近理想输出,而又不消耗过多的控制能量。 x A t x B t u
• 其中
ˆ P
为常数矩阵,且满足下列黎卡提矩阵代数方程
ˆ A AT P ˆ P ˆ BR1 BT P ˆ Q 0 P
• 为了得到定常的反馈增益,必须满足下列条件: – 系统是定常的,而且是可控的 – 无限时间调节器 t f – J中不包含终值型指标,F=0 MATLAB命令lqr(A,B,Q,R,N)
权系数矩阵的选取
同济大学汽车学院 2010
P12 0 1 0 0 P11 P12 0 0 1 0 P P22 12 P22 P12 0 P11 P12 2 1 2 0 1 P 0 P22 1 12 P22 1 4
t
E B
x1
u=M D C
同济大学汽车学院 2010
二次型性能指标的最优控制
状态调节器问题:状态调节器是指采用状态反馈,使状态向量的各分量迅 速趋近于零,而不消耗很多能量的控制系统。
At x Bt u x xt 0 x0
寻找一个最优控制u*,使下面的性能指标为最小。
u + -
P t 1 11 12 t P
P 12 t x1 P22 t x2

2 P22 (t )
x2

x1
2 P12 (t )
P 11 P12 P 11 P12
P11 P 12 P P12 22


ˆx u R 1 B T P
• 其中
ˆ P
为常数矩阵,且满足下列黎卡提矩阵代数方程
ˆ A AT P ˆ P ˆ BR1 BT P ˆ Q 0 P
• 为了得到定常的反馈增益,必须满足下列条件: – 系统是定常的,而且是可控的 – 无限时间调节器 t f – J中不包含终值型指标,F=0 MATLAB命令lqr(A,B,Q,R,N)
• 最优控制问题的基本要素
– – – – 系统的状态方程(等式约束条件) 控制变量的限制 初始条件和终值条件 指标函数
2 t T T J J t0f L x,u, t dt J 0 x Qx u Rudt 0 e t dt
• 性能指标的形式
– 积分型 – 终值型 – 复合型
(t ) [ AT (t ) P(t )B(t )R 1 (t )BT (t )]g(t ) C T t Qt y t 0 g
同济大学汽车学院 2010
最优跟踪器问题的说明
• 跟踪系统的最优反馈部分和理想输出yr(t)无关,估计黎卡提矩阵微分方 程解出P(t),仍为一调节器问题。 • 跟踪部分相当于加入了一个g(t),它可以看出是作用于系统的强迫分量, 从而使调节器变为跟踪器。 • _g(t)的求解与yr(t)的变化有关,这就要求只有在过程开始之前知道yr(t) 的变化规律的情况下才能求出g(t) 。有些系统,例如控制雷达天线跟踪 人造地球卫星,卫星的运行规律是事先清楚的;但对于大多数跟踪系统, 例如随机性随动系统或者拦截导弹,就无法事先知道其运行规律,此时的 求解就会碰到很大困难,只能用大量的经验得出运动的统计规律,再求出 g(t) . 1 T • 如果取 Gt At Bt R t B t Pt 则有
y C (t ) x
• 定义误差向量为
et y yt
1 T 1 tf e f Fe f e T Qt e u T Rt u dt 2 2 t0
g (t0 )
C T (t )Q(t )
u -
• 跟踪问题的性能指标
J



最优解为
yr (t )

g (t )
性能指标J是和的函数,而和是t的函数,即J是函数的函数。这在数学上 称“泛函”,泛函的极值要用“变分法”才能求得。
同济大学汽车学院 2010
最优控制问题的举例
J x x
2 1 2 2
t
dt
x1 1, x2 2
求J极值时的
匀减速运动
x t
1 tf 2 t0 u dt 2
At x Bt u x xt 0 x0
寻找一个最优控制u*,使下面的性能指标为最小。
1 x 2 x 2 u x
J
3 1 2 1 2 2 2 2 3 1 0 x1 3 2 x2 2 x 4 x 2 x x u dt 1 2 1 2 2 2 2
u x

xt 0 x 0
xt f x f 0
J
x0 u t t f t0
x (t )
*
tf t t f t0
x0
物理解释:x-速度
u-力
A x0
x*(t)
O
t0 u*(t)
tf
同济大学汽车学院 2010
最优控制问题的举例
升降机快速降落问题
P(t )
x
t Pt At AT t Pt Pt Bt R 1 t BT t Pt Qt 0 P
同济大学汽车学院 2010
二次型性能指标的最优控制
状态调节器问题:状态调节器是指采用状态反馈,使状态向量的各分量迅 速趋近于零,而不消耗很多能量的控制系统。

同济大学汽车学院 2010
线性系统无限时间状态调节器举例
• 给定最优控制问题
x1 x2 x2 u
J 1 2 2 x1 2bx1 x 2 ax 2 u 2 dt 2 0



推导Q, R, A, B
同济大学汽车学院 2010
线性系统无限时间状态调节器举例
• 推导Q, R, A, B
t Pt A AT Pt Pt BR1 BT Pt Q 0 P
- 计算求得时变P(t)矩阵可以得到闭环状态反馈控制率 - 一般情况下不能求解析解,只能求数值解; - 虽然A、B、Q、R都是常数阵,但最优反馈增益仍是时变的。
同济大学汽车学院 2010
相关文档
最新文档