线性系统理论8线性二次型最优控制
合集下载
控制方法
• 为了弥补现代控制理论对数学模型的过分依赖,控制理论和回路传函恢 复(Loop Transfer Recovery,简称LTR)等设计理论应运而生。近十 多年发展起来的控制理论和LTR设计理论,是目前控制系统鲁棒性设计 较成功和完善的理论体系,也是近年来自动控制理论以及工程应用研究 领域的热门话题之一 。 • 1960~1975年是现代控制理论发展的鼎盛时期,以Kalman为代表的现 代控制理论,其主要特征就是以状态空间理论作为描述系统的工具。现 代控制理论以其清新和准确的概念,取得了许多突出的成就,诸如状态 的可控性、可观测性、LQ最优调节器以及最佳估计等等。但是,这一 期间的控制理论研究忽略了系统中存在的不确定性因素,致使其在许多 实际控制系统设计中未能获得较好的应用。1981年,加拿大学者 Zames针对LQG设计无法处理被控过程数学模型有误差或摄动、以及 经典频域设计理论不适用于MIMO系统情况,提出了著名的控制思想, 标志着控制理论的诞生。
G 0 s ——为结构模型的标称数学模型
G s G 0 s 1 G s
(2)
G s ——为结构模型的剩余模态,即模型的不确定性误差
通常结构模型的剩余模态稳定且有上届,它在频域满足式:
max G j W j
W j ——表示摄动界函数
回路传函恢复控制
• 线性二次高斯(Linear Quadratic Gaussian—LQG)方法是 以最优线性二次型调节器(LQR)和Kalman滤波器为中心的 反馈控制系统优化设计方法。由于其理论比较成熟,所以 在工程上被广泛应用。但是由于LQG设计的被控对象没有 考虑模型不确定性,带有Kalman滤波器的LQG方法设计 的控制系统鲁棒性差,模型若存在微小偏差或扰动,闭环 系统就可能出现不稳定的现象。因此,为弥补LQG设计方 法的缺陷,1979年Doyle和Stein提出了回路传函恢复方法。 • LQG/LTR回路传函恢复方法是把虚拟的过程噪声作为设 计参数加到设计模型输入端的鲁棒性恢复方法,能使LQG 设计具有最优线性二次调节器LQR所具有的稳定储备。其 设计思想就是设计滤波器增益,使得全状态LQR调节器自 然拥有的鲁棒特性在系统的输入端通过动态调节器得到基 本恢复。根据LQG/LTR理论,回路传递恢复后的系统具 有接近最优反馈控制系统的鲁棒性。
G 0 s ——为结构模型的标称数学模型
G s G 0 s 1 G s
(2)
G s ——为结构模型的剩余模态,即模型的不确定性误差
通常结构模型的剩余模态稳定且有上届,它在频域满足式:
max G j W j
W j ——表示摄动界函数
回路传函恢复控制
• 线性二次高斯(Linear Quadratic Gaussian—LQG)方法是 以最优线性二次型调节器(LQR)和Kalman滤波器为中心的 反馈控制系统优化设计方法。由于其理论比较成熟,所以 在工程上被广泛应用。但是由于LQG设计的被控对象没有 考虑模型不确定性,带有Kalman滤波器的LQG方法设计 的控制系统鲁棒性差,模型若存在微小偏差或扰动,闭环 系统就可能出现不稳定的现象。因此,为弥补LQG设计方 法的缺陷,1979年Doyle和Stein提出了回路传函恢复方法。 • LQG/LTR回路传函恢复方法是把虚拟的过程噪声作为设 计参数加到设计模型输入端的鲁棒性恢复方法,能使LQG 设计具有最优线性二次调节器LQR所具有的稳定储备。其 设计思想就是设计滤波器增益,使得全状态LQR调节器自 然拥有的鲁棒特性在系统的输入端通过动态调节器得到基 本恢复。根据LQG/LTR理论,回路传递恢复后的系统具 有接近最优反馈控制系统的鲁棒性。
线性二次型最优控制
线性二次型最优控制(11/12)
现在讨论上述线性二次型问题的几种特殊情况。
1) 若令C(t)=I,z(t)=0,则y(t)=x(t)=-e(t)。这时,线性二次型问题 的性能指标泛函变为
J[u()]
1 2
xτ
(t
f
)Fx(t
f
)
1 2
tf [xτ (t)Q(t)x(t) uτ (t)R(t)u(t)]dt
➢ 本节将陆续介绍线性二次型问题及其解的存在性、唯一 性和最优控制解的充分必要条件。
➢ 线性系统的二次型性能指标的最优控制问题可表述如下。
线性二次型最优控制(4/12)
线性二次型最优控制问题 设线性时变系统的状态方程和输 出量测方程为
x(t) A(t)x(t) B(t)u(t), x(t0 ) x0 y(t) C(t) x(t)
解 根据定理7-14,可以求出该问题的最优控制为
u(t) 1 p(t)x(t) r
式中,p(t)是如下黎卡提微分方程及边界条件的解
p(t) 2ap(t) 1 p2 (t) q, r
p(t f ) f
p(t) 2ap(t) 1 p2 (t) q, r
p(t f ) f
最优控制的存在性与唯一性(6/13)
图7-6 线性系统最优状态调节器
上述结论是线性时变系统的结论,当系统是线性定常的时候, 上述结论仍然成立,而且计算还要简单。
线性系统理论LQR
中包含非线性环节
的最优调节系统,则对满足扇形条件
的任意
( )
k1TRTR()k2TR,0
,扰12 动k最1优k调2节系统可保持大范围渐近稳定。 ( )
扇形条件的几何解释
20
对单输入无限时间时不变LQ调节问题,进入于最优调节系统反馈
通道中的向量非线性摄动 ( 化) 为标量非线性摄动 ( ) ,且
P ( t) P ( t,0 ,tf) ; P ( tf,0 ,tf) P ( tf) 0 解阵P(t)的基本属性
x0T P(0,0,t f )x0 m(0, x0)
lim
t f
P(t,
0,
t
f
)
P(t,
0,
)
P
PA AT P Q PBR1BT P 0
R T R 0 ,Q Q T 0 或 “ Q Q T 0 , A ,Q 1 2 完 全 能 观 测 ”
最优轨线 x * ( t) A ( t) x * ( t) B ( t) u * ( t) ,x * ( t 0 ) x 0
最优性能值 J*J(u*())1 2x0 TP (t0)x0, x00
有限时间时变LQ问题的基本属性
7
最优控制的唯一性
➢ 最优控制必存在且唯一,即
u * (t) R 1 (t)B T(t)P (t)x * (t)
【线性系统课件】线性二次型最优控制问题
u (t ) R
1
B P (t ) x (t )
T
x [ A BR x (0 ) x0
1
B P ( t )] x ,
T
u
B
-
A
R
1
x
C
y
B P (t )
T
• 注意: --有限时间LQ调节问题的最优调节系统是状态反馈系统, 反馈矩阵是唯一的。 --对象系统虽然是定常的,但闭环系统却是时变的。 --Riccati矩阵微分方程是非线性微分方程,难求解析解,可 离散计算。 --前述的定理也适用时变线性系统。 二.无限时间LQ调节问题的最优解 提法: 线性系统 x Ax Bu , x ( 0 ) 性能指标
z Fz Gy Hu , z ( 0 ) z 0 ˆ x T
1
z
在F,G,H,T满足一定条件时,可作为原系统 的观测器。
结论1: x 0 , z 0 , u 任意,上述系统是{A,B,C}的全维状态观测 器的充要条件是:
(1) TA FT GC , T 非奇异 ( 2 ) H TB ( 3 ) i ( F ), i 1, 2 , , n 均具负实部
J 1 2
x0
[ x ( t ) Qx ( t ) u ( t ) Ru ( t )] dt
18讲 最优控制-线性二次型-输出跟踪
能源与动力学院系统控制与仿真研究室
17
最优控制——线性二次型 5.3输出调节器
无限时域线性定常系统输出调节器问题
能源与动力学院系统控制与仿真研究室
18
最优控制——线性二次型 5.3输出调节器
能源与动力学院系统控制与仿真研究室
19
能源与动力学院系统控制与仿真研究室
20
最优控制——线性二次型 5.3输出调节器
能源与动力学院系统控制与仿真研究室
36
最优控制——线性二次型 5.4跟踪问题
一般来说,期望输出往往难以事先确定,因而 设计最优跟踪系统时,常常采用两种方式: 1)假设期望输出具有某种典型变化规律。此 时,系统的工作性能取决于期望输出的实际值 与预定值的符合程度。 2)把期望输出视为随机信号。此时,系统的 工作性能在平均意义下最优,但不能保证在任 一次试验中,系统的响应都是满意的。
无限时域状态调节器
能源与动力学院系统控制与仿真研究室
3
能源与动力学院系统控制与仿真研究室
4
最优控制——线性二次型 5.2.2无限时域状态调节器
1 T t x A BR B P x t Ax t ,
x t0 x0
能源与动力学院系统控制与仿真研究室
T 1 T T t A t B t R t B t P t t C t Q t yr t
现代控制理论二次型性能指标的线性系统最优控制-西工大
(t) Q(t)x(t) AT (t)(t)
这是一组一阶线必微分方程,其边界条件为:
及横截wk.baidu.com件
x(t0 ) x(t0 )
(t
f
)
x(t
f
)
1 2
xT
(t
f
)Fx (t
f
)
Fx (t
f
)
由于横截条件中 x(t f ) 与 (t f ) 存在线性关系,而正则方 程又是线性的。因此可以假设,在任何时刻x 与 均可以 存在如下线性关系;
§8.1 线性连续系统状态调节器问题
设线性系统的状态方程为
x(t) A(t)x(t) B(t)u(t)
u(t) 不受约束,性能指标为
J
1 2
xT
(t f
)Fx(t f
)
1 2
tf [xT (t)Q(t)x(t) uT (t)R(t)u(t)]dt
t0
终端时刻 tf 固定。要求寻找最优控制 u(t) ,使性能
(t) H Q(t)x(t) AT (t)(t)
x
由于控制不受约束,控制方程满足
由此可得:
H R(t)u(t) BT (t)(t) 0
u
u (t) R1(t) BT (t) (t)
由于R(t) 的正定性保证了 R1(t) 存在,从而 u(t) 才可能存在。
最优控制问题的线性系统方法
最优控制问题的线性系统方法最优控制是应用数学和控制理论中的一个重要分支,旨在寻找系统
最优行为以满足特定的性能指标。在线性系统中,最优控制问题可以
通过线性规划和线性二次型问题来表示和解决。本文将探讨基于线性
系统的最优控制问题,并介绍常见的线性系统方法。
一、线性系统基础
线性系统是指系统的行为遵循线性关系的动态系统。它可以用线性
微分方程来描述,具有以下形式:
$$\dot{x}(t)=Ax(t)+Bu(t)$$
$$y(t)=Cx(t)+Du(t)$$
其中$x(t)$是系统的状态向量,$u(t)$是输入向量,$y(t)$是输出向量,$A$是系统矩阵,$B$是输入矩阵,$C$是输出矩阵,$D$是直接传递矩阵。线性系统的状态和输出可以通过系统的初始状态$x(0)$、输入
$u(t)$和系统矩阵来确定。
二、最优控制问题的目标和约束
最优控制问题旨在寻找满足特定性能指标的最优控制策略。通常,
我们定义一个性能指标函数$J$,它量化了系统的性能表现。最优控制
问题的目标是最小化或最大化$J$,同时满足系统动态方程和约束条件。
常见的性能指标函数包括最小化控制误差、最小化能量消耗、最小
化响应时间等。约束条件可以是状态约束、输入约束或输出约束,用
于限制系统的操作范围。
三、线性规划方法
线性规划是一种常见的最优控制方法,基于线性系统模型和线性约
束条件。最优控制问题可以通过线性规划的方法进行建模和求解。
线性规划问题的一般形式如下:
$$\min_{u(t)} J = \int_{t_0}^{t_f} \left( q(t)x^T(t)Qx(t)+r(t)u^T(t)Ru(t) \right) dt$$
第五章 章 线性系统二次型指标的最优控制
要求寻找最优控制 U (t ) ,使 J 最小。这里U (t )无约 Q 束。P 、 (t )为对称半正定阵,(t )为对称正定阵。终 R 端时间 t f 为有限值。
返回子目录
5.3.1 用极小值原理求解上面的问题
因U (t ) 无约束,故等同于用经典变分法求解。取 哈密顿函数为
H 1 T X (t )Q(t ) X (t ) U T (t ) R(t )U (t ) 2
R(t ) 为正定阵,于是
设
r1 (t ) 0 r2 (t ) 0 ,则 ,
1 tf T 1 tf 2 U (t ) R(t )U (t )dt [r1 (t )u12 (t ) r2 (t )u 2 (t )]dt 2 t0 2 t0
它与消耗的控制能量成正比,消耗得越多,则性 能指标值 J 越大。故性能指标中这一项表示了对消耗 控制能量的惩罚。1 (t ) 、r2 (t ) 可看作加权系数,如认 r 为 u1 (t ) 的重要性大于 u 2 (t ),则可加大 r1 (t ) 。将 R(t ) 选 成时间函数,是为了对不同时刻的 U (t ) 加权不一样。 实际上,为了简单起见常选用常数阵 R 。
Q(t )
f 0
总之,性能指标 J (u ) 最小表示了要用不大的 控制量来保持较小的误差,以达到能量和误差的 综合最优。
下面讨论几种特殊情况:
最 优 控 制 (8)
• 闭环后的系统矩阵Ad-BdK的特征值。
图8.4 例8.6伺服控制系统结构图
图8.5 例8.6伺服控制系统的单位阶跃响应曲线
• 8.4 最少燃料控制问题 • 8.4.1 伪逆的基本概念 • 所谓伪逆是逆概念的推广。它对于代数方 程中未知变量的个数与线性无关的方程个 数不同时的求解很有用。 • 考虑代数方程
• ③对应的最优控制为 • 此外,根据式(8.59)得到 • 对应最优控制
• 闭环系统的状态方程为
• 应用矩阵求逆引理,式(8.89)可改写为
• 最小性能指标则没有变化,仍然为
• 可见求解稳态二次最优控制的关键问题, 就是求解式 (8.84) 稳态黎卡提方程,由矩阵 求逆引理有
• 式(8.92)是一种迭代算法,迭代是由对应的 非稳态方程开始计算
• 假设系统状态完全可控,系统性能指标为
• 式中 Q——n×n维正定或半正定实对称矩阵; • R——r×r维正定实对称矩阵; • S——n×n维正定或半正定实对称矩阵。 • Q , R , S 为加权矩阵,反映了设计者对状态矢量 x(k)、控制矢量u(k)、终端矢量的关心程度。
• 8.2.2 离散系统二次型问题的解 • 引入拉格朗日乘子λ(k),构成新的性能指标
• 因此可以求得最优反馈增益矩阵K为
wenku.baidu.com
• 最优控制u(t)为
• 式(8.19)中的矩阵P必须满足式(8.10)或者满 足下列方程:
(优选)线性二次型最优控制器设计
同时得到闭环阶跃响应曲线,如图1-1所示。 图1-1 闭环系统阶跃响应曲线
由图1-1可知,闭环系统单位阶跃响应曲线略微 超调后立即单调衰减,仿真曲线是很理想的,反 映了最优控制的结果。
(2)我们可以用MATLAB函数lqry()来求解LQ最优控 制器,给出程序清单如下:
A=[0,1,0;0,0,1;-1,-4,-6]; B=[0,0,1]';C=[1,0,0];D=0; Q=1; R=1; K=lqry(A,B,C,D,Q,R) k1=K(1); Ac=A-B*K;Bc=B*k1;Cc=C;Dc=D; Step(Ac,Bc,Cc,Dc)
根据极值原理,我们可以导出最优控制律:
u R B 1 TPx Kx
式中,K为最优反馈增益矩阵;P为常值正定矩阵,必须
A R 满足黎卡夫(Riccati)代数方程 PA TP PB 1BP Q 0
因此,系统设计归结于求解黎卡夫(Riccati)方程的问题,并 求出反馈增益矩阵K。
2.连续系统二次型最优控制的MATLAB函数
(3) (Q-NR-1NT,A-BR-1NT)在虚轴上不是非能观
模式。
当上述条件不满足时,则二次型最优控制无解,函数
会显示警告信号。
3.连续系统二次型最优控制设计实例
【例8.7】设系统状态空间表达式为:
0
•
x
0
离散时间系统的线性二次型最优控制 - 离散时间系统的线性二次型最优控制(ppt文档)
其中的矩阵P满足
P Q AT PA AT PB(R BT PB)1 BT PA
离散系统 Riccati方程
wenku.baidu.com
2 k0
2 k0
1 xT (0)Px(0) 2
因此,
xT (k)Qx(k) xT (0)Px(0)
k 0
其中的P是 ATPA P Q 的对称正定解矩阵。
特点:通过求解一个代数方程来求得无穷级数的和!
系统的离散时间模型: x(k 1) Ax(k) Bu(k)
二次型性能指标
J1
[xT (k)Qx(k) uT (k)Ru(k)]
2 k0
目的:设计一个状态反馈控制律
u(k) Kx(k)
使得性能指标 J 最小化。
离散系统线性二次型 最优控制问题
定理7.3.1 若(A, B)是能控的,则离散系统线性二次型
最优控制问题有解,最优控制器是
u(k) (R BT PB)1 BT PAx(k)
由于系统 x(k 1) Ax(k) 是渐近稳定的, 故对任意的对称正定矩阵Q,
AT PA P Q
有对称正定解P,李雅普诺夫函数 V (x(k)) xT (k)Px(k)
V (x(k)) V (x(k 1)) V (x(k)) xT (k 1)Px(k 1) xT (k)Px(k) [Ax(k)]T P[Ax(k)] xT (k)Px(k) xT (k)(AT PA P)x(k)
P Q AT PA AT PB(R BT PB)1 BT PA
离散系统 Riccati方程
wenku.baidu.com
2 k0
2 k0
1 xT (0)Px(0) 2
因此,
xT (k)Qx(k) xT (0)Px(0)
k 0
其中的P是 ATPA P Q 的对称正定解矩阵。
特点:通过求解一个代数方程来求得无穷级数的和!
系统的离散时间模型: x(k 1) Ax(k) Bu(k)
二次型性能指标
J1
[xT (k)Qx(k) uT (k)Ru(k)]
2 k0
目的:设计一个状态反馈控制律
u(k) Kx(k)
使得性能指标 J 最小化。
离散系统线性二次型 最优控制问题
定理7.3.1 若(A, B)是能控的,则离散系统线性二次型
最优控制问题有解,最优控制器是
u(k) (R BT PB)1 BT PAx(k)
由于系统 x(k 1) Ax(k) 是渐近稳定的, 故对任意的对称正定矩阵Q,
AT PA P Q
有对称正定解P,李雅普诺夫函数 V (x(k)) xT (k)Px(k)
V (x(k)) V (x(k 1)) V (x(k)) xT (k 1)Px(k 1) xT (k)Px(k) [Ax(k)]T P[Ax(k)] xT (k)Px(k) xT (k)(AT PA P)x(k)
chapter8_随机线性系统的最优控制
(8-25)
由于上式右端花括号内的量是依赖于测量值 ZN-1=[Z1,Z2,…,ZN-1]T和m0 为已知这一条 件上的,而条件ZN-1又是随机的,因此要利用条 件期望的性质来计算。根据本章§2中关于条件概 率的定义可推出下面的性质
E[ ] E [ E ( | )]
(8-26)
上式右端方括号内的求数学期望是对随机变量 而言的(假定 已知),外层的求数学期望是对条件 而言的,而等式左端是无条件数学期望,上式可证 明如下:
然后,将这此与UN-1有关的项对UN-1求导 并令其等于零,即
T T T 2E X N 1 | Z N 1 , m0 T , N 1QN N 1U N 1 U N 1 (N 1QN N 1 RN 1 )U N 1 0 N U N 1
利用标量对向量的求导公式,可得
(8-29)
我们知道,最小方差估计即条件均值,在高斯 分布情况下,线性最小方差估计即最小方差估计, 因为卡尔曼滤波值是线性最小方差估计,故滤波值 ˆ X N 1 就是条件均值,即
E[ X N 1 | Z
N 1
ˆ , m0 ] X N 1
(8-28)
于是(8-28)式可成
T T ˆ U N 1 (N 1QN N 1 RN 1 ) 1 N 1QN N , N 1 X N 1
P( N ), Q(k )
线性二次型最优控制器设计
根据极值原理,我们可以导出最优控制律:
u
∗
百度文库
= −R
−1
B Px = − Kx
T
式中,K为最优反馈增益矩阵;P为常值正定矩阵,必须 T −1 P − PB BP + Q = 0 满足黎卡夫(Riccati)代数方程 PA +
A
R
因此,系统设计归结于求解黎卡夫(Riccati)方程的问题,并 求出反馈增益矩阵K。
∗
•
为最小。
式中,Q为半正定实对称常数矩阵;R为正定实对称 常数矩阵;Q、R分别为X和U的加权矩阵。 根据极值原理,我们可以导出最优控制律:
u
∗
= −[ R + B PB ]B PAx(k ) = − Kx
T T
式中,K为最优反馈增益矩阵;P为常值正定矩阵,必 T −1 PA + A P − PB R BP + Q = 0 须满足黎卡夫(Riccati)代数方程 因此,系统设计归结于求解黎卡夫(Riccati)方程 的 问题,并求出反馈增益矩阵K。
设计LQG控制器的一般步骤如下。 (1)根据二次型的性能指标J,寻求最优状态反馈增益矩阵K。 (2)设计一个卡尔曼滤波器来估计系统状态。 (3)构建LQG控制器。 3 LQG 下面介绍Kalman滤波器和LQG控制器设计的MATLAB实现。
2. Kalman滤波器 滤波器
线性二次型的最优控制
(5-17)对时间求导
黎卡提方程(Riccati)
边界条件:
( t Fx ( t f) f)
( t ) P ( t ) x ( t )
( 5 10 )
( 5 17 )
P ( t F ( 5 22 ) f)
黎卡提方程求解问题: (1)可以证明,P(t)为对称矩阵,只需求解n(n+1)/2个一阶微分方程组。 (2)为非线性微分方程,大多数情况下只能通过计算机求出数值解。 还可进一步证明,最优性能指标为:
1 ) C ( t ) I y ( t ) 0y ( t ) x ( t ) e ( t ) 状态调 r
2 )
y ( t ) 0 y ( t ) e ( t ) 输出调节器 r
3 ) y ( t ) 0e ( t ) y ( t ) y ( t ) 跟踪问题 r r
x
1 T 1 T
P x P x P x P [ Ax BR B Px ] [ P PA PBR B P ] x( 5 20 )
(5-20)与(5-19)相等,可得
T 1 T P P A P A P B BR P Q ( 5 21 )
用不大的控制,来保持较小的误差,以达到能量和误差综合最优的目的。 线性二次型问题的三种重要情形:
线性系统理论LQR
最优控制的状态反馈属性: * * * u ( t ) K x ( t ), 最优控制的状态空间描述:
1 T * * x (t ) ( A B R B P ) x ,
K
*
R B P
T
1
x (0) x 0 , t 0
*
稳定性和指数稳定性
最优条件系统的渐近稳定性
无限时间时不变LQ条件问题,其最优调节系统必为大范围渐近稳定
最优控制问题的数学实质
性能指标泛函的约束最优化(极值问题) 数学上多采用变分法
最优控制问题按末时刻的分类
有限时间LQR:只考虑系统在过渡过程中的最优运行
无限时间LQR:还要考虑系统趋于平衡状态时的渐近行为;更实用
调节问题和跟踪问题
最优调节问题: 寻找使性能指标泛函最优的控制量u,使系统由初始状态驱动到零平衡态 最优跟踪问题: 寻找使性能指标泛函最优的控制量u, 使系统输出跟踪参考输入. 最优跟踪是最优调节的推广,可转化为等价的调节问题.
最优控制具有状态反馈形式
u ( t ) K ( t ) x ( t ),
* * *
K (t ) R
*
1
(t ) B (t ) P (t )
T
最优调节系统的状态空间描述
* * * x ( t ) A ( t ) x ( t ) B ( t ) u ( t ),
线性二次型最优控制问题
所以,
P(t f ) 0
矩阵黎卡提(Riccati)微分方程
矩阵黎卡提(Riccati)微分方程 的边界条件
2023/12/21
18
P(t)的3个重要性质
▪ 由微分方程理论的存在与唯一性定理,可以证明 P(t)存在而且唯一。
▪ 对于任意的t[t0,tf], P(t)均为对称阵,即
P(t)=PT(t)
若C(t)=I(单位矩阵),Yr(t)=0,则 Y (t) X (t) e(t)
于是性能指标(6.1.2)变为
J
1 2
X T (t f
)SX (t f
)
1 2
tf [ X T (t)Q(t) X (t) U T (t)R(t)U (t)]dt
t0
这时问题归结为:用不大的控制能量,使系统状态X(t)保
(2)将S阵取为半正定,以便保证终端代价的非负性,但容
许在e(tf)不为零时的终端代价为零,这相当于不考虑与之相
应的终端误差。出于同样理由,Q(t)亦取半正定。但R(t)必须 取正定,这是因为控制代价实际上可以反映控制过程的能量
2023/12/21
8
消耗,而UT(t)R(t)U(t) 则反映各瞬间的控制功率,只要U(t) 不为零,控制功率当然就不应等于零。
2
2
因为控制函数U(t)本身不受约束,所以有
H 0 U (t)
P(t f ) 0
矩阵黎卡提(Riccati)微分方程
矩阵黎卡提(Riccati)微分方程 的边界条件
2023/12/21
18
P(t)的3个重要性质
▪ 由微分方程理论的存在与唯一性定理,可以证明 P(t)存在而且唯一。
▪ 对于任意的t[t0,tf], P(t)均为对称阵,即
P(t)=PT(t)
若C(t)=I(单位矩阵),Yr(t)=0,则 Y (t) X (t) e(t)
于是性能指标(6.1.2)变为
J
1 2
X T (t f
)SX (t f
)
1 2
tf [ X T (t)Q(t) X (t) U T (t)R(t)U (t)]dt
t0
这时问题归结为:用不大的控制能量,使系统状态X(t)保
(2)将S阵取为半正定,以便保证终端代价的非负性,但容
许在e(tf)不为零时的终端代价为零,这相当于不考虑与之相
应的终端误差。出于同样理由,Q(t)亦取半正定。但R(t)必须 取正定,这是因为控制代价实际上可以反映控制过程的能量
2023/12/21
8
消耗,而UT(t)R(t)U(t) 则反映各瞬间的控制功率,只要U(t) 不为零,控制功率当然就不应等于零。
2
2
因为控制函数U(t)本身不受约束,所以有
H 0 U (t)
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章
线性二次型最优控制
8.1
变分法简介
最优控制理论是变分法,也是泛函极 值理论的一个分支。 定义8.1.1 设y( x ) 为已给的某类函数。如 果对于这类函数中的每一个函数,有某数 J 与之对应,则称 J 为这类函数的泛函, 记为 J J y( x )。函数类 y( x ) 称为泛函
0 1 0 解 在本系统中,易知 A 0 0 , B 1
求最优控制 u ( t )
2 1 1 0 1 Q , R 2 ; S 0 2 , t0 0, t f 3 1 4
P (t )
是 2 2 对称阵,设为
J y x y J L y x , y
L y( x ),y 为 J 的线性主部,即
J L y x y y x y maxy
其中, L y( x ),y 相对于 J 为线性泛函
J 的定义域。
例8.1.1 设 y( x) 为定义在 0,1 上的具有连 续导数的函数的全体,则 J y( x) 1 1 y 2 dx
0
为一个泛函。
泛函的一些基本概念
1.泛函J y( x )的变量 y x 的变分:
泛函 J y( x )的变量 y x 的增量称为变分, 记为: ,指两个函数间的差,即: y
T
称为Hamilton函数。
8.2 有限时间状态调节器问题 8.2.1 问题的描述 问题8.2.1 [有限时间的线性二次型最优状态
调节问题] 在满足受控对象状态方程: xt At xt Bt ut , xt 0 x0
的约束条件下,在容许控制的范围内求取
t0
tf
对于 x x t 成立。
定理8.1.3 泛函 J xt t x, x, t dt
tf
0
在约束条件
F x, x, t 0 , t t0 , t f (其中
F 为一个关于 x 和
J x,
x 连续可微的 m
及边界条件
P tf S
且最优性能值为
1 T J x t 0 x t 0 P t 0 x t 0 2
说明8.2.1 方程
P T t AT t P T t P T t At P
T
t Bt R 1 t B T t P T t Q t
y y x y1 x 2.泛函 J y( x )的连续性: 对于任意给定的正数 ,如果存在正 数 ,当 y x y0 x , y x y0 x ,,
y
k
x y0 x
维向量 函数)下的条件、极值问题等价 于下述泛函 t
f
F 的无条件极值问题,即在满足 x, x, t 0 , t t0 , t f 且极小化泛函 J x t 的 x t
t0
, t T F x, x, t dt x, x
当 maxy 0 时, y x , y 0
8.1.2 泛函的极值 定义8.1.2 给定泛函 J [ y( x)] 及其定义域中 一变量 y0 ( x ) 。如果对于任何一个与 y0 ( x ) 接近的变量 y( x ) ,都有 J y0 x J y( x ) 0
则 M t 在 t 0 , t f 上恒为零。
tf
t0
y T t M t dt 0
J x t 在 x t 定理8.1.2 泛函
处取得极值的必要条件是下述Euler方程
d 0 x dt x 和边界条件
x 0, x 0
则称泛函 J y( x )在 y0 ( x ) 上达到一个相对 的极大值。如果上述关系对于泛函 J y( x ) 的定义域中所有的 y( x ) 均成立,则称泛函 J y( x ) 在 y0 ( x )上达到其定义域上的一个 绝对极大值。如果上式中的不等号反向, 则称泛函 J y( x ) 在 y0 ( x )上达到极小值。
H x, u , , t x
H x , u, , t u
x x
0
u u
状态方程 和边界条件 及横截条件
x f x ,u ,t
x t 0 x0
t f
x
t t f
其中
H x, u, , t x, u, t f x, u, t
或 ut R1 t BT t P t xt 作用下的最 优轨线有系统
t At Bt R1 t BT t Pt x t , x t0 x0 x
决定。 说明8.2.4 在上述最优控制问题中,我们并 没有要求系统是可稳的。 说明8.2.5 最优控制系统的结构如下图所 示。
T
下的二次型最优状态调节器为
ut K t xt , K t R
1
t B t Pt
其中,P t 为一
n n
阶矩阵,且满足
下述矩阵微分方程
t P t A t AT t P t P P t B t R 1 t BT t P t Q t
J y1 x y2 x J y1 ( x) J y2 ( x) 则称 J y( x )为线性泛函,常记为 L y( x )
4. 泛函 J y( x )的增量: 由变量 y x 的变分导致的泛函增 量,记为 J ,即 J J y x y J y( x ) 5. 泛函 J y( x ) 的变分 泛函 J y( x ) 的变分记为 :J ,其定 义为
上泛函 J 的Euler方程成立。
8.1.3
最优控制问题
问题OC 已知一个动态系统:
x f x, u, t 其中, R n为状态向量,u R r 为控制向 x
量,f 为一个关于所有变量连续可微的向量 函数; t0 , t f , xt0 x0 , xt f 自由。目的是 t 要寻找系统的一个控制 u t ,使下述泛函
称为Riccati矩阵微分方程,可以证明 其解 P t 是一个对称阵。
说明8.2.2 方程Riccati矩阵微分方程是 非线性的,通常不能直接求得解析解, 可用数字计算机离线计算,并将其解 P t 存储起来备用。
说明8.2.3 最优控制
ut K t xt , K t R 1 t B T t P t
例8.2.2 给定系统 x1 x2 , x2 u 及性能指标
1 x12 (3) 2 x2 2 (3) J 2 1 3 2 1 2 2 2 x1 ( t ) 4 x2 ( t ) 2 x1 ( t ) x2 ( t ) u ( t ) dt 2 0 2
tf
0
性能指标: x, u, t dt xt f 达极小。 J t
u t 为上 定理8.1.4 (基本定理) 设 述最优控制的解, t 为系统 x f x, u, t x
在 u t 驱动下的运动,则存在一个对应的 n 维向量函数 t ,它们满足下述正则方程
定理8.1.1 如果具有变分的泛函 J y( x ) 在 y y0 ( x )上达到极值,则 J y( x ) 沿着 y0 ( x ) 的变分 J 为零。
引理8.1.1 设 M t 是 t 0 , t f 上的 r 维连续 向量函数。如果对于任意的、在 t 0 , t f 上连续,且满足 yt 0 y t f 0 的 r 维向量函数 yt 有
2 b x a P ( t ) x( t ), x(0) x0 r
闭环系统的状态方程为
它是一个一阶时变系统,其解就是最优轨线
t b2 x ( t ) exp a P ( x )d x(0) r 0
P t B t R 1 t B T t P t Q t (t ) 2aP (t ) 1 b 2 P 2 (t ) q及边界条件 即P r P (t f ) s求解上述微分方程有
s
P (t )
b
2
dP (t ) 2 rP (t ) 2aP (t ) q
P11 ( t ) P12 ( t ) P(t ) P12 ( t ) P22 (t ) 最优控制为
k
时有 J y x J y0 x 则称泛函 J y( x ) 为在 y0 x 处具有 k 阶 接近度的连续泛函。 3.线性泛函:设 J y( x ) 为一连续泛函。如 果对于任意常数 , , J 之定义域中的任 何变量 y1 x , y2 x ,有
最优控制
u t
,使得在该控制律的作用下
上述系统的状态在限定时间 t 0 , t f
内由给定的 x t 0 出发转移到某个 xt f
且同时使得式
1 tf T 1 T T J x Qt x u Rt u dt x t f Sx t f 2 t0 2
例8.2.1给定系统x (t ) ax (t ) bu (t ), x (0) x0 1 tf 1 2 2 和性能指标J qx (t ) ru (t ) dt sx 2 (t f ) 2 t0 2 其中,q 0; r 0; s 0求最优控制u (t )。 解 从式u (t ) R 1 (t ) B T (t ) P (t ) x (t )知 1 u (t ) bP (t ) x (t ) 其中,P (t )应满足 r 方程 P t P t A t AT t P t
tf
t
dt
由此可得
sb 2 r 2 ( t t f ) ( ) 2 e r sb r P (t ) 2 sb 2 r 2 ( t t f ) b 1 2 e sb r
式中
qb2 2 a r
Leabharlann Baidu
的性能指标 J 取得极小值。
8.2.2 有限时间最优状态调节器 定理8.2.1 线性系统 T H x, u, , t x, u, t f x, u, t
在性能指标
1 tf T 1 T T J x Qt x u Rt u dt x t f Sx t f 2 t0 2
线性二次型最优控制
8.1
变分法简介
最优控制理论是变分法,也是泛函极 值理论的一个分支。 定义8.1.1 设y( x ) 为已给的某类函数。如 果对于这类函数中的每一个函数,有某数 J 与之对应,则称 J 为这类函数的泛函, 记为 J J y( x )。函数类 y( x ) 称为泛函
0 1 0 解 在本系统中,易知 A 0 0 , B 1
求最优控制 u ( t )
2 1 1 0 1 Q , R 2 ; S 0 2 , t0 0, t f 3 1 4
P (t )
是 2 2 对称阵,设为
J y x y J L y x , y
L y( x ),y 为 J 的线性主部,即
J L y x y y x y maxy
其中, L y( x ),y 相对于 J 为线性泛函
J 的定义域。
例8.1.1 设 y( x) 为定义在 0,1 上的具有连 续导数的函数的全体,则 J y( x) 1 1 y 2 dx
0
为一个泛函。
泛函的一些基本概念
1.泛函J y( x )的变量 y x 的变分:
泛函 J y( x )的变量 y x 的增量称为变分, 记为: ,指两个函数间的差,即: y
T
称为Hamilton函数。
8.2 有限时间状态调节器问题 8.2.1 问题的描述 问题8.2.1 [有限时间的线性二次型最优状态
调节问题] 在满足受控对象状态方程: xt At xt Bt ut , xt 0 x0
的约束条件下,在容许控制的范围内求取
t0
tf
对于 x x t 成立。
定理8.1.3 泛函 J xt t x, x, t dt
tf
0
在约束条件
F x, x, t 0 , t t0 , t f (其中
F 为一个关于 x 和
J x,
x 连续可微的 m
及边界条件
P tf S
且最优性能值为
1 T J x t 0 x t 0 P t 0 x t 0 2
说明8.2.1 方程
P T t AT t P T t P T t At P
T
t Bt R 1 t B T t P T t Q t
y y x y1 x 2.泛函 J y( x )的连续性: 对于任意给定的正数 ,如果存在正 数 ,当 y x y0 x , y x y0 x ,,
y
k
x y0 x
维向量 函数)下的条件、极值问题等价 于下述泛函 t
f
F 的无条件极值问题,即在满足 x, x, t 0 , t t0 , t f 且极小化泛函 J x t 的 x t
t0
, t T F x, x, t dt x, x
当 maxy 0 时, y x , y 0
8.1.2 泛函的极值 定义8.1.2 给定泛函 J [ y( x)] 及其定义域中 一变量 y0 ( x ) 。如果对于任何一个与 y0 ( x ) 接近的变量 y( x ) ,都有 J y0 x J y( x ) 0
则 M t 在 t 0 , t f 上恒为零。
tf
t0
y T t M t dt 0
J x t 在 x t 定理8.1.2 泛函
处取得极值的必要条件是下述Euler方程
d 0 x dt x 和边界条件
x 0, x 0
则称泛函 J y( x )在 y0 ( x ) 上达到一个相对 的极大值。如果上述关系对于泛函 J y( x ) 的定义域中所有的 y( x ) 均成立,则称泛函 J y( x ) 在 y0 ( x )上达到其定义域上的一个 绝对极大值。如果上式中的不等号反向, 则称泛函 J y( x ) 在 y0 ( x )上达到极小值。
H x, u , , t x
H x , u, , t u
x x
0
u u
状态方程 和边界条件 及横截条件
x f x ,u ,t
x t 0 x0
t f
x
t t f
其中
H x, u, , t x, u, t f x, u, t
或 ut R1 t BT t P t xt 作用下的最 优轨线有系统
t At Bt R1 t BT t Pt x t , x t0 x0 x
决定。 说明8.2.4 在上述最优控制问题中,我们并 没有要求系统是可稳的。 说明8.2.5 最优控制系统的结构如下图所 示。
T
下的二次型最优状态调节器为
ut K t xt , K t R
1
t B t Pt
其中,P t 为一
n n
阶矩阵,且满足
下述矩阵微分方程
t P t A t AT t P t P P t B t R 1 t BT t P t Q t
J y1 x y2 x J y1 ( x) J y2 ( x) 则称 J y( x )为线性泛函,常记为 L y( x )
4. 泛函 J y( x )的增量: 由变量 y x 的变分导致的泛函增 量,记为 J ,即 J J y x y J y( x ) 5. 泛函 J y( x ) 的变分 泛函 J y( x ) 的变分记为 :J ,其定 义为
上泛函 J 的Euler方程成立。
8.1.3
最优控制问题
问题OC 已知一个动态系统:
x f x, u, t 其中, R n为状态向量,u R r 为控制向 x
量,f 为一个关于所有变量连续可微的向量 函数; t0 , t f , xt0 x0 , xt f 自由。目的是 t 要寻找系统的一个控制 u t ,使下述泛函
称为Riccati矩阵微分方程,可以证明 其解 P t 是一个对称阵。
说明8.2.2 方程Riccati矩阵微分方程是 非线性的,通常不能直接求得解析解, 可用数字计算机离线计算,并将其解 P t 存储起来备用。
说明8.2.3 最优控制
ut K t xt , K t R 1 t B T t P t
例8.2.2 给定系统 x1 x2 , x2 u 及性能指标
1 x12 (3) 2 x2 2 (3) J 2 1 3 2 1 2 2 2 x1 ( t ) 4 x2 ( t ) 2 x1 ( t ) x2 ( t ) u ( t ) dt 2 0 2
tf
0
性能指标: x, u, t dt xt f 达极小。 J t
u t 为上 定理8.1.4 (基本定理) 设 述最优控制的解, t 为系统 x f x, u, t x
在 u t 驱动下的运动,则存在一个对应的 n 维向量函数 t ,它们满足下述正则方程
定理8.1.1 如果具有变分的泛函 J y( x ) 在 y y0 ( x )上达到极值,则 J y( x ) 沿着 y0 ( x ) 的变分 J 为零。
引理8.1.1 设 M t 是 t 0 , t f 上的 r 维连续 向量函数。如果对于任意的、在 t 0 , t f 上连续,且满足 yt 0 y t f 0 的 r 维向量函数 yt 有
2 b x a P ( t ) x( t ), x(0) x0 r
闭环系统的状态方程为
它是一个一阶时变系统,其解就是最优轨线
t b2 x ( t ) exp a P ( x )d x(0) r 0
P t B t R 1 t B T t P t Q t (t ) 2aP (t ) 1 b 2 P 2 (t ) q及边界条件 即P r P (t f ) s求解上述微分方程有
s
P (t )
b
2
dP (t ) 2 rP (t ) 2aP (t ) q
P11 ( t ) P12 ( t ) P(t ) P12 ( t ) P22 (t ) 最优控制为
k
时有 J y x J y0 x 则称泛函 J y( x ) 为在 y0 x 处具有 k 阶 接近度的连续泛函。 3.线性泛函:设 J y( x ) 为一连续泛函。如 果对于任意常数 , , J 之定义域中的任 何变量 y1 x , y2 x ,有
最优控制
u t
,使得在该控制律的作用下
上述系统的状态在限定时间 t 0 , t f
内由给定的 x t 0 出发转移到某个 xt f
且同时使得式
1 tf T 1 T T J x Qt x u Rt u dt x t f Sx t f 2 t0 2
例8.2.1给定系统x (t ) ax (t ) bu (t ), x (0) x0 1 tf 1 2 2 和性能指标J qx (t ) ru (t ) dt sx 2 (t f ) 2 t0 2 其中,q 0; r 0; s 0求最优控制u (t )。 解 从式u (t ) R 1 (t ) B T (t ) P (t ) x (t )知 1 u (t ) bP (t ) x (t ) 其中,P (t )应满足 r 方程 P t P t A t AT t P t
tf
t
dt
由此可得
sb 2 r 2 ( t t f ) ( ) 2 e r sb r P (t ) 2 sb 2 r 2 ( t t f ) b 1 2 e sb r
式中
qb2 2 a r
Leabharlann Baidu
的性能指标 J 取得极小值。
8.2.2 有限时间最优状态调节器 定理8.2.1 线性系统 T H x, u, , t x, u, t f x, u, t
在性能指标
1 tf T 1 T T J x Qt x u Rt u dt x t f Sx t f 2 t0 2