连续系统的最优控制
最优控制-第七章-动态规划法
当∆t很小时,有
t t
t
Lx, u, t d t Lx, u, t t
J x, t min
*
min
uU
uU
tf
t0
Lx, u, t d t Φ xt f
tf t t
t t
t
Lx, u, t d t
Lx, u, t d t Φ xt f
P1 11
7
P2 4 2
P3 4 4
12 A 4 8 Q1
4 3 2 2 Q3 B
5 Q2
第一段:P1、Q1的前站是始发站A。显见从
A到B的最优值为12,故得最优路线为AQ1P2Q3B。
综上可见,动态规划法的特点是: 1) 与穷举算法相比,可使计算量大大减少。如
上述最优路线问题,用动态规划法只须做10次
J x, t min Lx, u, t t J xt t , t t
* * uU
(8)
* J x , t J x, t * * J x x, t t J x, t t (12) x t x * T
A城出发到B城的行车时间最短。
P1 3 A 4 Q1 1
7
P2
2
P3 4
4
6 8 2 Q2
3 3 3
2 Q3 4
2
B
现将A到B分成四段,每一段都要作一最优决 策,使总过程时间为最短。所以这是一个多段最 优决策问题。 由图2可知,所有可能的行车路线共有8条。 如果将各条路线所需的时间都一一计算出来,并 作一比较,便可求得最优路线是AQ1P2Q3B,历时 12。这种一一计算的方法称为穷举算法。这种方 法计算量大,如本例就要做3×23=24次加法和7次 比较。如果决策一个n段过程,则共需(n-1)2n-1次 加法和(2n-1-1)次比较。可见随着段数的增多,计 算量将急剧增加。
第六章 最优控制2012
,使J 为极小。
一、性能指标及分类 性能指标函数(又称目标函数、性能泛函),最优控制
问题可归结为求性能指标的极值问题。按照实际控制性能 常见:
⑴ 最短时间问题:
拦截导弹最短时间控制
⑵ 最小消耗问题:控制量u(t)与燃料消耗量成正比
导弹最小燃料控制
(3) 线性调节器问题:考虑在平衡位置 x=0附近的状态调节
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向 量及控制向量在整个动态过程中都满足性能要求。
⑵ 终值型性能指标:
卫星的指向控制
在变分法中称为迈耶尔问题。只要求状态在过程终端时 满足一定要求,而对状态及控制量在整个动态过程中的演变 不作要求。
⑶ 复合型性能指标:
卫星的指向和 稳定控制
的变分是指两个函数间的差
问题:何为两个函数的差?两个函数距离接近?
K阶近似度
定义:设 是线性赋范空间 上的连续泛函,其增量可表示为
其中,
是关于 的线性连续泛函,
是关于 的高
阶无穷小。则
称为泛函 的变分。
泛函的变分等于
3、泛函变分的规则 1) 2) 3) 4)
变分的导数等于导数的变分
4、泛函的极值
寻求在
上的最优控制
或
,以将系统状
态从
转移到 x(t f ) 或 x(t f ) 的一个集合,并使性能指标
最优。其中
是 x 、u 和t 的连续函数
最优控制问题就是求解一类带有约束条件的条件泛函极值问 题。
泛函与变分法
一、泛函与变分
1、泛函的基本定义: 对于某个函数集合 中的每一个函数 ,变量J 都有一个
在变分法中称为波尔札问题。它要求状态在过程终端 时满足一定要求,而且状态向量及控制向量在整个动态过 程中都应满足一定要求。
可化为规范形式的问题
线性连续系统最优控制补充讲义(2004-03-09)3.6 可化为规范形式的LQ 问题3.6.1 具有规定衰减速度(稳定度)的调节器系统稳定条件,极点在左半复平面。
衰减速度:系统离虚轴最近的闭环极点与虚轴间的距离,σ。
σ 越大,系统的非零初态响应的衰减速度愈快。
若闭环系统的极点都在距离虚轴为σ的直线左边,则称闭环系统有至少不低于σ 的衰减速度。
最优化问题I :()()()()[]⎰∞+=0221min dt t Ru t u t Qx t x e J TT t α t s . ()()()t Bu t Ax t x+=& ()00x x = 式中,R 正定,Q 半正定,α为正常量,(A,B )为能控对,(A,D )为能观对,T DD Q =令,()()t x e t x t α= ()()t u e t u t α= 则有()()uBe x e I A x e Bu Ax e x e x e x t t t t t t ααααααααα++=++=+=&& 转化为最优化问题II :()()()()[]⎰∞+=021min dt t u R t u t x Q t x J T Tut s .()()()000x x x u B x I A x==++=α& 可以证明:[A,B ]完全能控[]B I A ,α+⇒完全能控。
[A,D ]完全能观[]D I A ,α+⇒完全能观。
则,最优化问题II 有唯一解:()()t x K t u α-=其中ααP B R K T 1-=()()01=+-+++-Q P B BR P P I A I A P TT αααααα又由于()()t x K t x e K u e u t t αααα-=-==--所以,两个最优控制问题的反馈增益阵是相同的,又由于最优控制问题II的闭环系统 ()x BK I A xαα-+=& 渐近稳定,即 ()()0lim lim ==∞→∞→t x e t x t t t α所以,()t x 也是渐近稳定的,且其衰减速度不低于t e α-。
最优控制基本原理
最优控制基本原理
最优控制基本原理是控制理论中的一个重要分支,它主要研究如何设计最优控制器以实现系统的最优性能。
最优控制的基本原理包括动态规划、变分法和最优化理论等。
动态规划是一种通过将问题分解成子问题并递归地解决这些子问题来求解最优控制问题的方法。
它通过构建最优化问题的状态转移方程和边界条件来寻找最优控制策略。
变分法则是一种数学方法,它通过将最优控制问题转化为弱形式的变分问题来寻找最优控制策略。
变分法运用泛函分析中的概念和方法,可以得到对动力学过程进行最优控制的必要条件。
最优化理论是一种通过最小化或最大化目标函数来寻找最优控制策略的方法,它主要应用于连续系统和非线性系统的最优控制问题中。
最优化理论的方法包括拉格朗日乘数法、Kuhn-Tucker条件和梯度下降法等。
最优控制基本原理在实际应用中有着广泛的应用,例如控制机器人、导弹、航天器和工业过程等。
通过研究最优控制基本原理,可以提高控制系统的性能,提高工业过程的效率,优化资源利用等。
- 1 -。
最优控制-极大值原理
近似算法
针对极大值原理的求解过程,开 发了一系列近似算法,如梯度法、 牛顿法等,提高了求解效率。
鲁棒性分析
将极大值原理应用于鲁棒性分析, 研究系统在不确定性因素下的最 优控制策略,增强了系统的抗干 扰能力。
极大值原理在工程领域的应用
航空航天控制
在航空航天领域,利用极大值原理进行最优 控制设计,实现无人机、卫星等的高精度姿 态调整和轨道优化。
03
极大值原理还可以应用于经济 学、生物学等领域,为这些领 域的研究提供新的思路和方法 。
02
最优控制理论概述
最优控制问题定义
01
确定一个控制输入,使得某个给定的性能指标达到 最优。
02
性能指标通常由系统状态和控制输入的函数来描述。
03
目标是在满足系统约束的条件下,找到最优的控制 策略。
最优控制问题的分类
1 2
确定型
已知系统的动态模型和控制约束,求最优控制输 入。
随机型
考虑系统的不确定性,如随机干扰、参数不确定 性等。
3
鲁棒型
考虑系统模型的不确定性,设计鲁棒控制策略。
最优控制问题通过求解优化问题得到最优解的解析表达式。
数值法
02
通过迭代或搜索方法找到最优解。
极大值原理
03
基于动态规划的方法,通过求解一系列的子问题来找到最优解。
03
极大值原理
极大值原理的概述
极大值原理是现代控制理论中的基本原理之一,它为解决最 优控制问题提供了一种有效的方法。该原理基于动态系统的 状态和性能之间的关系,通过寻求系统状态的最大或最小变 化,来达到最优的控制效果。
在最优控制问题中,极大值原理关注的是在给定的初始和终 端状态约束下,如何选择控制输入使得某个性能指标达到最 优。它适用于连续和离散时间系统,以及线性或非线性系统 。
现代控制理论》电子
➢ 也就是说,一开始司机要在经过x1(1)站还是x2(1)站两种
情况中作出决策。
✓ 到x1(1)站或x2(1)后,又面临下一站是经过x1(2)站 还是x2(2)站的第2次决策。
最优性原理与离散系统的动态规划 7.6.1 最优性原理与法离(1散/系3)统的动态规划法
基于对多阶段决策过程的研究,贝尔曼在20世纪50年代首先提出了求解离散多阶 段决策优化问题的动态规划法。 如今,这种决策优化方法在许多领域得到应用和发展,如在生产计划、资源配 置、信息处理、模式识别等方面都有成功的应用。 下面要介绍的是,贝尔曼本人将动态规划优化方法成功地应用于动态系统的 最优控制问题,即构成最优控制的两种主要求解方法之一的最优控制动态规 划法。
映了该问题的一种规律性,即所谓的贝尔曼的最优性原理。
它是动态规划法的核心。
最优性原理一般问题的问题描述 2. 最优性原理一般(问1题/2的2问)题描述
现在正式阐述动态规划的基本原理。 在引进一些专门的名词之后,先叙述所要求解的多阶段决策问题,接着给出和 证明动态规划法的核心问题最优性原理,并应用这一基本原理求解多阶段决 策过程,并将该求解方法推广至在离散系统最优控制问题。
的是: 从最后一段开始,先分别算出x1(3)站和x2(3)
站到终点F的最短时间,并分别记为J[x1(3)] 和J[x2(3)]。
实际上,最后一段没有选择的余地。 ✓ 因此,由图7-10可求得
J[x1(3)]=4, J[x2(3)]=3
多阶段决策问题(5/12)
为便于今后求解过程的应用,可将 从x1(3)站和x2(3)站到终点的最短 时间J[x1(3)]和J[x2(3)]的数值标 记于代表该站的小圆圈内,如图711所示。
最优控制的基本理论及应用
本章在介绍解决最优控制问题3种基本方法(变分 法、极小值原理和动态规划)的基础上,阐述两类典 型最优反馈系统的设计,即线性二次型最优控制和最 小时间控制。
6.2 最优控制问题的提出及数学描述
6.3.2 用变分法求解无约束条件的泛函极值问题
设积分型性能泛函为
Jtt0f L[x(tx)(,t)]d,tt
(6-24)
在区间[t0 ,t f ]上,被积函数 L[x(t),x(t),t]二次连续可微, 轨线x(t)有连续的二阶导数,x(t)Rn ,对x(t)没有任何 约束。要求确定极值轨迹 x *(t) ,使泛函J为极值。
级数 ,则
J()tt0f L x Tη(t) L x Tη (t)R dt
(6-29)
式中,R表示泰勒(Taylor)级数展开式中的高阶项。
如果定义x(t)和 x (t) 的一阶变分为 δ x εη (t),δ x εη (t)
由泛函变分的定义,泛函的一阶变分为
(6-30)
6.2.2 最优控制问题的数学描述
构成最优控制问题必须具备以下几个基本条件:
1.被控系统的数学模型,即动态系统的状态方程
状态方程在最优控制中为等式约束条件。
2.控制变量的约束条件(容许控制)
任何实际物理系统,控制变量总是受约束的,一
般可写成
u(t)U
(6-3)
式中,U表示一个封闭的点集合,称为控制域。此时称 u(t)为容许控制。
1)积分型性能泛函
Jtt0f Lx((t)u,(t),dtt)
2)终值型性能泛函
J[x(tf ),tf]
线性二次型最优控制器设计
程序运行结果如下: K =0.4142 0.6104 0.1009 同时得到闭环阶跃响应曲线,如图1-2所示。
图1-2 闭环系统阶跃响应曲线 由图1-1和图1-2知,经最优输出反馈后,闭环系统阶跃响应曲线与经最优状态反 馈后的阶跃响应曲线很接近。
三、离散系统线性二次型最优控制
下面对离散系统线性二次型最优控制进行详细介绍。
其中,A为系统的状态矩阵;B为系统的输出矩 阵;Q为给定的半正定实对称常数矩阵;R为给 定的正定实对称常数矩阵;N代表更一般化性 能指标中交叉乘积项的加权矩阵;K为最优反馈 增益矩阵;S为对应Riccati方程的唯一正定解P (若矩阵A-BK是稳定矩阵,则总有正定解P存 在);E为矩阵A-BK的特征值。
1000 Q= 取 0
,R=1。 用MATLAB函数dlqr()来求解最优控制器,给出程序清 单如下: %求解最优控制器 a=2;b=1;c=1;d=0; Q=[1000,0;0,1]; R=1; A=[a,0;-c*a,1]; B=[b;-c*b]; Kx=dlqr(A,B,Q,R) k1=-Kx(2);k2=Kx(1); axc=[(a-b*k2),b*k1;(-c*a+c*b*k2),(1-c*b*k1)]; bxc=[0;1];cxc=[1,0];dxc=0; dstep(axc,bxc,cxc,dxc,1,100)
•
1.LQG最优控制原理 最优控制原理
x(t ) = Ax(t ) + Bu (t ) + Gw(t ) 假设对象模型的状态方程表示为:
y (t ) = Cx(t ) + v(t )
T
式中,ω(t)和ν(t)为白噪声信号,ω(t)为系统干扰噪声,ν(t)为传感器带来的 量测噪声。假设这些信号为零均值的Gauss过程,它们的协方差矩阵为:
(2021年整理)最优控制理论考试重点
(完整)最优控制理论考试重点编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整)最优控制理论考试重点)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整)最优控制理论考试重点的全部内容。
1.最优控制问题的性能指标(1)积分型性能指标(拉格朗日型):⎰=ft t dt t t u t x L u J 0]),(),([)(反映控制过程偏差在某种意义下的平均或控制过程的快速性,同时能反映燃料或能量的消耗。
(2)末值型性能指标(梅耶型):]),([)(f f t t x u J φ=,接近目标集程度,即末态控制精度的度量. (3)综合性能指标(鲍尔扎型):⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ.2.最优控制问题的数学模型给定系统的状态方程:]),(),([)(t t u t x f t x =•;状态方程的边界条件:⎩⎨⎧∈===St x t t x t x t t f f )(,)(,000;给定性能指标:⎰+=f tt f f dt t t u t x L t t x u J 0]),(),([]),([)(φ;允许控制域u (t ):U t u ∈)(。
3.最优控制应用的几种类型:最短时间控制,最小能量控制,线性调节器,最少燃料消耗控制,线性跟踪器。
4.选取性能指标注意:应能反映对系统的主要技术条件要求,便于对最优控制进行求解,所导出最优控制易于实现。
5.边界条件:指状态向量在起点或终点的所有容许值的集合。
6.横截条件:依据性能指标的要求,从容许值的集合中选择哪一点作为始态或终态的问题。
《最优控制》第1章绪论
2020/8/9
1
第1章 绪论 第2章 求解最优控制的变分方法 第3章 最大值原理 第4章 线性二次型性能指标的最优控制 第5章 动态规划 第6章 状态估计
2
教学要求:
1. 学习泛函变分法,理解最优控制的一般概念 2. 掌握利用变分法求最优控制方法 3. 掌握极大值原理,状态调节器 4. 掌握动态规划
x(t) f [x(t), u(t), t]
(2)边界条件 ①初始时刻t0,初始状态x(t0)一般给定 ②终端时刻tf,变动,固定 ③终端状态x(tf)
12
第1章——绪论
x(tf)一般需满足一个约束方程[x(tf ), tf ] 0
满足约束方程的x(tf)构成一个目标集 x(tf ) S (3)一个衡量系统性能的性能指标
t0
N 1
或J x(N) F[x(k),u(k), k]
k k0
最优控制问题
(控制域) u t x t
J
17
4 常见的最优控制
tf
1.最少时间控制J dt t f t0
它要求设计一个快速控t0制系统,使系统在最短
时x间t0 内从初态终态 xt f
2.最少燃如料:导弹拦截器的轨道转移 。
最优值,J* J[u *(t)] 称为最优性能指标
14
3 研究最优控制的前提条件
1.给出受控系统的动态描述(状态方程)
连续系统 x(t) f [x(t),u(t),t]
离散系统 x(tk1 ) f [ x(tk ), u(tk ), tk ]
2.明确控制域(容许控制)
控制约束 ut 控制域(取值范围)
Mg
设M 1,x1(t) x(t)为高度,x(2 t) x1(t) x(t)
系统最优控制资料
• 一个最优控制问题的复杂程度,或者说其求解和实现的难易程度是由上述四 方面的具体规定,特别是系统的性能指标的具体形式来决定的。一般来说,
• 常用的最优化求解方法有变分法、最大值原理以及动态规划 法等。
• 控制系统的最优控制问题一般提法为:对于用动态方程描述 的系统,在某初始和终端状态条件下,从系统所允许的某控
制系统集合中寻找一个控制,使得给定的系统的性能目标函 数达到最优。
最优控制问题的描述
1、系统的状态方程。 对连续系统,其状态方程为: X f ( X (t ), u(t ), t ) 对离散系统,其状态方程为: X(k+1)=f( X(k), u(k), k ) 系统状态方程给出了系统内部状态随系统控制输入的变化关系,或者说是 内部状态的一种约束关系,或者说是系统状态在整个控制过程的转移约束 关系。
1953-1957年,贝尔曼(R.E.Bellman)创立“动态规划”原理。 为了解决多阶段决策过程逐步创立的,依据最优化原理,用一组基本 的递推关系式使过程连续地最优转移。“动态规划”对于研究最优控 制理论的重要性,表现于可得出离散时间系统的理论结果和迭代算法。
1956-1958年,庞特里亚金创立“极小值原理”。 它是最优控制理论的主要组成部分和该理论发展史上的一个里程 碑。对于“最大值原理”,由于放宽了有关条件的使得许多古典 变分法和动态规划方法无法解决的工程技术问题得到解决,所以 它是解决最优控制问题的一种最普遍的有效的方法。同时,庞特 里亚金在《最优过程的数学理论》著作中已经把最优控制理论初 步形成了一个完整的体系。
最优控制 (4)1
0
tf T T T J x dx (t f ) v t t f t x x dt 0 x x x
T
T dxT (t f ) x x
T v x (t f ) x t t f
H g T x x d H g T w w 0 dt d T ( z ) 0 dt
(2-25) (2-26) (2-27)
d 0 dt z
( x, x, w, w, z , z , , , t ) H ( x, , w, t ) T x T [ g ( x, w, t ) z 2 ]
n
其中 f 是 n 维连续可微的向量函数;状态 x (t ) R ,其初态 已知是
x (t0 ) x0
(2-2) (2-3)
终态应满足边界条件
[ x (t f ), t f ] 0
其中 是 r 维连续可微的向量函数,r n ;
u (t ) R m 受不等式 控制
g [ x (t ), u (t ), t ] 0
16
2)横截条件 T
vx 0 x t t t f t f f
T
T v 0 x x t t x f
T v H 0 (2-28) t f t f t t f
0
( x, x, w, w, z , z , , , t ) H ( x, , w, t ) T x T [ g ( x, w, t ) z 2 ]
17
对上列方程稍加分析,便知 (1)由(2-25)式
最优控制02
(2) T b i 通过0时,u i 由一个边界值变为另一个边界值。
(3) * T b i
某一时间段持续为0,则
u
i
为不确定值。
极小值原理求解最优控制问题
1、乒乓(bang-bang)原理 上面的系统如果属于平凡情况,则其最短时间控制为
u *(t)M sign(B T*(t))
该原理也适用于非线性系统 x A (x , t) B (x , t)u (t)
2、最短时间控制存在定理 设给定的线性系统为完全可控,并且系统矩阵A的特征值均具
有非正实部,控制变量满足不等式约束:u(t) M
则最短时间控制存在!
极小值原理求解最优控制问题
3、最短时间控制存在唯一性定理 设该系统属于平凡情况,若时间最优控制存在,它必定唯一。 4、开关次数定理 设该系统属于平凡情况,u(t) M,并且系统阵A的特征值全部为负实数 , 则如果最短时间控制存在,必为bang-bang控制,并且每个控制分量在两个 边界值之间的切换次数最多不超过n-1次。
又因 xn1 0 ,因此在所有时间内必须满足 xn1 0
形成新的状态方程:
x (t)f(x ,u ,t)
x n 1 (t)fn 1 (x ,t) 1 (x ,l)2l(1 ) l(x ,l)2l(l)
可解!
极小值原理求解最优控制问题
三、离散系统的极小值原理
设离散系统:
x(k+1)=f(x(k),u(k),k), k=0,1,2,…..N-1
式中 x(k) Rn , u(k) URm
k为常数,N为总参数。初始状态x(0)=x 0 ,终端状态x(N)自由。
性能指标:
N1
J=Q[x(N),N]+F(x(k),u(k),k)
最优控制第六章极小值原理
以 w u,w * u*代入上式,便得
H x*, *,u,t H x*, *,u*,t
(35)
上式表明,如果哈密尔顿函数H看成 utU 的
函数,那么最优轨迹上与最优控制u*(t)相对应的
H将取绝对极小值(即最小值)。这是极小值原理的
一个重要结论。
定理 设系统状态方程为
xt0 x0
Nxt f ,t f 0
(48)
这就是著名的极小值原理。
下面对定理作些说明: 1) 定理的第一、第二个条件,即式(41)~式
(44),普遍适用于求解各种类型的最优控制问题, 且与边界条件形式或终端时刻自由与否无关。其
中,第二个条件:min H x*, *,u,t H x*, *,u*,t uU
(45)
u u
3) H函数在最优轨迹终点处的值决定于
H
Φ
T
N
0
(46)
t f
t f tt f
4) 协态终值满足横截条件
t f
Φ
x
t
f
N T
x t f
tt f
(47)
5) 满足边界条件
J1
Ψ
x T
Ψ x
Φ t f
N T t f
tt f
t f
d xT
tf
Φ
x
N T x
Ψ x
t t
f
wT
Ψ w tt f
zT
Ψ z
tt f
最优控制理论
最优控制理论本词条由“科普中国”百科科学词条编写与应用工作项目提供专业内容并参与编辑最优控制理论(optimal control theory),是现代控制理论的一个主要分支,着重于研究使控制系统的性能指标实现最优化的基本条件和综合方法。
最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科。
它是现代控制理论的重要组成部分。
1简介这方面的开创性工作主要是由贝尔曼(R.E.Bellman)提出的动态规划和庞特里亚金等人提出的最大值原理。
这方面的先期工作应该追溯到维纳(N.Wiener)等人奠基的控制论(Cybernetics)。
1948年维纳发表了题为《控制论—关于动物和机器中控制与通讯的科学》的论文,第一次科学的提出了信息、反馈和控制的概念,为最优控制理论的诞生和发展奠定了基础。
2研究内容最优控制理论所研究的问题可以概括为:对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制方案,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。
这类问题广泛存在于技术领域或社会问题中。
例如,确定一个最优控制方式使空间飞行器由一个轨道转换到另一轨道过程中燃料消耗最少,选择一个温度的调节规律和相应的原料配比使化工反应过程的产量最多,制定一项最合理的人口政策使人口发展过程中老化指数、抚养指数和劳动力指数等为最优等,都是一些典型的最优控制问题。
最优控制理论是50年代中期在空间技术的推动下开始形成和发展起来的。
苏联学者Л.С.庞特里亚金1958年提出的极大值原理和美国学者R.贝尔曼1956年提出的动态规划,对最优控制理论的形成和发展起了重要的作用。
线性系统在二次型性能指标下的最优控制问题则是R.E.卡尔曼在60年代初提出和解决的。
3主要方法为了解决最优控制问题,必须建立描述受控运动过程的运动方程,给出控制变量的允许取值范围,指定运动过程的初始状态和目标状态,并且规定一个评价运动过程品质优劣的性能指标。
最优控制和自适应控制及其智能控制
第四十一章最优控制和自适应控制及其智能控制第一节最优控制[!、"]一、基于变分法的最优控制问题求解最优控制是经典控制理论发展到现代控制理论的重要标志之一。
这里“最优”一词指的是相对于某一给定性能指标最优,如使控制过程的时间最短,燃料消耗最少,或者误差最小,而不是任何性能指标下都是最优的。
给定受控系统的状态方程!"##(",$,%)寻求不受约束的控制向量$,使系统从初始状态"(%$)#"$在时间间隔[%$,%%]内转移到"(%%)且满足等式约束&["(%%),%%]#$这里&为’维向量函数;并使指标&取极值(#)["(%%),%%]’!%%%$*(",$,%)(%利用变分法求解最优控制时,首先构造哈密尔顿函数+和增广泛函(,。
+#*(",$,%)’!)#(",$,%)#+(",$,!,%)(,#)["(%%),%%]’")&["(%%),%%]’!%%%$[+(",$,!,%)*!)!"](%式中,"为-维、.为’维拉格郎日乘子向量。
由变分#(,#$导出的极值必要条件为:伴随方程!!#*"+"!状态方程!"##(",$,%)#"+"!控制方程"+"$#$终端约束&["(%%),%%]#$横截条件!(%%)#")""(%%)’"&)""(%%).用计算机联立求解上面五个方程,可得到最优控制问题的数值解。
二、极小值原理与动态规划用变分法求解最优控制问题时,均假定控制!不受约束,并且存在惟一的偏导数!"#!!。
然而任何实际的控制量均限制在允许范围内变化,即!"!或!!$!#%&,$"#,…,’有些问题中!"#!!不存在,在这些情况下,可利用极小值原理求解。
西工大最优控制课程 第2章 连续系统最优控制-1-时间端点固定
H 1 H n
1 t
n t
H x T H uT H x T
t
x
u
对于最优轨线,如果H 不显含t,应有
dH H 0 dt t
对横截条件的讨论
使用中分为三种情况(1)x(tf)固定;(2) x(tf)任意;
(3) x(tf)某些分量固定,某些分量任意。
情况(1)当x(tf)= xf为固定时,横截条件中因为x t f 0 ,
t1 t0
0(横截条件)
2 Bolza问题
非线性时变系统 x f ( x(t),u(t),t)
在 t0 时刻
x(t0 ) x0 u(t)
在 tf 时刻
x(t f ) x f
J 最小
min J u
[x(t
f
),t
f
]
t f ( x(t),u(t),t)dt]
t0
s.t .
x(t) f ( x(t),u(t),t), x(t0 ) x0
t0
两式的一次变分如下
t f
t0
(x)T
Fx
d dt
Fx
dt
tf t0
(u)T
Fu
d dt
Fu
dt
(x f )T Fx t f (u f )T Fu t f
t f (x)T (H )dt t f (u)T H dt
t0
x
t0
u
(x)T () tf
5 泛函极值存在必要条件的推导 时间端点固定情况目标泛函中积分项
主要内容 1 变分法的几点结论 2 Bolza问题 3 多目标优化问题 4 连续系统时间端点固定情况的泛函求极值问题 5 泛函极值存在必要条件的推导 6 连续系统时间端点固定情况泛函极值存在必要条件 7 两点边值问题的概念
最优控制
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。 定理 设J[x]是线性赋范空间Rn上的连续泛函, 若在x= x0处J[x]可微,则J[x]的变分为
J [ x0 , x] J [ x0 x]
(t ) Rn 是待定拉格朗日乘子。 为拉格朗日函数,
4.1.3 横截条件
(1)
末端时刻固定时的横截条件
F ( ) t t f x(t f ) 0 x
当tf 固定时,在x(t0)=x0 固定时,横截条件为
x(t0)=x0
如果末端状态也固定x(tf)=xf 时,边界条件退化为x(t0)=x0, x(tf)= xf ;当末端状态自由时,横截条件为
4、自变量函数的变分: 自变量函数 X (t )的变分 X X 是指同属于函数类X (t )中两个函数X 1 (t ) 、 2 (t ) 之差
X X 1 (t ) X 2 (t )
这里, t 看作为参数。当 X (t ) 为一维函数时,X 可用图4-1来表示。
图4-1 自变量函数的变分
x(t ) x * (t ) x(t )
于是泛函J 的增量 J 可计算如下(以下将*号省去)
J
tf t0
tf t0
F x x, x x, t F x, x, t dt
F F x x o ( x)2 ,( x)2 dt x x
H ( x, u, , t ) L( x, u, t ) T (t ) f ( x, u, t )
(15)
它称为哈密顿(Hamilton)函数,在最优控制中 起着重要的作用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章 连续系统的最优控制6.1 最优化问题6.2 最优控制的变分法求解6.3 线性系统二次型性能指标的最优控制1、线性系统有限时间最优状态调节系统 ◆二次型性能指标设受控系统对平衡点的增量方程为()()()()()x t A t x t B t u t ∆=∆+∆,00()x t x ∆=∆简记为()()()()()x t A t x t B t u t =+,00()x t x =最优状态调节是指:对上述系统,在时间区间0[,]f t t t ∈,寻求最优状态反馈控制,使初始状态偏差00()x t x =迅速衰减,且同时使二次型性能泛函11()()[()()()()]d 22ft t t tf f f x u t J x t Q x t x t Q x t u t Q u t t =++⎰*min f x u J J J J J =++→=式中 ()0f n n Q ⨯≥——终端加权矩阵。
()0x n n Q ⨯≥——状态加权矩阵。
()0u r r Q ⨯>——控制加权矩阵。
三个加权矩阵均为对称矩阵,为简单,一般取为对角矩阵。
●1()()2tf f f f J x t Q x t =表示对终端状态偏差即稳态控制精度的限制。
当1diag[]f f fn Q q q =,211()2n f fi i f i J q x t ==∑●01()()d 2ft tx xt J x t Q x t t =⎰表示对控制过程中状态偏差衰减速度的要求。
当1diag[]x x xn Q q q =,0211()d 2ft nx xi i i t J q x t t ==∑⎰●01()()d 2ft tu u t J u t Q u t t =⎰表示对控制过程中所消耗的能量的限制,以避免状态偏差过快衰减导致控制量超过允许数值。
当1diag[]u u ur Q q q =,0211()d 2ft ru ui i i t J q u t t ==∑⎰,2()i u t 可理解为功率。
实际上,在性能指标中,x J 已经对控制的稳态精度有所要求。
当对稳态精度有更高的要求时,才增加f J 项。
由上可知,上述二次型性能指标的物理意义是,在整个时间区间0[,]f t t t ∈,特别是终值时刻f t t =上状态变量尽量接近于0而又不消耗过大的控制能量。
◆f t 有限时的最优状态控制最优状态调节器问题是始端固定、终端自由的泛函极值问题,即0t 给定,00)x t x =(,f t 给定, )f t x (自由的泛函极值问题。
黎卡提(Riccati )矩阵微分方程(一阶非线性矩阵微分方程):1()()()()()()()()()ttux P t P t A t A t P t P t B t Q B t P t Q -++-+=0其终值条件为()f f P t Q =可以证明,当矩阵(),(),(),()u x A t B t Q t Q t 的各元素在0[,]f t t 上都是t 的连续函数时,黎卡提方程在0[,]f t t 上满足终值条件的解存在且唯一。
当()P t 解出后,便有最优控制为*1()()()()()()tuu t K t x t Q B t P t x t -==-式中,1()()()tuK t Q B t P t -=-为时变状态反馈矩阵。
最优性能指标为*0001()()()2tJ x t P t x t =闭环系统结构如图:⊗x◆()P t 的特征*()P t 的时变性:即使,,,u x A B Q Q 都是定常矩阵,此时黎卡提方程为定常系数矩阵微分方程,()P t 也是时变的。
*()P t 的对称性()P t 是对称矩阵,共含有(1)/2n n +个不同的元素。
*()P t 0[,]f t t t ∈的非负定性由于,,f u x Q Q Q 均为非负定矩阵,所以对任意的()u t 和相应的()x t ,总有0J ≥,*1()()()02tJ x t P t x t =≥,因()x t 是任意的,可知()0P t ≥。
*当f t t <<=∞,()P t 为常数矩阵在这种情况下,在动态过程的大多数时间内,()P t 为常数矩阵,从而最优控制的时变状态反馈简化为定常状态反馈。
说明后列。
例:系统状态方程为x x u =-+,0(0)x x =求最优控制,使1022211()()d min 22f J x t x u t =++→⎰解:1A =-,1B =,1f Q =,1x Q =,1u Q =,00t =,10f t = 矩阵黎卡提微分方程为2()()2()10P t P t P t -++=,()(10)1f f P t P Q ===对1f Q =,10f t =,解得))(21)1)(2()(2(2t t eP t e----+-++-=+--最优控制为*1()()()()()()tuu t Q B t P t x t P t x t -=-=-数值计算表明:(0)(1)(6)0.4140P P P ====,(7)0.4141P =,(8)0.4157P =(9)0.4430P =,(9.5)0.5372P =,(10)1f P Q ==1f Q =和0f Q =时的()P t 曲线如图所示。
t2、f t →∞时的线性定常系统最优状态调节器f t 有限时的最优状态调节器,由于()P t 是时变的。
若f t →∞,()P t 将趋于常数矩阵,最优状态反馈矩阵也将随之转化为常数矩阵。
◆无限时间(f t →∞)状态调节器问题 若线性定常系统x Ax Bu =+,00()x t x =能控,u 不受限制,二次型性能泛函为1[]d 2t tx u t J x Q x u Q u t ∞=+⎰式中 ()0x n n Q ⨯≥——状态加权对称常矩阵;()0u r r Q ⨯>——控制加权对称常矩阵。
当0x Q >或0x Q ≥但{,}A H 能观(其中tx H H Q =),则最优状态反馈控制存在且唯一:*1()()()tuu t Kx t Q B Px t -==-式中 1()tn n uK Q B P -⨯=-为最优定常状态反馈矩阵()n n P ⨯是满足满足下列黎卡提矩阵代数方程的正定对称常数矩阵:1ttux PA A P PBQ B P Q -+-+=0最优轨线*()x t 是下列奇次状态方程的解:()x A BK x =+ , 00()x t x =性能泛函的最小值为*001()()2tJ x t Px t =说明:*表面上u 不受限制,但由于性能泛函中含有1()()d 2tu t u t Q u t t ∞⎰,通过u Q 的选择,可把i u 控制在允许范围内。
* f t →∞最优调节闭环系统是定常系统。
结构图为⊗x*由于f t →∞,要求线性定常系统能控,否则不可控模态将使()x ∞→∞。
*无限时间最优调节系统必是大范围渐近稳定的。
证明:由前知,0P >.故标量函数()0tV x x Px =>。
而()[()]()tttt V x x Px x Px A BK x Px x P A BK x =+=+++11()()tt t ttuux A BQ B P Px x P A BQ B P x --=-+-11()tut tutA P PBQB P x PB x A Q P P B --=-+- 1()ttux x PBQ B Q P x -=+-由于0x Q >,0u Q >,故()0V x <。
此外,当x →∞,()V x →∞。
根据李亚普诺夫稳定性定理,无限时间最优调节系统是大范围渐近稳定的。
*无限时间最优调节系统是渐近稳定的,当f t →∞,*()0f e x t x ==。
故在性能泛函中,终端泛函1()()2tf f f x t Q x t 失去意义,予以取消,或认为f Q =0。
例:简化的同步发电机—无穷大系统机电模型如图。
模型数据为:10s M =,0.5T =,377rad/s N ω=。
二次型性能泛函权矩阵diag[0.251]x Q =,1u Q =。
求最优状态控制。
解:系统状态方程x Ax Bu =+为0/01/N u T MM ωδδωω∆⎡⎤∆⎡⎤⎡⎤⎡⎤=+⎢⎥⎢⎥⎢⎥⎢⎥-∆∆⎣⎦⎣⎦⎣⎦⎣⎦ 对于所给数据37700.0500.1u δδωω∆⎡⎤∆⎡⎤⎡⎤⎡⎤=+⎢⎥⎢⎥⎢⎥⎢⎥-∆∆⎣⎦⎣⎦⎣⎦⎣⎦ 展开黎卡提方程1ttux PA A P PBQ B P Q -+-+=0得1112111212221222037700.050.0503770p p p p p p p p -⎡⎤⎡⎤⎡⎤⎡⎤+⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦⎣⎦1112111212221222000.2500000.010100p p p p p p p p ⎡⎤⎡⎤⎡⎤⎡⎤⎡⎤-+=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦⎣⎦ 由于111212221222[00.1]0.1[]tp p B P p p p p ⎡⎤==⨯⎢⎥⎣⎦,因此,只需求出12p 和22p 。
将黎卡提方程展开,有212p +1012p -25=0,2220.01p +75422p +1=0解得12 2.071,12.07p =-;22p =满足0P >的解为12 2.071p =,22395.3p ==最优状态反馈矩阵为11222[]0.1[][0.207139.53]tuK k k Q B P p p δω-==-=-⨯=--闭环系统结构无控制时,特征方程和特征值分别为37700.05s sI A s--==,1,2j4.342rad/s λ=±系统临界稳定。
施加最优控制后377()00.0707 3.953s sI A bK s ---==+1,2 1.9765j4.769rad/s λ=-±系统渐近稳定,且阻尼良好。
阻尼比为Re /0.383ζλλ==3、f t →∞时的线性定常系统最优输出调节器若线性定常系统x Ax Bu =+,00()x t x =y C x =能控且能观,u 不受限制,二次型性能泛函为1[]d 2t ty u t J y Q y u Q u t ∞=+⎰式中 ()0y m m Q ⨯≥——输出加权对称常矩阵;()0u r r Q ⨯>——控制加权对称常数矩阵。
求最优控制*()u t ,使min J J →。
参照最优状态调节器的结果,最优输出调节器的最优控制为*1()()()tuu t Kx t Q B Px t -==-式中 1()tn n uK Q B P -⨯=-为最优定常状态反馈矩阵()n n P ⨯是满足满足下列黎卡提矩阵代数方程的正定对称常数矩阵:1uty ttPA A P PBQ B P C Q C -+-+=0注意:因黎卡提矩阵代数方程不同,此处所得P 阵与最优状态调节器时的不同,从而最优控制也不同。