现代控制理论最优控制.
最优控制理论
对于越来越多的复杂控制对象,一方面,人们所要求的控制性能不再单纯的局限于一两个指标;另一方面,上述各种优化方法,都是基于优化问题具有精确的数学模型基础之上的。但是许多实际工程问题是很难或不可能得到其精确的数学模型的。这就限制了上述经典优化方法的实际应用。随着模糊理论、神经网络等智能技术和计算机技术的发展。 近年来,智能式的优化方法得到了重视和发展。 (1)神经网络优化方法 人工神经网络的研究起源于1943年和Mc Culloch和Pitts的工作。在优化方面,1982年Hopfield首先引入Lyapuov能量函数用于判断网络的稳定性,提出了Hopfield单层离散模型;Hopfield和Tank又发展了Hopfield单层连续模型。1986年,Hopfield和Tank将电子电路与Hopfield模型直接对应,实现了硬件模拟;Kennedy和Chua基于非线性电路理论提出了模拟电路模型,并使用系统微分方程的Lyapuov函数研究了电子电路的稳定性。这些工作都有力地促进了对神经网络优化方法的研究。 根据神经网络理论,神经网络能量函数的极小点对应于系统的稳定平衡点,这样能量函数极小点的求解就转换为求解系统的稳定平衡点。随着时间的演化,网络的运动轨道在空间中总是朝着能量函数减小的方向运动,最终到达系统的平衡点——即能量函数的极小点。因此如果把神经网络动力系统的稳定吸引子考虑为适当的能量函数(或增广能量函数)的极小点,优化计算就从一初始点随着系统流到达某一极小点。如果将全局优化的概念用于控制系统,则控制系统的目标函数最终将达到希望的最小点。这就是神经优化计算的基本原理。 与一般的数学规划一样,神经网络方法也存在着重分析次数较多的弱点,如何与结构的近似重分析等结构优化技术结合,减少迭代次数是今后进一步研究的方向之一。 由于Hopfield模型能同时适用于离散问题和连续问题,因此可望有效地解决控制工程中普遍存在的混合离散变量非线性优化问题。 (2)遗传算法 遗传算法和遗传规划是一种新兴的搜索寻优技术。它仿效生物的进化和遗传,根据“优胜劣汰”原则,使所要求解决的问题从初始解逐步地逼近最优解。在许多情况下,遗传算法明显优于传统的优化方法。该算法允许所求解的问题是非线性的和不连续的,并能从整个可行解空间寻找全局最优解和次优解,避免只得到局部最优解。这样可以为我们提供更多有用的参考信息,以便更好地进行系统控制。同时其搜索最优解的过程是有指导性的,避免了一般优化算法的维数灾难问题。遗传算法的这些优点随着计算机技术的发展,在控制领域中将发挥越来越大的作用。 目前的研究表明,遗传算法是一种具有很大潜力的结构优化方法。它用于解决非线性结构优化、动力结构优化、形状优化、拓扑优化等复杂优化问题,具有较大的优势。 (3)模糊优化方法 最优化问题一直是模糊理论应用最为广泛的领域之一。 自从Bellman和Zadeh在 70年代初期对这一研究作出开创性工作以来,其主要研究集中在一般意义下的理论研究、模糊线性规划、多目标模糊规划、以及模糊规划理论在随机规划及许多实际问题中的应用。主要的研究方法是利用模糊集的a截集或确定模糊集的隶属函数将模糊规划问题转化为经典的规划问题来解决。 模糊优化方法与普通优化方法的要求相同,仍然是寻求一个控制方案(即一组设计变量),满足给定的约束条件,并使目标函数为最优值,区别仅在于其中包含有模糊因素。普通优化可以归结为求解一个普通数学规划问题,模糊规划则可归结为求解一个模糊数学规划(fuzzymathematicalprogramming)问题。包含控制变量、目标函数和约束条件,但其中控制变量、目标函数和约束条件可能都是模糊的,也可能某一方面是模糊的而其它方面是清晰的。例如模糊约束的优化设计问题中模糊因素是包含在约束条件(如几何约束、性能约束和人文约束等)中的。求解模糊数学规划问题的基本思想是把模糊优化转化为非模糊优化即普通优化问题。方法可分为两类:一类是给出模糊解(fuzzysolution);另一类是给出一个特定的清晰解(crispsolution)。必须指出,上述解法都是对于模糊线性规划(fuzzylinearprogramming)提出的。然而大多数实际工程问题是由非线形模糊规划(fuzzynonlinearprogramming)加以描述的。于是有人提出了水平截集法、限界搜索法和最大水平法等,并取得了一些可喜的成果。 在控制领域中,模糊控制与自学习算法、模糊控制与遗传算法相融合,通过改进学习算法、遗传算法,按给定优化性能指标,对被控对象进行逐步寻优学习,从而能够有效地确定模糊控制器的结构和参数
现代控制理论最优控制课件
04 离散时间系统的最优控制
CHAPTER
离散时间系统的最优控制问题的描述
定义系统
离散时间系统通常由差分方程描述,包括状 态转移方程和输出方程。
确定初始状态
最优控制问题通常从一个给定的初始状态开 始,我们需要确定这个初始状态。
确定控制输入
在离散时间系统中,控制输入是离散的,我 们需要确定哪些控制输入是可行的。
工业生产领域
02 现代控制理论在工业生产领域中也得到了广泛的应用
,如过程控制、柔性制造等。
社会经济领域
03
现代控制理论在社会经济领域中也得到了广泛的应用
,如金融风险管理、能源调度等。
02 最优控制基本概念
CHAPTER
最优控制问题的描述
确定受控系统的状态和输入,以便在 给定条件下使系统的性能指标达到最 优。
LQR方法
利用LQR(线性二次调节器)设计最优控制 器。
线性二次最优控制的应用实例
经济巡航控制
在航空航天领域,通过线性二次最优控制实现燃料消 耗最小化。
电力系统控制
在电力系统中,利用线性二次最优控制实现稳定运行 和最小化损耗。
机器人控制
在机器人领域,通过线性二次最优控制实现轨迹跟踪 和避障等任务。
03
02
时变控制系统
04
非线性控制系统
如果系统的输出与输入之间存在 非线性关系,那么该系统就被称 为非线性控制系统。
这类系统的特点是系统的参数随 时间而变化。
静态控制系统
这类系统的特点是系统的输出与 输入之间没有时间上的依赖关系 。
发展历程
古典控制理论
这是最优控制理论的初级阶段,其研究的主 要对象是单输入单输出系统,主要方法是频 率分析法和根轨迹法。
现代控制理论 最优控制
[∗ + ]
=
=
由变分引理
[∗
+ ]ቕ
=
= ∗
=
得证
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题
引理:如果函数() 在区间 ∈ [ , ]上是连Βιβλιοθήκη 的,而且对于只满足某些一般条件的任意
[ + ]
=
+ ]ቕ
=
∆ +
= lim
ቤ
∆→
∆
=
+ −
= lim
→
′
1
1 2
= lim { ඐ +
+}
2
→
2
− ∗
<
则称泛函 在∗ 处是连续的。
其中, , ∗ 表示在函数空间中 与∗ 之间的距离:
泛函的变分
, ∗ = max − ∗
≤≤
泛函 增量∆ 的线性主部称为泛函的一阶变分,简称泛函的变分,记作
选定的函数()有)()(
= , 则在区间 ∈ [ , ]上有: () ≡
一 欧拉方程
讨论一个固定端点时间,固定端点状态的无约束条件变分问题。
问题: 考虑泛函为
ሶ
= න [ , (),
]
ሶ
式中 在 ∈ [ , ]上连续, [ , (),
最优控制问题介绍
最优控制问题介绍最优控制问题是现代控制理论的核心内容之一,它研究的主要问题是如何在满足一定约束条件下,使得某一性能指标达到最优。
这类问题广泛存在于各个领域,如航天工程、经济管理、生态系统等。
通过对最优控制问题的研究,我们可以更加科学、合理地进行决策,实现资源的优化配置,提高系统的运行效率。
一、最优控制问题的基本概念最优控制问题通常可以描述为一个动态系统的优化问题。
在这个问题中,我们需要找到一个控制策略,使得系统从初始状态出发,在给定的时间内,通过控制输入,使得系统的某一性能指标达到最优。
这个性能指标可以是时间最短、能量消耗最小、误差最小等。
为了解决这个问题,我们首先需要建立系统的数学模型。
这个模型应该能够准确地描述系统的动态行为,包括状态方程、输出方程以及约束条件等。
然后,我们需要定义一个性能指标函数,这个函数描述了我们希望优化的目标。
最后,我们通过求解一个优化问题,找到使得性能指标函数达到最优的控制策略。
二、最优控制问题的分类根据系统的动态特性和性能指标函数的不同,最优控制问题可以分为多种类型。
其中,最常见的包括线性二次型最优控制问题、最小时间控制问题、最小能量控制问题等。
1. 线性二次型最优控制问题:这类问题中,系统的动态特性是线性的,性能指标函数是状态变量和控制输入的二次型函数。
这类问题在实际应用中非常广泛,因为许多实际系统都可以近似为线性系统,而二次型性能指标函数可以方便地描述许多实际优化目标。
2. 最小时间控制问题:在这类问题中,我们的目标是使得系统从初始状态到达目标状态的时间最短。
这类问题通常出现在对时间要求非常严格的场合,如火箭发射、紧急制动等。
3. 最小能量控制问题:这类问题的目标是使得系统在完成指定任务的过程中消耗的能量最小。
这类问题在能源有限的系统中尤为重要,如无人机、电动汽车等。
三、最优控制问题的求解方法求解最优控制问题的方法主要有两种:解析法和数值法。
1. 解析法:解析法是通过求解系统的动态方程和性能指标函数的极值条件,得到最优控制策略的解析表达式。
现代控制理论 6 最优控制
(11)
对(11)式中的第三项进行分部积分,得
T J [ x ( t )] H ( x , u , λ , t ) d t λ ( t ) x λ ( t ) x d t f t T t f t 0
0
t f
t f
t 0
(12)
当泛函J 取极值时,其一次变分等于零。 即
T
将上式改写成
T T t H H f δ J λ ( t ) δ x ( t ) λ δ x δ u d t 0 f f t x ( t ) x u 0 f (13)
0
tf
( x ,x , t ) 及 x ( t ) 在 [ t 0 , t f ] 上连续可微, t 0 和 t f 给定, 其中, L
(t0) x x (tf ) xf ,x(t)Rn ,则极值轨线 x * ( t ) 满足如下欧 已知 x 0, 拉方程
L d L 0 x dt x
J [ x ( t t ( x , u , t ) d t f), f] L
t f t 0
(x ,u ,t) 是 x 、u 和t 的连续函数 最优。其中 L
最优控制问题就是求解一类带有约束条件的条件泛函极值问题。
补充:泛函与变分法
一、泛函与变分
1、泛函的基本定义: 如果对于某个函数集合 x(t)中的每一个函数 x (t ),变量J 都有一个 值与之对应,则称变量J 为依赖于函数 x (t ) 的泛函,记作 Jx ( t) 可见,泛函为标量,可以理解为“函数的函数” 例如:
由于 δ u 是任意的变分,根据变分法中的辅助引理,由(16)式得 (17) (14)式称为伴随方程, λ (t )为伴随变量,(17)式为控制方程。
现代控制理论基础 第6章 线性系统的最优控制
7
方法的比较
总的来说,当控制量无约束时,‘采用“变分法” ;当控制量有 约束时,采用“极小值原理” 或“动态规划”;如果系统是线性的, 采用“线性二次型”方法最好,因为,一方面,二次型指标反映了大 量实际的工程性能指标的要求;另方面,理论上的分析及求解较简单、 方便、规范,而且还有标准的计算机程序可供使用;得到的控制器易 于通过状态反馈实现闭环最优控制,工程实现方便。在实际的工程控 制中,目前线性二次型最优控制己得到了广泛的成功应用。
J 值为极值 J (最大值或最小值),这种泛函求极值的方法,实际上 就是数学上的“变分”问题,须采用数学中的“变分法” 。
5
采用直接变分法求解最优控制率,难于甚至“无法解决容许控 制属于闭集”的最优控制问题,所以受到实际工程应用上的限制, 例如,每台电动机都有最大功率的限制;船舶或飞机的操纵舵面 也有最大偏转角的限制。况且采用直接变分法设计出的系统,其 抗参数变化的能力,即系统的鲁棒性也不强。因此,工程应用上 有较小的实用价值。
线性系统二次型的最化控制,因为其性能指标具有明确的物理 意义,在大量的工程实际中具有代表性,而且最优控制率的求解 较简单,并具有统一的解析表达式,构成的最优控制系统具有简 单的线性状态反馈的型式,易于工程实现,所以在国内外实际的 工程中目前己得到广泛应用。本章主要介绍其基本概念、基本原 理和设计方法。
下面只介绍线性二次型最优控制的基本概念、求解原理及设 计中的一些主要结论。
8
第三节 线性二次型最优控制
一、控制对象数学模型
线性系统的状态空间表达式
x(t) A(t)x(t) B(t)u(t)
y(t) C(t)x(t)
式中,
n x(t) 为 维状态向量;
(6-4)
现代控制理论-第7章 最优控制
(3)控制规律:
u* kx(t)
P由黎卡提微分k 方Q2程1BT得P 到 边界条件:P(tf)=Q0
PA AT P PBQ21BT P Q1 P(t)
例:求解使:J最小的u*(t)
0 1 0 x 0 0x 1u,
பைடு நூலகம்
J
第二节 状态调节器
在不消耗过多控制能量的前提下,使系统各状态在受 到外界干扰作用下,维持平衡状态。
一.无限长时间状态调节器
1.原系统:可控系统
2.性能指标: 说明:(1) J
x Ax Bu, y Cx
12表0 (示xTQ1系x u统TQ2要u)d求t 状态变量偏离平衡点的累积
u* kx(t)
3.控制规律
k Q21BT P
正定实对称P由黎卡提代数方程得到:
PA AT P PBQ21BT P Q1 0
例:求使J最小的u*(t)。 0 1 0
解:
x 0 0x 1u,
J
1
(xT
x uTu)dt
误差最小,这xTQ意1x 味着因某种原因系统状态偏离平衡点,控制
作用应使它很快回复到平衡点,调节器的名称由此而来
(2) 表示在控制过程中,消耗的能量最小
J中(3的u)TQ权Q2u1重半正定,Q2正定,用来确定状态变量与控制能量在
即寻求控制规律,使系统的状态变量x(t)按性能指标J的要 求,在无限长的时间内达到平衡点
1.原系统:可控、可观系统
x Ax Bu, y Cx
2.性能指标:J
1 2
[(y
0
哈工大现代控制理论基础第十一章 最优控制
11.1.1 最优控制问题的两个例子
[例1] 飞船的月球软着陆问题。 如图所示,飞船 靠其发动机产生一个与月球重力方向相反的推力 , 使得飞船到月球表面时速度为零, 即实现软着陆。 要求设计推力函数 ,使得发动机燃料消耗最少。
月球
[解]
设飞船的质量为 , 其高度和垂直速度分别为 和 ,月球的重力加速度为常数 ,飞船的自身 质量及所带燃料分别为 和 。
其中, 目标集 可表示为 性能指标 可表示为 其中 和 为连续可导的标量函数。
11.2 应用变分法求解无约束条件 的最优控制问题
11.2.1 泛函与变分
一. 泛函与泛函算子
所谓泛函,简单地说就是函数的函数,定义如下:
设
为给定的某类函数,如果对于这类函数中的
每一个函数,有某个数 与之相对应, 则称 为这类
哈工大现代控制理论基 础第十一章 最优控制
2020年4月24日星期五
11.1 最优控制问题的一般提法
最优控制研究的主要问题: 根据已建立的被控 对象的数学模型, 选择一个容许控制律, 使得被控 对象按照预定的规律运动,并使某一个性能指标达到 最大或最小。
从数学的观点来看, 最优控制问题是求解一类 带有约束条件的泛函极值问题, 属于变分学范畴。
经典的变分法只能解决控制无约束的问题, 即容许控制属于开集的一类最优控制问题。 然而, 工程中的控制常常是有约束的, 即容许控制是属于 闭集的。为了解决这个问题, 20世纪50年代,美国 学者贝尔曼和苏联科学院院士庞德里亚金分别独立 地拓展了经典变分法, 分别给出了动态规划方法和 极大值原理。 它们构成了最优控制的理论基础。
证明略
泛函变分的规则 泛函的变分是一种线性映射, 满足下列性质:
1 2 3 4
武汉大学自动化专业 《现代控制理论》第七章 最优控制
1
最优控制研究的主要问题是: 根据已建立的被控对象的数学模型,选择一个容许的 控制规律,使得被控对象按预定要求运行,并使给 定的某一性能指标达到极小值(或极大值); 从数学观点看,最优控制研究的是求解一类带有约束 条件的泛函极值问题,属于变分学的范畴。 古典变分理论只能解决控制无约束(即容许控制属于 开集)的一类最优控制问题,为满足工程实际的需 要,在20世纪50年代中期出现了现代变分理论, 常用的数学工具是Bellman(美国)的“动态规划”, 和Pontryagin(苏联)的‘极大值原理“。,又进一步推动了现代控制论的发展
T t0 T tf t0
∴ ..J = {θ [ X (t ), t ] λ (t ) X (t )}
+ ∫ {H [ X (t ), u (t ), t ] + λT (t ) X (t )}dt
t0
tf
9
极大值曲线的充分条件为 δ2 J<0
五 无约束条件的泛函极值
& 求 J ( X ) = ∫t Φ( X , X , t )dt 的极值,就是确定X(t),使 J = min .
0
tf
& 几何意义:寻找一条曲线X(t),使给定的可微函数 Φ ( X , X , t ) 沿X(t) 的积分达到极值,此时X(t)=X*(t)
横截条件: ①两端固定 ②两端状态自由
δX 0 = 0,.....δX f = 0
Φ & X Φ & X
tf
= 0,.....
③始端自由,终端固定 ④始端固定,终端自由 ⑤终端 t f 自由,但状态 X (tf )=c (tf ) 受约束——拦截 问题
Φ & X
MPC概念资料
现代控制理论的几种控制策略1.最优控制最优控制是现代控制理论的一个重要组成部分。
成功应用于航天航空和军事领域,在许多方面改变了人们的生活。
一个典型的最优控制问题描述如下:被控系统的状态方程和初始条件给定,同时给定目标函数。
然后寻找一个可行的控制方法使系统从输出状态过渡到目标状态,并达到最优的性能指标。
动态规划、最大值原理和变分法是最优控制理论的基本内容和常用方法。
庞特里亚金极大值原理和贝尔曼动态规划是在约束条件下获得最优解的两个强有力的工具,应用于大部分最优控制问题。
在实际应用中,最优控制很适用于航天航和军事等领域,例如空间飞行器的登月、火箭的飞行控制和防御导弹的导弹封锁。
工业系统中也有一些最优控制的应用,例如生物工程系统中细菌数量的控制等。
然而,绝大多数过程控制问题都和流量、压力、温度和液位的控制有关,用传统的最优控制技术来控制它们并不合适。
2。
预测控制预测控制或称为模型预测控制(MPC)是仅有的成功应用于工业控制中的先进控制方法之一。
各类预测控制算法都有一些共同的特点,归结起来有三个基本特征:(1)预测模型,(2)有限时域滚动优化,(3)反馈校正。
这三步一般由计算机程序在线连续执行。
预 测控制是一种基于预测过程模型的控制算法,根据过程的历史信息判断将来的输入和输出。
它强调模型的函数而非模型的结构,因此,状态方程、传递函数甚至阶跃 响应或脉冲响应都可作为预测模型。
预测模型能体现系统将来的行为,因此,设计者可以实验不同的控制律用计算机仿真观察系统输出结果。
预测 控制是一种最优控制的算法,根据补偿函数或性能函数计算出将来的控制动作。
预测控制的优化过程不是一次离线完成的,是在有限的移动时间间隔内反复在线进行 的。
移动的时间间隔称为有限时域,这是与传统的最优控制最大的区别,传统的最优控制是用一个性能函数来判断全局最优化。
对于动态特性变化和存在不确定因素 的复杂系统无需在全局范围内判断最优化性能,因此这种滚动优化方法很适用于这样的复杂系统。
现代控制理论最优控制(1)
1)泛函自变量的变分
δ x x(t ) x (t )
*
2)泛函的变分 泛函的增量:由自变量函数x(t)的变分δx(t)的泛函J[x(t)]
增量为
Δ J [x] J [x(t) δ x(t)] J [x(t)] L[x(t ), δ x(t)] o[x(t), δ x(t)]
泛函的变分:泛函J[x(t)]的增量ΔJ[x(t)]的线性主部称为 泛函的一阶变分,简称泛函变分记为δJ,即
J J [ x(t ) x(t )] 0 L[ x(t ), x(t )]
类比于函数y=f(x),其增量为 Δy= f(x+Δx)-f(x)=f’(x)dx+o(Δx) y=f(x)的微分 dy=f’(x)dx
2. 确定容许控制域
对于r维控制向量u(t),要满足客观约束条件
i ( x, u ) 0 j 1, 2,, m mr 把u {u (t ) i ( x, u ) 0}称为控制域
满足u (t ) u的u (t )称为容许控制
3.确定始端与终端条件 若系统的初始时刻t0确定,则:
3) 泛函的极值
若泛函J[x(t)]在曲线x(t)= x*(t)上达到极值,则有
J J [ x(t ) x(t )] 0 0
若
ΔJ=J[x(t)]-J[x*(t)] ≥0
则称泛函J[x(t)]在曲线x*(t)上达到极小值;若
ΔJ=J[x(t)]-J[x*(t)] ≤0
3)综合型性能指标( 波尔扎型)
J x t , u t , t dt x(t f ), t f t 0 L 或J x(k f ), k f L[ x (k ), u ( k ), k ]
现代控制理论2.2(最优控制)
式中:
0 1 (t ) 0 1 X (t ) , A 0 0 , B C M 2 (t ) J
初始状态给定为: 终点状态给定为:
1 (0) 0, 1 (t f )
2 (0) 0, 2 (t f ) 0
除特殊情况外,最优控制问
题的解析解都是较复杂的,以至 必须求其数值解。
但必须指出,当线性系统具
有二次型性能指标时,其解就可
以用整齐的解析形式表示。
* 必须注意,控制作用u(t)不
像通常在传统设计中那样被称
为参考输入。当设计完成时,
最优控制u(t)将具有依靠输出
量或状态变量的性质,所以一 个闭环系统是自然形成的。
现代控制理论 课 件
——最 优 控 制 系 统 设 计
§6.1 最优控制的基本概念 §6.2 无约束最优控制的变分方法 §6.3 线性调节器问题 *§6.4 受约束最优控制的极小值原理 *§6.5 最小时间系统的控制问题
§6.1 最优控制的基本概念
在古典控制理论中,反馈控制系统的传统设 计方法有很多局限性,其中最重要的缺点是:
1 J 2
tf
t0
X QXdt
T
式中 Q为对称的正定矩阵。
或者:
1 tf T T J [X QX u Ru]dt 2 t0
式中,u为控制作用,矩阵R,Q 称为权 矩阵,在最优化过程中,它们的组成将对X 和u施加不同的影响。
③线性伺服器问题: 如果要求给定的系统状态X跟踪或者尽 可能地接近目标轨迹 X d ,则问题可公式 化为: 1 tf T J [(X X d ) Q (X X d )]dt 2 t0 J为极小值。 除此之外,还有最小能量问题、最小 燃料问题等等。
现代控制理论最优控制.
情况下,线性调节器或状态调节器是最常 见的一类线性二次型问题.
最优控制的目的是:当线性系统由于某种 原因偏离出原来的平衡状态,控制的目的是 使系统的状态x(t)尽量接近平衡状态,而所用 的量又不能太大,控制能量一般描述为控制 变量的二次型.
因此目标函数选为:
1 tf T J (u ) ( x Qx u T Ru )dt 2 t0
(5)跟踪问题.
5. 线性二次型最优控制问题
所谓二次型最优控制问题,实际上是指 目标函数是状态变量和控制变量的二次 型.
如状态调节器问题,而线性二次型最优 控制问题:则是除目标函数是状态变量和控 制变量的二次型,而且它的状态方程是线性 微分方程,即
x A(t ) x B(t )u, x(t0 ) x0
0
由于A-Bk是稳定矩阵,因此 x 0 , 故而 J 1 xT 0 Px 0 2 显然性能指标可由初始条件和P算得。
5.以下求k 由于R为正定实对称阵,故 R T T T ,其中 T为非奇异矩阵,于是方程式(5)可以写 成 T T T T T A k B P P A Bk Q k T Tk 0 (6)
明显地两者之间的差异和相同处在于: 相同: 都要在给定目标函数条件下,求使目标 函数取极值的函数式变量. 相异: 一个是求函数的极值时的变量取值问题, 另一个是求函数极值时求控制函数的问题.
由于最优控制中,目标函数依赖于控制 函数u(t),因而也称目标函数为目标泛函.
因此最优控制问题实际上是求使目标泛 函取极值的控制规律问题.
1 T
例2. 考虑如图所表示的系统.假如控制信号 为 u(t ) Kx(t )
试确定最优反馈增益 K ,使得下列性能指标 达到最小
现代控制理论 7-1 最优控制的一般概念
第七章 动态系统的最优控制方法§1 最优控制的一般概念 §2 最优控制中的变分法 §3 极小值原理及其应用 §4 线性二次型问题的最优控制系统分析 System Analysis建模 建模 稳态 稳态 性能 性能稳定性 稳定性 动态 动态 性能 性能控制 系统 研究 可控性 可控性 可观性 可观性综合设计 System Synthesis设计控制器 设计控制器改善性能,达到各种性能指标1综合设计 System Synthesis 常规综合 Conventional Synthesis 常规综合 Conventional Synthesis只满足系统某些指标的要求,如 稳定性、快速性及稳态误差;最优综合/控制 Optimal Synthesis 最优综合/控制 Optimal Synthesis确保系统某种指标最优的综合, 如最短时间、最低能耗等。
返回经典控制理论设计控制方法幅值裕量、相位裕量(频率指标); 上升时间、调节时间、超调量(时域指标)PID控制串联校正特点: 系统的控制结构是确定的;控制参数设计一般采用试凑方法; 不是最优结果。
2现代控制理论常规综合方法上升时间、调节时间、超调量(时域指标) 希望的闭环极点位置(复域指标);状态反馈 特点: 系统的控制结构是确定的;不是最优结果。
综合最优化 (optimization)—— 研究和解决如何从一切可能的方案中寻 找最优的方案。
(1) 如何将最优化问题表示为数学模型; (2) 如何根据数学模型(尽快)求出其最优解。
举例最优控制 (optimal control)—— 控制理论中的优化技术。
寻找在某种性能 指标要求下最好的控制。
返回3例:搅拌槽的温度控制 例:搅拌槽的温度控制一连续搅拌槽,J为搅拌器。
槽中原放0℃的液体, 现需将其温度经1小时后升高到40℃。
为此在入口处送 进温度为u(t) 的液体,出口处流出等量的液体,以保持 槽内液面恒定。
现代控制理论 第6章 最优控制(录像)2(极小值 [1]加了二次型
min H
uU
min uT BT
u( t ) SGN( BT )
得:
ui( t )sgn ( BT ) i ,i1,2, ,r
1 a 0
其中函数sgn a
0
a0
1 a 0
a为向量时用SGN表示。
总目录 返回 上一页 下一页
6.8 极小值原理
经典变分法
x Hx,u, ,t , Hx,u, ,t , Hx,u, ,t 0
x
u
状态方程
伴随方程
控制方程
应用范围:
u无约束, 且H对u连续可微 难满足
一般 ui Mi ( i 1,2 m ) 更一般控制u(t)受不等式约束:
gxt ,u(t),t 0
总目录 返回 上一页 下一页
t
u 切换时刻
总目录 返回 上一页 下一页
6.10.2 状态轨线及开关曲线
x* t 12.3
1
0 0.307
1
0.5
t 0 0.307
6.44
5
1 t 0 0.307 1 t
总目录 返回 上一页 下一页
例6.8.2 已知系统 x1t x1t ut x10 1
x2 t x1t
x2 0 0
其中 ut 1 ,若x t f 自由,求u* t 使
J x2 1 min
由正则方程组: x Ax Bu
H AT
x
(
t
)
e
AT t
(
0
)
e
AT t 0
u( t ) SGN( BT ) SGN( BT e ATt0 )
1.时间控制是Bang-Bang控制,即开关控制;
现代控制理论 最优控制11
得证。
§6-2.2 无约束条件的变分问题
引理:如果函数 F (t )在区间 [t0 , t f ]上是连续的,而且对于只满
§6-1 最优控制问题的一般提法
4. 性能指标 tf (1)积分型性能指标: J L[ x(t ), u (t ), t ]dt t0 反映控制过程中对系统性能的要求。
(2)终值型性能指标: J [ x(t f ), t f ] 反映了系统状态在终端时刻的性能。
(3)复合型性能指标: J [ x(t f ), t f ] L[ x(t ), u (t ), t ]dt t0 反映了控制过程和终端时刻对系统性能的要求。 若:[ x(t f ), t f ]、L[ x(t ), u (t ), t ] 为二次型函数,则复合型性能指 标可表示为二次型性能指标: 1 T 1 tf T J x (t f ) Px(t f ) [ x (t )Qx (t ) u T (t ) Ru (t )]dt 2 2 t0
足某些一般条件的任意选定的函数 (t )有
则在区间 [t0 , t f ]上有: F (t ) 0
t
tf
0
F (t ) (t ) dt 0
一. 欧拉方程
(t ), t ]dt 问题: 考虑泛函为 J [ x(t )] L[ x(t ), x
t0 tf
讨论一个固定端点时间,固定端点状态的无约束条件变分问题。
则称泛函 J [ x(t )] 在 x(t ) x* (t ) 有极小值或极大值。
2. 泛函极值定理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 将(2)代入(3)可得:
1 T 1 T T T J ( x Qx x k Rkx)dt x (Q k T Rk ) xdt 2 0 2 0
令 实对称阵 于是得到
T T
xT (Q k T Rk ) x
d T ( x .P.x) dt
式中P为正定
T Px xT Px xT (Q k T Rk ) x x
现代控制理论
第七章 最优控制
1.最优控制是什么? 什么是最优控制问题? 1.1 数学上的最优方法或提法是极值问题, 极值问题是函数的极值问题.这表明, 当自变量取何值时,函数或同变量达到 极值。
显然对照这种条件或仿照这种方法,最优 控制理论的提供或问题的表达式为:当控制 函数满足何种条件时,其目标函数达到极值.
Ax Bu x 0 1 0 A ,B ,x x1 0 0 1
x
2
T
2.) 求P,由于 则假设
A R 22
,故
P R 22
p11 p 12 P p21 p22
有黎卡提方程 AT P PA PBR1BT P Q 0 可得
x1 2 x 2
x
1
2 x2
特征方程 当 1 时, S 0.866 j 故A-BK是稳定的!
1,2
det(sI A BK ) s 2 2s 1 0
2.求最优控制的方法 1. 变分法: 17 世纪,无约束最优控制 2. 最大值原理:前苏联庞特里雅金在20世 纪50年代提出. (有约束最优控制) 3. 动态规划:美国贝尔曼1957年提出,求解 最优控制策略应用于弹道优化是控制策略.
3. 实现最优控制的必备条件 1. 具有适当精度的数学模型; 2. 有明确的控制约束; 3. 有明确的目标函数,其大小能反映出所设 计的控制系统的优劣.
因此,当二次型最优控制问题的性能指 标如前所描述的那样。 其最优控制为 u kx RT BT Px 其中P应满足 AT P PA PBR1BT P Q 0 (9) 式(9)称为退化的矩阵黎卡提方程。
8. 线性二次型最优控制的设计步骤 1).解黎卡提方程,求出矩阵P,并检验P的 正定性,如P正定,则 A – BK是稳定的; 2). 将解出的P,代入 K= R B P 中, 得到 最优控制 Q Kx
由于目标泛函可归结为或需满足式(5) 或式(6)的要求,同时泛函J对k极小值的 问题可归结为方程式(5)或式(6)对k取 极小值的问题。
也就是说,当k取何值时,式(5)或式( 6)为极小,这样可将式(6)改写为:
T 1 T T 1 T 1 T A P PA TK T B P . TK T B P PBR B P Q 0 T T
(5)跟踪问题.
5. 线性二次型最优控制问题
所谓二次型最优控制问题,实际上是指 目标函数是状态变量和控制变量的二次 型.
如状态调节器问题,而线性二次型最优 控制问题:则是除目标函数是状态变量和控 制变量的二次型,而且它的状态方程是线性 微分方程,即
A(t ) x B(t )u, x x(t0 ) x0
(Q k T Rk ) ( A Bk )T P P( A Bk )
4.性能指标可计算如下:
1 T 1 T T J x (Q k Rk ) xdt x Px 2 0 2
1 ( xT Px xT 0 Px 0 ) 2
情况下,线性调节器或状态调节器是最常 见的一类线性二次型问题.
最优控制的目的是:当线性系统由于某种 原因偏离出原来的平衡状态,控制的目的是 使系统的状态x(t)尽量接近平衡状态,而所用 的量又不能太大,控制能量一般描述为控制 变量的二次型.
因此目标函数选为:
1 tf T J (u ) ( x Qx u T Ru )dt 2 t0
0
由于A-Bk是稳定矩阵,因此 x 0 , 故而 J 1 xT 0 Px 0 2 显然性能指标可由初始条件和P算得。
5.以下求k 由于R为正定实对称阵,故 R T T T ,其中 T为非奇异矩阵,于是方程式(5)可以写 成 T T T T T A k B P P A Bk Q k T Tk 0 (6)
p12 p21
先设P为实对称矩阵,则
故可得到下列方程
a,
2 1 p12 0
b,
p11 p12 p22 0
C, p
11
p p
21
22
0
d,
2 2 p12 p22 0
其中b和c 是等价的,故得到三个方程
1 p 0 p11 p12 p22 0 2 2 p12 p22 0
0 0 p11 1 0 p 21
p p
12
p 11 p 22 21
p p
12
0 1 p 11 0 0 p 22 21
p p
12
0 1 22
1
1
p 11 0 1 p 21
1.2 最优控制的提法
给定系统状态方程 x f x, u, t , x(t0 ) t0
和目标函数(泛函)
J, u, t )dt ( x(t f ), t f )
求最优控制u(t) ∈U , 使J(u)最大或最 小, U是 R 的一个子集,可开可闭。
J (u ) xT (t )Qx(t )dt
f
t0
并对控制应有约束,如不,则控制会无穷大,则 目标泛函为
J (u ) ( xT (t )Qx(t ) u T Ru) dt
t0 tf
当有终点约束要求时
1 T 1 tf T J (u ) x (t f ) Fx(t f ) ( x (t )Qx(t ) u T Ru )dt 2 2 t0
4. 典型的最优控制问题 (1)最小时间问题; (2)最小能量问题; (3)最省燃料问题; (4)状态调节器问题;
当系统的状态偏离平衡点 xe 0 时,可用 状态的平方和的积分衡量误差的积累.
目标函数可取为
J (u ) xT (t )x(t )dt
t0 tf
更一般的取为状态变量的加权平方和的积 分: t
p p
12
1 0 0 0 0 0 0 22
上述方程,计算后得到
p12 p21 1 p p p 11 22 21 p11 p12 p22 0 0 2 p12 p21 p22 0 0
Q和R为加权矩阵,调整Q和R的元素,就是调 整状态变量接近“平衡状态”和“控制的量 不能太大”这两个目标的重视程度.
6、研究线形二次型问题的重要性
1).相当多的最优控制问题是线性二次型 问题 2).线性二次型问题理论上比较完善,其 最优控制是状态变量的反馈(或u=-kx), 所以应用比较方便,闭环品质较准。
或
T 1 T TK T A P PA PBR B P Q B P T 1 T T T 1 T . TK T 0 B P
(7)
在式(7)中,第一项与K无关,因此 若第二项取极小,则能得证该式为最小, 考虑到第二项为二次型的形式,即它们是 每个元素的平方和,其结果非负,因此若 使二次型取得最小值,则使得构成向量的 T 1 T 元素为零即可,即: TK T B P 0 1 T 1 T 1 T K T T B P R B P 或 (8) 时才出现极小值。
给定系统状态方程,
Ax Bu, x(t0 ) x0 x
(1)
确定下列最优控制向量的矩阵k,
u (t ) kx(t )
使下列性能指标达到最小值
1 T J ( x Qx u T Ru )dt 2 0
(2) (3)
式中Q、R为正定实对称阵。
求最优控制问题,实际归纳为求k,下面求 解过程 1.将(2)代入(1)可得: Ax Bkx ( A Bk ) x x (4) 在下面的推导过程中,假设矩阵A-Bk是稳定 矩阵,即A-Bk的特征值都具有负实部。
明显地两者之间的差异和相同处在于: 相同: 都要在给定目标函数条件下,求使目标 函数取极值的函数式变量. 相异: 一个是求函数的极值时的变量取值问题, 另一个是求函数极值时求控制函数的问题.
由于最优控制中,目标函数依赖于控制 函数u(t),因而也称目标函数为目标泛函.
因此最优控制问题实际上是求使目标泛 函取极值的控制规律问题.
因此,最优控制也是状态反馈控制问题 ,即 u r k x r 0 即 u kx , r 0 的目的 在于使系统的状态回到 xe 0 的系统原平衡 点位置处,当然若系统的原平衡点不为零, 则应先通过坐标变换,使系统的平衡状态为 零.
7、线性二次型最优控制的解(或二次型最 优状态调节器) 方法:变分法或最大值原理,研究非时 变理论
将式(4)的结果代入后得:
T x (Q k Rk ) x x A Bk P P A Bk x T
如果要对于所存x均成立,则
(5) 显然对式(5)来说,若A-Bk为稳定矩阵, 则必存在一个正定矩阵P,并满足式(5).
3.有了式(5)以后,问题转化为求P,并 检验P是否正定阵。
2 12
解出,
2 p 1
2 1
显然P是正定矩阵,所有元素大于零
故而最优增益为
K R B P
T 1
1