极大值原理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最优控制问题可表述为:寻求一个容许控制u(t),以使受控系统从某个给定的初始状态x(t0)=x0出发,在 末时刻tf达到目标集,并且使性能指标泛函J【u(·)】达到极小值或极大值。如果这个问题是有解的,那么就 称求得的容许控制为最优控制,记为u(t);而系统状态方程在u(t)作用下的解称为最优轨线,记为x(t);相 应的极小或极大性能指标值J【u(·)】,称为最优指标值。在数学上,最优控制问题的实质,是对受约束的泛 函J【u(·)】求极值的问题,其中的约束条件为系统的状态方程、目标集方程和容许控制域。
原理简介
极大值原理
maximum principle
最优控制理论中用以确定使受控系统或运动过程的给定性能指标取极大或极小值的最优控制的主要方法。在 工程领域中很大一类最优控制问题都可采用极大值原理所提供的方法和原则来定出最优控制的规律。在理论上, 极大值原理还是最优控制理论形成和发展的基础。极大值原理是对分析力学中古典变分法的推广,能用于处理由 于外力源的限制而使系统的输入(即控制)作用有约束的问题。极大值原理是20世纪50年代中期苏联学者Л.С. 庞特里亚金提出的,有关这一原理的主要结果及其严格的数学证明,都发表在后来出版的《最优过程的数学理论》 一书中。
式9式11式13LQ问题 线性二次型性能指标的最优控制问题。
次优控制
对于较为复杂的受控系统,即使系统为线性的情况,最优控制问题的求解也常有大量的计算。采用次优控制, 可在保证性能指标值足够接近最优性能值的同时,显著地减少问题求解的计算量。实现次优控制的主要的途径是 把复杂的受控系统通过适当的方法化为两个较为简单的子受控系统,并且针对子系统来计算最优控制,再综合地 作必要的修正。实现系统性能指标值 对最优性能值的接近程度来确定;要求接近的程度越高,修正计算量也就越大。特别是对于要求计算机实时控制 的受控系统,为了避免过大的计算量或避免增加控制系统在组成上的复杂性,常常更宜采用次优控制以代替最优 控制。
最优控制问题
01
四个要素
02
受控系统
03
容许控制
04
目标集
06
表述
05
性能指标
最优控制问题是从大量的工程实际问题(特别是航天和航空技术问题)中提炼出来的一个控制理论问题。最 优控制问题有四个要素。
通常采用状态方程(见状态空间法)的形式,它是状态向量x的一阶微分方程夶=f(x,u,t),其中u为控制向 量,t为时间变量。在最一般的情况下,受控系统是非线性(见非线性控制系统)和时变(见时变系统)的,所以 f(x,u,t)为非线性和时变的向量函数。
最优控制的类型
在一般情况下,由极大值原理定出的最优控制是时间变量t的函数u(t),称为程序控制或开环控制。程序控 制的主要缺点,是不能消除或抑制由于参数的变动和环境的变化对系统造成的扰动。最优控制的另一类形式是表 示为状态变量x(t)的函数u(x),实质上是一种状态反馈,称为综合控制或闭环控制,其优点是对抑制扰动有利。 原则上极大值原理能够用来确定综合控制形式的最优控制,但除了一些典型的最优控制问题外,对于一般的情况 决定综合控制往往相当困难。在工程领域中,最为常见的一种综合控制形式是所谓的砰-砰控制。在这类控制形 式中,根据系统的运动状况,最优控制u的各个控制变量在整个过程中分段地取为容许控制范围的正最大值或负最 大值。砰-砰控制的原理是把最优控制问题归结为:将状态空间划分为两个区域,一个区域对应于控制变量取正 最大值,另一个区域对应于控制变量取负最大值。这两个区域的分界面称为开关面,而决定砰-砰控制的具体形式 的关键就是决定开关面。砰-砰控制形式的最优控制常用于最速控制系统和最省燃料控制系统。在正常情况下, 砰-砰控制的控制变量由正最大值跃变到负最大值的次数是有限的,只有在跃变瞬时控制变量可取值于限制范围的 任何值。但对于某些问题,砰-砰控制中至少存在一个时间区间,其中控制变量可取为限制范围的任意值,这类问 题称为奇异最优控制问题。对于奇异最优控制问题,仅由极大值原理的条件还不足以确定奇异时间区间内的最优 控制u与最优轨线x间的关系即综合控制的形式。
极大值原理
数学证明理论
01 原理简介
03 基本形式 05 次优控制
目录
02 最优控制问题 04 最优控制的类型 06 推广
极大值原理是对分析力学中古典变分法的推广,能用于处理由于外力源的限制而使系统的输入(即控制)作 用有约束的问题。极大值原理是20世纪50年代中期苏联学者Л.С.庞特里亚金提出的,有关这一原理的主要结果 及其严格的数学证明,都发表在后来出版的《最优过程的数学理论》一书中。
推广
极大值原理不仅可用于解决连续形式的受控系统的最优控制问题,而且还被推广于处理离散形式的受控系统 的最优控制问题。离散最优控制问题的极大值原理称为离散极大值原理。极大值原理对求解分布参数系统的最优 控制问题也很有效,相应的方法称为分布参数系统的极大值原理。
谢谢观看
工程实际因素的限制决定了控制器的允许类型。一个容许控制只能在控制的容许类中选取。用U表示系统的控 制的允许类,则在数学上可将容许控制u表示为u∈U。通常U受到封闭性的边界限制。
在控制作用下系统状态所要达到的目标区。这个目标区可以是一个给定的点,也可以是一个给定的区域。用 tf表示运动过程的末时刻,x(tf)表示末时刻系统的状态,则目标集常可用向量等式g1(x(tf),tf)=0、向量不 等式g2(x(tf),tf)≤0来描述。
式1式2反映和评价系统性能优劣的指标。性能指标的形式由实际问题来决定,通常有两种类型:表示系统在 末时刻状态的性能指标称为末值型性能指标,记为S(x(tf),tf);用特定函数的积分表示系统运动过程中的性能 的指标称为积分型性能指标,记为式1其中t0为初始时刻。性能指标的一般形式为式2称为混合型性能指标。性能 指标值的大小依赖于控制作用的整体u(·)的选择,而不是取决于控制u在t时刻的值;因此J【u(·)】是控 制函数u(·)的函数(称为u(·)的泛函)。
基本形式
对于定常系统的最优控制问题的极大值原理可表述如下:如果最优控制问题的数学模型为:受控系统=f(x, u),x(t0)=x0,t∈【t0,tf】
目标集g1(x(tf))=0,g2(x(tf))≤0 容许控制u∈U 性能指标J【u(·)】=S(x(tf)) 末时刻tf自由 则u(t)为最优控制、x(t)为最优轨线和tf为最优末时刻的必要条件有五项。 ① x(t)满足方程(式3) 式3② λ(t)满足方程(式4)式中(式5)称为给定问题的哈密顿函数,λ^T(t)为λ(t)的转置。λ (t)称为状态x(t)的伴随状态,而其方程称为伴随方程。 式5 式4
相关文档
最新文档