最优控制变分法
优化理论课件(变分法与最优控制理论)
优化理论课件(2)第二部分动态优化:变分法和最优控制理论变分法是处理动态优化的古典方法,现在较少使用,在蒋中一的书中,变分法的思路可用来解释庞特里亚金最大值原理(一阶条件)。
本部分内容主要来自蒋中一《动态最优化基础》。
目录一、什么是动态优化? (3)(一)动态优化问题的基本要素 (4)(二)泛函及其相关概念 (4)(三)可变终结点 (5)(四)横截条件 (6)(五)目标泛函 (6)二、变分法 (7)(一)基本问题:固定终结点问题 (7)(1)基本问题及其假定 (7)(2)一阶条件:欧拉方程 (8)(二)推广:多状态变量与高阶导数 (10)(1)多状态变量 (10)(2)高阶导数 (10)(三)可变端点问题 (10)(1)一般性横截条件 (11)(2)垂直终结线问题 (12)(3)水平终结线问题 (12)(4)终结曲线问题,即错误!不能通过编辑域代码创建对象。
(12)(5)截断的垂直终结线问题 (12)(6)截断的水平终结线问题 (13)(7)多变量和高阶导数情形 (13)(四)二阶条件(充分条件) (14)(1)固定端点问题的二阶条件及其二次型检验 (14)(2)凹凸性充分条件 (14)(3)变分 (15)(五)无限期界问题 (16)(1)收敛性 (16)(2)横截条件 (17)(3)充分条件 (17)(六)带约束的优化问题 (17)(1)等式约束 (17)(2)不等式约束 (18)(3)积分约束(等周问题) (19)三、最优控制理论 (20)(一)最优控制理论导论 (20)(二)最大值原理及其横截条件 (21)(1)最简单问题及最大值原理(一阶必要条件) (21)(2)最大值原理的理论基础及其横截条件 (23)(3)自控问题的汉密尔顿函数不变性 (26)(4)推广到多变量 (26)(三)最大值原理的经济学解释及现值的汉密尔顿函数 (27)(1)最大值原理的经济学解释 (27)(2)现值的汉密尔顿函数 (28)(四)充分条件(二阶条件) (29)(1)曼加萨林定理 (29)(2)阿罗条件 (31)(五)无限期界问题 (31)(1)横截条件与反例 (32)(2)作为充分条件一部分的横截条件 (32)(六)有约束的最优控制问题 (33)(1)涉及控制变量的约束 (33)(2)状态空间约束 (39)四、拉姆齐模型 (43)(一)相关理论发展背景 (43)(二)最简单的拉姆齐模型及其动力系统 (45)(三)微分方程定性稳定性判别方法简介 (47)(1)稳定性与渐进稳定性 (47)(2)稳定性判别基本定理 (48)(2)平面动力系统的奇点 (49)一、什么是动态优化?例:一个企业将原料从初始状态A通过五道工序,变为总结状态Z,每个阶段的选择对应一个阶段的成本,如何选择路径使得总成本最小化?从这个例子中可以看到:首先,动态强调的是时期之间的联系,而不仅仅是有时间的顺序;其次,这里也包含了Bellman方程的基本原理。
第二章 变分法及其在最优控制中的应用
2 dx 2 2 dx = 2 dt xx dt x t x
= 其中:
xx x xx x x
2 x
2
t
x x
x
x
2 x x
xt
2 x t
所以 式<10>的全导数欧拉方程形式为:
t0 tf
.
问题:求 u * (t ),使被控过程状态由 x (t 0) 转移到 x (t f ) ,并使目标函数
J 最小。
, t ) 代入<4> 解:把<1 >式化为u的显函数形式,即 u F ( x, x 式,则有: . tf J [ x(t ), x(t ), t ]dt 5
a
b
x 的函数
) ) F ( x, y, y F ( x, y, y ]dx J [ y y a y y
b
泛函 J [ y ( x)]的变分 J 可通过增量形式求取:
泛函增量为: J J [ y( x) y( x)] J [ y( x)]
L[ y( x), y( x)] R[ y( x), y( x)]
2、 泛函的极值的定义:
若 泛函 J [ y ( x)] 在任何一条与 y y 0 ( x) 曲线接近的曲 线上的值均不小于 J [ y ( x)] ,即: , J [ y( x)] J [ y0 ( x)] 0 则称泛函 J [ y ( x)] 在曲线上达到极小值。 泛函极值是一个相对概念 , y ( x) 实际为相对于y0 ( x) 的一个微 小变化,变化形式有上述两种 :
1 3
x(t )
第4章 最优控制与变分法
第4章 最优控制与变分法
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。
4.1 最优控制问题的数学描述 4.2 无约束条件的动态最优化问题 4.3 带等式约束的动态最优化问题 4.4 用哈密顿函数求解最优控制问题
第4章 最优控制与变分法 3、约束条件的数学描述 、
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。
一般约束条件可用如下的等式约束方程或 不等式约束方程来描述: 不等式约束方程来描述:
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。
的质心距离地面的高度, 解 : 设 x(t)为 M的质心距离地面的高度 , 由牛顿第 为 的质心距离地面的高度
(4-1) )
J = θ ( x, t ) t
(4-9) )
性能指标如式(4-9)所示的问题称为迈耶问题 。 所示的问题称为迈耶问题。 性能指标如式 所示的问题称为迈耶问题 该类问题只关注始端和终端时刻的系统状态, 该类问题只关注始端和终端时刻的系统状态 , 而 不关心系统的运动过程, 因此性能指标只是始端、 不关心系统的运动过程 , 因此性能指标只是始端 、 终端时刻和状态的一个函数。 终端时刻和状态的一个函数。
第4章 最优控制与变分法
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。
最优控制变分法
x(t ) x (t ) (t )
将式(1· 2—5)两边对 t 求导,可得
将式(1· 2—5)、(1· 2—6)代入式(1· 2—3),又得
x(t ) x (t ) (t )
(1· 2—6)
J [ x] L[ x (t ) (t ), x (t ) (t ), t ]dt (1· 2—7) 在式(1· 2—7)中,每选择一个 (t ) ,都可作一条 J [x] 曲 线。选择各式各样的容许的 (t ),可以作出一族 J [x] 曲线,
二、固定端点时间、无约束条件的变分问题 这一节,我们讨论一类最简单的变分问题,即无约束条件、 端点时间固定,只有一个自变量函数的拉格郎问题。通过这个问 题来引出欧拉方程和横截条件。 求解变分问题,就是要把使泛函达到极值的那个自变量函数 找出来,这就需要利用欧拉方程和横截条件。因此,欧拉方程和 横截条件是求解变分问题的基础。 在推导欧拉方程和横截条件时要使用一个定理,这个定理叫 作变分法的基本颈备定理。 本节首先介绍基本预备定理,接着推导欧拉方程,然后讨论 横截条件,最后讨论泛函取极值的充分条件。
2. 欧拉方程 现在,我们来推导欧拉方程和相应的横截条件。首先讨论固定 端点问题,然后讨论未定端点问题。 考虑最简单的泛函
(1· 2—3) L 的极值。其中x(t ) 是 t 二次可微函数; [ x(t ), x(t ), t ],是变量 x, x和 t 连函函数,并且有连续二阶偏导数,端点时间 t 0 和 t f 固定。 首先研究容许函数(或曲线)端点固定的情况,即规定 x(t 0 ) x0 和 x(t f ) x f 。图1—4示出了一族容许函数。现在的 的问题是要从这一族容许函数(或曲线)中找出使泛函J取极值的函数(或 曲线),即极值函数或极值曲线。
最优控制变分法
最优控制变分法
最优控制变分法是一种数学方法,用于研究控制系统中最优化问题。
它通过对系统状态和控制变量的变分计算,得到最优控制方程和最优轨迹。
在实际应用中,最优控制变分法被广泛应用于机器人控制、航空航天、化工过程控制等领域。
与传统的优化方法相比,最优控制变分法能够更加准确地描述控制系统的动态行为,同时具有较高的求解精度。
此外,最优控制变分法还可以用于设计控制系统的参数,提高系统的性能和稳定性,从而最大程度地实现自动控制的效果。
- 1 -。
优化理论课件(变分法与最优控制理论)
优化理论课件(2)第二部分动态优化:变分法和最优控制理论变分法是处理动态优化的古典方法,现在较少使用,在蒋中一的书中,变分法的思路可用来解释庞特里亚金最大值原理(一阶条件)。
本部分内容主要来自蒋中一《动态最优化基础》。
目录一、什么是动态优化? (3)(一)动态优化问题的基本要素 (4)(二)泛函及其相关概念 (4)(三)可变终结点 (5)(四)横截条件 (7)(五)目标泛函 (7)二、变分法 (8)(一)基本问题:固定终结点问题 (8)(1)基本问题及其假定 (8)(2)一阶条件:欧拉方程 (8)(二)推广:多状态变量与高阶导数 (11)(1)多状态变量 (11)(2)高阶导数 (11)(三)可变端点问题 (12)(1)一般性横截条件 (12)(2)垂直终结线问题 (13)(3)水平终结线问题 (14)(4)终结曲线问题,即错误!不能通过编辑域代码创建对象。
(14)(5)截断的垂直终结线问题 (14)(6)截断的水平终结线问题 (14)(7)多变量和高阶导数情形 (15)(四)二阶条件(充分条件) (15)(1)固定端点问题的二阶条件及其二次型检验 (15)(2)凹凸性充分条件 (16)(3)变分 (17)(五)无限期界问题 (18)(1)收敛性 (18)(2)横截条件 (19)(3)充分条件 (19)(六)带约束的优化问题 (19)(1)等式约束 (19)(2)不等式约束 (21)(3)积分约束(等周问题) (21)三、最优控制理论 (22)(一)最优控制理论导论 (22)(二)最大值原理及其横截条件 (23)(1)最简单问题及最大值原理(一阶必要条件) (23)(2)最大值原理的理论基础及其横截条件 (26)(3)自控问题的汉密尔顿函数不变性 (29)(4)推广到多变量 (29)(三)最大值原理的经济学解释及现值的汉密尔顿函数 (30)(1)最大值原理的经济学解释 (30)(2)现值的汉密尔顿函数 (32)(四)充分条件(二阶条件) (32)(1)曼加萨林定理 (32)(2)阿罗条件 (34)(五)无限期界问题 (35)(1)横截条件与反例 (35)(2)作为充分条件一部分的横截条件 (36)(六)有约束的最优控制问题 (36)(1)涉及控制变量的约束 (37)(2)状态空间约束 (43)四、拉姆齐模型 (47)(一)相关理论发展背景 (47)(二)最简单的拉姆齐模型及其动力系统 (49)(三)微分方程定性稳定性判别方法简介 (53)(1)稳定性与渐进稳定性 (53)(2)稳定性判别基本定理 (53)(2)平面动力系统的奇点 (54)一、什么是动态优化?例:一个企业将原料从初始状态A通过五道工序,变为总结状态Z,每个阶段的选择对应一个阶段的成本,如何选择路径使得总成本最小化?从这个例子中可以看到:首先,动态强调的是时期之间的联系,而不仅仅是有时间的顺序;其次,这里也包含了Bellman方程的基本原理。
最优控制中的变分法
tf t0
2[x(t)x(t)]x(t)d|t0tt0f
2x(t)x(t)dt
第1章 最优控制中的变分法
(3)泛函的极值 泛函极值的定义:
对于与y0(x)接近的曲线y(x),泛函J[y(x)] 的增量
J J [ y ( x ) J [ y ] 0 ( x ) 0 或 ] J J [ y ( x ) J [ y ] 0 ( x ) 0 ]
d
J [ y 0 ( x ) ] J [ y 0 ( x ) ε y ( x ) 0 ] d() 0( 1 9 )
根据函数极值的条件,函数φ(ε)在ε=0时达到极值的必要条件为:
dd()00 (11)0
比较(1-9)和(1-10),可见:
J[y0(x) ]0 (1 1)1
根据泛函极值的必要条件,可得欧拉方程
[Lxddt(Lx)]0 Lx ddtLx 0
或 (123)
欧拉方程的展开形式:
L x t2 L x x2 L x x x 2 L 2x0 或(12)4 LxLtx Lxx x Lx x x0
对于某一类函数y(·)中的每一个函 数y(x),变量J都有一个值与之相对 应,那么变量J称作依赖于函数y(x) 的泛函。
记为: J=J [y(x)]
y(x)称为泛函的宗量
宗量的变分:
yy(x)y0(x)
例1-1问题的本质:泛函极值
第1章 最优控制中的变分法
泛函的连续性:
对任意给定的正数ε,总存在另一个正数δ,当
则泛函J[y(x)] 在曲线y0(x)上达到极值。
泛函极值定理: 若可微泛函J[y(x)]在y0(x)上达到极值,则在y= y0(x)上的变分为零。即
变分法求解最优控制
J (u(t )) (t f , x(t f )) F (t, x(t ), u(t ))dt
t0 tf
性能指标J(u(t))在数学上称为泛函,在控 制系统中称为损失函数。
变分法基本概念
1.泛函
设S 为一函数集合,若对于每一个函数 x(t)∈S有一个实数J 与之对应,则称J 是 定义在S 上的泛函,记作J (x(t))。S 称为 J 的容许函数集。
t0
tf
再令 J 1 0 ,由 便得:
dt f ,x(t f ),x,u, 的任意性,
(i) x * , * 必满足正则方程: 1.状态方程
x H f (t, x, u)
2.协态方程
H x
* *
(ii)哈密顿函数 H (t, x , u, ) 作为u的函数,也 必须满足
定义一个标量函数:
H (t, x, u, ) F (t, x, u) T (t ) f (t, x, u)
称为哈密顿函数。所以新的性 能指标为
J 1 ( x, u, ) (t f , x(t f )) [ H (t, x, u, ) T x]dt
t0 tf
t0 tf
d (dt fy) [t f fF xt ,yxdx , t ) t t f F'( ) y ) ( (, ) , u dy a (
T
b( y )
] [x(t f )] x (t f )
T
T tf
[(x) H x (u) H u ( ) H ( ) x]dt (t f )x t t f (x)T dt t0 f y ( x, y)dx f [b( y), y)]b' ( y) f [a( y), y)]at'0( y)
最优控制变分法
AB
x2 x1
1 y ' 2 dx
通过A,B两点的函数若为 y f (x) ,则不同的函数有不同的 弧长,即弧长是 y 的函数,记为 J ( y ) ,即
x2 1 y 2 dx J ( y ) AB x1
因此,求弧长的定积分是一种变换,它把x1与x2之间各点相应 的y变换为标量(弧长)。由此例可以看出定积分为泛函。 以下是各章经常要用到下列形式的目标函数
以下计算第二个积分,实际上是估计余项。 按泛函求极值的
ˆ 与 y 的一级距离应落入ε邻区内(由于本节的泛函 定义, y
只对 y 与 y’提出要求,故只用到一级距离),即令
ˆ y| d 0 max | y
x [ x 0 , x1 ]
ˆ ' y ' | d 1 max | y
x [ x 0 , x1 ]
第一章
变分法
1.1 泛函 1.2变分的推演 1.3Euler方程 1.4向量情形 1.5有约束的情形 1.6端点可变情形 1.7变分的另一种定义
1.1 泛函
(1)定义(泛函)
泛函是一映射L : J K , J Y , Y为一向量空间, K 一般为实数 域R或复数域C。 这说明泛函是一种变换,它把向量空间Y中某一子集J 映射为 K的某个子集。 例:曲线的弧长 在xy平面上过A(x1 ,y1),B(x2,y2)两点之间的曲线弧长公式为
| [ ( Fy Fy ) ' (F y ' Fy ' )]dx | | |dx
x0 x0
x1
x1
[| (Fy Fy ) | | ' ( F y ' Fy ' ) |]dx
变分法与最优控制
t
一阶相近
当函数x(t)与 x0(t)之差的绝对值以及它们的一 阶导数 x(t ) 和 x0 (t ) 之差的绝对值,即
x(t ) x0 (t ) 和 x(t ) x0 (t )
x x(t) x0(t)
t1 t t2
都很小,称函数x(t)与函数x0(t)是一阶相近的。
求解综合型(波尔扎)问题
2.2 无约束最优化问题
1、无约束固定端点泛函极值必要条件
问题 2-1 无约束固定终端泛函极值问题为:
其中, L[ x(t ), x(t ), t ] 及x(t)在[t0,tf]上连续可微, t0及tf 固定,x(t0)= x0,x(tf)= xf, x(t ) R n
求满足上式的极值轨线x*(t)。
边界条件
定理2-5 若给定曲线x(t)的始端x(t0)= x0和终端x(tf)= xf, 则泛函
J [ x(t )] L[ x(t ), x(t ), t ]dt
t0 tf
达到极值的必要条件是,曲线x(t)满足欧拉方程
欧拉(Euler)方程
d Lx L x 0 或 dt
泛函的变分 当宗量x(t)有变分时,泛函的增量可以表示为
J [ x(t )] J [ x(t ) x(t )] J [ x(t )] L[ x(t ),x(t )] r[ x(t ),x(t )]
线性 主部
其中,L[x(t),x(t)]是关于x(t)的线性连续泛函;
虑各种阻力的影响,问应取怎样 的路径,才能使所经历的时间最 短?
结论:最速降线是一条圆滚线。
在A、B两点所在的竖直 平面内选择一坐标系, 如上图所示。 A 点为坐 标原点,水平线为 x 轴, 铅垂线为y轴。
最优控制第1章 变分法
则称泛函f((x)在 x0 处是连续的。 定义2(泛函的连续性)若对任意给定的 ε > 0 ,总存 在 δ > 0,当 x(t) − x0 (t) ≤ δ 时,就有:
| J [ x(t )] − J [ x0 (t )] |< ε
其中,x(t)为在[0,3]上连续可积函数。J[x]表示由函数x(t) 在区间[0,3]上围成区域的面积。 当 x(t)=t 时,有J[x]=4.5 ;当 x( t ) = e t 时,有 J [ x] = e3 − 1 。 ¾ 通俗地说,泛函就是“函数的函数” 。 ¾ 泛函与函数的区别: 仅在于泛函的宗量(自变量函数) x(t) 是函数,而函数的自变量x是变数(独立变量)。
则称泛函J[x(t)]在 x0(t) 处是连续的。
定义3' (线性函数) 如果函数f(x) 满足: (1)齐次性:f (ax) = af ( x) ∀x ∈Ω, a ∈ R, ax ∈Ω (2)叠加性:f ( x1 + x2 ) = f ( x1) + f ( x2 ) ∀x1, x2 , x1 + x2 ∈Ω 则称函数f(x)是线性函数。 根据定义,容易判断f(x)=2x是线性函数,g(x)=2/x是非线性 函数。 定义3 (线性泛函)如果泛函J[x(t)] 满足: (1)齐次性: J[ax(t )] = aJ[ x(t )] (2)叠加性: J[ x1(t ) + x2 (t )] = J[ x1(t )] + J[ x2 (t )] 则称泛函J[x(t)]是线性泛函。
暂态性能、稳态误差等控制性能。
一、最优控制问题的几个实例 1. 登月舱的月球软着陆问题
为使宇宙飞船在月球表面上实现软着陆,必须寻求着陆过 程中发动机推力的最优控制规律,使燃料的消耗量最少。 设飞船的质量为m(t),离月球表面的高度为h(t),飞船的垂 直速度为v(t),发动机推力为u(t),月球表面的重力加速度 为g,不携带燃料的飞船质量为M,初始燃料的质量为F, 则飞船的运动方程可表示为:
变分法在最优控制中的应用
这里,极值曲线x(t)除满足边界条件和古典变分学中规定的连 续可微条件外,还须满足该等式约束条件。 由于动态系统的状态方程可归为等式约束,因此该等式约 束变分问题是研究最优控制的基础。 下面就给出并证明处理 等式约束变分问题的等式约束变 分定理。
(t , x(t ), x(t )) 0 (7 47)
当选择(t)满足
S ( x (t f ), t f ) H λ , λ(t f ) x x (t f )
时,可惟一确定拉格朗日乘子函数(t)。 于是,泛函J1的一阶变分可变为
J1
tf t0
H udt u
J1
tf
t0
H udt u
具有等式约束条件下的变分问题 (3/10)—定理7-4
定理 7-4(等式约束变分定理 ) 如果n维向量函数 x(t)能使等式 约束变分问题 取极值 , 那么 , 必存在待定的 m维拉格朗日乘子 向量函数(t),使泛函
J1 H (t , x(t ), x(t ), λ(t ))dt
t0 tf
t0 tf
H d H 0 (7 49) x dt x
末态时刻固定、末态无约束的最优控制问题(4/12)
求泛函J1的极值问题,可以直接用欧拉方程(7-49)来求得极值 条件,并且通过边界条件确定由极值条件得到方程解的积分 常数,如例7-6中,边界条件为系统起点和终点状态。
后面将会给出不同情况下的边界条件。
Ch.7 最优控制原理
目录(1/1)
目
录
7.1 最优控制概述 7.2 变分法 7.3 变分法在最优控制中的应用 7.4 极大值原理 7.5 线性二次型最优控制 7.6 动态规划与离散系统最优控制 7.7 Matlab问题 本章小结
最优控制第三章用变分法解最优控制问题
H 2x
x
H 0 2u 0 2u
u
u x
x u x u u x x x 0
2023/12/27
x(t ) c1et c2et x(t) c1et c2et u
由边界条件和横截条件 x(0) x0
H (t f ) [ t ]t f
cc11
c2 x0 c2 0
约束条件 x(t0 ) x0 , M [x(t f ), t f ] 0
正则方程 x H
H x
控制方程 H 0 u
2023/12/27
边界条件和横截条件
终端固定
x(t0 ) x0 ,
M [x(t f )] 0 x(t f ) x f
tf
给定
终端自由 终端约束
终端固定
tf
自由
终端自由 终端约束
2 (t f
)
x2 (t f
)
M (
x2 (t f
)T )
v(t f
)
2 (2) x2 (2) 2 5v c2e2 c1
代入 x1 (2), x2 (2)
2023/12/27
14
解得
0.5c2 c3 c1 0.5c2
c4 c3
0 0
7c1 3e2c2 4e2c3 c4 15 x1 (2) 5x2 (2) 15
(t f
)
[ x
(M x
)T v] tt f
M [x(t f ), t f ] 0
H (t f
)
[
t
vT
M t
] tt f
9
例2 已知系统状态方程为 x u(t), x(0) 1
求最优控制 u* (t) 使性能指标 J 1e2t (x 2 u 2 )dt 为最小 0
4 最优控制-变分法
I D (t )
≤ I D max
tf 0
(5) ) (6) )
性能指标
J =∫
dt = tf
最优控制问题为:在状态方程的约束下, 最优控制问题为:在状态方程的约束下,寻求最优控制 I D (t )≤ I D max ,将 x (t f ) 转移到 x (0) ,使J 为极小。 为极小。
最优控制问题的基本组成
泛函与变分法
一、泛函与变分 1、泛函的基本定义: 、泛函的基本定义: 变量J 如果对于某个函数集合{x(t )}中的每一个函数 x(t ),变量 都有一个 值与之对应,则称变量J 的泛函, 值与之对应,则称变量 为依赖于函数 x(t ) 的泛函,记作 J [x(t )] 可见,泛函为标量,可以理解为“函数的函数” 可见,泛函为标量,可以理解为“函数的函数” 例如: 例如:
0 0 & x1 0 1 x1 K 系统方程为 1 x = 0 0 x + m I D + TF J 2 J D &2 D x ( 0) 0 x1 (t f ) θ 初始状态 1 = x (0) 0 末值状态 = 2 x2 (t f ) 0
系统数学模型
& 系统状态方程为 x(t ) = f [ x(t ), u (t ), t ], t ∈ [t0 , t f ]
边界条件与目标集 容许控制 变化范围受限制的控制- 闭集 控制域 Ω 闭集- 控制域, 变化范围受限制的控制 -闭集 -控制域, ; 容许控制 u (t ) ∈ Ω 变化范围不受限制的控制- 开集 变化范围不受限制的控制 -开集 性能指标 性能泛函、 性能泛函、目标函数或代价函数
用变分法求解最优控制问题
与以前不同的是,在动态问题中拉格朗日乘子 向量(t) 是时间函数。
在最优控制中经常将 (t )称为伴随变量,协态(协状 态向量)或共轭状态。引入 (t) 后可作出下面的增 广泛函
Ja X (t f ),t f
tf t0
FX ,U,t T (t) f (X ,U,t) X
对上式第二项作分部积分,按公式
可得
t f t0
udv uv
tf t0
t f vdu
t0
J
tf t0
F x
d dt
(
F x
)xdt
F x
x
tf t0
(5-2)
J取极值的必要条件是 J 等于零。因 x是 任意的,要使(5-2)中第一项(积分项)为 零,必有
x* (t) sht sh1
例5-2 求使指标
J 1 (x 2 x3 )dt 0
取极值的轨迹 x* (t) ,并要求 x* (0) 0 ,但对 x* (1) 没有限制。
解 这是终端自由的情况。欧拉—拉格朗日方程为
d (2x 3x 2 ) 0 dt即2x Fra bibliotek 3x 2 常数
d dt
(
F X
)
dt
X
T
F X
tf t0
向量欧拉——拉格朗日方程为
F X
d dt
(
F X
)
0
式中
F
x1
F
F X
x
2
F
用变分法求解最优控制问题
tf t0
F
x
x
F x
x
o
(
x)2, (
x)
2
dt
上式中 o[( x)2 , ( x)2 ]是高阶项。
(泰勒级数展开)
根据定义,泛函的变分 J 是 J 的线性
主部,即
J
tf t0
F x
x
F x
x dt
与以前不同的是,在动态问题中拉格朗日乘子 向量(t) 是时间函数。
在最优控制中经常将 (t )称为伴随变量,协态(协状 态向量)或共轭状态。引入 (t) 后可作出下面的增 广泛函
Ja X (t f ),t f
tf t0
FX ,U,t T (t) f (X ,U,t) X
F x
d dt
(
F x
)
0
(5-3)
上式称为欧拉——拉格朗日方程。
(5-2)式中第二项为零的条件要分两种情况来讨论:
1、 固定端点的情况
这时 x(t0 ) x0 , x(t f ) x f ,它们不发生变化,所 以 x(t0 ) x(t f ) 0 。而(5-2)中第二项可写成
第五章 用变分法解最优控制 —泛函极值问题
本章主要内容
5.1 变分法基础 5.2 无约束条件的泛函极值问题 5.3 有约束条件的泛函极值——动态系
统的最优控t f 制问题 5.4 小结
在动态系统最优控制问题中,性能指标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面再次列出变 分法中的一些主要结果,可对照微分学中的结果来 理解,以加深印象及理解。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
AB
x2 x1
1 y ' 2 dx
通过A,B两点的函数若为 y f (x) ,则不同的函数有不同的 弧长,即弧长是 y 的函数,记为 J ( y ) ,即
x2 1 y 2 dx J ( y ) AB x1
因此,求弧长的定积分是一种变换,它把x1与x2之间各点相应 的y变换为标量(弧长)。由此例可以看出定积分为泛函。 以下是各章经常要用到下列形式的目标函数
级数展开后的线性主部,而 o(y ) 就是Taylor级数 展开的各高阶项之和。即
ˆ ) J ( y ) [ Fyy Fy 'y ']dx J(y
x0
x1
(1—1)
1 x1 [ Fyy (y ) 2 2 Fyy 'yy ' Fy ' y ' (y ' ) 2 ]dx 2 x0
| [ ( Fy Fy ) ' (F y ' Fy ' )]dx | | |dx
x0 x0
x1
x1
[| (Fy Fy ) | | ' ( F y ' Fy ' ) |]dx
x0
x1
2 ( x1 x0 )
说明这一项为高阶无穷小。代入
ˆ) ห้องสมุดไป่ตู้J ( y) J(y
x1
F
x1 x0
y
F y dx
( F y F y ) '( F y' F y ' ) dx x0
F
x1 x0
y
F y dx o ( y , y ')
第一章
变分法
1.1 泛函 1.2变分的推演 1.3Euler方程 1.4向量情形 1.5有约束的情形 1.6端点可变情形 1.7变分的另一种定义
1.1 泛函
(1)定义(泛函)
泛函是一映射L : J K , J Y , Y为一向量空间, K 一般为实数 域R或复数域C。 这说明泛函是一种变换,它把向量空间Y中某一子集J 映射为 K的某个子集。 例:曲线的弧长 在xy平面上过A(x1 ,y1),B(x2,y2)两点之间的曲线弧长公式为
max( d 0 , d 1 )
必有 所以
ˆ y | , | y ˆ ' y ' | |y
ˆ y | | ( y 2 ) y || ( y ) y || y
ˆ ' y ' | | ( y ' 3 ' ) y ' || ( y ' ) y ' || y
(3)定义(n级ε邻区和泛函求极值)
ˆ ( x) 为中心,由 ( x ) 和 ( x ) 以函数 y
ˆ ( x) 构成的带状 (ε为无穷小量),称为函数 y
的ε邻区。若有另一个函数 y F ( x),
ˆ 和 y 的零级距离落入ε邻区内,称该邻区为零级 y
则称泛函有极小值。 该定义说明泛函极小值存在的充分条件为
ˆ )J ( y ) 0. J(y
同样泛函极大值存在的充分条件为:
ˆ )J ( y ) 0; J(y
1.2 变分的推演
考虑如下泛函求极值问题 x1 J ( y ) F ( x, y ( x), y( x))dx x0 式中,F 为 x, y ( x), 及 y ( x ) 的函数。 虽然以下的推演可以推广到目标函数中具有高阶导数的情 况,但在自动控制中都是用一阶的状态向量方程描写系统 的,因此目标函数中通常不出现二阶以上的高阶导数 。 设极值曲线为 y ˆy ˆ ( x), 可取曲线为 y y ( x ).
因此
ˆ) J 2 J 3J J ( y) J ( y
从全局极值看, 当 J ( y ) J ( y ˆ ) 0 时有全局最小,当
ˆ ) 0 时有全局最大。从局部极值看,y 落入 y J ( y) J ( y ˆ
的n级
ˆ )与J ( y ) 十分接近,因此, 邻区内, J ( y
x1 x0
F y y F y ' y ' dx o ( y , y ')
式中,采用了变分记号。
y 的一次变分
y 的一次变分
ˆ y y y
ˆ ' y ' y ' ' y
受上式的启发,看到 F y y F y ' y ' 是 F ( x, y, y' ) 用Taylor
因此,定义泛函的一次变分为
J
x1
x0
[ F y y F y ' y ' ] dx
定义泛函的二次变分定义为
1 x1 J [ F yy ( y ) 2 2 F yy ' y y ' F y ' y ' ( y ' ) 2 ]dx 2 x0
2
注意,泛函的二次变分并不等于对泛函的一次变分再取 一次变分。
邻区。N 级
邻区的定义可以类推。
所谓泛函求极值就是:
ˆ ( x), 寻找 y F ( x) 使 y 落入 设存在极值曲线 y
ˆ的n级 y
邻区内,则 y F ( x ) 就是所求的极值曲线。
(4)定义(泛函的极值)
设 J ( y ) 为泛函,y为规定的区域内可以取的曲线
ˆ 为极值曲线。若 J ( y ˆ ) J ( y ) (简称可取曲线),y
式中, 0 1 1, 0 2 1, 0 3 1 利用多元函数的中值定理,
F ( x, y , y ) F ( x, y , y ') Fy ( x, y 2 , y 3 ) ' Fy ' ( x, y 2 , y 3 )
J 0
为局部极值存在的必要条件;而
2 J 0 为局部极值存在极小的充分条件,
2 J 0 为局部极值存在极大的充分条件。
1.3 EULER方程
泛函求极值
min J ( y )
y
x1
x0
F ( x , y ( x ), y ' ( x )) dx
泛函极值存在的必要条件为 J 0 由式(1—1),得泛函极值存在的必要条件为
注意x无增量,故缺一项。书写为方便起见,令
Fy Fy ( x, y 2 , y 3 ), Fy Fy( x, y 2 , y 3 )
代入,
x1 ˆ ) J ( y ) [ F ( x, y , y ) F ( x, y, y ')]dx J(y x0 x1 [ Fy ( x, y 2 , y 3 ) Fy( x, y 2 , y 3 )]dx x0 x1 [ Fy Fy]dx x0 x1 x1 [ Fy Fy ' ]dx [ ( Fy Fy ) ( Fy Fy)]dx x0 x0
d max(d 0, d1)
d max(d 0, d1, d 2)
………………
dn
max | F(n) (x) G(n) (x) |, x [a,b]
d max( d 0, d 1, d 2., dn )
称 为 n级 距 离
该定义说明在闭区间[a,b]内,两条曲线纵坐标的差取绝 对值(因距离总为正),并从所有绝对值中找出最大的作 为零级距离。如果零级距离很小,表示两条曲线很靠近。 但是零级距离小并不能保证两条曲线形状相同,因此还要 看一阶导数,二阶导数……,n阶导数是否接近。由于一 级距离是从d0,d1取出最大的一个形成的,所以一级距离 小就表示两条曲线的距离很近。对于二级距离,……,n 阶距离的解释可以类推。
J [ x ( t f ), t f ]
tf
t0
( x ( t ), u ( t ), t ) dt
x(t) 为状态向量, t f 为终时, 式中,t为时间, t0为开始时间,
和 都是标量函数。 u(t ) 为控制向量, x(tf ) 为状态向量终态。
上式中,第一项
把向量 x(t f ) 及 t f 变换为标量,的确为泛函
以下计算第二个积分,实际上是估计余项。 按泛函求极值的
ˆ 与 y 的一级距离应落入ε邻区内(由于本节的泛函 定义, y
只对 y 与 y’提出要求,故只用到一级距离),即令
ˆ y| d 0 max | y
x [ x 0 , x1 ]
ˆ ' y ' | d 1 max | y
x [ x 0 , x1 ]
ˆ 和 y 的差用 表示,则 若 y
ˆ ( x) y ( x) ( x), y
ˆ 和 y 的差是不同的 显然 是x的函数,因为不同 x 时 y ˆ ( x) ( x), 最后结果是一样的)。 (当然也可以令 y ( x) y
移项,得 求导,得
ˆ y y
ˆ y y
| Fy ' Fy ' || Fy ' ( x, y 2 , y 3 ) Fy ' ( x, y , y ) | 2
其中,=max( 1, 2)。上两式无非说明对于连续函数,自 变量的增量为无穷小时,函数的增量也为无穷小。 由于和的绝对值小于等于绝对值的和,故
若 F(x, y, y)对 x 的一阶偏导数 Fx , F ( x, y , y ) 对 y 的一阶偏导数