用变分法求解最优控制问题

合集下载

第6章用变分法求解最优控制问题

§6－2 泛函与变分的基本概念
3.泛函的变分 ● 泛函的增量由自变量函数 x(t ) 的变分 x(t ) 引起泛函 J [ x(t )]的增量
J J [ x* (t ) x(t )] J [ x* (t )] 为泛函 J [ x(t )] 的增量。
f {x(t f ); g1[ x(t f )] 0, g 2 [ x(t f )] 0}
3. 容许控制控制量受客观条件限制所能取值得范围。
U {u (t )； ( x, u ) 0} u (t ) U
§6－1 最优控制问题的一般提法
4. 性能指标 tf L[ x(t ), u (t ), t ]dt （1）积分型性能指标： J t0 反映控制过程中对系统性能的要求。
在容许控制集合 U 中，寻找控制向量 u (t ) U , t [t0 , t f ] ，使系统由给定的初始状态出发，在 t t0 时刻转移到规定的目标集，并使性能 tf 指标： J [ x(t ), t ] L[ x(t ), u (t ), t ]dt
f f
取得极小值。

t0
1 2
若 x(t ) t 有
t x ( t ) e 若有
§6－2 泛函与变分的基本概念
2.泛函自变量的变分泛函 J [ x(t )] 的自变量函数 x(t ) 与标称函数 x* (t )之间的差值函数
x x(t ) x(t ) x* (t ) 称为泛函自变量的变分，记作 x(t )或 x 。 x(t ) x (t ) B 设 x (t ) 为 x(t ) 的容许曲线，即 x(t ) x (t ) x* (t ) (t ) x* (t ) 令 0 1 A 则 x* (t ) x* (t ) (t ) x (t ) t 这样： x(t ) (t ) x(t ) x* (t ) (t ) x* (t ) x(t )

第二章变分法及其在最优控制中的应用

2 dx 2 2 dx = 2 dt xx dt x t x
= 其中：
xx x xx x x
2 x
2
t
x x

x
x

2 x x

xt

2 x t

所以式<10>的全导数欧拉方程形式为：
t0 tf
.
问题：求 u * (t )，使被控过程状态由 x (t 0) 转移到 x (t f ) ，并使目标函数
J 最小。
, t ) 代入<4> 解：把<1 >式化为u的显函数形式，即 u F ( x, x 式，则有： . tf J [ x(t ), x(t ), t ]dt 5
a
b
x 的函数
) ) F ( x, y, y F ( x, y, y ]dx J [ y y a y y
b
泛函 J [ y ( x)]的变分 J 可通过增量形式求取：
泛函增量为： J J [ y( x) y( x)] J [ y( x)]
L[ y( x), y( x)] R[ y( x), y( x)]
2、泛函的极值的定义：
若泛函 J [ y ( x)] 在任何一条与 y y 0 ( x) 曲线接近的曲线上的值均不小于 J [ y ( x)] ，即：， J [ y( x)] J [ y0 ( x)] 0 则称泛函 J [ y ( x)] 在曲线上达到极小值。泛函极值是一个相对概念， y ( x) 实际为相对于y0 ( x) 的一个微小变化，变化形式有上述两种 :
1 3
x(t )

chap1_变分法及其在最优控制中的应用

x
x(t) x0(t)
o
t1 图1－3
t2
t
一阶相近当函数x(t)与 x0(t)之差的绝对值以及它们的一阶导数 x(t ) 和 x0 (t ) 之差的绝对值，即 x ( t ) x0 ( t ) , x ( t ) x 0 ( t ) t1 t t2 (1.1.3) 都很小，称函数x(t)与函数x0(t)是一阶相近的，如图1-4 所示。 x(t) x x0(t)
Q．E．D
例1.1.4 求泛函
x 2 (t )dt 的变分。 0 Nhomakorabea1
根据式（1.1.11），该泛函的变分为：
J J [ x(t ) x(t )] 0
1
[ x(t) x(t)] dt
1 2 0
0
[ x(t ) x(t )]2 dt 0 0
（2） J[cx(t)]=c J[x(t)]
其中，c是任意常数，就称为线性泛函。例如
J [ x(t )] [tx(t ) (sin t ) x(t )]dt
t1 t2
J [ x(t )] [ p(t ) x(t ) q(t ) x(t )]dt
t1
t2
J [ x(t )] x(t ) t 2
当曲线方程x=x(t)（满足x(ta)= xa ， x(tb)= xb ）给定后，可算出它在A、B两点间的弧长为：
A(ta,xa) o 图1－1
B(tb,xb) x(t)
t
J
tb
ta
dx dt 1 dt
t
2
例1.1.3 函数的不定积分 y 0 x ( )d 不是泛函。泛函的上述概念，可以推广到含有几个函数的泛函的情况，例如：

5 最优控制-极小值原理

* j
正常（或平凡）情况、奇异（或非平凡）正常（或平凡）情况、奇异（或非平凡）情况
Bang-Bang控制原理控制原理是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t )， ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
（50））（51））（52））
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律：哈密顿函数沿最优轨线随时间的变化规律：
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出用变分法求解最优控制时，用变分法求解最优控制时，认不受限制。为控制向量 u(t )不受限制。但是实际的系统，实际的系统，控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。某种限制的。
因此，因此，应用控制方程 ∂H = 0

最优控制中的变分法

tf t0
2[x(t)x(t)]x(t)d|t0tt0f
2x(t)x(t)dt
第1章最优控制中的变分法
(3)泛函的极值泛函极值的定义：
对于与y0(x)接近的曲线y(x)，泛函J[y(x)] 的增量
J J [ y ( x ) J [ y ] 0 ( x ) 0 或 ] J J [ y ( x ) J [ y ] 0 ( x ) 0 ]
d
J [ y 0 ( x ) ] J [ y 0 ( x ) ε y ( x ) 0 ] d() 0( 1 9 )
根据函数极值的条件，函数φ(ε)在ε=0时达到极值的必要条件为：
dd()00 (11)0
比较（1-9）和（1-10），可见：
J[y0(x) ]0 (1 1)1
根据泛函极值的必要条件，可得欧拉方程
[Lxddt(Lx)]0 Lx ddtLx 0
或 (123)
欧拉方程的展开形式：
L x t2 L x x2 L x x x 2 L 2x0 或(12)4 LxLtx Lxx x Lx x x0
对于某一类函数y(·)中的每一个函数y(x)，变量J都有一个值与之相对应，那么变量J称作依赖于函数y(x) 的泛函。
记为： J=J [y(x)]
y(x)称为泛函的宗量
宗量的变分：
yy(x)y0(x)
例1-1问题的本质：泛函极值
第1章最优控制中的变分法
泛函的连续性：
对任意给定的正数ε，总存在另一个正数δ，当
则泛函J[y(x)] 在曲线y0(x)上达到极值。
泛函极值定理：若可微泛函J[y(x)]在y0(x)上达到极值，则在y= y0(x)上的变分为零。即

最优控制第五章用变分法求解连续最优控制问题—有约束条件的泛函极值

xT

H x
uT

H u

d
t

xT

tf t0
使J´取极小的必要条件是，对任意的δu和δx，
都有δJ´=0成立。
因此得
H 0
x H x

H 0 u
tf 0 t0
(5-9) (5-10) (5-11) (5-12)
(5-5)
或 J tf H x, x,u, ,td t t0
(5-6)
式中
Hx, x,u,,t Lxt,ut,t T tf xt,ut,t xt
(5-7)
对式(5-5)右边第二项作分部积分，得
t f T x d t t f T x d t T x t f
为此，构造增广泛函
J Φxt f ,t f T Nxt f ,t f

t f
t0
Lxt,ut,t T
t f
xt , ut , t
xt d t
(5-21)
写出哈密顿函数
Hxt,ut,t,t Lxt,ut,t T t f xt,ut,t
(5-25)
ut u*t ut
(5-26)
tf

t
* f
t f
(5-27)
x(t) δx (t* f)
x*(t)
x(t) x(t0)
x
t
f
t f
δx(tf)
0 t0
t*f t*f+ δtf
t
图4 可变终端各变分间的关系
从图4可知在端点处变分之间存在下列近似关系
考虑到式(5-24)右边第一项和第二项的一次

基于古典变分法和极小值原理推导最优控制的解析求解条件

基于古典变分法和极小值原理推导最优控制的解析求解条件基于古典变分法和极小值原理推导最优控制的解析求解条件引言：最优控制理论是数学和工程学交叉的一个重要领域，在各个工程领域都有广泛的应用。

它的目标是通过优化方法寻找使系统指标达到极值的控制策略。

在这个领域中，变分法和极小值原理是两个重要的数学工具。

本文将介绍古典变分法和极小值原理，以及如何利用它们推导最优控制的解析求解条件。

一、古典变分法的基本原理古典变分法是研究极值问题的一种有效数学方法。

它的核心思想是将待求函数看作一族函数的极限形式，然后通过对这族函数进行泛函求导来获得包含待求函数的微分方程。

在最优控制问题中，我们希望找到一个控制策略，使系统的目标函数达到最小值或最大值。

通过应用古典变分法，我们可以将这个极值问题转化为一个泛函极值问题，并通过求解泛函极值问题来得到最优控制。

在使用古典变分法进行最优控制问题的分析时，我们需要定义一个泛函，即系统的目标函数。

泛函通常形式如下：\[ J[y,u] = \int_{t_0}^{t_f} L(t, y(t), u(t)) dt \]其中，\[y(t)\] 是状态变量，\[u(t)\] 是控制变量，\[L(t, y(t), u(t))\] 是泛函的被积表达式，它描述了系统的动力学以及待求函数的影响因素。

二、极小值原理极小值原理是古典变分法中的一个基本概念，用于推导变分问题的最优性条件。

对于一个给定的泛函\[J[y,u]\]，如果它的极小值存在且为唯一解，那么这个极小值必须满足极小值原理的条件。

极小值原理的一般形式可以表示为：\[ \frac{d}{dt} \left(\frac{\partial L}{\partial \dot{y}}\right) -\frac{\partial L}{\partial y} = 0 \]\[ \frac{\partial L}{\partial u} = 0 \]这两个条件是极小值原理的必要条件。

最优控制变分法

tf
F (t ) (t )dt 0
(1· 2—1)
t0
则在区间 [t 0 , t f ]上
F (t ) 0
下面我们来证明这个定理。由于函数 (t )，是任意选定的，因此，可以取 (t ) W (t ) F (t ) (1.2—2) 其中 W (t ) 的是任一满足条件
0 , t t0和t t f W (t ) 2 c , t0 t t f
二、固定端点时间、无约束条件的变分问题这一节，我们讨论一类最简单的变分问题，即无约束条件、端点时间固定，只有一个自变量函数的拉格郎问题。通过这个问题来引出欧拉方程和横截条件。求解变分问题，就是要把使泛函达到极值的那个自变量函数找出来，这就需要利用欧拉方程和横截条件。因此，欧拉方程和横截条件是求解变分问题的基础。在推导欧拉方程和横截条件时要使用一个定理，这个定理叫作变分法的基本颈备定理。本节首先介绍基本预备定理，接着推导欧拉方程，然后讨论横截条件，最后讨论泛函取极值的充分条件。
2. 欧拉方程现在，我们来推导欧拉方程和相应的横截条件。首先讨论固定端点问题，然后讨论未定端点问题。考虑最简单的泛函
(1· 2—3) L 的极值。其中x(t ) 是 t 二次可微函数； [ x(t ), x(t ), t ]，是变量 x, x和 t 连函函数，并且有连续二阶偏导数，端点时间 t 0 和 t f 固定。首先研究容许函数（或曲线）端点固定的情况，即规定 x(t 0 ) x0 和 x(t f ) x f 。图1—4示出了一族容许函数。现在的的问题是要从这一族容许函数(或曲线)中找出使泛函J取极值的函数(或曲线)，即极值函数或极值曲线。
tf
(2)马耶耳问题马耶尔问题的泛函表示为 J 1[ x(t f ),t f ] 2 [ x(t 0 ),t 0 ] 绪论中基于性能指标（0—9）的最短时间控制问题和基于性能指标（0—15）的最优推力方向角选择问题就是马耶耳问题的一个特例。 t (3)波尔扎问题波尔扎问题的性能泛函是 J 1 [ x(t f ), t f ] 2 [ x(t 0 ), t 0 ] L[ x(t ), u (t ), t ]dt

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

用变分法求解最优控制问题
本章主要内容
➢ 5.1 变分法基础 ➢ 5.2 无约束条件的泛函极值问题 ➢ 5.3 有约束条件的泛函极值——动态系
统的最优控制问题 ➢ 5.4 小结
在动态系统最优控制问题中，性能指标是一个泛函，性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面再次列出变分法中的一些主要结果，可对照微分学中的结果来理解，以加深印象及理解。
式中
(5-9)
(5-10)
泛函变分由（5-2）式改为向量欧拉——拉格朗日方程为式中
(5-11)
横截条件为（自由端点情况）
（分以下
和
两种情况：）
例5-1 求通过点（0，0）及（1，1）且使取极值的轨迹。
解这是固定端点问题，相应的欧拉——拉格朗日方程为
即
它的通解形式为式中：
Sht—双曲正弦函数 Cht—双曲余弦函数
时，有
是泛函的变分。是的线性
6、泛函的极值：若存在，对满足的
一切X，
具有同一符号，则
称在
处有极值。
定理：在
处有极值的必要条件是对
于所有容许的增量函数（自变量的变分），
泛函在处的变分为零
为了判别是极大还是极小，要计算二阶变分。但在实际问题中根据问题的性质容易判别
是极大还是极小，故一般不计算。
5.1 变分法基础回顾
相关的定义： 1、泛函：如果对某一类函数中的每一个函数，有一个实数值与之相对应，则称为依赖于函数的泛函，记为
简单来说，泛函是以函数为自变量的函数。
2、泛函的连续性：若对任给的
当
时，就有
，存在
则称在处是连续的。源自3、线性泛函：满足下面条件的泛函称为线性泛函
齐次性：叠加性：
1、固定端点的情况
这时
，它们不发生变化，所
以
。而（5-2）中第二项可写成
（5-4）
当
时，（5-4）式自然为零。
2、自由端点的情况
这时和可以发生化，
，
而且可以独立地变化。于是要使（5-2）中第二项
为零，由（5-4）式可得
（5-5）
（5-6）
因为这里讨论是标量函数的情况，和也是标量，且是任意的，故（5-5）、（5-6）可化为
（5-7）
（5-8）
（5-7）、（5-8）称为横截条件。
当边界条件全部给定（即固定端点）时，不需
要这些横截条件。当
给定时，不要（5-8
）。当
给定时，不要（5-7）。
5.2.2 泛函的自变量函数为向量函数的情况
现在，将上面对是标量函数时所得到的公式推广到是n维向量函数的情况。这时，性能泛函为
上式中
是高阶项。
（泰勒级数展开）
根据定义，泛函的变分是的线性主部，即
对上式第二项作分部积分，按公式
可得
（5-2）
J取极值的必要条件是等于零。因是任意的，要使（5-2）中第一项（积分项）为零，必有
（5-3）
上式称为欧拉——拉格朗日方程。
（5-2）式中第二项为零的条件要分两种情况来讨论：
这里是实数，和是函数空间中的函数。
4、自变量函数的变分：自变量函数的变分是指同属于函数类中两个函数、之差
这里, t 看作为参数。当可用图5-1来表示。
为一维函数时，
图5-1自变量函数的变分
5、泛函的变分：当自变量函数有变分时，泛函的增量为
这里，，则称主部。
是的线性泛函，若
（5-21）~（5-24）即为取极值的必要条件，由此即可求得最优值，，。
（5-22）式即为状态方程，这可由的定义式（5-18）看出，实际解题时无需求，只要直接用状态方程即可，这里为形式上对称而写成（5-22）式。
（5-17）
于是有约束条件的泛函的极值问题化为无约束条件的增广泛函的极值问题。再引入一个标量函数
（5-18）
它称为哈密顿（Hamilton）函数，在最优控制中起着重要的作用
于是可写成对上式积分号内第二项作分部积分后可得（5-19）
设、相对于最优值别为和
、的变分分
因为自由，故还要考虑变分
由初始条件
，可得A=0。
再由终端条件
，可得
，
因而极值轨迹为
例5-2 求使指标
取极值的轨迹没有限制。
，并要求
，但对
解这是终端自由的情况。欧拉—拉格朗日方程为
即于是
常数是常数，则是时间的线性函数，令
由
可得
，又终端是自由的，由式
（5-7）可得横截条件为
即
由上式解得或
。时的极值轨迹
为
。
下面来计算由这些变分引起的泛函的变分。
计算增量，然后用泰勒级数展开到一阶项即可得到
为极小的必要条件是：对任意的、、，变分等于零。由（5-18）及（5-20 ）可得下面的一组关系式
（协态方程）（状态方程）（横截条件）（控制方程）
（5-21）（5-22）（5-24）（5-23）
5.2 无约束条件的泛函极值问题
5.2.1 泛函的自变量函数为标量函数的情况
为简单起见，先讨论自变量函数为标量函数
（一维）的情况。我们要寻求极值曲线
，
使下面的性能泛函取极值
（5-1）
为此，让自变量函数、在极值曲线、附近发生微小变分、，即
于是泛函J 的增量可计算如下（以下将*号省去）
5.3.1 终端时刻给定，终端状态自由
将状态方程（5-13）写成等式约束方程的形式（5-15）
与有约束条件的函数极值情况类似，引入待定的n 维拉格朗日乘子向量函数
（5-16）
与以前不同的是，在动态问题中拉格朗日乘子向量是时间函数。
在最优控制中经常将称为伴随变量，协态（协状态向量）或共轭状态。引入后可作出下面的增广泛函
否则不能用变分法求解，而要用极小值原理或动态
规划法求解）
是n维连续可微的向量函
数。性能指标如下：
（5-14）
这是综合指标。我们要求出最优控制和满足状态方程的极值轨迹，使性能指标取极值。
在下面的讨论中，假定初始时刻和初始状态是给定的，终端则可能有几种情况。我们
将就几种常见的情况来讨论，即给定，自由和自由, 属于一个约束集。
；
时的极值轨迹为
。
容易验证
时，
，对应局部极大。
对应局部极小；时，
5.3 有约束条件的泛函极值 ——动态系统的最优控制问题
前面讨论泛函极值问题时，对极值轨迹没有附加任何约束条件。但在动态系统最优控制问题中，极值轨迹必须满足系统的状态方程，也就是要受到状态方程的约束。考虑下列系统
（5-13）
式中，为维状态向量，为维控制向量（这里假定不受限制.