最优控制 第五章 用变分法求解连续最优控制问题—有约束条件的泛函极值
泛函极值问题的求解

泛函极值问题的求解泛函极值问题的求解使用变分法。
泛函极值问题是指在给定约束条件下,求一个泛函的极值。
泛函是一个函数的函数,即输入是函数,输出是一个实数。
假设有一个泛函J[f],其中f是一个函数,我们要求使得J[f]取得极小值或极大值。
解决这个问题的方法是通过变分法,变分法的基本思想是将函数f沿着任意变化,并计算J[f]的变化。
如果变化很小,那么我们可以认为J[f]的变化主要来自于f的变化。
为了使用变分法求解泛函极值问题,需要定义一个变分算子δ,表示函数f的变分。
变分算子的定义如下:δ[f(x)] = εh(x)其中,ε是一个很小的实数,h(x)是一个任意函数。
使用变分算子之后,泛函的变化可以表示为:δJ[f] = J[f + εh(x)] - J[f]对δJ[f]进行展开,再取ε趋近于0的极限,得到以下关系:δJ[f] = 0这个关系成为欧拉方程,它是求解泛函极值问题的基本方程。
根据具体的泛函形式和约束条件,可以使用欧拉方程得到具体的解。
需要注意的是,在变分法中,要求函数f满足一定的边界条件。
边界条件是泛函极值问题中的附加条件,通过这些条件可以得到具有特定特征的解。
总结起来,求解泛函极值问题的步骤如下:1. 定义泛函J[f]以及函数f满足的边界条件;2. 引入变分算子δ并计算δJ[f];3. 使用欧拉方程δJ[f] = 0 求解得到f的表达式;4. 检验解是否满足边界条件,如果不满足,则舍去;5. 找到所有满足边界条件的解,分别计算J[f],选择其中极小值或极大值作为泛函的极值。
需要注意的是,求解泛函极值问题需要具备一定的数学知识和技巧,对欧拉方程的求解以及边界条件的选择都有一定的要求。
因此,在具体求解时可能需要借助一些数学工具和方法。
最优控制变分法

J L[ x(t ), x(t ), t ]dt
tf
假设 x (t )是 x (t ) 极值曲线是任一邻近于它的容许曲线, 如图1—5所示。令
(t ) x (t ) x (t )
和
(1· 2—4)
(1· 2—5) (t ) 是 t 的连续可微函数,叫做 x(t )的变分。 是一个小参数。选 择不同的 和 (t )就能够把 x (t ) 邻近的容许函数表示出来。 因此,式(1.2—5)表示了 x (t ) 邻近的任意一族容许函数。特别地, x 当 0 时,(t ) x (t ) ;当 1 时,x(t ) x (t ) 。这一族函数 都起始于 (t 0 , x0 ) ,终止于 (t f , x f ) 。
式中, t x(t ) 是n维矢量; u(t ) 是m维矢量; t 是独立变量; L[ x(t ), u(t ), t ] 是 x(t ) 、 (t ) 和 t 连续函数。 u 绪论中基于性能指标(0—2)、(0—10)和(0—1)的最优控制问 题是拉格郎问题的实例。
0
J L[ x(t ), u (t ), t ]dt
(t ) 0 且
(t ) 0
x (t ) 零阶接近的x(t ) 如果在容许函数的集合函数集合中,对一切同
,
有
J [ x (t )] J [ x(t )]
则称 J [ x (t )] 是 J [ x(t )]泛函的一个强局部极小值;如果对一切同 x (t ) 一阶接近的 x(t ) ,有 J [ x (t )] J [ x(t )] 则称 J [ x (t )]是 J [ x(t )]泛函的一个弱局部极小值。 容易看出,在定义泛函的总体极小值、强局部极小值和弱局 x (t ) 是分别同数目逐次减少的函数的集合相 部极小值时,函数 比较的。因此,若局部极小值的必要条件也是强局部极小值的必 要条件,强局部极小值的必要条件也是总体极小值的必要条件, 反之则不尽然。
最优控制全部PPT课件

J
(x(t f ),t f)
tf t0
F(x(t),u(t),t)dt
为最小。
这就是最优控制问题。
如果问题有解,记为u*(t), t∈ [t0,tf],则u*(t)叫做最优控制(极值控制),相应的轨 线X*(t)称为最优轨线(极值轨线),而性能指标J*=J(u*(·))则称为最优性能指标。
第11页/共184页
目标质心的位置矢量和速度矢量为: xM xM
F(t)为拦截器的推力
x xL xM v xL xM
则拦截器与目标的相对运动方程为:
x v v a(t) F (t)
m(t)
m F (t) c
其中a(t)是除控制加速度外的固有相对加速度,是已知的。
初始条件为: x(t0 ) x0 v(t0 ) v0 m(t0 ) m0 终端条件为: x(t f ) 0 v(t f )任意 m(t f ) me
至于末态时刻,可以事先规定,也可以是未知的。 有时初态也没有完全给定,这时,初态集合可以类似地用初态约束来表示。
第9页/共184页
3:容许控制 在实际控制问题中,大多数控制量受客观条件的限制,只能在一定范围内取 值,这种限制通常可以用如下不等式约束来表示:
0 u(t) umax 或ui i 1,2p
给定一个线性系统,其平衡状态X(0)=0,设计的目的是保持系统处于平衡状态,即 这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。
线性调节器的性能指标为:
J
tf t0
n
xi 2 (t)dt
i 1
加权后的性能指标为:
J
tf t0
n
qi xi 2 (t)dt
i1
对u(t)有约束的性能指标为: J t f 1 [ X T (t)QX (t) uT (t)Ru(t)]dt
最优控制问题的变分法解析

最优控制问题的变分法解析在控制论中,最优控制问题是寻找系统在给定约束条件下的最佳控制策略,以使所定义的性能指标取得最优值。
变分法是一种重要的数学工具,被广泛应用于解决最优控制问题。
本文将通过对最优控制问题的变分法解析,探讨其原理、应用和解决方法。
一、最优控制问题的基本原理最优控制问题的基本原理可以通过变分法进行分析。
变分法是数学中研究函数极值问题的一种方法,其关键思想是将函数的变分(变化量)与被考察函数的变化率联系起来。
在最优控制问题中,我们希望找到一个控制函数,使得系统的性能指标(如代价函数)取得最优值。
二、最优控制问题的数学描述最优控制问题通常使用微分方程或差分方程来描述系统的动力学行为。
假设系统的动力学方程为:```dx(t)/dt = f(x(t), u(t))```其中,x(t)为系统的状态向量,u(t)为系统的控制向量,f(x(t), u(t))表示系统的动力学行为。
我们的目标是通过选择合适的控制函数u(t)来最小化一个代价函数J,即:```J = ∫ L(x(t), u(t)) dt + Φ(x(T))```其中,L(x(t), u(t))为运动学指标函数,Φ(x(T))为终点状态指标函数。
通过变分法我们可以得到最优控制问题的欧拉-拉格朗日方程:```L_x - d/dt(L_u) = 0```其中,L_x表示L对x的偏导数,L_u表示L对u的偏导数。
三、最优控制问题的解决方法解决最优控制问题的一种常用方法是动态规划。
基本思想是将问题分解为一系列子问题,并利用最优子结构性质递归求解。
通过将最优控制问题转化为一组哈密顿-雅可比-贝尔曼(HJB)方程,可以得到最优控制的解析解。
此外,还可以采用数值方法,如离散化法和优化法,求得数值近似解。
四、最优控制问题的应用领域最优控制问题在许多领域都有着广泛的应用。
在经济学中,最优控制可用于优化投资组合、经济增长模型等;在工程领域,最优控制可用于优化控制系统、自动驾驶等;在生物学中,最优控制可用于优化生态系统管理、生物过程模型等。
最优控制问题求解方法综述(中英双语)

最优控制问题求解方法综述Summary of approaches of optimal control problem摘要:最优控制问题就是依据各种不同的研究对象以及人们预期达到的目的,寻找一个最优控制规律或设计出一个最优控制方案或最优控制系统。
解决最优问题的主要方法有变分法、极小值原理和动态规划法,本文重点阐述了各种方法的特点、适应范围、可求解问题的种类和各种方法之间的互相联系。
Abstract:Optimal control problems are to find an optimal control law or design a optimal control program or system according to various kinds of different research objects and the aim people want. The approaches to solve optimal control problems generally contain variational method, the pontryagin minimum principle and dynamic programming. This paper mainly states characteristics, range of application, kinds of the solvable problems of each approach and the association between these three methods.关键词:最优控制、变分法、极小值、动态规划Keywords: optimal control , classical variational method , the pontryagin minimum principle , dynamic programming正文:最优控制理论是现代控制理论的一个主要分支,着重于研究使控制系统的性能指标实现最优化的基本条件和综合方法。
变分法与最优控制

2.1 变分法概述
1、泛函定义
定义: 如果变量y对于某一函数类中的每一个函数 x(t),都有一个确定的值与之对应,那么就 称变量y为依赖于函数x(t)的泛函,记为: y=J [x(t)]。
说明:由于函数的值是由自变量的选取而确定的,而泛函 的值是由自变量的函数的选取而确定的,所以将泛函理解 为“函数的函数”。
点向较低的B点滑动,如果不考
虑各种阻力的影响,问应取怎样 的路径,才能使所经历的时间最 短?
结论:最速降线是一条圆滚线。
B(xf,yf)
y
在A、B两点所在的竖
直平面内选择一坐标系,
如上图所示。A点为坐 标原点,水平线为x轴, 铅垂线为y轴。
向量欧拉方程
对于向量空间的泛函,也存在着欧拉方程,不 过是欧拉方程组(即向量欧拉方程)。
若给定曲线x(t)的始端x(t0)= x0和终端x(tf)= xf,
J[x(t) ] tf L[x(t)x ,(t)t,]dt t0
达到极值的必要条件是,曲线x(t)满足欧拉方程
Lx ddtLx0 或
欧拉(Euler)方程
其中x(t)应有连续的二阶导数, L[x(t)x ,(t)t,] 则至少应是二次连续可微的。 (证明略)
2.2 无约束最优化问题
1、无约束固定端点泛函极值必要条件
问题 2-1 无约束固定终端泛函极值问题为:
其中, L[x(t),及x(tx)(,tt)]在[t0,tf]上连续可微, t0及tf固定, x(t0)= x0,x(tf)= xf, x(t)Rn
求满足上式的极值轨线x*(t)。
边界条件
定理2-5 则泛函
(证明略)
定理2-2 连续泛函J(x)的二次变分定义为
(证明略)
变分法与最优控制问题

变分法与最优控制问题在数学和物理学中,变分法是一种用于求解最优化问题的数学方法,特别适用于求解函数als^565^到l=0的极值点。
最优控制问题是指在给定约束条件下,寻找使得控制系统性能指标最优的控制策略。
本文将介绍变分法与最优控制问题的基本概念和应用。
一、变分法的基本概念变分法是一种通过将问题转化为变分问题,再利用变分法原理对变分问题进行求解的方法。
变分法关注的是函数als^565^的泛函ls^565^= ∫f(als^565^, al'=I0'~I1',其中als^565^是取决于一个或多个独立变量al的函数。
变分问题就是要找到使得泛函ls^565^达到极值的函数als^565^。
二、变分法的应用变分法在数学和物理学中有广泛的应用,特别是在最优控制问题中。
最优控制问题是指在给定的系统模型和性能指标下,寻找使得性能指标最优的控制策略。
变分法在最优控制问题中起到了重要的作用。
在最优控制问题中,我们需要根据系统的状态变量和控制变量,构建系统的数学模型。
然后,通过构建性能指标,将最优控制问题转化为求解一个泛函的极小值问题。
利用变分法的原理,我们可以获得泛函的欧拉-拉格朗日方程,从而得到系统的最优控制策略。
最优控制问题的解决可以为实际应用提供最佳的控制策略。
三、变分法与最优控制问题的应用举例为了更好地理解变分法与最优控制问题,我们举一个简单的例子来说明其应用。
假设有一辆汽车行驶在一段道路上,我们的目标是寻找一种最优的加速度控制策略,使得汽车在最短的时间内到达目的地。
在这个问题中,车辆的位置可以用参数x表示,车辆的速度可以用参数v表示,我们的目标是找到使得到达目的地时间最短的速度曲线v(t)。
首先,我们需要建立车辆的数学模型,这里我们假设车辆的运动服从牛顿第二定律。
通过构建性能指标,我们可以得到泛函的表达式:ls^565^ = ∫[1 + (dht/dt)^2]dt其中dht/dt=t。
最优控制的基本理论及应用

本章在介绍解决最优控制问题3种基本方法(变分 法、极小值原理和动态规划)的基础上,阐述两类典 型最优反馈系统的设计,即线性二次型最优控制和最 小时间控制。
6.2 最优控制问题的提出及数学描述
6.3.2 用变分法求解无约束条件的泛函极值问题
设积分型性能泛函为
Jtt0f L[x(tx)(,t)]d,tt
(6-24)
在区间[t0 ,t f ]上,被积函数 L[x(t),x(t),t]二次连续可微, 轨线x(t)有连续的二阶导数,x(t)Rn ,对x(t)没有任何 约束。要求确定极值轨迹 x *(t) ,使泛函J为极值。
级数 ,则
J()tt0f L x Tη(t) L x Tη (t)R dt
(6-29)
式中,R表示泰勒(Taylor)级数展开式中的高阶项。
如果定义x(t)和 x (t) 的一阶变分为 δ x εη (t),δ x εη (t)
由泛函变分的定义,泛函的一阶变分为
(6-30)
6.2.2 最优控制问题的数学描述
构成最优控制问题必须具备以下几个基本条件:
1.被控系统的数学模型,即动态系统的状态方程
状态方程在最优控制中为等式约束条件。
2.控制变量的约束条件(容许控制)
任何实际物理系统,控制变量总是受约束的,一
般可写成
u(t)U
(6-3)
式中,U表示一个封闭的点集合,称为控制域。此时称 u(t)为容许控制。
1)积分型性能泛函
Jtt0f Lx((t)u,(t),dtt)
2)终值型性能泛函
J[x(tf ),tf]
现代控制理论 第6章 最优控制(校内讲稿)1

2)终端型性能指标( 梅耶问题)
J x( t f )或J x( N )
3)综合型性能指标( 鲍尔扎问题)
J x ( t f ) Lx t ,ut ,t dt
终端指标
t
f
或J x( N )
N 1 k k 0
t0
L [ x( k ),u( k ),k ]
2.拉格朗日乘子法 设目标函数:
n维
x( tk 1 ) f [ x( tk ),u( tk ),tk ] n N倍
N 1 L k 0
J x( N ) 约束条件为:
x( k ), u( k ), k
( k 0 ,1, N 1 )
f [ x( k ), u( k ), k ] x( k 1 ) 0
6.9
Bang-Bang控制
总目录 章目录 返回
上一页 下一页
教学要求: 1. 学习泛函变分法,理解最优控制的一般概念 2. 掌握利用变分法求最优控制方法 3.掌握状态调节器,极小值原理
重点内容: •最优控制的一般问题及类型,泛函与变分,欧拉 方程,横截条件。 •变分法求有约束和无约束的最优控制。 •连续系统的极小值原理。 •有限和无限时间状态调节器方法,Riccati方程求 解。
爬山法 梯度法
总目录 章目录 返回
上一页 下一页
6.3 静态最优化问题的解
6.3.1 一元函数的极值
设: f ( u ) a , b 上的单值连续可微函数 J 则1) u为极小值点的充要条件
f ( u ) |u u 0
f ( u ) |u u 0
f ( u ) |u u 0
H f ( g )T 0 x x x H f ( g )T 0 u u u H g ( x ,u )0
最优控制第五章用变分法求解连续最优控制问题—有约束条件的泛函极值

xT
H x
uT
H u
d
t
xT
tf t0
使J´取极小的必要条件是,对任意的δu和δx,
都有δJ´=0成立。
因此得
H 0
x H x
H 0 u
tf 0 t0
(5-9) (5-10) (5-11) (5-12)
(5-5)
或 J tf H x, x,u, ,td t t0
(5-6)
式中
Hx, x,u,,t Lxt,ut,t T tf xt,ut,t xt
(5-7)
对式(5-5)右边第二项作分部积分,得
t f T x d t t f T x d t T x t f
为此,构造增广泛函
J Φxt f ,t f T Nxt f ,t f
t f
t0
Lxt,ut,t T
t f
xt , ut , t
xt d t
(5-21)
写出哈密顿函数
Hxt,ut,t,t Lxt,ut,t T t f xt,ut,t
(5-25)
ut u*t ut
(5-26)
tf
t
* f
t f
(5-27)
x(t) δx (t* f)
x*(t)
x(t) x(t0)
x
t
f
t f
δx(tf)
0 t0
t*f t*f+ δtf
t
图4 可变终端各变分间的关系
从图4可知在端点处变分之间存在下列近似关系
考虑到式(5-24)右边第一项和第二项的一次
最优控制问题的变分法解析

最优控制问题的变分法解析最优控制问题是应用数学中的一个重要分支,目标是通过对系统的动力学方程和性能指标进行数学建模,找到使性能指标最优化的控制策略。
在寻找最优控制策略的方法中,变分法起到了至关重要的作用。
本文将对最优控制问题的变分法进行解析,介绍其基本原理和应用方法。
一、变分法的基本原理变分法是数学中的一种计算最优化问题的方法,它基于函数的变分性质进行求解。
在最优控制问题中,我们通过变分法来求解函数的最小值,即找到一条函数曲线使得性能指标达到最优。
变分法的基本思想是将函数曲线看作是一个整体,通过对其进行微小的扰动来求解极值。
二、最优控制问题的变分表述最优控制问题通常可以用一组动力学方程和性能指标函数来表述。
假设已知系统的状态方程为:dx(t)/dt = f(x(t), u(t), t)其中,x(t)表示系统的状态,u(t)表示控制变量,t表示时间。
我们的目标是通过选择合适的控制变量u(t),使得性能指标函数J[x(t), u(t), t]最小化。
性能指标函数通常由目标状态和控制变量的组合表示。
为了求解最优控制问题,首先定义一个泛函:J[u(t)] = ∫L(x(t), u(t), t)dt其中,L(x(t), u(t), t)表示拉格朗日函数,它由性能指标函数和动力学方程组合而成。
通过对泛函J[u(t)]进行变分的方式,我们可以得到最优控制问题的欧拉-拉格朗日方程:δJ[u(t)]/δu(t) = 0三、求解最优控制问题的步骤1. 构建拉格朗日函数L(x(t), u(t), t):根据最优控制问题的具体要求,我们可以选择合适的拉格朗日函数。
通常情况下,拉格朗日函数由系统的动力学方程和性能指标函数组合而成。
2. 求解欧拉-拉格朗日方程:将拉格朗日函数带入欧拉-拉格朗日方程,利用变分法的原理求取控制变量u(t)。
3. 验证最优性条件:通过对极值条件的验证来确定所得到的解是否是最优解。
验证的方法包括极大极小值的判断、边界条件的验证等。
现代控制理论最优控制(1)

1)泛函自变量的变分
δ x x(t ) x (t )
*
2)泛函的变分 泛函的增量:由自变量函数x(t)的变分δx(t)的泛函J[x(t)]
增量为
Δ J [x] J [x(t) δ x(t)] J [x(t)] L[x(t ), δ x(t)] o[x(t), δ x(t)]
泛函的变分:泛函J[x(t)]的增量ΔJ[x(t)]的线性主部称为 泛函的一阶变分,简称泛函变分记为δJ,即
J J [ x(t ) x(t )] 0 L[ x(t ), x(t )]
类比于函数y=f(x),其增量为 Δy= f(x+Δx)-f(x)=f’(x)dx+o(Δx) y=f(x)的微分 dy=f’(x)dx
2. 确定容许控制域
对于r维控制向量u(t),要满足客观约束条件
i ( x, u ) 0 j 1, 2,, m mr 把u {u (t ) i ( x, u ) 0}称为控制域
满足u (t ) u的u (t )称为容许控制
3.确定始端与终端条件 若系统的初始时刻t0确定,则:
3) 泛函的极值
若泛函J[x(t)]在曲线x(t)= x*(t)上达到极值,则有
J J [ x(t ) x(t )] 0 0
若
ΔJ=J[x(t)]-J[x*(t)] ≥0
则称泛函J[x(t)]在曲线x*(t)上达到极小值;若
ΔJ=J[x(t)]-J[x*(t)] ≤0
3)综合型性能指标( 波尔扎型)
J x t , u t , t dt x(t f ), t f t 0 L 或J x(k f ), k f L[ x (k ), u ( k ), k ]
变分法求解最优控制

J (u(t )) (t f , x(t f )) F (t, x(t ), u(t ))dt
t0 tf
性能指标J(u(t))在数学上称为泛函,在控 制系统中称为损失函数。
变分法基本概念
1.泛函
设S 为一函数集合,若对于每一个函数 x(t)∈S有一个实数J 与之对应,则称J 是 定义在S 上的泛函,记作J (x(t))。S 称为 J 的容许函数集。
t0
tf
再令 J 1 0 ,由 便得:
dt f ,x(t f ),x,u, 的任意性,
(i) x * , * 必满足正则方程: 1.状态方程
x H f (t, x, u)
2.协态方程
H x
* *
(ii)哈密顿函数 H (t, x , u, ) 作为u的函数,也 必须满足
定义一个标量函数:
H (t, x, u, ) F (t, x, u) T (t ) f (t, x, u)
称为哈密顿函数。所以新的性 能指标为
J 1 ( x, u, ) (t f , x(t f )) [ H (t, x, u, ) T x]dt
t0 tf
t0 tf
d (dt fy) [t f fF xt ,yxdx , t ) t t f F'( ) y ) ( (, ) , u dy a (
T
b( y )
] [x(t f )] x (t f )
T
T tf
[(x) H x (u) H u ( ) H ( ) x]dt (t f )x t t f (x)T dt t0 f y ( x, y)dx f [b( y), y)]b' ( y) f [a( y), y)]at'0( y)
最优控制变分法

AB
x2 x1
1 y ' 2 dx
通过A,B两点的函数若为 y f (x) ,则不同的函数有不同的 弧长,即弧长是 y 的函数,记为 J ( y ) ,即
x2 1 y 2 dx J ( y ) AB x1
因此,求弧长的定积分是一种变换,它把x1与x2之间各点相应 的y变换为标量(弧长)。由此例可以看出定积分为泛函。 以下是各章经常要用到下列形式的目标函数
以下计算第二个积分,实际上是估计余项。 按泛函求极值的
ˆ 与 y 的一级距离应落入ε邻区内(由于本节的泛函 定义, y
只对 y 与 y’提出要求,故只用到一级距离),即令
ˆ y| d 0 max | y
x [ x 0 , x1 ]
ˆ ' y ' | d 1 max | y
x [ x 0 , x1 ]
第一章
变分法
1.1 泛函 1.2变分的推演 1.3Euler方程 1.4向量情形 1.5有约束的情形 1.6端点可变情形 1.7变分的另一种定义
1.1 泛函
(1)定义(泛函)
泛函是一映射L : J K , J Y , Y为一向量空间, K 一般为实数 域R或复数域C。 这说明泛函是一种变换,它把向量空间Y中某一子集J 映射为 K的某个子集。 例:曲线的弧长 在xy平面上过A(x1 ,y1),B(x2,y2)两点之间的曲线弧长公式为
| [ ( Fy Fy ) ' (F y ' Fy ' )]dx | | |dx
x0 x0
x1
x1
[| (Fy Fy ) | | ' ( F y ' Fy ' ) |]dx
最优控制理论PPT课件-48页PPT精品文档

u t R p 为 控 制 向 量 , 且 u t 在 t 0 , t f 上 分 段 连 续 ;
f R n 为 连 续 向 量 函 数 , x t 连 续 可 微
2.初态和终态: xt0,xtf S目标集
3.容许控制 : ut — 控 制 域
§6-2 最优控制中的变分法
现
代 泛函变分的求法
控
制 理 论
定理: J x 的变 J J 分 x x | 0, (0 1 )
性质:1 .F 1 F 2 F 1 F 2
2 .F 1 F 2 F 1 F 2 F 2 F 1
理 论
L x t,x r x t,x
其L 中 xt,x— J的线性函数
rxt,x— J的高阶无穷小
则L 称 xt,x为泛 Jxt函 的一阶变 J 分
泛函变分是泛函增量的线性主部
Modern Control Theory
Page: 9
2 1 2a1ta2
ua1ta2
这里 a1、a2 为常数
由 x2 udt 得: x2t1 2a1t2a2ta3
Modern Control Theory
Page: 21
§ 6-4 有约束条件下的泛函数极值问题
现
代 控
由 x1 x2dt 得:x 1 t 1 6 a 1 t3 1 2 a 2 t2 a 3 t a 4
现
代 控
当 t0 和 tf给 定 时 , x t0 和 x tf 是 否 定 还 是 自 由 , 可 分 四 种
制 情 况 :
理 论 (1) 固定始端和终端
x(t)
即 x t 0 和 x t f 给 定 x t 0 0 ,x t f 0
最优控制课程介绍

最优控制先修课程:常微分方程,最优化方法最优控制问题是具有特殊数学结构的一类最优化问题,在科学、工程和管理乃至人文领域都存在大量的最优控制问题。
最优控制研究动态系统在各种约束条件下,寻求目标泛函取极值的最优控制函数与最优状态轨线的数学理论和方法,它是静态最优化在无穷维空间的扩展。
希望学生通过本课程的学习,能够结合实际背景,建立最优控制的模型,理解求解最优控制的三大类基本方法的数学思想,灵活地掌握这些方法的基本过程,并能解释计算结果的意义。
主要内容如下:最优控制问题及其建模;数学基础;变分法及其在最优控制的应用;极小值原理及其应用;动态规划方法及其应用;应用。
最优控制一、课程基本信息 1.先修课程:数学系本科包括到大三的全部课程 2.面向对象:理学院数学系各专业 3.推荐教学参考书:吴沧浦,《最优控制的理论与方法》,国防工业出版社,2000 王朝珠等,《最优控制理论》,科学出版社,2003 邢继祥等,《最优控制应用基础》,科学出版社,2003 W. L. Brogan, Modern C ontrol Theor y, (3th eidition), Prentice-Hall, Englew ood C liffs,1991 二、课程的性质和任务本课程是数学与应用数学专业本科生高年级选修课程之一。
从数学的角度,最优控制问题是最优化问题中具有特殊结构的一类问题。
就问题的来源看,它又是控制问题。
最优控制研究动态系统在各种约束条件下寻求使目标泛函取极值的最优控制函数和最优状态轨线的数学理论和方法。
最优控制问题涉及范围广跨度大,几乎理工医农,管理军事乃至人文经法领域,都存在着大量此类问题。
最优化已是寻求最优系统和结构,挖掘系统潜力的有力武器,学会求解最优控制问题,是应用数学工作者的最基本素养之一。
通过本课程的主要任务是,从各个教学环节引导学生认识不同数学问题的特点和相应数学模型的结构,自己学会分析实际问题,建立各种数量之间的联系,写出正确的合理的最优控制的模型;领会求解最优控制问题解法是如何提出的数学思想,并学会如何根据这些思想来构成相应方法的技巧;学会能正确地解释计算结果的物理意义的能力。
用变分法求解最优控制问题

tf t0
F
x
x
F x
x
o
(
x)2, (
x)
2
dt
上式中 o[( x)2 , ( x)2 ]是高阶项。
(泰勒级数展开)
根据定义,泛函的变分 J 是 J 的线性
主部,即
J
tf t0
F x
x
F x
x dt
与以前不同的是,在动态问题中拉格朗日乘子 向量(t) 是时间函数。
在最优控制中经常将 (t )称为伴随变量,协态(协状 态向量)或共轭状态。引入 (t) 后可作出下面的增 广泛函
Ja X (t f ),t f
tf t0
FX ,U,t T (t) f (X ,U,t) X
F x
d dt
(
F x
)
0
(5-3)
上式称为欧拉——拉格朗日方程。
(5-2)式中第二项为零的条件要分两种情况来讨论:
1、 固定端点的情况
这时 x(t0 ) x0 , x(t f ) x f ,它们不发生变化,所 以 x(t0 ) x(t f ) 0 。而(5-2)中第二项可写成
第五章 用变分法解最优控制 —泛函极值问题
本章主要内容
5.1 变分法基础 5.2 无约束条件的泛函极值问题 5.3 有约束条件的泛函极值——动态系
统的最优控t f 制问题 5.4 小结
在动态系统最优控制问题中,性能指标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面再次列出变 分法中的一些主要结果,可对照微分学中的结果来 理解,以加深印象及理解。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上节讨论没有约束条件的泛函极值问题。 上节讨论没有约束条件的泛函极值问题。但在 最优控制问题中,泛函 所依赖的函数总要受到受控 最优控制问题中,泛函J所依赖的函数总要受到受控 系统状态方程的约束。 系统状态方程的约束。解决这类问题的思路是应用 拉格朗日乘子法, 拉格朗日乘子法,将这种有约束条件的泛函极值问 题转化为无约束条件的泛函极值问题。 题转化为无约束条件的泛函极值问题。
[
]
所示。 例1:有系统如图 所示。欲使系统在 内从状态 :有系统如图1所示 欲使系统在2s内从状态
θ (0) 1 ω(0) = 1 转移到 θ(2) 0 ω(2) = 0 ,使性能泛函
1 2 2 。 J = ∫ u (t ) dt → m ,试求 in 试求u(t)。 2 0
& f [x(t ), u(t ), t] − x(t ) = 0
应用拉格朗日乘子法, 应用拉格朗日乘子法,构造增广泛函
(5-3)
& J ′ = ∫ L[x(t ), u(t ), t] + λT (t )[ f [x(t ), u(t ), t] − x(t )] dt
tf t0
{
}
式中λ(t)——待定的 维拉格朗日乘子矢量。 待定的n维拉格朗日乘子矢量 式中 待定的 维拉格朗日乘子矢量。
λ(t f ) = 0
若始端和终端都固定时, 若始端和终端都固定时,δx(t0)=0,δx(tf)=0则以 , 则以
x(t0 ) = x0
x(t f ) = x f
作为两个边界条件。 作为两个边界条件。
(5-15) (5-16)
实际上,上述泛函极值的必要条件, 实际上,上述泛函极值的必要条件,亦可 由式(5-6)写出欧拉方程直接导出。 写出欧拉方程直接导出。 由式 写出欧拉方程直接导出 即
(5-18)
N x(t f ), t f = 0
式中N——q维向量函数,n≥q。 维向量函数, 式中 维向量函数 。
[
]
(5-19)
性能泛函
J = Φ x(t f ), t f + ∫ L[x(t ), u(t ), t]d t
tf t0
[
]
(5-20)
其中Φ、 都是连续可微的数量函数 都是连续可微的数量函数, 其中 、L都是连续可微的数量函数,tf是待求 的终端时间。 的终端时间。 最优控制问题是寻求控制矢量u , 最优控制问题是寻求控制矢量 *(t),将系统从 初态x(t 转移到目标集 转移到目标集N[x(tf), tf]=0上,并使 取极小。 取极小。 初态 0)转移到目标集 上 并使J取极小
λ1 = C1 λ2 = −C1t + C2
u = C1t − C2 1 3 1 2 x1 = C1t − C2t + C3t + C4 6 2 1 2 x2 = C1t − C2t + C3 2
4个积分常数 1, C2, C3, C4由4个边界条件 个积分常数C 个积分常数 个边界条件
x1 (0) = 1, x2 (0) = 1, x1 (2) = 0, x2 (2) = 0
定义纯量函数
H[x, u, λ, t] = L[x, u, t] + λ f [x, u, t]
T
(5-4)
为哈密尔顿函数。 称H[x,u,λ,t]为哈密尔顿函数。则 为哈密尔顿函数
′ = ∫ H[x, u, λ, t] − λT x dt & J
tf t0
{
}
(5-5) (5-6)
或 式中
& J ′ = ∫ H[x, x, u, λ, t]d t
这个方程是在假设δu为任意,控制 这个方程是在假设 为任意,控制u(t)取值 为任意 取值 不受约束条件下得到的。如果u(t)为容许控制, 不受约束条件下得到的。如果 为容许控制, 为容许控制 的约束, 变分不能任意取值 变分不能任意取值, 受到 u(t ) ∈U 的约束,δu变分不能任意取值,
∂H 那么, 不成立, 那么,关系式 = 0不成立,这种情况留待极 ∂u
*
x1 *(t) t
0.5
1 * x2 (t)
1.5
2
比较上述结果可见,即使是同一个问题, 比较上述结果可见,即使是同一个问题, 如果终端条件不同,其最优解也不同。 如果终端条件不同,其最优解也不同。
二、波尔札问题
设系统状态方程
& x(t ) = f [x(t ), u(t ), t]
初始状态x(t0)= x0,终始状态 f)满足 终始状态x(t 满足 初始状态
T
由欧拉方程, 由欧拉方程,得
& ∂H d ∂H 0 0λ1 λ1 − = λ + & = 0 & ∂x dt ∂x 1 0 2 λ2
& λ1 = 0 ⇒ & λ2 = −λ1
λ1 ∂H d ∂H − = u + [0 1] = 0 & ∂u dt ∂u λ2
T T T t0
tf
tf t0
将上式代入式(5-5),得 , 将上式代入式
J ′ = ∫ H[x, u, λ, t] + λ x dt − λ x
tf T T t0
{
}
tf t0
(5-8)
相对于最优控制u 及最优轨线 设u(t)和x(t)相对于最优控制 *(t)及最优轨线 和 相对于最优控制 的变分为δu和 ,计算由δu和 引起的 u*(t)的变分为 和δx,计算由 和δx引起的 的变分为 J´的变分为: 的变分为:
u(t)
ω(t)
1s
θ(t)
1s
x1
x2
解:系统状态方程及边界条件为
0 1 0 & x= x + 1u 0 0 1 0 x(0) = , x(2) = 1 0
由式(5-7),得 , 由式
0 1 2 T 0 1 & & H = L + λ [ f − x] = u + λ x + 1u − x 2 0 0
tf t0
& & H[x, x, u, λ, t] = L[x(t ), u(t ), t] + λ (t ){ f [x(t ), u(t ), t] − x(t )}
T
(5-7)
对式(5-5)右边第二项作分部积分,得 右边第二项作分部积分, 对式 右边第二项作分部积分
∫
tf
t0
& & − λ x dt = ∫ λ x dt − λ x
x(t) u(t) (2,2,5) 2 1 0 -1 -2 u*(t) -3 x2*(t) 0.5 1 7/6 1.5 2 t x1 (t)
*
例2:设问题同例 。但将终端状态改为 :设问题同例1。但将终端状态改为θ(2)=0, , ω(2)自由,即终端条件改成部分约束、部分自 自由,即终端条件改成部分约束、 自由 重求u 、 由。重求 *(t)、x*(t)。 。
于是得
u (t ) = 6t −12 3 3 9 2 * x1 (t ) = t − t + t +1 16 8 9 2 9 * x2 (t ) = t − t +1 16 4
*
u*(t)和x*(t)的图像见图 。 的图像见图3。 和 的图像见图
x(t) u(t) 2 1 0 -2 -4 -6 u (t) -8 -10
解得
7 C1 = 3, C2 = , C3 = 1, C4 = 1 2
因此, 因此,最优解为
7 u (t ) = 3t − 2 1 3 7 2 * x1 (t ) = t − t + t +1 2 4 3 2 7 * x2 (t ) = t − t +1 2 2
*
最优控制u 及最优轨线 及最优轨线x 如图 所示。 如图2所示 最优控制 *(t)及最优轨线 *(t)如图 所示。
在这类极值问题中, 在这类极值问题中,要处理两种类型的等式约 一是微分方程约束,一是终端边界约束。 束。一是微分方程约束,一是终端边界约束。根据 拉格朗日乘子法,要引入两面两个乘子矢量, 拉格朗日乘子法,要引入两面两个乘子矢量,一个 是n维λ(t),另一个是 维µ,将等式约束条件泛函 维 ,另一个是q维 , 极值化成无约束条件泛函极值问题来求解。 极值化成无约束条件泛函极值问题来求解。
⇒{u = −λ2
∂H d ∂H 0 1 0 & − = x + 1u − x = 0 & ∂λ dt ∂λ 0 0
& x1 = x2 ⇒ & x2 = u
5个未知数 1, x2, λ1, λ2, u,由5个方程联立求得通解 个未知数x 个未知数 , 个方程联立求得通解
正则方程及控制方程与例1完全相同 完全相同, 解 正则方程及控制方程与例 完全相同,只是 边界条件改成 t = 0时 x1 (0) = 1, x2 (0) = 1,t = 2 时
x1(2) = 0, λ2 (2) = 0,代入例1的通解中可确定积分 代入例 的通解中可确定积分
常数: 常数:
9 18 C1 = , C2 = , C3 = 1, C4 = 1 8 8
[
]
J = ∫ L[x(t ), u(t ), t]d t
tf t0
(5-2)
寻求最优控制u(t),将系统从初始状态x(t0)=x0 ,将系统从初始状态 寻求最优控制 转移到终端状态x(t ,并使性能泛函J取极值 取极值。 转移到终端状态 f),并使性能泛函 取极值。
将状态方程式(5-1)写成约束方程形式 写成约束方程形式 将状态方程式