最优控制理论第四章资料
最优控制理论第四章.ppt
Since (t)-1 on [0,1] and x(0)=1>0, the original
optimal control given by (4.11) is u*(t)=-1. Substituting this into (4.8) we get x(t)=1-t, which is positive for t<1. Thus
In case of first order constraints, h1(x,u,t) is as follows:
With respect to the ith constraint hi(x,t)0, a sub
Interval (1,2) [0,T] with 1< 2 is called an interior
i.e., xi(t) 0, i=1,2,…,n. Constraints exhibiting (4.1) are called pure state variable inequality constraints. The general form is
With (4.1): at any point where a component xi(t)>0, the corresponding constraint xi(t) 0 is not binding and can be ignored.
Clearly, the optimal control u* will be the one that keeps x as small as possible, subject to the state constraint (4.1) and the boundary condition x(0)=x(3)=1. Thus,
最优控制理论及应用
的控制律,使被控对象按预定要求运行,并使给
定的某一性能指标达到极小值(或极大值)
2019年3月10日
2
最优控制理论与应用
二 最优控制问题 1 例子 飞船软着陆问题 宇宙飞船在月球表面着陆
时速度必须为零,即软着陆,这要靠发动机的推
力变化来完成。问题是如何选择一个推力方案,
使燃料消耗最小。
m 飞船的质量,h 高度,v 垂直速度, g 月球重力加速度常数,M 飞船自身质量 F 燃料的质量
最优控制理论与应用
最优控制理论与应用
第一章 最优控制问题的一般概念 第二章 最优控制的变分方法 第三章 极小值原理及其应用 第四章 线性二次型问题的最优控制 第五章 动态规划
2019年3月10日
1
最优控制理论与应用
第一章 最优控制问题的一般概念
一 基本概念
最优控制理论中心问题:
给定一个控制系统(
已建立的被控对象的数学模型),选择一个容许
2019年3月10日
24
最优控制理论与应用
2.2 欧拉方程
(2)有等式约束泛函极值的必要条件 定理2.4 设有如下泛函极值问题:
min J ( x( )) g( x, x, t )dt
x(t ) t0 tf
s.t.
f ( x, x, t ) 0
其中, f=0为系统运动的微分方程,g(x,x,t)及x(t)在[t 0 ,t f ] 上连续可微,t 0 及t f 给定。 x,x,f R n 已知x(t 0 ) x 0 , x(t f ) x f , x(t) n , 则极值轨线x * (t) 满足如下欧拉方程
控制约束
0 u(t ) umax
任务:满足控制约束条件下,求发动机推力的 最优变化律,使登月舱由初始出发点到达目标处 (末态),并使性能指标达到极值(燃耗量最小)
第4章 最优控制
X (0) = X 0
比较可得
J = ∫ F ( X , U , t ) dt
t0
tf
F = α 2 x 2 + β 2u 2 f =u
求哈密顿函数
H = α 2 x 2 + β 2 u 2 + ΛT (t ) u
有必要条件可得
H ( X (t ), U (t ), Λ (t ), t ) H U = = 2β 2u + Λ = 0 U (t )
u(t)
u (t ) < K
M x(t)
x(t 0 )
问题是: 问题
什么样的 u(t),使M 能最快地到达地面,并使到达地面时的速度等于零?
设物体M的质量为1 , x(t)表示物体离地面的高度. x
M 的运动微分方程式
u(t)
M x(t)
d2x = u (t ) g 2 dt
选择
x1 (t ) = x(t ), x2 (t ) = x(t ) = x1 (t )
Q 和 R 是正定实对称矩阵,又称为加权矩阵。 取Q和R为对角矩阵,设Q和R的元素为 q1 , q 2 ,..., q n 和 r1 , r2 ,..., rn 。 则二次型性能指标可写为
2 2 J = ∫ (q1 x12 + q 2 x 2 + + r1u12 + r2 u 2 + )dt t0 tf
瞬时推力
f(t) 应满足
0 ≤ f (t ) ≤ f max
要求控制拦截器从相对目标的初始状态出发,于某终点时刻 tf 与目标相遇(拦截) 即 且应满足
x (t f ) = 0
m(t f ) ≥ me
me 燃料耗尽后火箭的质量
最优控制ppt课件
精品课件
定理(变分预备定理):设 ( t )
是时间区间
[t0, t1]上连续的n维向量( t函) 数,
的连续n维向量函数(t,0)且(t1)0
有
t1
T
(t)(t)dt
,若
0
t0
是任意
则必有
(t)0,t[t0,t1]
精品课件
4.1.2 欧拉方程
LX,XrX,X
这里,LX,X 是X 的线性泛函,rX,X 是关于 X
的 高阶无穷小,则
JLX,X
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
精品课件
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。
定理 设J[x]是线性赋范空间Rn上的连续泛函
返回主目录
精品课件
在动态系统最优控制问题中,性能指标是 一个泛函,性能指标最优即泛函达到极值。解决泛 函极值问题的有力工具是变分法。所以下面就来列 出变分法中的一些主要结果,大部分不加证明,但 读者可对照微分学中的结果来理解。
精品课件
4.1.1 泛函与变分
先来给出下面的一些定义。
1、泛函: 如果对某一类函数X(t)中的每一个函
(1) (L1 L2 ) L1 L2
(2) ( L1L2 ) L2 L1 L1 L2
b
b
(3) a L[ x, x, t]dt a L[ x, x, t]dt
(4) dx d x
dt dt 精品课件
举例:
可见,计算泛函的变分如同计算函数的微分一样。
精品课件
6、泛函的极值:若存在 0 ,对满足的 X X* 一切X,J(X)J(X*)具有同一符号,则
最优控制ppt第四章
4.1 经典变分法的局限性 4.2 连续系统的极小值原理 4.3 最短时间控制问题 4.4 最少燃料控制问题 4.5 离散系统的极小值原理 4.6 小结
4.1 经典变分法的局限性
上面我们用经典变分法解最优控制问题时,得出了 最优性的必要条件
H 0 U
在得出这个条件时,作了下面的假定:
两式相减可得这一段的 X (t)
t
X (t)
[ f (X ,U U,t) f (X ,U ,t)]dt
(4-6)
t1
可以对 X (t) 的大小作估计
X (t)
max t1 tt1
f (X ,U U,t)
f (X ,U ,t) (t t1 )
由于 是微量,所以 X (t) 也是微量,因而在精确
到一阶微量的情况下,下式成立
f (X ,U
U )
f (X ,U
U ) f
X
|X X
X
(4-7)
将式(4-7)代入(4-6),并注意到微量 X 在
微小时间间隔上的积分是高阶微量,即得
X (t) t [ f (X ,U U,t) f (X ,U ,t)]dt t1
X (t0 ) X 0
(4-2)
控制向量 U (t) Rm,并受下面的约束
U
(4-3)
末值状态必须满足的约束条件为
G X (t f ),t f 0
性能指标函数为
J X (t f ),t f TG X (t f ),t f
其中 Rn 为待定列向量。
(4-4) (4-5)
H
H
H
u*
u u* u0
u u*
u
(a)
最优控制应用基础-第四章
R ,
1 ,Riccati方程为
p 11 ( t f ) 0 , p 12 ( t f ) 0 , p (t ) S , 1 22 f
p 12 p 22
p 11 p 12 0 , 故有 u * 1 R 1TB T P ( t ) X ( t ) T P ( t ) P( t ) A ( t ) A ( t ) P( t ) P( t ) B ( t ) R ( t ) B ( t ) P( t ) Q ( t ) 1 1 p 22 , x 2 (t ) t f t 1 S1 t t 1 S
Q ( t ) x ( t ) A ( t ) P( t ) x ( t )
T
得黎卡提(Riccati)矩阵(P(t)是对称时变矩阵)微分方程
T 1 T P ( t ) P( t ) A ( t ) A ( t ) P( t ) P( t ) B ( t ) R ( t ) B ( t ) P( t ) Q ( t )
J 1 2 S 1 x 2 (t f )
2
1 2
tf
u dt
2
t0
取极小。 解
p 11 P p 12
0 A 0 1 0 0 ,B , Q 0 1
2 p 11 p 12 , p 12 p 12 p 22 p 11 , p p2 2 p , 22 12 22
第四章 线性最优控制
线性最优控制问题,它研究的受控对象是线性的,性能 指标是关于状态矢量和控制矢量的二次型函数,因此,又称 做线性二次型问题。线性二次型问题在现代控制理论中占有 重要地位,它是卡尔曼在20世纪60年代初提出和解决的。 线性二次型问题能够避开求解一般最优控制问题时经常 遇到的非线性两点边界值问题,得到闭合形式的解析解,而 且求出的最优控制是统一的状态变量的线性函数,可以利用 反馈方法来构成闭环控制,在工程上易于实现。它在理论上 也很重要,有许多控制问题可以作为线性二次型问题来处理。 尤其是需要综合考虑各种设计参数的关系时,线性二次 型问题可以把一些相互矛盾的要求统一在一个性能指标中, 求得系统的总体最优性。 线性最优控制问题包括线性调节器和线性伺服系统两类 问题。
最优控制理论PPT课件-48页PPT精品文档
u t R p 为 控 制 向 量 , 且 u t 在 t 0 , t f 上 分 段 连 续 ;
f R n 为 连 续 向 量 函 数 , x t 连 续 可 微
2.初态和终态: xt0,xtf S目标集
3.容许控制 : ut — 控 制 域
§6-2 最优控制中的变分法
现
代 泛函变分的求法
控
制 理 论
定理: J x 的变 J J 分 x x | 0, (0 1 )
性质:1 .F 1 F 2 F 1 F 2
2 .F 1 F 2 F 1 F 2 F 2 F 1
理 论
L x t,x r x t,x
其L 中 xt,x— J的线性函数
rxt,x— J的高阶无穷小
则L 称 xt,x为泛 Jxt函 的一阶变 J 分
泛函变分是泛函增量的线性主部
Modern Control Theory
Page: 9
2 1 2a1ta2
ua1ta2
这里 a1、a2 为常数
由 x2 udt 得: x2t1 2a1t2a2ta3
Modern Control Theory
Page: 21
§ 6-4 有约束条件下的泛函数极值问题
现
代 控
由 x1 x2dt 得:x 1 t 1 6 a 1 t3 1 2 a 2 t2 a 3 t a 4
现
代 控
当 t0 和 tf给 定 时 , x t0 和 x tf 是 否 定 还 是 自 由 , 可 分 四 种
制 情 况 :
理 论 (1) 固定始端和终端
x(t)
即 x t 0 和 x t f 给 定 x t 0 0 ,x t f 0
第4章 最优控制理论
t* f t f
t f 很小,第二项可用积分中值定理
, t dt F x* t f , x * * t f , t f * t f J x F x* , x
t0 tf t* f
t* f
F x
J
1 T T x ( t ) x ( t ) Q x ( t ) x ( t ) u Ru dt d d 2 t0
二次型性能指标,工程中应用最为广泛
• 性能指标,泛函,即函数的函数
按数学形式
积分型 拉格朗日问题 终值型 迈耶耳问题 混合型 波尔扎问题
* *
tf
x
t0
f * , t d F x* , x * , t *, t F x* , x dJ F x* , x dt d 0 t x dt x x t 0
t
tf
0
t0 t f 0 以及极值条件
2.固定边界的泛函极值
t , t dt 积分型,Langrange问题 设泛函 J x F x t , x
xR
tf t0
分部积分法
udv uv
a b
b
b a
vdu
a b b
b
在 t0 , t f 连续二次可导
xt0 x0 xt f x f
2015年11月
§4.0 概述
研究:针对一个控制系统(被控对象),在给定一个性能指标下,
如何选择控制规律,使性能指标达到最优(极小)。
• 问题描述
动态系统: 初始状态:
如何选取容许控制域或最优控制
高等教育《最优控制理论》课件 第四章
f
t0
& { F [ x ( t ), ω ( t ), t ]
& & & & + λ T [ f ( x , ω , t ) − x ] + Γ T [ G ( x , ω , t ) − Z 2 ]} dt
令哈密而顿函数为
& & & H ( x , ω , λ , t ) = F ( x , ω , t ) + λT f ( x , ω , t )
拉格朗日纯量函数
& & & & & & & Φ ( x , x , ω , z , λ , Γ , t ) = H ( x , ω , λ , t ) − λT x + Γ T [G ( x , ω , t ) − Z 2 ]
则
t
J a = θ [ x ( t f ), t f ] + v M [ x ( t f ), t f ] +
M为q 维连续可微向量函数, q ≤ n 性能指标:
J = θ [ x ( t f ), t f ] +
∫
t
f
t0
F [ x ( t ), u ( t ), t ] dt
最优控制问题就是要寻找最优容许控制u(t)使J为极小
令
& ω (t ) = u (t ) ω (t 0 ) = 0
Z T (t ) = [ z1 (t ), z 2 (t ),L z m (t )] & 且 [ Z (t )]2 = G[ x(t ), u (t ), t ] Z (t0 ) = 0
M [ x ( t f ), t f ] = 0
最优控制
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。 定理 设J[x]是线性赋范空间Rn上的连续泛函, 若在x= x0处J[x]可微,则J[x]的变分为
J [ x0 , x] J [ x0 x]
(t ) Rn 是待定拉格朗日乘子。 为拉格朗日函数,
4.1.3 横截条件
(1)
末端时刻固定时的横截条件
F ( ) t t f x(t f ) 0 x
当tf 固定时,在x(t0)=x0 固定时,横截条件为
x(t0)=x0
如果末端状态也固定x(tf)=xf 时,边界条件退化为x(t0)=x0, x(tf)= xf ;当末端状态自由时,横截条件为
4、自变量函数的变分: 自变量函数 X (t )的变分 X X 是指同属于函数类X (t )中两个函数X 1 (t ) 、 2 (t ) 之差
X X 1 (t ) X 2 (t )
这里, t 看作为参数。当 X (t ) 为一维函数时,X 可用图4-1来表示。
图4-1 自变量函数的变分
x(t ) x * (t ) x(t )
于是泛函J 的增量 J 可计算如下(以下将*号省去)
J
tf t0
tf t0
F x x, x x, t F x, x, t dt
F F x x o ( x)2 ,( x)2 dt x x
H ( x, u, , t ) L( x, u, t ) T (t ) f ( x, u, t )
(15)
它称为哈密顿(Hamilton)函数,在最优控制中 起着重要的作用。
最优控制全部PPT课件
给定一个线性系统,其平衡状态X(0)=0,设计的目的是保持系统处于平衡状态,即 这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。
线性调节器的性能指标为:
J
tf t0
n
xi 2 (t)dt
i 1
加权后的性能指标为:
J
tf t0
n
qi xi 2 (t)dt
i1
对u(t)有约束的性能指标为: J t f 1 [ X T (t)QX (t) uT (t)Ru(t)]dt
上述由控制约束所规定的点集称为控制域U,凡在t0-tf上有定义,且在控制域U 内取值的每一个控制函数u(t)均称为容许控制。
4:性能指标
通常情况下,最优控制问题的性能指标形如:
J
(x(t f ),t f)
tf t0
F(x(t),u(t),t)dt
其中第一项是接近目标集程度,即末态控制精度的度量,称为末值型性能指标。
第6页/共184页
从工程实际考虑,约束条件为 0 F(t) maxF(t)
如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指标:
J
tf t0
[c1
F (t )]d t
为最小
综上所述,所谓最优防天拦截问题,即选择满足约束条件的控制F(t),驱使系统从初始 状态出发的解,在某个时刻满足终端条件,且使性能指标为极值(极小值)。
第14页/共184页
5:线性跟踪器
若要求状态X(t)跟踪或尽可能接近目标轨迹Xd(t),则这种系统称为状态跟踪器,其相 应的性能指标为:
J
tf t0
1 [ X (t) 2
Xd
(t )] T
Q[ X (t)
最优控制理论PPT课件
生产计划与调度
在企业生产管理中,利用 最优控制理论对生产计划 和调度进行优化,提高生 产效率和降低成本。
08
总结与展望
最优控制理论的重要性和应用前景
总结
最优控制理论是现代控制理论的重要组成部分,它在解决复杂系统的优化和控制问题方面 具有显著的优势。该理论通过数学模型和算法,寻求在给定条件下实现系统性能最优化的 控制策略。
非线性最优控制理论
20世纪70年代,基于微分几何、非 线性分析和最优控制问题的研究。
智能优化算法与最优控制
20世纪80年代,考虑系统不确定性 ,引入概率论和随机过程理论。
03
最优控制问题的数学模型
状态方程与性能指标
状态方程
描述系统动态行为的数学方程,通常表示为状态变量对时间 的导数等于其函数。
性能指标
态。这种控制策略的关键在于如何根据当前状态信息快速、准确地计算出最优控制输入。
离散系统的最优输出反馈控制
总结词
离散系统的最优输出反馈控制是一种基 于系统输出的反馈控制策略,通过最优 控制算法计算出在当前输出下的最优控 制输入,使得系统状态在有限时间内达 到预期目标。
VS
详细描述
离散系统的最优输出反馈控制是一种有效 的最优控制策略,它根据系统的输出信息 ,通过最优控制算法计算出在当前输出下 的最优控制输入,使得系统状态在有限的 时间步内以最优的方式达到目标状态。这 种控制策略的关键在于如何根据输出信息 快速、准确地计算出最优控制输入。
控制问题分类
确定性和不确定性控制、线性与 非线性控制、连续和离散控制等 。
重要性及应用领域
重要性
在实际工程和科学问题中,许多问题 都需要通过最优控制理论来解决,如 航天器轨道控制、机器人运动控制、 电力系统优化等。
最优控制理论讲义
最优控制理论讲义第一章 绪论§1.1最优控制问题静态最优化问题:输入—输出—代数方程 动态最优化问题:输入—输出—微分方程 确定性最优控制:系统参数确定,无随机输入 随机性最优控制:系统参数确定,有随机输入⎩⎨⎧=+=)()()()()(t Cx t Y t Bu t Ax t x⎩⎨⎧+=++=)()()()()()()(t v t Cx t Y t w t Bu t Ax t x例:飞船的月球软着陆问题推力 dtdmkf -= 运动方程 mg dt dmk mg f dtx d m --=-=22)()(][00f t t t m t m dt dtdmJ f-=-=⎰ 初始条件 ⎩⎨⎧======0)(,)(,00f f t x x t t ht x x t t约束条件为 0≤≤-dtdmα 求min J§1.2最优控制的数学模型一 控制系统的数学模型(集中参数系统)直接法建立:动力学、运动学的基本定律,即解析法. 间接法建立:通过“辩识”的途径确定系统的结构与参数.)),(),(()(t t u t x f t x= 其中 T n t x t x t x t x )](,)(),([)(21 =,T r t u t u t u t u )](,)(),([)(21 =,],,[21n f f f f =)(t x 为n 维状态向量,)(t u 为r 维控制向量,f 为n 维函数向量.二 目标集通过)(t u 使)(t x 由)(0t x 到)(f t x ,其中)(0t x 为初始状态,并且通常为已知;)(f t x 为终端状态,即控制所要求达到的目标。
一般来说对终端状态的要求可用如下的约束条件表示:0)),((,0)),((21≤=f f f f t t x g t t x g . 三 容许控制i u 具有不同的物理属性,一般有r 1,2i u i ,,=≤α,即在控制域U 内.凡在闭区间],[0f t t 上有定义,且控制域U 内取值的每一个控制函数)(t u 均称为容许控制。
最优控制理论
用数学语言来比较详细地表达最优控制问题 的内容:
(1)建立被控系统的状态方程
X f X (t ),U (t ), t
(1-17)
其中, (t ) 为 n 维状态向量, (t ) 为 m 维控制向量, X U f X (t ),U (t ), t 为 n 维向量函数,它可以是非线性 时变向量函数,也可以是线性定常的向量函数。 状态方程必须精确的知道。
(2)确定状态方程的边界条件。一个动态过程 对应于 n 维状态空间中从一个状态到另一个状态 的转移,也就是状态空间中的一条轨线。在最优 控制中初态通常是知道的,即
X (t0 ) X 0
(1-18)
而到达终端的时刻 t f 和状态 X (t f ) 则因问题而异。
例如,在流水线生产过程中,t f 是固定的;在飞机 快速爬高时,只规定爬高的高度 X (t f ) X f ,而 t f 是自由的,要求 t f t0 越小越好。终端状态 X (t f ) 一 般属于一个目标集 S ,即
二、最优控制发展过程
上世纪五十年代初期布绍(Bushaw)研究 了伺服系统的时间最优控制问题。 以后,拉塞尔(LaSalle)发展了时间最优 控制的理论,即所谓Bang—Bang控制理论。 1953至1957年间美国学者贝尔曼(Bellman) 创立了“动态规划”理论,发展了变分学中的哈密 顿—雅可比(Hamilton—Jacobi)理论。
t [0, t f ]
(1-11) (1-12)
x(0) x0
x0 是初始时刻的商品存货量,且 x0 0。从 x(t ) 的实
际意义来看,显然必须选取生产率使得
x(t ) 0
t [0, t f ]
(1-13)
最优控制第四章习题答案教学提纲
最优控制第四章习题答案11212212min ,(0)1,(0)1,,()0,()0,||1f f f J t x x x x x u x t x t u =======≤&&求最优控制。
解:哈密顿函数:1221H x u λλ=++由极小值原理知,要使(,,)H x u λ极小,就要使2u λ达到极小。
由控制约束条件||1u ≤可得,最优控制为2*21,0()1,0u t λλ->⎧=⎨<⎩协态方程:121120,H H x x λλλ∂∂=-==-=∂∂&& 从而11212(),()t c t c t c λλ==+容易判断,12,c c 不能同时为零,否则有*()1f H t =与定理矛盾。
根据12,c c 的不同选择可以得到*2()t λ和*()u t 的可能曲线如图所示。
因而可候选的最优控制顺序为:{}{}{}{}1,1,1,1,1,1---。
状态方程:12x x =&,2x u =&2134231,2x ut c t c x ut c =++=+ 边界条件:12(0)1,(0)1,x x ==,12()0,()0,f f x t x t ==431,1c c ==21211122x x u u=+- 当1u =时,最优曲线方程2121122x x =+, 当1u =-时,最优曲线方程2121322x x =-+,2121221:(,)|,02x x x x x γ+⎧⎫=≤⎨⎬⎩⎭同理2121221:(,)|,02x x x x x γ-⎧⎫=-≥⎨⎬⎩⎭画在同一图中2. 0min ,ft u J dt =⎰112()()()x t x t u x t u =-+=&&且有110220(0)(0)x x x x =⎧⎨=⎩12()0()0f f x t x t =⎧⎪⎨=⎪⎩||1u ≤,求最优控制。
解:哈密顿函数:11211121()1()H x u u x u λλλλλ=+-++=-++不难判断最优控制为:1,121,12u λλλλ->-⎧=⎨<-⎩协态方程:11212,0H H x x λλλ∂∂=-==-=∂∂&&从而1122,t c e c λλ== 状态方程:112x x u x u=-+=&&,13t x u c e -=-,24x ut c =+ 边界条件:110220(0),(0)x x x x ==代入得:420c x =,310c u x =-202202110(1)x x x x uux u ex e--=-+ 当1u =,202202202211010511(1)1x x x x x x x x e x e x e c e ----=-+=--=-,当1u =-,220211061(1)1x x x x x e c e -=-++=-+当图像经过原点时:561,1c c ==所以1u =时,最优曲线方程为:211x x e -=- 1u =-时,最优曲线方程为:211x x e =-+222||1||12112||12112|1|:{(,)||1|,0,0}:{(,)||1|,0,0}x x x x e x x x e x x x x x e x x γγ+-=-=-><=-<>3. 0min ,ft u J dt =⎰21220102,2x x x x x u ϖξϖ=-=--+&&且有110220(0)(0)x x x x =⎧⎨=⎩,12()0()0f fx t x t =⎧⎪⎨=⎪⎩||1u ≤,求最优控制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
The complementary slackness conditions for
the direct multiplier are 0 and x*=0. Since 0,
it follows that
Example 4.1 Consider the problem:
Solution. The Hamiltonian is which implies the optimal control to be
When x=0, we impose
, in order to insure
that (4.10) holds. Therefore, the optimal control on the
state constraint boundary is
Now we form the Lagrangian
where 1,2, and satisfy the complementary
same as in Example 2.2, namely,
Since (t)-1 on [0,1] and x(0trol given by (4.11) is u*(t)=-1. Substituting this into (4.8) we get x(t)=1-t, which is positive for t<1. Thus
and the modified transversality condition
where is a constant vector satisfying
Since the constraints are adjoined indirectly (in this case via their first time derivative) to form the Lagrangian, the method is called the indirect adjoining approach. If on the other hand the Lagrangian L is formed by adjoining directly the constraints (4.1), i.e.,
In any interval where xi(t)=0,we must have
so
that xi does not become negative.
The control must be constrained to satisfy
making fi 0, as a constraint of the mixed type (3.3) over the interval. We can add the constraint
Chapter 4
The Maximum Principle: General Inequality Constraints
4.1 Pure State Variable Inequality Constraints: Indirect Method
It is common to require state variable to remain nonnegative, i.e.,
i.e., xi(t) 0, i=1,2,…,n. Constraints exhibiting (4.1) are called pure state variable inequality constraints. The general form is
With (4.1): at any point where a component xi(t)>0, the corresponding constraint xi(t) 0 is not binding and can be ignored.
We associate multipliers ηi with (4.3) whenever (4.3) must be imposed, i.e., whenever xi(t)=0. A convenient way to do this is to impose an “either or” condition
complementary slackness conditions on the multiplier
η. The last condition
is difficult to motivate. The
direct maximum principle multiplier is related to η as
ηi xi=0. This will make ηi=0 whenever xi >0.
We can now form the Lagrangian where H is as defined in (3.7) and η=(η1, η2 ,…,ηn ). We apply the maximum principle in (3.11) with additional necessary conditions satisfied by η
where is a multiplier associated with (4.1), then the
method is referred to as the direct adjoining approach.
Remark 4.1 The first two conditions in (4.5) are
slackness conditions
Furthermore, the optimal trajectory must satisfy From the Lagrangian we also get
Let us first try (2)= =0. Then the solution for is the