最优控制--极大值原理(专业教学)

合集下载

极大值原理

极大值原理

最优控制问题可表述为:寻求一个容许控制u(t),以使受控系统从某个给定的初始状态x(t0)=x0出发,在 末时刻tf达到目标集,并且使性能指标泛函J【u(·)】达到极小值或极大值。如果这个问题是有解的,那么就 称求得的容许控制为最优控制,记为u(t);而系统状态方程在u(t)作用下的解称为最优轨线,记为x(t);相 应的极小或极大性能指标值J【u(·)】,称为最优指标值。在数学上,最优控制问题的实质,是对受约束的泛 函J【u(·)】求极值的问题,其中的约束条件为系统的状态方程、目标集方程和容许控制域。
原理简介
极大值原理
maximum principle
最优控制理论中用以确定使受控系统或运动过程的给定性能指标取极大或极小值的最优控制的主要方法。在 工程领域中很大一类最优控制问题都可采用极大值原理所提供的方法和原则来定出最优控制的规律。在理论上, 极大值原理还是最优控制理论形成和发展的基础。极大值原理是对分析力学中古典变分法的推广,能用于处理由 于外力源的限制而使系统的输入(即控制)作用有约束的问题。极大值原理是20世纪50年代中期苏联学者Л.С. 庞特里亚金提出的,有关这一原理的主要结果及其严格的数学证明,都发表在后来出版的《最优过程的数学理论》 一书中。
式9式11式13LQ问题 线性二次型性能指标的最优控制问题。
次优控制
对于较为复杂的受控系统,即使系统为线性的情况,最优控制问题的求解也常有大量的计算。采用次优控制, 可在保证性能指标值足够接近最优性能值的同时,显著地减少问题求解的计算量。实现次优控制的主要的途径是 把复杂的受控系统通过适当的方法化为两个较为简单的子受控系统,并且针对子系统来计算最优控制,再综合地 作必要的修正。实现系统性能指标值 对最优性能值的接近程度来确定;要求接近的程度越高,修正计算量也就越大。特别是对于要求计算机实时控制 的受控系统,为了避免过大的计算量或避免增加控制系统在组成上的复杂性,常常更宜采用次优控制以代替最优 控制。

基于极大值原理的最优控制

基于极大值原理的最优控制

1 h(t f ) 2 v(t f )
3
1 和 2 为待定的拉格朗日乘子 式中,
4)将哈密顿函数整理为
H 1v 2 ( u g ) 3 (ku ) (1v 2 g ) ( 2 k3 )u m m
5)由极小值条件,H相对于 u (t ) 取绝对极小值。因此,最优控制为
2 u , max m k3 0 u (t ) 0, 2 k3 0 m
上述结果表明,只有当发动机推力在最大值和零值之间进行开关 控制,才有可能在实现软着陆的同时,保证燃料消耗最少。
4
thank you !

3 (t )

H 2 (t )u (t ) m m 2 (t )
3)由横截条件
1 (t f )
2 (t f )
1 1 1 h(t f ) h(t f )
J m(t )
2 2 2 v(t f ) v(t f ) 3 (t f ) 1 m(t f )
现代控制理论
实例分析: 基于极大值原理的最优控制
例:设宇宙飞船质量为m(t),高度为h(t),垂直速度为v(t),发动机推力为 u(t),月球表面的重力加速度设为常数g,不带燃料的飞船质量为M,初始燃料 的总质量为F,发动机最大推力为 umax ,发动机飞船的状态方程为:
h(t ) v (t ) , h(0) h0 u (t ) v (t ) g , v (0) v0 m(t ) m(t ) ku(t ),

m(0) M F
要求飞船在月球上实现软着陆,即终端约束为
1 h(t f ) 0 , 2 v(t f ) 0

最优控制——最大值原理

最优控制——最大值原理

最优控制——最大值原理最优控制问题是数学中的一个重要问题,研究如何在给定约束条件下使一个系统达到最优状态。

在数学的最优控制理论中,最大值原理是一种重要的工具和方法,被广泛应用于很多最优控制问题的求解中。

本文将详细介绍最优控制中的最大值原理及其应用。

最大值原理也称为哈密顿-雅可比-贝尔曼方程(hamilton-jacobi-bellman equation),它是最优控制问题的一个基本性质。

最大值原理给出了在给定约束条件下系统状态的最优演化方程。

最大值原理的基本形式是哈密顿-雅可比-贝尔曼方程。

对于一个给定的最优控制问题,假设系统的演化满足一个偏微分方程,此方程将由状态变量、控制变量、时间变量以及一个哈密顿函数构成,具体形式如下:∂V/∂t + min(u) {H(x,u,t)+ ∇V⋅f(x,u,t)} = 0其中,V(x,t)是值函数(value function),表示从状态x在时间t开始时,系统必须选择的最佳控制来最大化性能指标的期望值。

f(x,u,t)是状态方程(state equation),描述系统状态的演化。

H(x,u,t)是哈密顿函数(Hamiltonian),是一个将值函数、控制变量和状态方程综合起来的函数,它的作用是描述系统的动力学性质。

最大值原理的关键在于通过逐步迭代的方式求解值函数V(x,t),找到使系统达到最优状态的最佳控制变量。

这一过程通常称为最优控制问题的动态规划(dynamic programming)。

最大值原理的主要应用涉及很多不同领域,例如经济学、工程学、生物学等。

在经济学中,最大值原理被广泛应用于决策理论、资产定价、宏观经济模型等领域。

在工程学中,最大值原理常用于控制系统设计、路径规划、优化问题等。

在生物学中,最大值原理被用于神经科学、生态学、生物系统动力学建模等。

最大值原理的应用还包括优化问题、最短路径问题、最优控制问题、反问题等。

它不仅可以用于求解连续问题,也可以用于离散问题。

第七章 最优控制:最大值原理

第七章 最优控制:最大值原理
H u 2u 0 u 1 2


(7.39)
H
2
u
2
2 0
u (t )
的解是最大化 H


例1 最大化
满足 y y u 和 y (0 ) 1
V

1 0
u dt
2
y (1) 0


汉密尔顿函数: H u 2 ( y u )
0
H t , y



(T ) y T ( 0 ) y 0
的第一项对 求导,得:
T ( ) 0
(7.28)


H H q ( t ) dt H y q (t ) p (t ) u y


f (t , y , u ) H
以上两个方程右边相同,因此左边相等:
y
推导得到最大值 原理的条件之一
以上推导得到:


H ( t , y , u , ) y ( t ) dt ( T ) y
T 0
T
(0) y0
步骤3 推导新目标泛函 的另一种形式
推导得到最大值原 理的一般横截条件
第二节 其他终结条件

一般横截条件:
H t T T
(T ) y T 0
(7.30)
y
y Z
• 固定终结点的横截条件:
y (T ) y T

(T 和
y T 给定)
水平终结线的横截条件:
[ H ]t T 0
t
0
T
T2
T

最优控制-极大值原理

最优控制-极大值原理

近似算法
针对极大值原理的求解过程,开 发了一系列近似算法,如梯度法、 牛顿法等,提高了求解效率。
鲁棒性分析
将极大值原理应用于鲁棒性分析, 研究系统在不确定性因素下的最 优控制策略,增强了系统的抗干 扰能力。
极大值原理在工程领域的应用
航空航天控制
在航空航天领域,利用极大值原理进行最优 控制设计,实现无人机、卫星等的高精度姿 态调整和轨道优化。
03
极大值原理还可以应用于经济 学、生物学等领域,为这些领 域的研究提供新的思路和方法 。
02
最优控制理论概述
最优控制问题定义
01
确定一个控制输入,使得某个给定的性能指标达到 最优。
02
性能指标通常由系统状态和控制输入的函数来描述。
03
目标是在满足系统约束的条件下,找到最优的控制 策略。
最优控制问题的分类
1 2
确定型
已知系统的动态模型和控制约束,求最优控制输 入。
随机型
考虑系统的不确定性,如随机干扰、参数不确定 性等。
3
鲁棒型
考虑系统模型的不确定性,设计鲁棒控制策略。
最优控制问题通过求解优化问题得到最优解的解析表达式。
数值法
02
通过迭代或搜索方法找到最优解。
极大值原理
03
基于动态规划的方法,通过求解一系列的子问题来找到最优解。
03
极大值原理
极大值原理的概述
极大值原理是现代控制理论中的基本原理之一,它为解决最 优控制问题提供了一种有效的方法。该原理基于动态系统的 状态和性能之间的关系,通过寻求系统状态的最大或最小变 化,来达到最优的控制效果。
在最优控制问题中,极大值原理关注的是在给定的初始和终 端状态约束下,如何选择控制输入使得某个性能指标达到最 优。它适用于连续和离散时间系统,以及线性或非线性系统 。

《最优控制》第3章庞德里雅金极大值原理解析

《最优控制》第3章庞德里雅金极大值原理解析
3
tf
t0
第3章——庞德里雅金极大值原理
(1)最优轨线 x * (t ) 和协态向量 (t ) 满足规范方程组
x
H H x
(2)在最优轨线 x * (t )上与最优控制 u * (t )上对应的哈密顿 函数取最小值
H ( x*, u*, , t )umin H ( x, u, , t )
目标泛函:
J dt , | f (t ) | 1 0
8
tf
第3章——庞德里雅金极大值原理
1 x2 x 问题:设系统的状态方程 其中控制变量u (t ) 满足约束 x u 2
, 条件 | u(t) | 1 设系统的初始状态 x1 (0) x10 , x2 (0) x20 ;
快速控制系统的这个特性称为有限切换原理,相应的 控制方式称为Bang-bang控制。 (6)求最优轨线
①u 1 2 u dx2 dt x2 t c1 x2 (0) x20 x2 (t ) t x20 x 1 2 1 x2 x1 (t ) t x20t x10 x 2
7
第3章——庞德里雅金极大值原理
2、双积分装置时间最优控制系统 考察惯用语性负荷在一无阻尼环境中运动情况:
Y (s) 1 m y 2 (t ) f (t ) 设m 1 G ( s ) F (s) S
1 x2 x 设 x1 y, x2 x 1 y 得 2 u x
4
第3章——庞德里雅金极大值原理
(3)边界条件
x ( t ) x(t0 ) x0 , (t f ) ①当 f 不受限制, x(t f )
②当存在终端约束条件
[ x(t f ), t f ] 0时,x(t0 ) x0

极大值原理MaximumPrincipleMaximumPrinciple

极大值原理MaximumPrincipleMaximumPrinciple

维尔斯特拉斯E函数 (Weierstrass Erdmann Function)
设有泛函 有 tf ( t ), t ] dt J ( x ) L[ x ( t ), x
t0
若用p(x,t)表示其极值曲线场中极值曲线斜率,则可以证 表示其极值曲线场中极值曲线斜率 则可以证 明泛函增量可表示为
3.1 泛函极值的充分条件
几个有关定义 个有关定义 正常场 定义3 3-1 1:若( x,t )平面某 )平面某一区域 区域D上每 上每一点都有曲线族中一条 点都有曲线族中 条 且仅有一条通过,则称曲线族在区域D上形成一个正常场。曲线族 上点(x,t)处的切线的角系数称为场在点(x,t)的斜率。 中心场 定义3-2:若区域D上曲线族的全部曲线都通过一点(x0,t0),即 它们形成曲线束,且束心也属于 它们形成曲线束,且束 也属于D,同时除束 ,同时除束心外,曲线在 外,曲线在D内不 再相交,曲线布满区域D,则该场为中心场。 极值曲线场 定义3-3 3 3:若正常场或中心场是由某一变分问题的极值曲线族所形 若正常场或中心场是由某 变分问题的极值曲线族所形 成,则称之为极值曲线场。 以上定义可以从平面场拓展到n维空间场。

对于强极值,
① 曲线c应是满足极值条件的极值曲线; ② 极值曲线c能够被包含在极值曲线场中; 能够被包含在极值曲线场中 , p, t ) 值,函数 E ( x , x ③ 对于c近旁所有点(x, t)以及任意的 x 不变号 极小值时E≥0,极大值时 不变号,极小值时 极大值时E≤0。
3.2 连续系统极大值原理

J a ( u) [ x ( t f ), t f ] T [ x ( t f ), t f ]
f 2 ]}dt (3-2-8) , t ) T[ f ( x , w , t) x ] T [ g( x , w , t) Z { L( x , w

最优控制理论习题课

最优控制理论习题课

2
1, 2 (t) c2et
c1
1 2
u2
(1
2
) x2
2u
S ( x(2))
1 2
[ x1 (2)
5]2
1 2
[ x2
(2)
2]2 ,
G(x(2)) x1(2) 5x2 (2) 15 0
控制方程:
H u
0 u 2
0 u(t) c2et
c1
x2 (t) x2 (t) u
最优控制理论习题
--变分法、极大值原理
例1设系统状态方程为
x& u,
边界条件为
x(0)
1,x(t
f
)
0,
(t
自由)
f
性能指标为
J
tf
1 2
t f u 2 dt
0
要求确定最优控制 u *,使 J 最小。
解:这是 t f 自由问题。终端状态固定,x(t f ) 0 是满足约束集的特殊情况,即
G[ X (t f ), t f ] x(t f ) 0
)T )
v(t f
)
2 (2) x2 (2) 2 5v c2e2 c1
代入 x1 (2), x2 (2)
0.5c2 c3 c1 0.5c2
c4 c3
0 0
7c1 3e2c2 4e2c3 c4 15 x1 (2) 5x2 (2) 15
3c1 0.5e2c2 e2c3 c4 v 5
优控制 u* (t) 2
再由规范方程 x u ,可得
x(t) 2 t c
由初始条件 x(0) 1 ,求得 c 1 ,故最优轨迹为
x* (t) 2 t 1 以终端条件
x*

北京交通大学(最优控制理论与算法研究生课程)第四章 极大值原理

北京交通大学(最优控制理论与算法研究生课程)第四章 极大值原理

自由末端的极大值原理(7/8)
H ( x * (t ), λ(t ), u* (t )) min H ( x* (t ), λ(t ), u(t )) (96)
u ( t )U
3) 由极值求解条件(96)可知,极大值原理得到的是全局最 小值,而非局部极值,而古典变分法中由极值条件 H/u=0得到的是局部极小值。
自由末端的极大值原理(3/8)
满足 2) 边界条件
λ(t f ) S ( x (t f )) x (t f )
的解, 其中哈密顿函数为
H ( x(t ), λ(t ), u(t )) λ (t ) f ( x(t ), u(t ))
3)则有
H ( x * (t ), λ(t ), u* (t )) min H ( x* (t ), λ(t ), u(t ))
再则,如果把条件(96)仍称为极值条件,则极大值原 理得到的是强极值。
而古典变分法在欧拉方程推导时,对极值曲线x*(t)和 其导数都引入变分,得到的是弱极值。 不难理解,当满足古典变分法的应用条件时,极值条 件 H/u=0 只是极大值原理的极值求解条件 (96) 的 一个特例。
自由末端的极大值原理(8/8)
x(t)的表达式(1/3)
(2) x(t)的表达式 根据 f(x,u) 对 x 的可微性 , 由状态方程 (92) 可得如下由控制量 的变分u(t)引起的状态方程(92)的变分
f ( x* x , u* u) f ( x * , u* ) x f ( x * , u* u) * * f ( x , u u) x o ( x ) f ( x , u ) x f ( x* , u* ) * * * * x f ( x , u u ) f ( x , u ) x f ( x* , u* u) f ( x* , u* ) x o( x ) x x

最优控制--极大值原理

最优控制--极大值原理

目标函数J 为最小
步骤:应用最小值原理进行问题的求解
⑴列写哈密顿函数
H x(t), u(t), (t), t
1 T (t)f x(t), t Bx(t), tu(t)
1 T (t) f x(t), t T (t)Bx(t), tu(t)
⑵由控制方程求u*(t)
∵u有约束, ∴H在u*上取得极小值,即:
X (t0 ) X 0
(t
f
)
[ X (t f ), t
X (t f )
f
]
gT [ X [
X
(t (t
f f
,t )
f
)]
]
H
tf
t f
g T (
)
t f
0
3、与 U * (t) 对应的哈密顿函数H取极小值。
H[X *(t),U *(t), *(t), t] min H[X *(t),U (t), *(t), t] u (t )
末端条件: X t f 0
求u * (t) ,使系统状态从 X (t0) X0 转移到 X (t f ) X f 0
则: H * (t) H * (t f ) 常数 。{ dH dt
t f L( X ,U )dt 包括
t0
H H中不显函t} t
J [ X (t f )]
J
t f L( X ,U )dt
t0
(与末端状态无关)
2)、t f 自由,
[ X (t f )]
J
[ X (t f )]
tf t0
-1 , q j *(t) 0 +1 不定 , q j *(t) 0 -1
奇异
t
可见:当 当

第三章极大值原理(MaximumPrinciple)(MaximumPrinciple)

第三章极大值原理(MaximumPrinciple)(MaximumPrinciple)

• 取 Z 2 g 可以保证g非负;而由 u(t) 的分段连续性,有 w (t) 的分
段连续性,则进一步有w(t)分段光滑连续。因此,可以采用
Lagrange乘子法进行求解。
• 分别取Lagrange乘子 Rn, Rr, R ,p 构造广义性能指标
Ja (u) [ x(t f ), t f ] T [ x(t f ), t f ]
g[x(t),u(t),t] ≥0
(3-2-4)
则为把状态x(t)自初始状态
x(t0 ) x0
转移到满足边界条件
[ x(t f ), t f ] 0
的终态,其中tf未知,并使性能指标(泛函)
达J到(u最) 小 值[x,(t实f )现, t f最]优tt控0f L制[x的(t)条, u件(t)是, t:)]dt
u
以上即为极大值原理的简单推导。
(3-2-32) (3-2-33) (3-2-33’)
至此可以将庞特里亚金极大值原理表示为:
定理3-1:设系统的状态方程为
x(t) f [x(t),u(t),t]
(3-2-1)
控制变量u(t)是有第一类间断点的分段连续函数,属于m维空间中 的有界闭集Ω,满足不等式约束条件
以上定义可以从平面场拓展到n维空间场。
维尔斯特拉斯E函数 (Weierstrass Erdmann Function)
设有泛函
J ( x) t f L[ x(t ), x(t ), t] dt t0
若用p(x,t)表示其极值曲线场中极值曲线斜率,则可以证 明泛函增量可表示为
J( x) t f E[x(t), x(t), p( x, t), t] dt t0
F w
(Z
Z * )T

最优控制全部PPT课件

最优控制全部PPT课件

给定一个线性系统,其平衡状态X(0)=0,设计的目的是保持系统处于平衡状态,即 这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。
线性调节器的性能指标为:
J
tf t0
n
xi 2 (t)dt
i 1
加权后的性能指标为:
J
tf t0
n
qi xi 2 (t)dt
i1
对u(t)有约束的性能指标为: J t f 1 [ X T (t)QX (t) uT (t)Ru(t)]dt
上述由控制约束所规定的点集称为控制域U,凡在t0-tf上有定义,且在控制域U 内取值的每一个控制函数u(t)均称为容许控制。
4:性能指标
通常情况下,最优控制问题的性能指标形如:
J
(x(t f ),t f)
tf t0
F(x(t),u(t),t)dt
其中第一项是接近目标集程度,即末态控制精度的度量,称为末值型性能指标。
第6页/共184页
从工程实际考虑,约束条件为 0 F(t) maxF(t)
如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指标:
J
tf t0
[c1
F (t )]d t
为最小
综上所述,所谓最优防天拦截问题,即选择满足约束条件的控制F(t),驱使系统从初始 状态出发的解,在某个时刻满足终端条件,且使性能指标为极值(极小值)。
第14页/共184页
5:线性跟踪器
若要求状态X(t)跟踪或尽可能接近目标轨迹Xd(t),则这种系统称为状态跟踪器,其相 应的性能指标为:
J
tf t0
1 [ X (t) 2
Xd
(t )] T
Q[ X (t)

极大值原理

极大值原理

极大值原理极大值原理极大值原理 maximum principle 最优控制理论中用以确定使受控系统或运动过程的给定性能指标取极大或极小值的最优控制的主要方法。

在工程领域中很大一类最优控制问题都可采用极大值原理所提供的方法和原则来定出最优控制的规律。

在理论上极大值原理还是最优控制理论形成和发展的基础。

极大值原理是对分析力学中古典变分法的推广能用于处理由于外力源的限制而使系统的输入即控制作用有约束的问题。

极大值原理是20世纪50年代中期苏联学者Л.С.庞特里亚金提出的有关这一原理的主要结果及其严格的数学证明都发表在后来出版的《最优过程的数学理论》一书中。

我今天的讲座就是讲自动控制的发展。

从开始阶段的发生到形成一个控制理论讲整个这个进程。

我们讲自动控制就是指这样的反馈控制系统这是有一个控制器跟一个控制对象组成的把这个控制对象的输出信号把它取回来测量回来以后跟所要求的信号进行比较。

根据这误差告诉控制器这就是机器内部的工作了。

让控制器完成这个控制作用使得这个偏差消除或者说使得控制对象的输出跟踪我所需要的要求的信号。

控制对象的输出量一般来说都是一个物理量比如说我控制一个机器的转速就是需要把速度测量出来才能进行控制。

自动控制系统从一开始出现的时候大家假如接触到这门学科的话可能都知道是瓦特的离心调速器。

这是离心调速器的几种方案的示意图什么叫离心调速器呢就是有两个飞球一转起来以后因为离心力飞球就往外胀。

飞球胀开以后这个下面的套筒就往上升这个套筒在移动就带动执行机构动作这是最早的瓦特的离心调速器。

实际上这个离心调速器不是瓦特发明的一般我们叫瓦特的离心调速器它实际上不是瓦特的发明。

这是什么呢就是在那个时期大家看到风力磨坊就是相当于离心调速器的那个飞球实际上在那个时候已经有这样的调速器。

瓦特是发明了蒸汽机用了这样的一个调速器但是现在很多人都愿意把这个离心调速器挂在瓦特的名下。

所以一般的书上大家看到的是瓦特的离心调速器你要看正式的书假如材料写的确切的话只说1788年前后不确切说哪一天的年代因为不是他发明的。

极大值原理

极大值原理

极大值原理
极大值原理是微分方程理论中的一个重要概念,它在研究微分方程解的性质和行为时发挥着关键作用。

在这篇文档中,我们将详细介绍极大值原理的定义、应用和相关概念,希望能够为大家对这一理论有一个清晰的认识。

首先,我们来看一下极大值原理的定义。

极大值原理是指微分方程解在某个区域内取得极大值(或极小值)的点,要么是边界上的点,要么是解在该区域内的驻点。

这一原理为我们分析微分方程解的性质提供了重要的线索,有助于我们理解解的行为和特征。

接下来,我们将介绍极大值原理的应用。

在实际问题中,通过极大值原理可以帮助我们分析微分方程解的行为,例如确定解的稳定性、存在性和唯一性等性质。

通过对解的极值点进行分析,我们可以得到关于解的定性信息,这对于理解和预测实际问题的发展趋势具有重要意义。

除了极大值原理的基本概念和应用,我们还需要了解一些相关的概念。

例如,在具体的微分方程问题中,我们可能会遇到最大值原理、最小值原理、弱极值原理等不同形式的极值原理,它们在不同的问题中具有不同的作用和意义。

因此,我们需要对这些相关概念有一个清晰的认识,以便能够灵活运用极值原理解决具体的微分方程问题。

总之,极大值原理是微分方程理论中的重要概念,它为我们分析微分方程解的性质和行为提供了重要的线索。

通过对极大值原理的理解和运用,我们可以更好地理解微分方程解的行为,为实际问题的分析和预测提供有力的支持。

希望本文能够帮助大家对极值原理有一个清晰的认识,进一步提高对微分方程理论的理解和运用能力。

最优控制最大值原理

最优控制最大值原理
最大值原理(当然包括最小值原理,以下同)是对古典变 分法的发展。它不仅可以用来求解函数U(t)不受约束或只 受开集性约束的最优控制问题,而且也可以用来求解控制 函数U(t)受到闭集性约束条件的最优控制问题。这就意味 着最大值原理放宽了对控制函数U(t)的要求。
最大值原理没有提出哈密顿函数H对控制函数U(t)的可微 性的要求,因此,其应用条件进一步放宽了。并且,由最 大值原理所求得的最优控制U(t)使哈密顿函数H达到全局、 绝对最大值,而由古典变分法的极值条件H/ U=0所得到 的解是H的局部、相对最大值或驻值。因此,最大值原理 将古典变分法求解最优控制问题的极值条件作为一个特例 概括在自己之中 。
ห้องสมุดไป่ตู้
14
(2)边界条件为
(3) 在最优控制U*(t)和最优轨线X*(t)上哈密顿函数达到最大值, 即
说明:由于定理2.1.2的中心内容是,使性能泛函达到极小值 的最优控制的必要条件是哈密顿函数H达到最大值,所以 ,该定理称为最大值原理。
*
15
例 2.1.1 给定一阶线性系统和初始条件 (2.1.11)
(1)应用最大值原理求解,为此构造哈密顿函数 (2.1.14)
*
16
按照最大值原理,为使泛函(2.1.13)达到极小值必须选择控 制函数u(t) ,使哈密顿函数(2.1.14)达到最大值。
由式(2.1.14)可见,当u(t)与((t)+1/2)同号,且取其约束条件
的边界值,即| u(t) |=1时,使哈密顿函数H达到最大值。所以 ,控制函数应选择为
求增量j设最优控制ut相应地也发生变分设为由状态方程221得2262015121543227将式227与式226相减并左乘以228考虑到哈密顿函数为则式228变为对上式两端进行积分得2292015121544对上式左端进行分部积分得将上式代入式229移项后得22102015121545将上式代入式2210得性能泛函的增量为2211化简增量j由于协态变量方程为2212并利用泰勒公式将式2211右端的第二项积分中的第一个函数的最优轨线x20151215462213其中02015121547将式2212和式2213代入式2211中经整理得2214在上式右端后两个积分中都含有它们相对于第一个积分而言都是高阶无穷小量记为于是式2214变为20151215482215反证法证明定理为了证明最大值原理是使性能泛函j达到极小值的必要条件需要证明

最优控制 ppt2第二章求极值

最优控制 ppt2第二章求极值

式中
f (X )
' x1 *
f ( x1, x2 ) x1
f ( x1, x2 ) x2
* x1 x1 * x 2 x2
* x1 x1 * x2 x 2
f (X )
' x2 *
f x'1' x1 ( X * )
'' x2 x2
2 f ( x1, x2 ) x1
i 1,2,, n
j 1,2,, m
L g j ( x1 , x2 , j
, xn ) 0
例2-3 求从原点(0,0,0)至平面
g ( x1 , x2 , x3 ) ax1 bx2 cx3 d 0
的最短距离。
解 原点至空间任何一点 ( x1 , x2 , x3 ) 的距离的平 方为
* * * f ( X ) f ( x 1 , x2 ) 取极值的必要条 由(2-5)式可知, 件为 * 0 fX (2-7)
' X T f x' X 0
(2-8)
则这个极值为极小值。由于 X是任意的不为零 的向量,要使(2-8)式成立,由矩阵理论可知, 二阶导数矩阵(又称为Hessian阵) f X'' 必须是正 定的。正定阵形式上可表示为
2
* x1 x1 * x2 x2
f
(X )
*
2 f ( x1, x2 ) x2
2
* x1 x1 * x2 x 2
f x'1' x2 ( X * )
2 f ( x1, x2 ) x1x2
* x1 x1 * x2 x2
o[(x1 )2 ,(x2 )2 ] 表示高阶无穷小。将(2-4)式用
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

X (t0 ) X 0
(t f
)
[ X (t f ), t
X (t f )
f
]
gT [ X [
X
(t f (t f
,tf )
)]
]
H
gT
t优f 选知t识f ( t f
)
0
4
3、与 U * (t) 对应的哈密顿函数H取极小值。
H[ X *(t),U *(t), *(t), t] min H[ X *(t),U (t), *(t), t] u(t)
第三章 极小值原理及应用
经典变分法缺陷:
1、应用前提:a 、控制量 u(t)的取值不受任何限制,没有任何 不等式约束。
b 、 f、L、 等函数对其自变量有充分可微性。
2、实际控制要求:
a 、控制量u受不等式约束,如:Mi (u) 0 ,i=1,2,3……
b 、性能指标有时并不完全可微
优选知识
1
如:燃料最优控制: J t f u(t) dt t0
J[U ] H
u0 u u2
U 00 U11 U2 u
若采用经典变分:
H U
0,U *
U1;实际应为U *
U
。极小值原理。
0
J[U ] H
u0 u u1
U0
U1 u
优选知识
2
若采用经典变分法: H 0 不再适用,求不出解来
U
实际应为 U * U 0 极小值原理
J[U ] H
U0 U * U1
1 0 t 0.307
所以 U * (t)
0.5 0.307 t 1

x(t)
x(t) 1 0 t 0.307
x(t) 0.5 0.307 t 1
c1et 1 0 t 0.307
x(t)
c2et 0.5
0.307 t 1
优选知识
9
由x(0)=5代入,得c1 4
所以 x*(t) 4et 1
即:设 X * (t), * (t) 为满足状态方程和协状态方程的最优解。
在 H[ X * (t),U * (t), * (t), t] 中。把H仅看作U的函数,若J为最小,必要条
件为 U * (t) 使得 H[ X * (t),U * (t), * (t), t] 仅看作U的函数时也取最小值。
极小值原理的证明:应用数学基础较多,有些书中用很大篇幅进行
g T t f
0
7
四、例题分析 :设一阶系统状态方程:

x(t) x(t) u(t)
x(0)=5
控制约束: 0.5 u 1
试求使性能指标: J
1
[x(t) u(t)]dt
0
为极小值的最优控制U *(t)及最优性能指标 J *
t 解:定常系统, f 固定,末端自由问题
H x u (x u) x(1 ) u(1 )
0 t 0.307
令t=0.307可得0.307≤t≤1时x(t)的初始条件:
x(0.307) 4e0.307 1 6.44 解得 c2 4.34
4et 1
0 t 0.307
所以 X * (t)
4.34et 0.5 0.307 t 1
1)t0 , t f已知,X (t0 ) X 0 , X (t f ) X f 边界条件为:X (t0 ) X 0 , X (t f ) X f
2) t0 , X (t0 ) X 0 给定,X (t f )自由,t f 未给定,
边界条件: X
(t0 )
X 0 , (t
f
)
X
|t f
确定t f
一般:对于实际系统 有最优解 有唯一解 最优解 根据物理意义 --------
极小值原理
--------
--
优选知识讨论的是 t0和 X (t0 ) 已知。X (t f )受约束,t f 自由的最一般
情况。若 t f 和末端状态不同,只需改变极小值原理的边界条件即可。
u u0 u u1
若在容许控制范围内,J或H有极值且唯一,用极小值 原理与经典变分法,所得
结论一致。
优选知识
3
一、<定理>极小值原理:[时变系统]
时变受控系统

X
f
(X ,U ,t),其中控制向量u(t)
R r,
为容许控制
域, U(t)是在内取值的任何分段连续函数,为使状态向量由初始
X (t0 ) X 0 转移到末端 X (t f ),X (t f ) 满足约束:g[ X (t f ), t f ] 0 ,
t f 未定, 并使性能指标达
J
[ X (t f ), t f ]
tf t0
L[ X (t),U (t), t]dt
到极小值。设
U
*
(t
)
和t
* f
是如上J为最小的最优解,X
*
(t
)为最优状态轨
线,则必存在不为0的n维向量 (t),满足:
1、规范方程:

X f (X ,U,t)

H
X
2、边界条件:
根据极小值原理,使H绝对极小相当于使J为极小
1 1
所以 U * (t)
0.5 1
由协状态方程:

(t
)
H
[1 (t)]; (t) cet 1
X
优选知识
8
由横截条件: (1) ce1 1 0; c e; (t) e1t 1
显然:当 (ts ) 1时,U * (t) 产生切换
(ts ) e1ts 1 1, ts 0.307
:
H tf
t f
0
3) t0 , t f 已知,X (t0 ) X 0给定,末端受约束 g[ X (t f ), t f ] 0
边界条件为: X (t0 ) X 0
(t f )
X
tf
g T X
tf
g[ X (t f ), t f ] 0
t 若
f 自由:外加:
H
|t f
优选知t f识
这一原理是苏联学者 “庞特里亚金”等人首先提出,而后加以证明得
_
在证明过程中: 与H得符号与这里所定义的相反。 H H
_
_
H[ X * (t), (t),U * (t)] max H[ X * (t), (t), u(t)]
u(t)
∴所以有的文献中也称为“极大值原理”。
3、H对u没有可微要求,因此应用拓宽。 4、 极小值原来是求取最优控制的必要条件,非充分条件。 即:满足极小值原理不一定J取极小值,需进一步判断。
证明,省略。
二、极小值原理的意义:
1 、容许控制条件放宽
变分法:在整个控制域,对U没有约束 H 0 且即使U不受限制,
有时 H 0 计算不易。
u
u
极小值原理:H在U的约束闭集中取极小值。
变分法仅为优极选小知识值原理的一个特例。
5
2、最优控制 U * 使哈密顿函数H取极小值,极小值原理由此得名。
相关文档
最新文档