3 极大值原理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1)设u*(t)是最优控制,x*(t)为由此最优控制产生的最优轨线,则存在 与其相对应的协态向量λ*(t),使x*(t)和λ*(t)满足规范方程组
H [ x * ( t ), * ( t ), u* ( t ), t ] * * * * (t ) H [ x ( t ), ( t ), u ( t ), t ] x * (t ) x
由泛函极值必要条件 J a 0 及 t f , x f , x , w , Z 的 任意性,得此泛函极值的必要条件为:
欧拉方程: 横截条件: T F d F T F F x { }t 0 (3-2-20) 0 (3-2-17) t f t f x x dt x F T d F (3-2-21) { }t 0 0 (3-2-18) x x x dt w F (3-2-22) d F (3-2-19) 0 t 0 w dt Z F (3-2-23) 0
(3-2-9) (3-2-10)
, , , t ) H ( x, , w 2] , w , Z , t ) T x T [ g( x , w , t) Z F ( x, x
Leabharlann Baidu
则有
, , , t )dt , w , Z J a ( u) [ x( t f ), t f ] ( t ) [ x( t f ), t f ] F ( x , x
① 曲线c应是满足极值条件的极值曲线; ② 极值曲线c能够被包含在极值曲线场中; ③ 对于c近旁所有点(x, t)以及近于p(x, t)的 x , p, t ) 值,函数 E ( x , x 不变号,极小值时E≥0,极大值时E≤0。

对于强极值,
① 曲线c应是满足极值条件的极值曲线; ② 极值曲线c能够被包含在极值曲线场中; ③ 对于c近旁所有点(x, t)以及任意的 x , p, t ) 值,函数 E ( x , x 不变号,极小值时E≥0,极大值时E≤0。
u,上式即 考虑 w
H ( x * , * , u, t ) H ( x * , * , u* , t )

H ( x * , * , u* , t ) min H ( x * , * , u, t )
u
以上即为极大值原理的简单推导。
至此可以将庞特里亚金极大值原理表示为: 定理3-1:设系统的状态方程为 (t ) f [ x(t ), u(t ), t ] x (3-2-1)
3.1 泛函极值的充分条件
几个有关定义 正常场 定义3-1:若(t,x)平面某一区域D上每一点都有曲线族中一条且 仅有一条通过,则称曲线族在区域D上形成一个正常场。曲线族上 点(t,x)处的切线的角系数称为场在点(t,x)的斜率。 中心场 定义3-2:若区域D上曲线族的全部曲线都通过一点(t0,x0),即 它们形成曲线束,且束心也属于D,同时除束心外,曲线在D内不 再相交,曲线布满区域D,则该场为中心场。 极值曲线场 定义3-3:若正常场或中心场是由某一变分问题的极值曲线族所形 成,则称之为极值曲线场。
T t0
tf
求其一阶变分有
(3-2-11) (3-2-12)
J a J t J x J w J Z
f
其中
J t
f
t f t f T T { Fdt } t f t f { F} tf t f t f t f t f t f (3-2-13)
t0
tf
(3-2-5)

u(t)有界并受不等式约束,与前面讨论的问题不同。 u(t)有界一般可以考虑为是分段连续函数,对不等式约束则要设法转化 为等式约束处理。 引进新变量Z(t)和w(t),取 (3-2-6) ( t )] 2 g [ x ( t ), u ( t ), t ], Z ( t ) 0 [Z 0 (3-2-7) w ( t ) u ( t ), w ( t 0 ) 0 2 g 可以保证g非负;而由u(t)的分段连续性,有 取Z

(t ) 的分段连续性,则进一步有w(t)分段光滑连续。因此,可以采 w 用Lagrange乘子法进行求解。

p 分别取Lagrange乘子 R n, R ,构造广义性能指标 Rr ,
J a ( u ) [ x ( t f ), t f ] T ( t ) [ x ( t f ), t f ]
tf F F T T J x x { } t f {x T }dt x t 0 x x x tf F d F T T T F } t f {(x ) t f x T [ ]dt } x f { t 0 x dt x x x x (3-2-14) t f ,则有 式(3-2-14)中,由于 x f x ( t f ) x T F T J x x f { } tf x x x tf F d F T F (3-2-14’) (x ) t f t f x T [ ]dt t0 x x dt x tf T F T d F J w (w ) w ]dt (3-2-15) t f t0 dt w w tf T F T d F (3-2-16) J Z (Z ) t f Z ]dt t 0 Z dt Z T f
tf
再由3.1节中泛函达到极值的充分条件,维尔斯特拉斯E函数在泛 函极小值时沿最优轨线非负,即有
) F ( x* , w* , Z * , x *) , w , Z *, w *, Z E F ( x* , w* , Z * , x F F (3-2-31) Z * ) T F 0 w * )T (w (Z x w Z d F 将F函数定义式(3-2-10)代入上式,并考虑由 0 dt w F F d F F F 和 ,有 0;由 0和 0 t 0 ,有 t 0 ,以及 f w w dt Z Z Z 2 在最优轨线上有 Z g ( x , u, t ),所以有 x * )T (x
tf 2 ]}dt (3-2-8) , t ) T [ f ( x , w , t) x ] T [ g( x , w , t) Z { L( x , w t
0
, t ) L( x , w , t ) T f ( x , w , t) 定义 H ( x , , w
控制变量u(t)是有第一类间断点的分段连续函数,属于m维空间中 的有界闭集Ω,满足不等式约束条件 g[ x(t ), u( t ), t ] ≥0 (3-2-4) 则为把状态x(t)自初始状态
x ( t 0 ) x0
(3-2-2) (3-2-3) (3-2-5)
转移到满足边界条件 [ x ( t f ), t f ] 0 的终态,其中tf未知,并使性能指标(泛函) tf J ( u) [ x( t f ), t f ] L[ x( t ), u( t ), t )]dt t0 达到最小值,实现最优控制的条件是:
r R 其中, ,r ≤n 。
u(t)属于有界闭集Ω,受不等式 g[ x(t ), u(t ), t ] ≥0 约束,g为p维连续可微函数,p≤m。 求最优控制 u* ( t ) ,满足上列条件,并使性能指标 达到极小值。
(3-2-4)
J ( u) [ x( t f ), t f ] L[ x( t ), u(t ), t )]dt
3.2 连续系统极大值原理
考虑系统状态方程 ( t ) f [ x ( t ), u ( t ), t ] x
x (t ) R n , u(t ) R m 其中, ,m≤n x(t0 ) x0 初始状态
(3-2-1) (3-2-2) (3-2-3)
终态满足
[ x ( t f ), t f ] 0
t0 tf t0
其中 E[ x , x , p, t ] L[ x , x , t ] L[ x , p, t ] [ x p] L[ x , p, t ] p 称为维尔斯特拉斯E函数。
泛函J在曲线上达到极值的充分条件
设泛函J在曲线c上达到极值,可分为弱极值和强极值两种 情况,其充分条件分别为: 对于弱极值,
T { H } t f 0(3-2-27) t f t f T { } t f 0 (3-2-28) x x H g T (3-2-29) { } tf 0 w w ) 0 ( T Z (3-2-30)
f
, t ) H ( x * , * , w *, t) 0 E H ( x * , * , w
(3-2-32)
, t ) H ( x * , * , w *, t) 0 E H ( x * , * , w
(3-2-32) (3-2-33) (3-2-33’)
f
f
f
Z
tf
, , , t ) H ( x, , w 2] , w , Z , t ) T x T [ g( x , w , t) Z 将 F ( x, x
代入以上各式,可得泛函极值必要条件为:
欧拉方程: T H g (3-2-24) x x d H g T { } 0(3-2-25) w dt w d T (3-2-26) ( Z ) 0 dt 横截条件:
维尔斯特拉斯E函数 (Weierstrass Erdmann Function)
设有泛函 tf ( t ), t ] dt J ( x ) L[ x ( t ), x 若用p(x,t)表示其极值曲线场中极值曲线斜率,则可以证 明泛函增量可表示为
( t ), p( x , t ), t ] dt J ( x ) E[ x( t ), x
第三章 极大值原理 (Maximum Principle)
前面介绍的变分法属于经典变分学的内容。 经典变分学只能解决容许控制属于开集的一类最优控制问题,而且 对轨线x( t )、函数L、f 均有连续可微要求。实际工程应用问题中, 这些要求一般无法得到满足。 为解决容许控制属于闭集的一类最优控制问题,前苏联数学家庞特 里亚金(俄文ЛОНТЛЯТИН,英文Pontryagin)受力学中 Hamilton原理启发,于1958年提出极大值原理并加以证明。 极大值原理将经典变分学推进到现代变分学,成为现代控制理论的 重要基石。 极大值原理(Maximum Principle),或称最大值原理,也有称为极 小值原理或最小值原理(Minimum Principle)。 极大值原理的证明在数学上非常严格,本课程只从工程应用需要的 理解程度出发对其进行简单推导。
相关文档
最新文档