第十章_具有约束的最优控制问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

G ( t , y , u ) [ 的运动方程
T
]
(t )
在计划时期内的初始值和终结值是:
0 0
( 0 ) G ( , y , u ) d 0
(T ) G ( , y , u ) d k
0
上页的最优控制问题变为:T 最优控制问题: 最大化 0 F ( t , y , u ) dt
T
例2 解以下最优控制问题:

最大化 0 1 dt y yu 满足
y (0) 5 y ( T ) 11 T 自由
T


u ( t ) [ 1,1]
它具有一个受约束的控制变量,该控制集合可视为 两个不等式约束:
1 u (t ) 和 u (t ) 1
汉密尔顿函数: H 拉格朗日函数:
u
对于所有 t [ 0 , T ]
]
H y [ 的运动方程 ]
y
H
[ y 的运动方程
(t ) 常数
( T ) 0 [ 横截条件 ]
四、不等式积分约束 T 最优控制问题: 最大化 0 F ( t , y , u ) dt y f (t, y , u ) 满足
y H H
u
F (t, y , u ) f (t, y , u ) G (t, y , u )
[ y 的运动方程
[ 的运动方程
]


[ 的运动方程
]
[ 的运动方程
]
( T ) 0 [ 横截条件 ]
上页的最大值原理可简化为:
Max H
]
]
( T ) 0 , ( T ) k 0 , ( T )[ ( T ) k ] 0 [ 的横截条件
]
汉密尔顿函数 H 独立于 ,所以有:
H 0 ( t ) 常数
上页的最大值原理可简化为:
Max H
u
对于所有 t [ 0 , T ]
u
t
f ( t , y , u ) [ c g ( t , y , u )]
t [0, T ] 0
对于所有
(10 . 51 ) (10 . 52 )
c g (t, y , u , u ) 0 0
y 的运动方程: (10 . 53 ) y
如果存在内部解,关于 u 最大化

u j
0
以及
i ci g 0 i 0 i
i
i
0
对于所有 t [ 0 , T ]
( i 1, 2 )
运动方程:
y
和 的运动方程:y


y
以上没有对 u j 施加约束,若对 u j 变量附加了非负约束:
汉密尔顿函数:H 最大值原理: Max
F (t, y , u ) f (t, y , u ) G (t, y , u )
对于所有 t [ 0 , T ] u H H [ 的运动方程 y [ y 的运动方程 ] y H H [ 的运动方程 ] [ 的运动方程 ( T ) 0 [ y 的横截条件 ] H
第九章 具有约束的最优控制问题
第一节 涉及控制变量的约束
一、等式约束
最优控制问题:

最大化 0 F ( t , y , u 1 , u 2 ) dt y f ( t , y , u1 , u 2 ) 满足
g ( t , y 1 , u1 , u 2 ) c
T


边界条件
汉密尔顿函数:H
1 ( y u )
1 ( y u ) 1 ( u 1) 2 (1 u )
上页推导得到拉格朗日函数:
1 ( y u ) 1 ( u 1) 2 (1 u )
最大值原理:
u 1 2 0 对于所有 t [0, T ]

最大化 0 满足 y f (t, y , u )
(t, y , u )e
T
t
dt
g (t, y ,(t, y , u )e (t, y , u )e
0
t
f (t, y , u )
拉格朗日函数: 最大值原理:
对于给定的 ,或者 关于( y , u ) 对所有t [ 0 , T ] 是凹 的,或者 H 0 关于 y 对于所有t [ 0 , T ] 是凹的。
如果是无限水平问题,充分性定理仍然适用,但是要 加上一个补充性条件:
T
lim ( t )[ y ( t ) y ( t )] 0
(10 . 46 )
y

,根据 (10 . 43 ) 可知 1 2 0 或 1 2 又根据 (10 . 44 ) 的 1 0 可知 2 0 再根据 (10 . 45 ) 的互补松弛条件可知 1 u 0
0
u 1
*
若 0

满足
y f (t, y , u ) G (t, y , u )
y (0) y0 y ( T )自由
( y 0 , T 给定 )


( 0 ) 0 (T ) k
( k 给定 )
汉密尔顿函数:H
F (t, y , u ) f (t, y , u ) G (t, y , u )

g u j 0 对于所有 t [ 0 , T ] ( j 1, 2 )
t [0, T ]
满足约束条件:

c g ( t , y , u , u ) 0 对于所有
y 的运动方程:y ( H )
( H g ) 的运动方程: y y y
*
如果是现值汉密尔顿函数和拉格朗日函数,通过用 代替 并用 H c0 代替 H 0 ,依然可以使用充分性定理。
n u

( t , y , u ) mf ( t , y , u ) n [ c g ( t , y , u )]
对于所有 n t [0, T ] 0
0
(10 . 57 ) (10 . 58 )
c g (t, y , u , u ) 0 n 0 n
F ( t , y , u1 , u 2 ) f ( t , y , u1 , u 2 )
该汉密尔顿函数受制于约束 g ( t , y 1 , u1 , u 2 ) c,相应地, 我们构造拉格朗日函数(增广汉密尔顿函数):
H ( t )[ c g ( t , y , u 1 , u 2 )] F ( t , y , u 1 , u 2 ) f ( t , y , u 1 , u 2 ) ( t )[ c g ( t , y , u 1 , u 2 )]
u j 0 uj 0 uj u j 0
不等式约束的最大值原理要成为必要条件,还需满足以下一个约 束限制:
第339页
三、等周问题 最优控制问题: 最大化 0 F ( t , y , u ) dt y f (t, y , u ) 满足
T
G ( t , y , u ) dt
二、不等式约束 最优控制问题:

最大化 0 F ( t , y , u 1 , u 2 ) dt y f ( t , y , u1 , u 2 ) 满足
g ( t , y 1 , u 1 , u 2 ) c1
1
T
g ( t , y 1 , u1 , u 2 ) c 2
2


1
]
H y [ 的运动方程 ]
y
H
[ y 的运动方程
( T ) 0 [ y 的横截条件
( t ) 常数 0

]
k
G ( t , y , u ) dt
0
T
0
k
G ( t , y , u ) dt 0 0
G ( t , y , u ) dt
0
T
k
( k 给定 )
( y 0 , T 给定 )


y (0) y0
y ( T )自由
我们引入一个新的状态变量 (t ) ,使得积分约束可以 用 (t ) 来替代:
( t ) G ( , y , u ) d
0 t
方程两边求导:
y 的运动方程: y m
(10 . 59 )
m m

m 的运动方程:

(10 . 54 )
六、充分条件 汉密尔顿函数: H 拉格朗日函数:
0
F f G
H [c g ]
u (t )
*
H 表示沿着控制变量最优路径 函数。
取值的汉密尔顿
具有约束条件的充分性定理:
上页推导得到: u *
同理可以得到: u *
1
若 0
1 若 0
与第229页(7.48)式的符号函数相同, (7.48)式 的符号函数表示为:
u sgn
*

1 u 如果 0 1
*
五、现值汉密尔顿函数和拉格朗日函数
边界条件
我们把汉密尔顿函数增广至拉格朗日函数:
F f 1 ( t )[ c1 g ] 2 ( t )[ c 2 g ]
2
拉格朗日函数: 最大值原理:
F f 1 ( t )[ c1 g ] 2 ( t )[ c 2 g ]
1 2
(10 . 43 ) (10 . 44 ) (10 . 45 ) (10 . 47 )

1 2
y
u 1 0 1 0 1 ( u 1) 0 1 u 0 2 0 2 (1 u ) 0
yu
G (t, y , u ) y (0) y0

T
y ( T )自由
( y 0 , T 给定 )

H
]
( 0 ) 0 (T ) k
对于所有 t [ 0 , T ]
H y H
( k 给定 )
汉密尔顿函数:H
最大值原理: Max
0
T
k
( k 给定 )
( y 0 , T 给定 )


y (0) y0
y ( T )自由
我们引入一个新的状态变量 (t ) ,使得积分约束可以 用 (t ) 来替代:
( t ) G ( , y , u ) d
0 t
方程两边求导:
G ( t , y , u ) [ 的运动方程
T
]
(t )
在计划时期内的初始值和终结值是:
0 0
( 0 ) G ( , y , u ) d 0
(T ) G ( , y , u ) d k
0
上页的最优控制问题变为: 最优控制问题: 最大化 F ( t , y , u ) dt 0 y f (t, y , u ) 满足
(10 . 54 ) 的运动方程: y
引入新的乘子:
m e n e
t
(隐含 me (隐含 ne
t
)
t
t
)
汉密尔顿函数: H c
He
e
t
t
( t , y , u ) mf ( t , y , u )
拉格朗日函数:
最大值原理:
上页推导得到拉格朗日函数(增广汉密尔顿函数):
F ( t , y , u1 , u 2 ) f ( t , y , u1 , u 2 ) ( t )[ c g ( t , y , u1 , u 2 )]
最大值原理: 关于 u 最大化
u j F u j f u j
相关文档
最新文档