(完整版)最优控制---汉密尔顿函数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
u* t 3t 7
2
x1* t
1 2
t3
7 4
t
2
t
1
x
* 2
t
ቤተ መጻሕፍቲ ባይዱ
3 2
t2
7 2
t
1
最优控制u*(t)及最优轨线x*(t)如图2所示。
x(t) u(t) 2 1
x1*(t)
(2,2,5)
0
t
0.5
1 7/6 1.5
2
-1
-2
x2*(t)
u*(t)
-3
例2:设问题同例1。但将终端状态改为θ(2)=0, ω(2)自由,即终端条件改成部分约束、部分自 由。重求u*(t)、x*(t)。
式(5-9)与式(5-10)联立称为哈密尔顿正则方程。
式(5-11)称为控制方程,
这个方程是在假设δu为任意,控制u(t)取值
不受约束条件下得到的。如果u(t)为容许控制,
受到 utU 的约束,δu变分不能任意取值,
那么,关系式 H 0不成立,这种情况留待极 u
小值原理中讨论。
式(5-12)称为横截条件。常用于补充边界条件。
xt f xt,ut,t
(5-1)
式中 xt Rn;ut Rr ;
f xt,ut,t ——n维连续可微的矢量函数。
设给定 t t0 ,t f ,初始状态为x(t0)=x0,
终端状态x(tf)自由。性能泛函为
J
t f
t0
Lxt,ut,td t
(5-2)
寻求最优控制u(t),将系统从初始状态x(t0)=x0 转移到终端状态x(tf),并使性能泛函J取极值。
1 C1
2 C1t C2
u C1t C2
x1
1 6
C1t
3
1 2
C
2t
2
C3t
C4
x2
1 2
C1t
2
C2t C3
4个积分常数C1, C2, C3, C4由4个边界条件
x10 1, x2 0 1, x12 0, x2 2 0
解得
C1
3, C2
7 2 ,C3
1,C4
1
因此,最优解为
t0
t0
t0
将上式代入式(5-5),得
J t f Hx,u, ,t T x d t T x t f (5-8)
t0
t0
设u(t)和x(t)相对于最优控制u*(t)及最优轨线
u*(t)的变分为δu和δx,计算由δu和δx引起的
J´的变分为:
J
tf t0
xT
H x
uT
H u
初始状态x(t0)= x0,终始状态x(tf)满足
Nxt f ,t f 0
式中N——q维向量函数,n≥q。
J tf Hx,u,,t T x d t t0
(5-5)
或 J tf H x, x,u, ,td t t0
(5-6)
式中
Hx, x,u,,t Lxt,ut,t T tf xt,ut,t xt
(5-7)
对式(5-5)右边第二项作分部积分,得
t f T x d t t f T x d t T x t f
由式(5-6)写出欧拉方程直接导出。
即 H d H
x H
H
u
dt
d dt
d dt
H t f
x t0
x H
H u
0
0
0
0
HxH
H
u
tf t0
x 0 0
0
(5-17)
应用上述条件求解最优控制的步骤如下:
1) 由控制方程
H 0 u
解出 u* u~x,
2) 将u*代入正则方程解两边边值问题,求x*、λ*。
x2* t
9 16
t2
9 4
t
1
u*(t)和x*(t)的图像见图3。
x(t) u(t) 2
x1 *(t )
1
0
0.5
1
1.5
-2
x2*(t)
-4
-6
u*(t) -8
-10
t 2
比较上述结果可见,即使是同一个问题, 如果终端条件不同,其最优解也不同。
二、波尔札问题
设系统状态方程
xt f xt,ut,t
解 正则方程及控制方程与例1完全相同,只是
边界条件改成 t 0时 x10 1, x2 0 1,t 2 时 x12 0,2 2 0 ,代入例1的通解中可确定积分
常数:
9
18
C1 8 ,C2 8 ,C3 1,C4 1
于是得
u* t 6t 12
x1* t
3 16
t3
9 8
t2
t
1
第五章 用变分法求解连续 最优控制问题
—有约束条件的泛函极值
上节讨论没有约束条件的泛函极值问题。但在 最优控制问题中,泛函J所依赖的函数总要受到受控 系统状态方程的约束。解决这类问题的思路是应用 拉格朗日乘子法,将这种有约束条件的泛函极值问 题转化为无约束条件的泛函极值问题。
一、拉格朗日问题
考虑系统
将状态方程式(5-1)写成约束方程形式
f xt,ut,t xt 0
(5-3)
应用拉格朗日乘子法,构造增广泛函
J
t f
t0
Lxt
,
ut
,
t
T
t
f
xt
,
ut
,
t
xt
d
t
式中λ(t)——待定的n维拉格朗日乘子矢量。
定义纯量函数
Hx,u,,t Lx,u,t T f x,u,t (5-4)
称H[x,u,λ,t]为哈密尔顿函数。则
d
t
xT
tf t0
使J´取极小的必要条件是,对任意的δu和δx,
都有δJ´=0成立。
因此得
H 0
x H x
H 0 u
tf 0 t0
(5-9) (5-10) (5-11) (5-12)
式(5-9)称为动态系统的伴随方程或协态方程, λ又称为伴随矢量或协态矢量。
式(5-10)即系统的状态方程。
3) 再将x*、λ*代入得 u* u~ x*, * 为所求。
例1:有系统如图1所示。欲使系统在2s内从状态
0 0
1 1
转移到
2 2
0 0
,使性能泛函
J
1 2
2 u 2 td t
0
min
,试求u(t)。
u(t)
ω(t)
θ(t)
1s
1s
x1
x2
解:系统状态方程及边界条件为
x
0 0
1 0 0x 1u
x0
1 1,
x2
0 0
由式(5-7),得
H
L T f
x
1 u2 2
T
0 0
1 0
x
10u
x
由欧拉方程,得
H x
d dt
H x
0 1
01 02
12
0
2101
H u
d dt
H u
u
0
112
0
u 2
H
d dt
H
0 0
1 0
x
0 1u
x
0
x1 x2
x2 u
5个未知数x1, x2, λ1, λ2, u,由5个方程联立求得通解
例如,若始端固定,终态自由时,由于δx(t0)=0, δx(tf)任意,则有
xt0 x0
(5-13)
t f 0
(5-14)
若始端和终端都固定时,δx(t0)=0,δx(tf)=0则以
xt0 x0
(5-15)
x t f x f
(5-16)
作为两个边界条件。
实际上,上述泛函极值的必要条件,亦可