最优控制中的变分法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
构造一个新的辅助泛函:
(1 35)
J ' tf {L[x(t),u(t),t] T (t)[ f [x(t),u(t),t] x(t)]}dt t0
定义哈密尔顿(Hamilton)函数H: (将 x(t)分离出去)
(1 36)
H[x(t), u(t), (t), t] L[x(t), u(t), t] T (t) f [x(t), u(t), t]
J
tf t0
[ L x
x]dt
L x
x
tf t0
tf t0
x
d (L)dt dt x
t f [L d (L)]xdt
t0 x dt x
(1 22)
根据泛函极值的必要条件,可得欧拉方程
[L d (L)] 0 或
x dt x d
(1 23)
Lx dt Lx 0
欧拉方程的展开形式:
L x
2L tx
用下从确点立A一滑条动连到结点定B点所A需(0的,时0)间和最定短点(B忽(x略f,摩y擦f)的和曲阻线力。的使影质响点)。在重力作
解:最速降线问题的示意图如下
J[ y(x)] t f dt 0
1 mv 2 mgy 2 v ds 2gy
dt
dt ds (dx)2 (dy)2
2gy
2gy
第1章 最优控制中的变分法
2.端点等式约束(等式约束的更一般形式)
问题:已知受控系统状态方程为
x f [x(t),u(t),t] x(t0 ) x0
[x(t f ),t f ] 0
目标泛函为:
t [t0,t f ] (1 42)
J
[x(t f ),t f ]
tf t0
L[x(t),u(t),t]dt
J J[ y(x)] J[ y0 (x)] 0或 J J[ y(x)] J[ y0 (x)] 0
则泛函J[y(x)] 在曲线y0(x)上达到极值。
泛函极值定理: 若可微泛函J[y(x)]在y0(x)上达到极值,则在y= y0(x)上的变分为零。即
J 0
(1 7)
第1章 最优控制中的变分法
泛函:
对于某一类函数y(·)中的每一个函 数y(x),变量J都有一个值与之相对 应,那么变量J称作依赖于函数y(x) 的泛函。
记为: J=J [y(x)]
y(x)称为泛函的宗量
宗量的变分:
y y(x) y0 (x)
例1-1问题的本质:泛函极值
第1章 最优控制中的变分法
泛函的连续性:
对任意给定的正数ε,总存在另一个正数δ,当
(1 37)
代入(1-36)式
J ' t f {H T x}dt t0 t f F[x(t), x(t), u(t), (t), t]dt t0
(1 38)
第1章 最优控制中的变分法
J ' t f {H T x}dt t0 t f F[x(t), x(t), u(t), (t), t]dt t0
t f [L T ( f
t0
x)]dt
(1 44)
用分部积分法消去
J~ [x(t f ),t f
x(t) ] vT
[
x(t
tf t0
f)
T
,t f
x(t)dt
] T (t f
T x(t
)x(t f
) )
tf t0
T
t f T x(t)dt
t0
(t0 )x(t0 )
tf {H[x(t),(t),u(t),t] T (t)x(t)}dt t0
2L x xx
2L x2
x
0
或
(1 24)
Lx Ltx Lxxx Lxxx 0
第1章 最优控制中的变分法
欧拉方程的特殊形式(L不显含t时) L L[x, x]
dx dt
[ L x
d dt
(L )] x
L t
2x t 2
(L ) x
[ d dt
(L )] x
dx dt
0
d [L xL] 0
dt
(1 43)
求最优控制u*(t),使系统从初始状态x(t0)转移到终端状态x(tf), 其目标 函数J 取极值。
根据一个微分约束,一个端点约束,共需引入2个拉格朗日乘子向量, 构成新的辅助目标泛函:
第1章 最优控制中的变分法
J~ [x(t f ),t f ] vT[x(t f ),t f ]
(t0 ) (t f ) 0 x(t) (t)
(1 16 ) (117)
J * t f L[x*(t), x*(t),t]dt t0
(118)
将(1-15)式代入(1-13)
J ( ) tf L[x*(t) (t), x*(t) (t),t]dt t0
(119)
J ( ) J ( ) J *
例:求下列泛函的变分
J t f x2 (t)dt t0
J
J[x(t) x(t)]|0
tf t0
[
x(t
)
x(t
)]2
dt
|
0
tf t0
2[x(t)
x(t)]x(t)dt
| 0
tf 2x(t)x(t)dt
t0
第1章 最优控制中的变分法
(3)泛函的极值 泛函极值的定义:
对于与y0(x)接近的曲线y(x),泛函J[y(x)] 的增量
x
(1 25) (1 26) (1 27)
L xL c (1 28) x
第1章 最优控制中的变分法
再来回顾最速降线问题,其指标函数为:
J[ y(x)] x f 1 y2 dx
0 2gy
L L[ y(x), y(x)]
代入(1-28)式:
L yLy
1 y2 y
y
c
2gy
2gy(1 y2 )
t f [L* L* (t) L* (t) R]dt t f L*dt
t0
x* (t )
x* (t )
t0
J t f [L x L x]dt (1 21)
t0 x
x
(1 20)
第1章 最优控制中的变分法
J t f [L x L x]dt (1 21)
t0 x
Βιβλιοθήκη Baidu
x
对式(1-21)中被积函数第二项分部积分(消去 x)
y( x) y0 ( x) , y( x) y0 ( x) , ... ,
y (k ) ( x) y0(k ) ( x) ,...时 J[y(x)] J[y0(x)]
则称泛函J[y(x)]在点y0(x)处是连续的。 两个函数接近度的概念:k阶接近度
零阶接近度
一阶接近度
第1章 最优控制中的变分法
(1 1)
(1 2) 1 y2
dx 2gy
(1 3)
J[ y(x)] xf
1 y2 dx
0 2gy
(1 4)
第1章 最优控制中的变分法
(1)泛函的概念
函数: 对于变量x的某一变域中的每一个 值,y都有一个值与之相对应,那 么变量y称作变量x的函数。 记为: y=f (x)
x称为函数的自变量 自变量的微分: dx=x-x0 (增量足够小时)
解决具有等式约束条件的最优化问题的基本思路,就是应用拉格朗
日乘子法,将有约束条件的泛函极值问题转化为无约束条件的泛函极值 问题。
1.微分约束 问题:已知受控系统状态方程为
x f [x(t),u(t),t] t [t0 , t f ]
(1 33)
目标泛函为:
x(t0 ) x0
J xt(ftLf [)x(tx)t,fu(t),t]dt t0
(1 34)
求 其目最标优函控数制Ju取*(t极),值使。系(统两从点初边始值状问态题x)(t0)转移到终端状态x(tf),
第1章 最优控制中的变分法
这里,为了将有约束条件的泛函极值问题转化为无约束条件的泛函 极值问题,可应用拉格朗日乘子法。为此,引入待定的n维拉格朗日乘 子向量λ(t),即
(t) [1(t) 2 (t) n (t)]T
2.端点变动的情况 (例如,拦截问题)
始点x0在曲线x=φ(x)上变动 终点xf在曲线x=ψ(x)上变动
第1章 最优控制中的变分法
端点变动时泛函极值的必要条件: (推导过程略)
(1)欧拉方程
L d (L) 0 x dt x
(1 30)
(2)横截条件
[L ( x)Lx]tf 0
(1 31)
x(t0 ) x0
线性泛函: 泛函J[y(x)]如果满足下列两个条件:
1) J[ y1(x) y2 (x)] J[ y1(x)] J[ y2 (x)] 2) J[cy(x)] cJ[ y(x)]
则称为线性泛函。
第1章 最优控制中的变分法
(2)泛函的变分
设泛函J[y(x)]为连续泛函,则泛函增量的线性主部称为泛函的变分:
第1章 最优控制中的变分法
1.2 无约束条件的最优化问题
1.端点固定的情况
了解泛函极值的概念后,再来研究最速降线问题。其目标函数为:
J xf L[x, y(x), y(x)]dx 0
不失一般性,可写为:
(1 12 )
J tf L[t, x(t), x(t)]dt t0
(113)
问题为:确定一个函数x(t),使J[x(t)] 达到极小(大)值。这条能使泛函 J[x(t)] 达到极值的曲线称为极值曲线(轨线),记作: x*(t)
多元辅助泛函J’的欧拉方程为:
(1 38)
F d F 0 x dt x
F
d dt
F
0
H 0
x H x f
(1 39) 协态方程
正则方程组
(1 40) 状态方程
F d F 0 u dt u
H 0 u
(1 41) 控制方程
根据上述三个方程,加上边界条件,可得最优控制问题的唯一确定解
思考: x(t0 ) x0 , t f 给定,x(t f ) 自由时的情况。
证明如下:
() J[y0(x) εy(x)] 0 (18)
J[ y0 (x)]
J[ y0 (x)
εy(x)] 0
d
d
( )
0
(1 9)
根据函数极值的条件,函数φ(ε)在ε=0时达到极值的必要条件为:
d
d
(
)
0
0
比较(1-9)和(1-10),可见:
(110)
J[ y0 (x)] 0
(1 11)
x
性能指标为 j[x(t)] t f 1 x2 dt 0
2
由欧拉方程: d (
x ) 0
dt 1 x2
1 01 2
积分得,
t
x c, x c a,
1 x2
1 c2
再积分,得通解 x(t) at b
根据始端条件: x(0) 1, b 1
根据终端横截条件, [L ( x)Lx]t f
第1章 最优控制中的变分法
第1章 最优控制中的变分法
本章主要内容:
1.1 变分的基本概念 1.2 无约束条件的最优化问题 1.3 具有等式约束条件的最优化问题 1.4 应用变分法求解最优控制问题
第1章 最优控制中的变分法
1.1 变分的基本概念
例1-1 最速降线问题
最速降线问题对变分学的创立产生过重大影响。
记为: δ J。 可以证明,泛函的变分是唯一的。 如何求解泛函的变分?
借鉴函数f(x)微分的求解:
x
f
(x dx) 0 f(x dx)dx 0
f(x)dx df
(x)
与(1-5)类似,可得出泛函J[y(x)] 的求解:
(1 5)
J[ y(x)]
J[ y( x)
y(x)] 0
(1 6)
第1章 最优控制中的变分法
(1 45)
极值的必要条件是一阶变分为零
J~ [dt f
(1 29)
1 y2 2gy
整理、简化后可得
y
c1 1 y2
, c1
1 2 gc 2
.
若用参数法求解,令 y ctg ,可得
x
y
c1
2 c1
( sin (1 c os
) )
2
这是圆滚线的参数方程。
第1章 最优控制中的变分法
关于欧拉方程的几点说明: 欧拉方程是泛函极值的必要条件,是否充分还需进一步判断。 (参见p56 “泛函极值的充分条件——勒盖特条件) 欧拉方程是二阶微分方程,只有在个别情况下才能得到封闭形式 的解。(如最速降线问题)
对于端点固定的情况,容许轨线x(t)应满足下列边界条件:
x(t0 ) x0 x(t f ) x f (114)
对(1-13)求取泛函极值的思路:求取泛函的变分(通过泰勒展开, 求取泛函增量的线性主部,)
第1章 最优控制中的变分法
容许轨线是由极值曲线微小摄动而成,即
x(t) x*(t) (t) (115)
x(t f ) (t f )
[L ( x)Lx]t0 0
(1 32)
x(t0 ) (t0 )
x(t f ) xt f
第1章 最优控制中的变分法
例:确定点A(0,1)至给定直线 (t) 2 t 的最短的曲线方程。
解:由A至 的弧长 ds (dt)2 (dx)2 1 x2 dt
x a 1
得最优轨线方程:
x*(t) t 1
1 x2 (1 a)
x 0 1 x2
第1章 最优控制中的变分法
1.3 具有等式约束条件的最优化问题
在最优控制问题中,泛函J[x(t)]所依赖的函数往往会受到—定约束条
件的限制。在动态最优化问题中,由于受控系统的数学模型往往用微分 方程来描述,所以等式约束就是系统的状态方程。
(1 35)
J ' tf {L[x(t),u(t),t] T (t)[ f [x(t),u(t),t] x(t)]}dt t0
定义哈密尔顿(Hamilton)函数H: (将 x(t)分离出去)
(1 36)
H[x(t), u(t), (t), t] L[x(t), u(t), t] T (t) f [x(t), u(t), t]
J
tf t0
[ L x
x]dt
L x
x
tf t0
tf t0
x
d (L)dt dt x
t f [L d (L)]xdt
t0 x dt x
(1 22)
根据泛函极值的必要条件,可得欧拉方程
[L d (L)] 0 或
x dt x d
(1 23)
Lx dt Lx 0
欧拉方程的展开形式:
L x
2L tx
用下从确点立A一滑条动连到结点定B点所A需(0的,时0)间和最定短点(B忽(x略f,摩y擦f)的和曲阻线力。的使影质响点)。在重力作
解:最速降线问题的示意图如下
J[ y(x)] t f dt 0
1 mv 2 mgy 2 v ds 2gy
dt
dt ds (dx)2 (dy)2
2gy
2gy
第1章 最优控制中的变分法
2.端点等式约束(等式约束的更一般形式)
问题:已知受控系统状态方程为
x f [x(t),u(t),t] x(t0 ) x0
[x(t f ),t f ] 0
目标泛函为:
t [t0,t f ] (1 42)
J
[x(t f ),t f ]
tf t0
L[x(t),u(t),t]dt
J J[ y(x)] J[ y0 (x)] 0或 J J[ y(x)] J[ y0 (x)] 0
则泛函J[y(x)] 在曲线y0(x)上达到极值。
泛函极值定理: 若可微泛函J[y(x)]在y0(x)上达到极值,则在y= y0(x)上的变分为零。即
J 0
(1 7)
第1章 最优控制中的变分法
泛函:
对于某一类函数y(·)中的每一个函 数y(x),变量J都有一个值与之相对 应,那么变量J称作依赖于函数y(x) 的泛函。
记为: J=J [y(x)]
y(x)称为泛函的宗量
宗量的变分:
y y(x) y0 (x)
例1-1问题的本质:泛函极值
第1章 最优控制中的变分法
泛函的连续性:
对任意给定的正数ε,总存在另一个正数δ,当
(1 37)
代入(1-36)式
J ' t f {H T x}dt t0 t f F[x(t), x(t), u(t), (t), t]dt t0
(1 38)
第1章 最优控制中的变分法
J ' t f {H T x}dt t0 t f F[x(t), x(t), u(t), (t), t]dt t0
t f [L T ( f
t0
x)]dt
(1 44)
用分部积分法消去
J~ [x(t f ),t f
x(t) ] vT
[
x(t
tf t0
f)
T
,t f
x(t)dt
] T (t f
T x(t
)x(t f
) )
tf t0
T
t f T x(t)dt
t0
(t0 )x(t0 )
tf {H[x(t),(t),u(t),t] T (t)x(t)}dt t0
2L x xx
2L x2
x
0
或
(1 24)
Lx Ltx Lxxx Lxxx 0
第1章 最优控制中的变分法
欧拉方程的特殊形式(L不显含t时) L L[x, x]
dx dt
[ L x
d dt
(L )] x
L t
2x t 2
(L ) x
[ d dt
(L )] x
dx dt
0
d [L xL] 0
dt
(1 43)
求最优控制u*(t),使系统从初始状态x(t0)转移到终端状态x(tf), 其目标 函数J 取极值。
根据一个微分约束,一个端点约束,共需引入2个拉格朗日乘子向量, 构成新的辅助目标泛函:
第1章 最优控制中的变分法
J~ [x(t f ),t f ] vT[x(t f ),t f ]
(t0 ) (t f ) 0 x(t) (t)
(1 16 ) (117)
J * t f L[x*(t), x*(t),t]dt t0
(118)
将(1-15)式代入(1-13)
J ( ) tf L[x*(t) (t), x*(t) (t),t]dt t0
(119)
J ( ) J ( ) J *
例:求下列泛函的变分
J t f x2 (t)dt t0
J
J[x(t) x(t)]|0
tf t0
[
x(t
)
x(t
)]2
dt
|
0
tf t0
2[x(t)
x(t)]x(t)dt
| 0
tf 2x(t)x(t)dt
t0
第1章 最优控制中的变分法
(3)泛函的极值 泛函极值的定义:
对于与y0(x)接近的曲线y(x),泛函J[y(x)] 的增量
x
(1 25) (1 26) (1 27)
L xL c (1 28) x
第1章 最优控制中的变分法
再来回顾最速降线问题,其指标函数为:
J[ y(x)] x f 1 y2 dx
0 2gy
L L[ y(x), y(x)]
代入(1-28)式:
L yLy
1 y2 y
y
c
2gy
2gy(1 y2 )
t f [L* L* (t) L* (t) R]dt t f L*dt
t0
x* (t )
x* (t )
t0
J t f [L x L x]dt (1 21)
t0 x
x
(1 20)
第1章 最优控制中的变分法
J t f [L x L x]dt (1 21)
t0 x
Βιβλιοθήκη Baidu
x
对式(1-21)中被积函数第二项分部积分(消去 x)
y( x) y0 ( x) , y( x) y0 ( x) , ... ,
y (k ) ( x) y0(k ) ( x) ,...时 J[y(x)] J[y0(x)]
则称泛函J[y(x)]在点y0(x)处是连续的。 两个函数接近度的概念:k阶接近度
零阶接近度
一阶接近度
第1章 最优控制中的变分法
(1 1)
(1 2) 1 y2
dx 2gy
(1 3)
J[ y(x)] xf
1 y2 dx
0 2gy
(1 4)
第1章 最优控制中的变分法
(1)泛函的概念
函数: 对于变量x的某一变域中的每一个 值,y都有一个值与之相对应,那 么变量y称作变量x的函数。 记为: y=f (x)
x称为函数的自变量 自变量的微分: dx=x-x0 (增量足够小时)
解决具有等式约束条件的最优化问题的基本思路,就是应用拉格朗
日乘子法,将有约束条件的泛函极值问题转化为无约束条件的泛函极值 问题。
1.微分约束 问题:已知受控系统状态方程为
x f [x(t),u(t),t] t [t0 , t f ]
(1 33)
目标泛函为:
x(t0 ) x0
J xt(ftLf [)x(tx)t,fu(t),t]dt t0
(1 34)
求 其目最标优函控数制Ju取*(t极),值使。系(统两从点初边始值状问态题x)(t0)转移到终端状态x(tf),
第1章 最优控制中的变分法
这里,为了将有约束条件的泛函极值问题转化为无约束条件的泛函 极值问题,可应用拉格朗日乘子法。为此,引入待定的n维拉格朗日乘 子向量λ(t),即
(t) [1(t) 2 (t) n (t)]T
2.端点变动的情况 (例如,拦截问题)
始点x0在曲线x=φ(x)上变动 终点xf在曲线x=ψ(x)上变动
第1章 最优控制中的变分法
端点变动时泛函极值的必要条件: (推导过程略)
(1)欧拉方程
L d (L) 0 x dt x
(1 30)
(2)横截条件
[L ( x)Lx]tf 0
(1 31)
x(t0 ) x0
线性泛函: 泛函J[y(x)]如果满足下列两个条件:
1) J[ y1(x) y2 (x)] J[ y1(x)] J[ y2 (x)] 2) J[cy(x)] cJ[ y(x)]
则称为线性泛函。
第1章 最优控制中的变分法
(2)泛函的变分
设泛函J[y(x)]为连续泛函,则泛函增量的线性主部称为泛函的变分:
第1章 最优控制中的变分法
1.2 无约束条件的最优化问题
1.端点固定的情况
了解泛函极值的概念后,再来研究最速降线问题。其目标函数为:
J xf L[x, y(x), y(x)]dx 0
不失一般性,可写为:
(1 12 )
J tf L[t, x(t), x(t)]dt t0
(113)
问题为:确定一个函数x(t),使J[x(t)] 达到极小(大)值。这条能使泛函 J[x(t)] 达到极值的曲线称为极值曲线(轨线),记作: x*(t)
多元辅助泛函J’的欧拉方程为:
(1 38)
F d F 0 x dt x
F
d dt
F
0
H 0
x H x f
(1 39) 协态方程
正则方程组
(1 40) 状态方程
F d F 0 u dt u
H 0 u
(1 41) 控制方程
根据上述三个方程,加上边界条件,可得最优控制问题的唯一确定解
思考: x(t0 ) x0 , t f 给定,x(t f ) 自由时的情况。
证明如下:
() J[y0(x) εy(x)] 0 (18)
J[ y0 (x)]
J[ y0 (x)
εy(x)] 0
d
d
( )
0
(1 9)
根据函数极值的条件,函数φ(ε)在ε=0时达到极值的必要条件为:
d
d
(
)
0
0
比较(1-9)和(1-10),可见:
(110)
J[ y0 (x)] 0
(1 11)
x
性能指标为 j[x(t)] t f 1 x2 dt 0
2
由欧拉方程: d (
x ) 0
dt 1 x2
1 01 2
积分得,
t
x c, x c a,
1 x2
1 c2
再积分,得通解 x(t) at b
根据始端条件: x(0) 1, b 1
根据终端横截条件, [L ( x)Lx]t f
第1章 最优控制中的变分法
第1章 最优控制中的变分法
本章主要内容:
1.1 变分的基本概念 1.2 无约束条件的最优化问题 1.3 具有等式约束条件的最优化问题 1.4 应用变分法求解最优控制问题
第1章 最优控制中的变分法
1.1 变分的基本概念
例1-1 最速降线问题
最速降线问题对变分学的创立产生过重大影响。
记为: δ J。 可以证明,泛函的变分是唯一的。 如何求解泛函的变分?
借鉴函数f(x)微分的求解:
x
f
(x dx) 0 f(x dx)dx 0
f(x)dx df
(x)
与(1-5)类似,可得出泛函J[y(x)] 的求解:
(1 5)
J[ y(x)]
J[ y( x)
y(x)] 0
(1 6)
第1章 最优控制中的变分法
(1 45)
极值的必要条件是一阶变分为零
J~ [dt f
(1 29)
1 y2 2gy
整理、简化后可得
y
c1 1 y2
, c1
1 2 gc 2
.
若用参数法求解,令 y ctg ,可得
x
y
c1
2 c1
( sin (1 c os
) )
2
这是圆滚线的参数方程。
第1章 最优控制中的变分法
关于欧拉方程的几点说明: 欧拉方程是泛函极值的必要条件,是否充分还需进一步判断。 (参见p56 “泛函极值的充分条件——勒盖特条件) 欧拉方程是二阶微分方程,只有在个别情况下才能得到封闭形式 的解。(如最速降线问题)
对于端点固定的情况,容许轨线x(t)应满足下列边界条件:
x(t0 ) x0 x(t f ) x f (114)
对(1-13)求取泛函极值的思路:求取泛函的变分(通过泰勒展开, 求取泛函增量的线性主部,)
第1章 最优控制中的变分法
容许轨线是由极值曲线微小摄动而成,即
x(t) x*(t) (t) (115)
x(t f ) (t f )
[L ( x)Lx]t0 0
(1 32)
x(t0 ) (t0 )
x(t f ) xt f
第1章 最优控制中的变分法
例:确定点A(0,1)至给定直线 (t) 2 t 的最短的曲线方程。
解:由A至 的弧长 ds (dt)2 (dx)2 1 x2 dt
x a 1
得最优轨线方程:
x*(t) t 1
1 x2 (1 a)
x 0 1 x2
第1章 最优控制中的变分法
1.3 具有等式约束条件的最优化问题
在最优控制问题中,泛函J[x(t)]所依赖的函数往往会受到—定约束条
件的限制。在动态最优化问题中,由于受控系统的数学模型往往用微分 方程来描述,所以等式约束就是系统的状态方程。