动态最优化 徐高的笔记
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2.2.7)
由于 (2.2.7) 中的三项均含有任意元素, 故三项必须分别为零。 第一项可导出欧拉方程, 后二项导出横截条件。 又 则
∆yT = p(T ) + y ′(T )∆T 3 p(T ) = ∆yT − y ′(T )∆T
(2.2.8) (2.2.9)
故,一般的横截条件为
[F − y ′F ]
F (t , y, y ′) = 0 ,则该积分收敛。
条件 II:
∫
∞
0
F (t , y, y ′)dt 中,如果被积函数具有形式 G (t , y, y ′)e − ρt ,其中 ρ > 0 且 G 有界,
则该积分收敛。 横截条件
[F − y ′F ]
y ′ t →∞
∆T + Fy′
[ ]
t →∞
]
(2.2.13)
此式可以通过画一个图看出。详见蒋中一《动态最优化基础》76 页图 3.1 4
XG’s 动态最优化笔记
由于 ∆T 是任意的,可得横截条件为
[F + (φ ′ − y ′)F ]
y ′ t =T
=0
(2.2.14)
再加上 yT = φ (T ) 可确定曲线。 情形 IV:截断垂直(水平)终结线: 。做法是,先按照垂直终结线(水平终结线)方法 有终结约束 yT ≥ y min (或 T ≤ Tmax ) 求出最优曲线。检查是否符合约束,若是,则结束。否则按照固定终点问题 (T , y min ) (或
∆yT = 0
(2.4.4)
两项中的任一项都必须单独趋于零。
5
XG’s 动态最优化笔记
2.5 约束问题
等式约束
′ , L, y n ′ )dt V [ y1 ,L, y n ] = ∫ F (t , y1 ,L, y n , y1
0
T
(2.5.1)
g 1 (t , y1 ,L , y n ) = c1
s.t.
m
g (t , y1 ,L , y n ) = c m
(m<n) 。 其中 c1 ,L , cm 均为常数,
M
F = F + ∑ λi (t ) ci − g i
i =1
m
(
)
(2.5.2)
V = ∫ Fdt
0
T
(2.5.3)
式(2.5.3)中泛函的自由极值将对应原始泛函(2.5.1)的约束极值。 有欧拉方程
* * 假设 T 是已知的最优终结时间。则 T 邻近的任何 T 可以表示为
T = T * + ε∆T
其中, ε 为一个很小的数, ∆T 代表任意取定的 T 的小变动。则
(2.2.2)
3
XG’s 动态最优化笔记
dT dT (ε ) = = ∆T dε dε
式(2.2.1)的极值等价于以下函数的极值
(2.2.3)
Fy′y′ D≡ F yy ′
Fy′y Fyy
D 在任何地方负(正)定 ⇔ F (t , y, y ′) 是凹(凸)的
2.4 无限计划水平
目标泛函的收敛性 条件 I:
∫
∞
0
F (t , y, y ′)dt 中,如果 F 在整个积分区间有上界, 且对某有限时刻 t 0 , 有 ∀t ≥ t 0 ,
Fyj −
不等式约束
d F y′ = 0 t ∈ [0, T ] dt j
T
( j = 1,2, L, n)
(2.5.4)
′ , L, y n ′ )dt V [ y1 ,L, y n ] = ∫ F (t , y1 ,L, y n , y1
0
(2.5.5)
g 1 (t , y1 ,L, y n ) ≤ c1
V (ε ) = ∫
T (ε )
0
′ F t , y * (t ) + εp (t ), y * (t ) + εp ′(t ) dt
(2.2.4)
其中, p (0) = 0 , p(T ) 任意。
T ( ε ) ∂F dV (ε ) dT =∫ =0 dt + F [t , y (T ), y ′(T )] 0 ∂ε dε dε
最大值原理 汉密尔顿函数4
H (t , y, u , λ ) ≡ F (t , y, u ) + λf (t , y, u )
a
b dI = ∫ Fx (t , x)dt dx a
b
(1.2.1) [莱布尼兹法则] (1.2.2) (1.2.3) (1.2.4) (1.2.5) (1.2.6) (1.2.7)
J (b, a) ≡ ∫ F (t , x)dx
a
b
∂J = F (t , x) t =b = F (b, x) ∂b ∂J = − F (t , x) t = a = − F (a, x) ∂a
XG’s 动态最优化笔记
动态最优化1
徐 高2
1. 预备知识
1.1 目标泛函
标准问题:
V [ y ] = ∫ F [t , y (t ), y ′(t )]dt
T 0
(1.1.1)
迈耶问题(终结控制问题) :
V [ y ] = G[T , y (T )]
博尔扎问题:
(1.1.2)
V [ y ] = ∫ F [t , y (t ), y ′(t )]dt + G[T , y (T )]
K ( x) ≡ ∫
b( x )
a
F (t , x)dt
b( x ) dK = ∫ Fx (t , x)dt + F [b( x), x]b ′( x) a dx
wenku.baidu.com
1 2
本文为作者自学蒋中一的《动态最优化基础》一书所作的笔记。 Xu_gao2000@yahoo.com.cn 1
XG’s 动态最优化笔记
d F y′ = 0 , t ∈ [0, T ] , ( j = 1,2, L, n) dt j
(2.5.7) (2.5.8)
′ , L, y n ′ )dt V [ y1 ,L, y n ] = ∫ F (t , y1 ,L, y n , y1
0
T
(2.5.9)
′ ,L, y n ′ )dt = k1 G 1 (t , y1 ,L, y n , y1 M s.t. T m ∫ G (t , y1 ,L, y n , y1′ ,L, y n′ )dt = k m
(Tmax , yT ) )求解问题。
2.3 二阶条件
充分性定理:对于固定端点问题(2.1.1) ,如果 F (t , y, y ′) 关于 ( y , y ′) 是凹(凸)的, 那么欧拉方程对识别 V [ y ] 一个绝对最大值(最小值)是充分的。 对于可变端点问题, F (t , y, y ′) 的凹(凸)性,加上欧拉方程及横截条件,对识别 V [ y ] 的一个绝对最大值(最小值)是充分的
2. 变分法
2.1 变分法的基本问题
基本问题
max(min)V [ y ] = ∫ F [t , y (t ), y ′(t )]dt
T 0
(2.1.1)
s.t.
y (0) = A (A 给定) y (T ) = Z (T,Z 给定)
一阶条件(欧拉方程)的推导 推导的思路是将泛函极值的问题转化为一个一元函数极值的问题, 这样就可以用求驻点 的方法得到极值。 设 y (t ) 为最优函数,则满足约束的任意函数可以表示为 y (t ) + εp (t ) 。其中 p (t ) 是任
(2.1.4)
T dV (ε ) d = ∫ p (t ) Fy − Fy′ dt = 0 0 dε dt
(2.1.5)
由于 p (t ) 是任意函数,要上式成立,则必须有
Fy −
d Fy′ = 0 ,对于所有 t ∈ [0, T ] dt
y′
[欧拉方程]
(2.1.6)
欧拉方程的其它形式
[欧拉—泊松方程]
(2.1.16)
2.2 可变端点的横截条件 max(min)V [ y ] = ∫ F [t , y (t ), y ′(t )]dt
T
0
(2.2.1)
s.t.
y (0) = A (A 给定)
y (T ) = yT (T, yT 给定)
一般横截条件的推导 推导的思想仍然是将泛函的极值问题转化为一个一元函数极值的问题。 不同的是需要将 终点也表示为 ε 的函数。
0 0
∫
T
F = F − λG , ( λ =常数)
得必要条件欧拉方程为
(2.5.10)
6
XG’s 动态最优化笔记
Fy −
d Fy′ = 0 dt
(2.5.11)
3. 最优控制理论
3.1 最大值原理
最优控制的最简单问题
max V = ∫ F (t , y, u )dt
0
T
(3.1.1)
s.t.
& = f (t , y, u ) y y (0) = A ,, y (T ) 自由(A,T 给定) u (t ) ∈ u ,对所有 t ∈ [0, T ]
∫ F dt = F
y
(2.1.7) (2.1.8)
Fy′y′ y ′′(t ) + Fyy′ y ′(t ) + Fty′ − Fy = 0
特殊情形下的欧拉方程
2
XG’s 动态最优化笔记
情形 I: F = F (t , y ′) ,解为
Fy′ = 常数
情形 II: F = F ( y , y ′) ,解为
(2.2.5)
由
∫
T (ε )
0
T ∂F d dt = ∫ p (t ) Fy − Fy′ dt + [ Fy′ ]t =T p (T ) 0 ∂ε dt
(2.2.6)
得问题(2.2.1)的一阶条件为
∫
T
0
d p (t ) Fy − Fy′ dt + [ Fy′ ]t =T p (T ) + [ F ]t =T ∆T = 0 dt
s.t.
m
g (t , y1 ,L, y n ) ≤ c m
F = F + ∑ λi (t ) ci − g i
i =1 m
M
(
)
(2.5.6)
由欧拉方程
Fyj −
及互补松弛条件 可求得最优值。 等周问题
λi (t )(ci − g i ) = 0 , t ∈ [0, T ] , (i = 1,2,L, m)
0
T
(2.1.13) (2.1.14) (2.1.15)
Fyj −
T
d Fy′j = 0 ( j = 1,2, L, n) dt
[欧拉方程组]
V [ y ] = ∫ F (t , y, y ′, y ′′,L, y ( n ) )dt
0
Fy −
n d d2 n d Fy′ + 2 Fy′′ − L + (− 1) F (n) = 0 dt dt dt n y
y ′ t =T
∆T + Fy′
[ ]
t =T
∆yT = 0
(2.2.10)
一般的横截条件(2.2.10)可以写成各种具体形式 特殊横截条件 情形 I:垂直终结线(固定时间水平问题) : 由 ∆T = 0 , F − y ′Fy′
[
]
t =T
∆T = 0 自动满足,可得(自然边界条件)
(2.2.11)
T ∂F T dV (ε ) =∫ dt = ∫ Fy p (t ) + Fy′ p ′(t ) dt = 0 0 ∂ε 0 dε
[
]
(2.1.3)
又由分部积分法可得
∫
T
0
Fy′ p ′(t )dt = Fy′ p (t ) 0 − ∫ p (t )
T 0
[
]
T
T d d Fy′ dt = − ∫ p (t ) Fy′ dt 0 dt dt
* *
意函数, p (0) = p (T ) = 0 则目标泛函可以表示为 ε 的函数为
T ′ V (ε ) = ∫ F t , y * (t ) + εp (t ), y * (t ) + εp ′(t ) dt 0
(2.1.2)
目标泛函取极值等价于函数 V (ε ) 取极值。其一阶必要条件为
[F ]
y ′ t =T
=0
情形 II:水平终结线(固定端点问题) 由 ∆yT = 0 可得
[F − y ′F ]
情形 III:终结曲线
y ′ t =T
=0
(2.2.12)
yT = φ (T ) ,则 ∆yT = φ ′∆T ,代如一般横截条件(2.2.10)得
[F − y ′F
3
y′
+ Fy′φ ′ t =T ∆T = 0
T 0
(1.1.3)
三种问题的转化:令 z (t ) ≡ G[t , y (t )] ,满足 z (0) = 0 ,则 可将迈耶问题与博尔扎问题均转化成为标准问题。
∫
T
0
z ′(t )dt = z (t ) 0 = G[T , y (T )] 。
T
1.2 求导一个定积分
I ( x) ≡ ∫ F (t , x)dt
(2.1.9)
F − y ′Fy′ = 常数
情形 III: F = F ( y ′) ,解为
(2.1.10)
Fy′y′ y ′′(t ) = 0
情形 IV: F = F (t , y ) ,解为
(2.1.11)
Fy = 0
欧拉方程的推广
(2.1.12)
′ , L, y n ′ )dt V [ y1 ,L, y n ] = ∫ F (t , y1 ,L, y n , y1