动态最优化第7讲 最优控制理论极大值原理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七讲 最优控制理论最大值原理

(三)最大值原理

(4)例子——算例2
Max S .T .
V 2 y 3u dt
2 0
dy yu dt y 0 4 u t 0,2 y 2 自由
第七讲 最优控制理论最大值原理

(三)最大值原理

(4)例子——算例2
曲线1
H (3)如果算得 : 常数 (曲线 0 3) , u H关于u是线性函数的,斜率为负, H的最大值取控制变量的左边界:u a H (4)如果算得 : 常数 (曲线 0 4) , u H关于u是线性函数,斜率为正,
*
曲线2
曲线3
曲线4
H的最大值取控制变量的右边界:u c

第七讲 最优控制理论最大值原理

(一)最优控制引论

假设经济中有一种可耗尽资源,储量为: S 0 S0 当资源被开采时,资源的储量随时间的变化为: dS t E t dt E t :为t时的开采量。具有两个特性:1)能够由决 策者控制;2)能够影响存储量变量(状态变量)。
T 0
第七讲 最优控制理论最大值原理

(三)最大值原理
(2)最大值原理的条件 注意条件:

Max
u
H t , y, u,
对于所有的t 0, T
是一般性的描述
指: H t , y, u * , H t , y, u,
对于所有t 0,T
u 2
曲线2
H t , y, u ,
a
曲线3
H 0, 2 u 则确定最优控制为边界解:u * a或u * c 如果算得
曲线4
0
b
c
u
然后比较u * a和u * c时H的大小,取最大的边界值
第七讲 最优控制理论最大值原理

(三)最大值原理

(2)最大值原理的条件
H
第七讲 最优控制理论最大值原理

(三)最大值原理

(3)例子——算例1
汉密尔顿函数:H 1 u

2 1/ 2

u
步骤2:求共态变量的运动方程 d H dt y d H 0 * t C (常数) 1
dt y
dy H 步骤3:求状态变量的运动方程 dt

主体的任务是:选择最优容许控制路径U * t ,与 相应的最优容许状态路径 y * t 一起在给定时期 [0,T]上最优化目标泛函。
第七讲 最优控制理论最大值原理

(二)最优控制的基本问题

(2)特殊性质
1)控制路径不必要求是连续的,仅需要它是分片 连续的(允许包含跳跃间断); 状态路径在整个时期中必须是连续的,允许具有有 限个尖点(分片可微)。 dy
dy H u dt
第七讲 最优控制理论最大值原理

(三)最大值原理
步骤4:利用边界条件和横截条件确定定解
H * 2 0 u t 1 u H d * t C1 y dt dy H dy u dt dt

(三)最大值原理

(4)例子——算例2
Max
u
H 2 y 3u
ut 0,2
曲线1 3 曲线2 3
H / u 3
H
分类讨论:
1)如果 3 则H / u 0, u * 2 2)如果 3
则H / u 0,u* 0



H 0 u
得到:

1
2


用二阶条件验证最优解是否是最大值:
2H 2 1/ 2 2 2 3 / 2 2 3 / 2 2 2 2 3 / 2 1 u u 1 u 1 u 1 u u 1 u 0 2 u
*
a
0
b
c
u
第七讲 最优控制理论最大值原理

(三)最大值原理

(3)例子——算例1
Max S .T .
V 1 u
0
T

2 1/ 2

dt
dy u dt y 0 A y T 自由 (A, T给定)
第七讲 最优控制理论最大值原理

(三)最大值原理

(3)例子——算例1
一个例子:
资源使用的效用函数:U E t 或U S t
第七讲 最优控制理论最大值原理

(一)最优控制引论
假设企业的目标:在给定时间[0,T]上最大化使用这 种资源的总效用。 (1)变分法模型:
Max S .T .

T
0
U S t e t dt S 0 S 0 S T 自由
动态最优化方法
——第7讲 最优控制理论极大值原理
第七讲 最优控制理论最大值原理

(一)最优控制引论

变分法:寻找目标泛函的状态路径y的最优时间路径
最优控制理论:寻找控制变量u的最优时间路径。发 现了最优控制路径,就可以找到相应的最优状态路 径。注意力集中在控制变量上,这些控制变量充当 最优化的工具手段。
(2)最优控制理论模型:
Max S .T .
U E t dt
T 0
dS E t (状态变量的运动方程) dt S 0 S 0 S T 自由
第七讲 最优控制理论最大值原理

(二)最优控制的基本问题
(1)基本思想 控制变量(u):是一个政策或操作工具,使实施 主体能够影响状态变量(y)。


1 / 2
由横截条件 T 0 ,得: * T C1 0, 从而:* t 0 * 2 1/ 2 最优控制路径: u t 1 0
由 dy dy u和u * t 0 0 y * t C2 dt dt 把初始条件:y 0 A代入,得:y * t A
dy 控制变量为 u t ,运动方程(或状态方程): f t , y, u dt 控制变量通过运动方程影响状态变量 y t
第七讲 最优控制理论最大值原理

(二)最优控制的基本问题

(4)一个特例
Max S .T .
T 0
V F t , y, u dt dy u dt y 0 A
a
b
0
2
u
u
第七讲 最优控制理论最大值原理

(三)最大值原理

(4)例子——算例2 H 2 y 3u
d H 步骤2:求共态变量的运动方程 dt y d H d 2 2 dt y dt
t C 1e t 2
dy H 步骤3:求状态变量的运动方程 dt dy H yu dt
第七讲 最优控制理论最大值原理

(三)最大值原理

(4)例子——算例2
步骤4:利用边界条件和横截条件求最优路径
H t , y, u , u * 2, 如果 3; u * 0, 如果 3 Max u H d t C 1e t 2 y dt dy H dy yu dt dt
共态变量: t (类似拉格朗日乘子)
第七讲 最优控制理论最大值原理

(三)最大值原理

(2)最大值原理的条件
(最优控制理论求一阶必要条件需满足的条件)
Max
u
H t , y, u,
对于所有的t 0, T
dy H dt d H dt y
(y的运动方程) (的运动方程) (垂直终结线的横截条件)

(1)共态变量和汉密尔顿函数 T Max V F t , y, u dt 0
S .T . dy f t , y, u dt y 0 A u t , y T 自由 (A, T给定) 对于所有t 0, T
汉密尔顿函数: H F t , y, u t f t , y, u
步骤1:求 Max H t , y, u, u 汉密尔顿函数: H 2 y 3u y u 2 y 3u
得:H / u 3
汉密尔顿H关于u是线性的, 不能用条件 H / u 0,确定最优控制u*
第七讲 最优控制理论最大值原理
步骤1:求 Max H t , y, u, u 汉密尔顿函数: 2 1/ 2 H 1 u u
H是可微和非线性的,可用一阶条件
H 1 2 1 / 2 2u 0 u 2 1 u 2 1 u u 2 1 / 2 1 1 2 1 2 u * t 1 2 u
dt
u
f u
C
c
控制路径
d
y A
B
状态路径
b
a
0
e
t2
t1
T
t
0
t1
t2
T
t
第七讲 最优控制理论最大值原理

(二)最优控制的基本问题

(2)特殊性质
2)可以直接处理关于控制变量u的约束 (有界控制集合) 如: ut 1,2
碰碰解: u t 2,
*
u
对于t 0 ,t1 对于t t1,t 2 对于t t 2 ,T
2 1
0
控制路径
u * t 1, u * t 2,
t1
t2
T
t
第七讲 最优控制理论最大值原理

(二)最优控制的基本问题

(2)特殊性质
3)最简单问题是垂直终结线问题,而不是固定终 结点问题
y
yT
A 0 T t
y
t=T
A
0
yT 给定,uT 不自由
yT自由,uT 自由
T t
dy (运动方程为: u ) dt
y T 自由 (A, T给定)
消去u,得:
Max S .T . V F t , y, ydt
T 0
y 0 A
y T 自由 (A, T给定)
化为垂直终结线的变分法问题
第七讲 最优控制理论最大值原理

(三)最大值原理
最优控制理论的一阶必要条件称为最大值原理。
2 C1e2 2 0 C1 2e2 由横截条件: T 0 ,得: 共态变量最优路径定解:
* t 2e2t 2
第七讲 最优控制理论最大值原理

(三)最大值原理

(4)例子——算例2
1)由共态变量最优路径求控制变量的最优路径: 由:* t 2e2t 2
u
H
曲线1
曲线2
H t , y, u, H 0 u
曲线3
首先使用一阶条件 :
曲线4
2H 再用二阶条件: 2 0验证H是凹函数 u
a
0
b
c
u
第七讲 最优控制理论最大值原理

(三)最大值原理

(2)最大值原理的条件
H
曲线1
(2)如果H是下凸函数(曲线2),尽管 H H关于u可微, 但 0得出的是最小值, u 最优控制取决于边界解 : u * a或u * c 求解条件: Max
u *是最优控制,u是其它控制
第七讲 最优控制理论最大值原理

(三)最大值原理

假设:u a, c
(2)最大值原理的条件 H t , y, u, 对于条件: Max u
对于所有的t 0, T
( 1)如果H是上凹函数(曲线1),H关于u可微, H 且最优控制是内点解,则可用条件: 0 u 求解条件: Max
第七讲 最优控制理论最大值原理

(二)最优控制的基本问题

(3)最简单问题的形式(垂直终结线)
Max S .T . V F t , y, u dt
T 0
dy f t , y, u dt y 0 A u t , y T 自由 (A, T给定) 对于所有t 0, T
d* t 得: 2e 2t 0ቤተ መጻሕፍቲ ባይዱ 所以* t 关于t是减函数 dt 初始值:* 0 2e 2 2 12.788 3,
终点值:* 2 2 2 0 3
令:* t 2e2t 2 3 2 - ln2.5 1.084
相关文档
最新文档