最优化控制 变分法与最优控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
向量欧拉方程
向量欧拉方程
可写成标量方程组
L d L 0 x dt x 1 1 L d L 0 2 x2 dt x L d L 0 x dt x n n
30
L d L 0 X dt X
2 )dt 【例2.6】 求泛函 J [ x1 (t ), x2 (t )] 02 (2 x1 x2 x 12 x 2
根据所采用的函数之间距离定义的不同,对应的
泛函分别称为零阶连续泛函(2.1)或k阶连续泛函
(2.2)。
12
3、泛函的极值
如果 J [ x0 (t )] 是在与 x0 (t ) 仅仅具有零阶 相近度的曲线 x(t ) 的泛函中比较得出的极 值,称为强极值。
如果 J [ x0 (t )] 是在与 x0 (t ) 具有一阶或一阶 以上相近度的曲线 x(t ) 的泛函中比较得出 的极值,则称为弱极值。
k阶距离
(2.2)
显然,式(2.1)定量地表示两个函数之间的零阶相近度, 11 而式(2.2)定量地表示两个函数之间的k阶相近度。
(3)泛函的连续性
如果对于任意给定的正数,可以找到这样一个
>0,当
d[x(t),x0(t)]< 时,存在 ∣J[x(t)]-J[x0(t)] ∣ < 那么,就说泛函J在点x0(t)处是连续的。
欧拉方程的全导数形式
24
欧拉方程的全导数形式
在 令
d L 中,第二项 dt x (t ) 为全导数
L , t ) z g ( x, x x
d L dt x
L dx L dt L dx x dt x x dt t x dt x
满足边界条件
的极值函数。
x1 (0) 0, x1 ( ) 1, x2 (0) 0, x2 ( ) 1 2 2
思考:能否利用MATLAB符号工具箱求解微分方程组?
t1 t2
J [ x(t )] [ p(t ) x(t ) q(t ) x (t )]dt
t1
t2
J [ x(t )] x(t ) t 2
都满足上述两个条件,故均为线性泛函。
14
5、泛函的变分
宗量的变分 若函数x(t)是变量J的自变量函数,则称x(t)为泛 函J[x(t)]的宗量函数。 宗量的变分是指在同一函数类中的两个宗量函数间 的差:
4
【例2.1】
是一个泛函。
变量J的值是由函数x(t) 的选取而确定。 当 当 时, 有 时, 有 。 。
5
【例2.2】曲线的弧长
求:平面上连接给定两点A(x0,y0) 和B(x1,y1)的曲线的弧长 J。
x
B(x1,y1)
y=f(x)
A(x0,y0) o t
A、B两点间的曲线方程为:y=f(x)
在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为:
a t b
(k ) d [ x(t ), x0 (t )] max x(t ) x0 (t ) , x (t ) (t ) x 0 (t ) ,, x ( k ) (t ) x0
对于向量空间的泛函,也存在着欧拉方程,不 过是欧拉方程组(即向量欧拉方程)。
定理2-6 在n维函数空间中,若极值曲线
X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T和终端 X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是给定的,则泛函
r[x(t),x(t)]是关于x(t)的高阶无穷小;
L[x(t),x(t)]称为泛函的变分,记为
J L[ x(t ),x(t )]
也就是说,泛函的变分是泛函增量的线性主部。 当一个泛函具有变分时,称该泛函是可微的。
16
6、泛函变分的求法
定理2-1 连续泛函J(x)的变分,等于 泛函 对α的导数在α=0 时的值. 即
求解综合型(波尔扎)问题
21
2.2 无约束最优化问题
1、无约束固定端点泛函极值必要条件
问题 2-1 无约束固定终端泛函极值问题为:
(t ), t ] 及x(t)在[t0,tf]上连续可微, t0及tf 其中, L[ x(t ), x 固定,x(t0)= x0,x(tf)= xf, x(t ) R n
(证明略)
定理2-2 连续泛函J(x)的二次变分定义为
(证明略)
17
7、泛函变分的规则
18
【例2.3】
求泛函 的变分。
19
8、泛函极值的条件
泛函极值的必要条件:
定理2-3 连续可微泛函J(x) 在x0(t)上达到极值
的必要条件为:J(x)在x=x0处必有
泛函极值的充要条件:
定理2-4 设可微泛函J(x)存在二次变分, 则在
2 L dx 2 L 2 L dx 2 dt x x dt t x x
得欧拉方程的全导数形式
L 2 L 2L 2L 2 0 x x x tx xx x
或
L x Lx x Lx Lx t x x x 0
25
【例2.4】
求泛函 在边界条件
下的极值曲线及极值.
26
几种特殊的欧拉方程(可以得到封闭形式的解)
被积函数L不依赖于 x ,即 L L( x, t ) , t ) 被积函数L不依赖于x, 即 L L( x ) 被积函数L不依赖于t, 即 L L( x, x 在这种情况下,欧拉方程的首次积分为
x=x0处达到极小值的充要条件为: 同理,设可微泛函J(x)存在二次变分, 则在x=x0 处达到极大值的充要条件为:
20
主要内容
2.1 变分法概述
2.2 无约束最优化问题
无约束固定端点泛函极值必要条件 无约束自由端点泛函极值必要条件
2.3 等式约束最优化问题 2.4 变分法求解最优控制问题
引入哈密顿函数求解拉格朗日问题
A、B两点间的弧长为:
J
x1
x0
dy 1 dx dx
6
2
泛函的上述概念,可以推广到含有几个函数的 泛函的情况,例如:
J [ x (t ) y (t )]dt
0
1
J [ x(t )] L[ x(t ), x (t ), t ]dt
t0
tf
求一般函数极值 求泛函极值
3
பைடு நூலகம்.1 变分法概述
1、泛函定义
定义:
如果变量y对于某一函数类中的每一个函数 x(t),都有一个确定的值与之对应,那么就 称变量 y 为依赖于函数 x(t) 的泛函,记为: y=J [x(t)]。
说明:由于函数的值是由自变量的选取而确定的,而泛函 的值是由自变量的函数的选取而确定的,所以将泛函理解 为“函数的函数”。
L x Lx c 其中c是待定的积分常数。实际上,将上 式左边对t求全导数,有
d Lx Lx Lx Lx 2 Lx Lx (L x x x x ) x x x x x dt
x x ( Lx x Lx Lx x x ) 0 L x Lx c
(t ), t ]dt J [ X (t )] L[ X (t ), X
t0 tf
达到极值的必要条件是曲线X(t)满足向量欧拉方程
L d L 0 X dt X
或
LX
d LX 0 dt
(t ), t ]则至少应是 其中X(t)应有连续的二阶导数,而 L[ X (t ), X 29 二次连续可微的。
(t ), t ] 其中x(t)应有连续的二阶导数, L[ x(t ), x
则至少应是二次连续可微的。 (证明略) 思考:定理2-5和定理2-3有何区别?
23
几点说明:
积分型性能指标求极值的必要条件有两个:
欧拉方程 边界条件 TPBVP(Two Point Boundary Value Problem) 问题
第二讲 变分法与 最优控制
1
主要内容
2.1 变分法概述
2.2 无约束最优化问题
无约束固定端点泛函极值必要条件 无约束自由端点泛函极值必要条件
2.3 等式约束最优化问题 2.4 变分法求解最优控制问题
引入哈密顿函数求解拉格朗日问题
求解综合型(波尔扎)问题
2
2.1 变分法概述
1、泛函定义 2、泛函的连续性 3、泛函的极值 4、线性泛函 5、泛函的变分 6、泛函变分的求法 7、泛函变分的规则 8、泛函极值的条件
它们不在同一条铅垂线上。现有
一质点受重力的作用自较高的A
点向较低的B点滑动,如果不考
虑各种阻力的影响,问应取怎样 的路径,才能使所经历的时间最 短?
结论:最速降线是一条圆滚线。
在A、B两点所在的竖直 平面内选择一坐标系, 如上图所示。 A 点为坐 标原点,水平线为 x 轴, 28 铅垂线为y轴。
向量欧拉方程
x0(t)
注意:一阶相近的两个函数,必然 是零阶相近,反之不成立。
t2 t
o
t1
K阶相近 (k ) (k ) x ( t ) x ( t ) , x ( t ) x ( t ) , x ( t ) x 0 当 0 0 (t ) t1 t t2 都很小时,称函数x(t)与函数x0(t)是k阶 相近的。
微分法 变分法
7
2、泛函的连续性
函数相近
函数间的距离
泛函的连续性
8
(1)函数相近
零阶相近 当函数x(t)与 x0(t)之差的绝对值,即 ∣x(t)-x0(t) ∣, t1t t2
对于x(t)的定义域中的一切t( t1 t t2 )都很小时, 称函数x(t)与函数x0(t)是相近的,也称为零阶相近。
15
泛函的变分 当宗量x(t)有变分时,泛函的增量可以表示为
J [ x(t )] J [ x(t ) x(t )] J [ x(t )] L[ x(t ),x(t )] r[ x(t ),x(t )]
线性 主部
其中,L[x(t),x(t)]是关于x(t)的线性 连续泛函;
13
4、线性泛函
连续泛函如果满足下列条件:
(1)叠加原理 : J[x1(t)+ x2(t)]= J[x1(t)]+ J[x2(t)] (2) 齐次性: J[cx(t)]=c J[x(t)]
其中,c是任意常数,就称为线性泛函。 例如:
J [ x(t )] [tx(t ) (sin t ) x (t )]dt
求满足上式的极值轨线x*(t)。
22
边界条件
定理2-5 若给定曲线x(t)的始端x(t0)= x0和终端x(tf)= xf, 则泛函
J [ x(t )] L[ x(t ), x (t ), t ]dt
t0 tf
达到极值的必要条件是,曲线x(t)满足欧拉方程
欧拉(Euler)方程
或
d Lx L x 0 dt
10
(2)函数间距离 在不同的函数空间,函数间的距离定义也不同。
在函数空间C[a,b](在区间[a,b]上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: 零阶距离 d [ x (t ), x0 (t )] max x (t ) x0 (t ) (2.1)
a t b
x x(t) x0(t)
o
t1
t2
9
t
一阶相近
当函数x(t)与 x0(t)之差的绝对值以及它们的一 阶导数 x (t ) 和 x 0 (t ) 之差的绝对值,即
(t ) x 0 (t ) x(t ) x0 (t ) 和 x
x x(t)
t1 t t2
都很小,称函数x(t)与函数x0(t)是一阶相近的。
Lx Lxt x x Lxx Lxx 0
被积函数L线性地依赖于 x , 即 L ( x, t ) ( x, t ) x
【例2.5】 最速降线(又称捷线)问题
设在竖直平面内有两点A和B, o
A(0,0) dx dl dy B(xf,yf) y x