求解最优控制问题的伪谱法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
g l ≤ g(x(τ ), u(τ ),τ ) ≤ g u
(3)
M.Ross 和 F.Fahroo, “求解非平滑最优控制问题的直接法, ”会议录,2002IFAC 世界大会,巴塞罗那, 西班牙,2002 年 7 月,479-484 页。 2006 年 5 月 10 日
13
2006 年春季 z
16.323 17-7
16.323 讲课 17 DIDO,求解最优控制问题的伪谱法
z
M.Ross, “DIDO 用户手册 (版本.PR.1 β ) : 求解最优控制问题的 MATLAB
TM
应用程序包, ”海军研究生学院,Monterey,CA,Tech.Rep.04-01.0,二月。 2004。[在线]。 可用:http://tomlab.biz/docs/DIDOManualPR1.pdf z G.Elnagar,M.A.Kazemi 和 M.Razzaghi, “离散最优控制问题的伪谱 Legendre 法, ”IEEE 会刊.自动控制,第 40 卷,第 10 页,1793-1796 页,1995 年 10 月。 z M.Ross 和 F.Fahroo, “求解非平滑最优控制问题的直接法, ”2002 年 IFAC 世 界大会会议录,巴塞罗那,西班牙,2002 年 7 月,479-484 页。
z
直接法 转换连续 OCP 为离散 NLP Pros:围绕间接法“Cons”项中的列表 Cons 不如间接法精确 许多直接法不能产生共态信息
J.Betts, “轨道优化的数值方法调查, ”制导,控制和动力学,第 21 卷,第 2 期,193-207 页,1998 年 3 月。 8 D.Benson, “最优控制的高斯伪谱转录, ”博士论文,航空航天系,MIT,剑桥,马萨诸塞州,2005 年。 2006 年 5 月 10 日
10
C.Canuto,M.Hussaini,A.Quateroni 和 T.zang,流体动力学中的谱方法。柏林,德国:Springer-Verlag, 1988 年,第 2 章 2006 年 5 月 10 日
2006 年春季 z
16.323 17-5
ˆk 的时候,可以知道采用高斯类积分11 是最优的 当计算 u
2006 年春季
16.323 17-1
DIDO
z 最近一些年发表了很多求解通用非线性最优控制问题(OCP)的方法。其中 一些已经发展到足够成熟的标准,而且可以作为独立的程序包使用: DIDO1 — Ross 等人,海军研究生学院 稀疏最优控制软件(SOCS)2 — Betts,Boeing 非线性轨道生成(NTG)3 — Milam 等人,Caltech RIOTS_954 — Schwartz,加州大学 Berkeley
z
本质上,逼近函数(包括非周期函数)的谱方法可以用截断级数的更少项做 出更好的精度。
z
关于谱和伪谱法有一个广泛的可用文献。 免费书是:J.Boyd,Chebyshev 和 Fourier 谱方法。纽约:Dover,2000。12
11 12
高斯积分是一种用有限和逼近定积分的方法
http://www-personal.engin.umich.edu/~jpboyd/aaabook_9500may00.pdf
[ −1,1] 内的最优选择。
为映射时间坐标到区间
[ −1,1] ,定义:
τ2 =
(τ f − τ e )t + (τ f + τ e ) 2
τ1 =
z
(τ e − τ 0 )t + (τ e + τ 0 ) 2
LGL 节点与 Legendre 多项式密切相关。 -
LN (t ) 是区间 [ −1,1] 上 deg N 的 Legendre 多项式。
τ ∈ [τ 0 ,τ e ] τ ∈ [τ e ,τ f ] τ ∈ [τ 0 ,τ e ] τ ∈ [τ e ,τ f ] τ ∈ [τ 0 ,τ e ] τ ∈ [τ e ,τ f ]
(4)
⎧ f 1 (x(τ ), u(τ ),τ ) ⎪ f (⋅) = ⎨ 2 ⎪ ⎩f (x(τ ), u(τ ),τ )
wk.baidu.com2006 年 5 月 10 日
2006 年春季
16.323 17-6
Legendre 伪谱法
z DIDO 是个有效的计算工具13,可以求解很复杂的 OCP,包括非平滑问题, 就是状态/控制是不连续的。 OCP 中的这些不连续点是自然出现的, 如从最短时间问题中推导得出的 bang-bang 控制。 z 为了获取到非平滑行为,定义一个与必须满足的约束集相关的离散时间点的 行为。 考虑时刻τ e 的内部事件,并扩展到更多的内部事件。 在τ 0 和τ f 的边界条件都包括在定义里。 事件条件是:
z 则问题变为需要级数的多少项才能得到“足够好”的 u (t ) 的逼近,以及用有
ˆk 。 限多的点如何逼近 u
z 傅立叶法给出谱精度10。
“当函数无限平滑而且所有导数都是周期的, 展开式的第 k 个系数比任何 k 的逆幂衰减的快。 实际上, 这个衰减直到有足够多的系数表达函数的所有必要结构才能展示。系数随后快速衰减暗示傅立叶级数 在能很好的逼近函数的一些项之后截断。这个特征称作傅立叶方法的“谱精度” 。 ”
z
研究当前可用的求解器之一,DIDO5,选择它部分是因为其求解非常复杂问 题的能力,更显著的原因是支撑它的清晰的理论基础。
z
求解 OCP 的一般过程是转换问题为等价参数优化问题,而这个问题可以使 用开发很好的非线性程序(NLP)求解器解决。 DIDO 适应于相同的过程,而且 NLP 求解器基于序列二次规划(SQP) , 并且被命名为 SNOPT6。 所以 DIDO 有什么不同? — Legendre 伪谱法
这些函数在事件时间τ e 可以是非平滑的,但是在开区间 (τ 0 ,τ e ) 和 (τ e ,τ f 一定是连续可微的。 -
)
如果使用上标 1 表示在第一个区间内的函数,上标 2 表示第二个区间的 函数,
1 ⎧ ⎪ F (x(τ ), u(τ ),τ ) F (⋅) = ⎨ 2 ⎪ ⎩ F (x(τ ), u(τ ),τ )
z
假设现在想逼近一个周期函数 u (t ) ,这可以用傅立叶级数表示:
u (t ) =
k =−∞
ˆk eikt ∑u
∞
ˆk = ↔ u
1 2π
∫
2π
0
u (τ )e − ikt dτ
z
为了实际的目的,逼近最好是截断级数。另外,需要一些方法在感兴趣的区
ˆk 。 间内用有限多的 u (τ ) 的点计算 u
7
2006 年春季 z z
16.323 17-3
DIDO 类似于直接转录/配置法,都用 Legendre 多项式作为函数逼近的基础 已经知道 Legendre 伪谱法(虽然是直接法)具有的属性是其解满足必要优化 条件。 大多数其他直接法并不满足这点。9
9
M.Ross 和 F.Fahroo, “轨道优化方法调查, ”会议录。AIAA/AAS 天文动力学专家会议,Monterey,2002 年,AIAA2002-4727。
用感兴趣区间内最少数目的点产生最佳逼近。 著名的积分技术(主要的不同在区间的终端点。 ) Gauss 积分 Gauss-Radau 积分 Gauss-Lobatto 积分
z
对非周期函数,可以使用多项式的正交系统 Legendre(勒让德)多项式 Chebyshev(切比雪夫)多项式 Jacobi(雅可比)多项式 — 包括 Legendre 和 Chebyshev
N 2 + 1 LGL 点。
2006 年 5 月 10 日
2006 年春季 z
16.323 17-8
使用 Lagrange(拉格朗日)内插多项式,φl (t ) ,未知状态和控制则表示为:
1 1 1 x1 φl (t ) N (τ ) = ∑ x (τ l ) l =0 N
LGL 节点 tl , l
= 0,… , N 为 t0 = −1, t N = 1 ,对 1 ≤ l ≤ N − 1 , tl 是
LN (t ) 的零点, LN (t ) 的导数。
在 第 一 段 [τ 0 ,τ e ] , 有
N 1 + 1 LGL
点 , 而 且 在 第 二 段 [τ e ,τ f ] , 有
− + J (x(⋅), u(⋅),τ 0 ,τ e ,τ f ) = E (x 0 , x e , xe , x f ,τ 0 ,τ e ,τ f ) +
∫τ
受约束于动态约束:
τf
0
F (x(τ ), u(τ ),τ )dτ
(2)
x(τ ) = f (x(τ ), u(τ ),τ )
事件约束(1) ,以及混合状态控制路径约束:
4
TM
2006 年春季
16.323 17-2
直接法 vs 间接法
z OCP 求解技术可以分类为直接法或者间接法7 8
打靶法,多重打靶法,转录/配置法的直接和间接变量可得
z
间接法 目标是找到必要条件的近似解 Pros 高精度 解满足必要优化条件 Cons 必要优化条件必须解析推导(可能很难! ) 小收敛半径:需要一个好的初始猜测 需要共同预测 需要知道约束和无约束子弧的先验知识
2006 年 5 月 10 日
2006 年春季
16.323 17-4
谱方法
z DIDO 使用 Legendre 伪谱法,它常广泛用作流体流动建模。
z
DIDO 和直接配置法很像。 主要的不同:传统的配置法使用固定阶多项式(例如,三阶)逼近节点 间每一段的状态和控制, 而 DIDO 使用 Legendre 多项式作为基础逼近多 个节点上的变量(覆盖整个区间) 现在看函数逼近的谱方法。
1
M.Ross, “DIDO 用户手册(版本.PR.1 β ) :求解最优控制问题的 MATLAB
TM
应用程序包, ”海军研究生
学 院 , Monterey , CA , Tech.Rep.04-01.0 , 二 月 。 2004 。 [ 在 线 ] 。 可 用 : http://tomlab.biz/docs/DIDOManualPR1.pdf 2 K.Holmström,F.Martinsen 和 M.Edvall, “TOMLAB/SOCS 用户手册, ”Tomlab 优化公司,2005 年 2 月[在 线]。可用:http://tomlab.biz/docs/TOMLAB_SOCS.pdf 3 M.Milam,K.Mushambi 和 R.Murray , NTG- 实 时 轨 道 生 成 的 库 。 [ 在 线 ] 。 可 用 : http://www.cds.caltech.edu/~murray/software/2002a_ntg.html A.Schwartz,E.Polak 和 Y.Chen。 (1997 年,5 月) ,RIOTS_95 :求解最优控制问题的 Matlab 工具箱。 可用:http://tomlab.biz/docs/DIDOManualPR1.pdf 5 Kirk,第 107 页, “Carthage 的 Queen Dido 显然是第一个使用变分法处理问题的人。Dido,她许诺土地的 所有都可以用牛皮包围,聪明的把牛皮分为许多段,然后再最后系起来。这样做之后,她的问题发现用固 定轴承的闭合曲线包围了最大的面积。 ” 6 P.Gill,W.murray 和 M.Saundes, “SNOPT:大规模约束优化的 SQP 算法, ”SIAM J.最优化,第 12 卷,第 4 期,979-1006 页,2002 年。 2006 年 5 月 10 日
− + el ≤ e(x 0 , x e , xe , x f ,τ 0 ,τ e ,τ f ) ≤ eu
(1)
其中 x e
−
− = limε ↑0 x(τ e + ε ) , x e = limε ↓0 x(τ e + ε )
z
广义问题是确定状态控制对,可能还有事件时间τ e 和τ f ,最小化代价泛函:
1 ⎧ ⎪ g (x(τ ), u(τ ),τ ) g(⋅) = ⎨ 2 ⎪ ⎩g (x(τ ), u(τ ),τ )
(5)
(6)
如果有超过一个内部事件,可以按照时间把上面的函数划分。 z 在 Legendre 伪谱逼近中,节点是按照 Legendre-Gauss-Lobatto(LGL)积分 在区间 -