求解最优控制问题的伪谱法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

10
C.Canuto，M.Hussaini，A.Quateroni 和 T.zang，流体动力学中的谱方法。柏林，德国：Springer-Verlag， 1988 年，第 2 章 2006 年 5 月 10 日
2006 年春季 z
16.323 17-5
ˆk 的时候，可以知道采用高斯类积分11 是最优的当计算 u
2006 年 5 月 10 日
2006 年春季
16.323 17-4
谱方法
z DIDO 使用 Legendre 伪谱法，它常广泛用作流体流动建模。
z
DIDO 和直接配置法很像。主要的不同：传统的配置法使用固定阶多项式（例如，三阶）逼近节点间每一段的状态和控制，而 DIDO 使用 Legendre 多项式作为基础逼近多个节点上的变量（覆盖整个区间）现在看函数逼近的谱方法。
− + el ≤ e(x 0 , x e , xe , x f ,τ 0 ,τ e ,τ f ) ≤ eu
（1）
其中 x e
−
− = limε ↑0 x(τ e + ε ) ， x e = limε ↓0 x(τ e + ε )
z
广义问题是确定状态控制对，可能还有事件时间τ e 和τ f ，最小化代价泛函：
− + J (x(⋅), u(⋅),τ 0 ,τ e ,τ f ) = E (x 0 , x e , xe , x f ,τ 0 ,τ e ,τ f ) +
∫τ
受约束于动态约束：
τf
0
F (x(τ ), u(τ ),τ )dτ
（2）
x(τ ) = f (x(τ ), u(τ ),τ )
事件约束（1），以及混合状态控制路径约束：
z
本质上，逼近函数（包括非周期函数）的谱方法可以用截断级数的更少项做出更好的精度。
z
关于谱和伪谱法有一个广泛的可用文献。免费书是：J.Boyd，Chebyshev 和 Fourier 谱方法。纽约:Dover，2000。12
11 12
高斯积分是一种用有限和逼近定积分的方法
/~jpboyd/aaabook_9500may00.pdf
τ ∈ [τ 0 ,τ e ] τ ∈ [τ e ,τ f ] τ ∈ [τ 0 ,τ e ] τ ∈ [τ e ,τ f ] τ ∈ [τ 0 ,τ e ] τ ∈ [τ e ,τ f ]
（4）
⎧ f 1 (x(τ ), u(τ ),τ ) ⎪ f (⋅) = ⎨ 2 ⎪ ⎩f (x(τ ), u(τ ),τ )
N 2 + 1 LGL 点。
2006 年 5 月 10 日
2006 年春季 z
16.323 17-8
使用 Lagrange（拉格朗日）内插多项式，φl (t ) ，未知状态和控制则表示为：
1 1 1 x1 φl (t ) N (τ ) = ∑ x (τ l ) l =0 N
z
研究当前可用的求解器之一，DIDO5，选择它部分是因为其求解非常复杂问题的能力，更显著的原因是支撑它的清晰的理论基础。
z
求解 OCP 的一般过程是转换问题为等价参数优化问题，而这个问题可以使用开发很好的非线性程序（NLP）求解器解决。 DIDO 适应于相同的过程，而且 NLP 求解器基于序列二次规划（SQP），并且被命名为 SNOPT6。所以 DIDO 有什么不同？ — Legendre 伪谱法
z
直接法转换连续 OCP 为离散 NLP Pros：围绕间接法“Cons”项中的列表 Cons 不如间接法精确许多直接法不能产生共态信息
J.Betts， “轨道优化的数值方法调查， ”制导，控制和动力学，第 21 卷，第 2 期，193-207 页，1998 年 3 月。 8 D.Benson， “最优控制的高斯伪谱转录， ”博士论文，航空航天系，MIT，剑桥，马萨诸塞州，2005 年。 2006 年 5 月 10 日
1
M.Ross， “DIDO 用户手册（版本.PR.1 β ）：求解最优控制问题的 MATLAB
TM
应用程序包， ”海军研究生
学院， Monterey ， CA ， Tech.Rep.04-01.0 ，二月。 2004 。 [ 在线 ] 。可用： /docs/DIDOManualPR1.pdf 2 K.Holmström，F.Martinsen 和 M.Edvall， “TOMLAB/SOCS 用户手册， ”Tomlab 优化公司，2005 年 2 月[在线]。可用：/docs/TOMLAB_SOCS.pdf 3 am,K.Mushambi 和 R.Murray ， NTG- 实时轨道生成的库。 [ 在线 ] 。可用： /~murray/software/2002a_ntg.html A.Schwartz，E.Polak 和 Y.Chen。（1997 年，5 月），RIOTS_95 ：求解最优控制问题的 Matlab 工具箱。可用：/docs/DIDOManualPR1.pdf 5 Kirk，第 107 页， “Carthage 的 Queen Dido 显然是第一个使用变分法处理问题的人。Dido，她许诺土地的所有都可以用牛皮包围，聪明的把牛皮分为许多段，然后再最后系起来。这样做之后，她的问题发现用固定轴承的闭合曲线包围了最大的面积。 ” 6 P.Gill，W.murray 和 M.Saundes， “SNOPT：大规模约束优化的 SQP 算法， ”SIAM J.最优化，第 12 卷，第 4 期，979-1006 页，2002 年。 2006 年 5 月 10 日
2006 年春季
16.323 17-1
DIDO
z 最近一些年发表了很多求解通用非线性最优控制问题（OCP）的方法。其中一些已经发展到足够成熟的标准，而且可以作为独立的程序包使用： DIDO1 — Ross 等人，海军研究生学院稀疏最优控制软件（SOCS）2 — Betts，Boeing 非线性轨道生成（NTG）3 — Milam 等人，Caltech RIOTS_954 — Schwartz，加州大学 Berkeley
16.323 讲课 17 DIDO，求解最优控制问题的伪谱法
z
M.Ross， “DIDO 用户手册（版本.PR.1 β ）：求解最优控制问题的 MATLAB
TM
应用程序包， ”海军研究生学院，Monterey，CA，Tech.Rep.04-01.0，二月。 2004。[在线]。可用：/docs/DIDOManualPR1.pdf z G.Elnagar，M.A.Kazemi 和 M.Razzaghi， “离散最优控制问题的伪谱 Legendre 法， ”IEEE 会刊.自动控制，第 40 卷，第 10 页，1793-1796 页，1995 年 10 月。 z M.Ross 和 F.Fahroo， “求解非平滑最优控制问题的直接法， ”2002 年 IFAC 世界大会会议录，巴塞罗那，西班牙，2002 年 7 月，479-484 页。
LGL 节点 tl , l
= 0,… , N 为 t0 = −1, t N = 1 ，对 1 ≤ l ≤ N − 1 ) 的导数。
在第一段 [τ 0 ,τ e ] ，有
N 1 + 1 LGL
点，而且在第二段 [τ e ,τ f ] ，有
1 ⎧ ⎪ g (x(τ ), u(τ ),τ ) g(⋅) = ⎨ 2 ⎪ ⎩g (x(τ ), u(τ ),τ )
（5）
（6）
如果有超过一个内部事件，可以按照时间把上面的函数划分。 z 在 Legendre 伪谱逼近中，节点是按照 Legendre-Gauss-Lobatto（LGL）积分在区间 -
2006 年 5 月 10 日
2006 年春季
16.323 17-6
Legendre 伪谱法
z DIDO 是个有效的计算工具13，可以求解很复杂的 OCP，包括非平滑问题，就是状态/控制是不连续的。 OCP 中的这些不连续点是自然出现的，如从最短时间问题中推导得出的 bang-bang 控制。 z 为了获取到非平滑行为，定义一个与必须满足的约束集相关的离散时间点的行为。考虑时刻τ e 的内部事件，并扩展到更多的内部事件。在τ 0 和τ f 的边界条件都包括在定义里。事件条件是：
g l ≤ g(x(τ ), u(τ ),τ ) ≤ g u
（3）
M.Ross 和 F.Fahroo， “求解非平滑最优控制问题的直接法， ”会议录，2002IFAC 世界大会，巴塞罗那，西班牙，2002 年 7 月，479-484 页。 2006 年 5 月 10 日
13
2006 年春季 z
16.323 17-7
7
2006 年春季 z z
16.323 17-3
DIDO 类似于直接转录/配置法，都用 Legendre 多项式作为函数逼近的基础已经知道 Legendre 伪谱法（虽然是直接法）具有的属性是其解满足必要优化条件。大多数其他直接法并不满足这点。9
9
M.Ross 和 F.Fahroo， “轨道优化方法调查， ”会议录。AIAA/AAS 天文动力学专家会议，Monterey，2002 年，AIAA2002-4727。
4
TM
2006 年春季
16.323 17-2
直接法 vs 间接法
z OCP 求解技术可以分类为直接法或者间接法7 8
打靶法，多重打靶法，转录/配置法的直接和间接变量可得
z
间接法目标是找到必要条件的近似解 Pros 高精度解满足必要优化条件 Cons 必要优化条件必须解析推导（可能很难！）小收敛半径：需要一个好的初始猜测需要共同预测需要知道约束和无约束子弧的先验知识
用感兴趣区间内最少数目的点产生最佳逼近。著名的积分技术（主要的不同在区间的终端点。） Gauss 积分 Gauss-Radau 积分 Gauss-Lobatto 积分
z
对非周期函数，可以使用多项式的正交系统 Legendre（勒让德）多项式 Chebyshev（切比雪夫）多项式 Jacobi（雅可比）多项式 — 包括 Legendre 和 Chebyshev
z 则问题变为需要级数的多少项才能得到“足够好”的 u (t ) 的逼近，以及用有
ˆk 。限多的点如何逼近 u
z 傅立叶法给出谱精度10。
“当函数无限平滑而且所有导数都是周期的，展开式的第 k 个系数比任何 k 的逆幂衰减的快。实际上，这个衰减直到有足够多的系数表达函数的所有必要结构才能展示。系数随后快速衰减暗示傅立叶级数在能很好的逼近函数的一些项之后截断。这个特征称作傅立叶方法的“谱精度” 。 ”
z
假设现在想逼近一个周期函数 u (t ) ，这可以用傅立叶级数表示：
u (t ) =
k =−∞
ˆk eikt ∑u
∞
ˆk = ↔ u
1 2π
∫
2π
0
u (τ )e − ikt dτ
z
为了实际的目的，逼近最好是截断级数。另外，需要一些方法在感兴趣的区
ˆk 。间内用有限多的 u (τ ) 的点计算 u
这些函数在事件时间τ e 可以是非平滑的，但是在开区间 (τ 0 ,τ e ) 和 (τ e ,τ f 一定是连续可微的。 -
)
如果使用上标 1 表示在第一个区间内的函数，上标 2 表示第二个区间的函数，
1 ⎧ ⎪ F (x(τ ), u(τ ),τ ) F (⋅) = ⎨ 2 ⎪ ⎩ F (x(τ ), u(τ ),τ )
[ −1,1] 内的最优选择。
为映射时间坐标到区间
[ −1,1] ，定义：
τ2 =
(τ f − τ e )t + (τ f + τ e ) 2
τ1 =
z
(τ e − τ 0 )t + (τ e + τ 0 ) 2
LGL 节点与 Legendre 多项式密切相关。 -
LN (t ) 是区间 [ −1,1] 上 deg N 的 Legendre 多项式。