适用于一次性和可重复使用运载器的最优控制方法概述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

本科毕业设计英文翻译
专业名称飞行器设计与工程
学生姓名郭旭
指导教师李新国
完成时间2010-04-08
本科毕业设计英文翻译
指导教师评阅意见
学生姓名:郭旭班级:2163 得分:
适用于一次性和可重复使用飞行器的最优控制方法概述
——Nicolas Berend, Christophe Talbot
摘要
飞行器轨道优化是一项复杂的工作,尤其是考虑到研究可重复使用飞行器时提出的特殊的问题时。

部分困难来自组成飞行器任务的轨道弧圈的不同的特性(约束和控制可能不一样)。

另一些困难某些情况下来自对上升和再入段之间阶段进行全局优化必要性。

最后,用于这项工作的优化工具应该是宽范围、稳定的,因为对于可重复使用飞行器的研究经常涉及很多不同的概念,也有很多不同的轨道情况(比如放弃任务的设定)。

本文的目的就是在飞行器轨道优化的大框架内给出不同的应用于法国CNES和ONERA的用于解决优化控制问题的方法。

这些方法都是对经典优化方法的有利应用,其设计目的是涵盖一次性飞行器和可重复使用飞行器的轨道计算的需求。

发布的第一个优化工具是OPTAX,用的是间接打靶方法。

发布的第二个和第三个工具是CNES的ORAGE和ONERA的FLOP/OLGA,用的是两个不同的梯度变量的方法。

本文描述了这些工具背后的方程和方法论以及其优缺点。

引言
对于空间运输而言轨道优化是一件不可避免的事。

自从空间探索开始以来随着飞行器(导弹、火箭、航天飞机和再入兵器等)和任务的进化发展了非常多的优化方法,详见参考文献【2】。

为了为未来飞行器体制做好准备人们正在研究部分或者全部的可重复使用飞行器。

从构架和技术的角度来看,这种飞行器增加的复杂性很明显,从轨道优化的角度来看也是这样的。

就技术来讲,飞行器的任务是由多重的阶段组成的,以分支路线的方式组合(多段再入的情况),具有不同的动态特性和控制特性。

历史上,欧洲曾开发了很多工具来解决一个或几个同类问题。

DIAMANT, EUROPA和ARIANE对这些工具的继承给我们带来了稳定的具有竞争力的用于传统一次性飞行器的程序,但是这些工具有时并不适用与可重复使用飞行器。

结果就是人们使用了更多的工具和方法。

本文中,我们对当今CNES和ONERA的最常用的工具进行了概述。

第一个是OPTAX,使用的是间接打靶方法。

发布的第二个和第三个工具是CNES 的ORAGE和ONERA的FLOP/OLGA,用的是两个不同的梯度变量的方法。

1. 间接打靶法:OPTAX: Ariane 轨道优化(CNES )
OPTAX 是Ariane 轨道和所有一次性飞行器上升轨道的主要的优化工具,在具有常值攻角或配平攻角的大气阶段的限制范围内也可以用于可重复使用飞行器。

OPTAX 是基于Pontryagin 最大化原则的直接应用。

事实上,这个原则仅仅应用于大气层以外的轨道圆弧(因为我们可以容易的得到控制的显示表达)。

大气层被参数化的优化。

1.1 该类问题的参数
我们考虑一下具有初始条件的一般情况,其包含参数p 、过渡约束q 、最终约束r 和自由最终时间。

这里的初始时间是opt t ,是最有控制的开始日期(空气动力可以忽略时的时刻是最典型的时刻)。

该问题的目的是将性能指数降到最低:
这里的目标函数是Mayer 形式的是因为对于上升段我们很少用整体的标准的缘故。

状态向量()X t 是由坐标、速度向量
和参数k a (有效载
荷质量、斜坡阶段持续时间、倾斜速度等)组成的。

控制量()u t 描述了推力矢量的方向,它是与飞行器的轴线是在同一条线上的。

最小值服从以下条件:
要注意0a 是在之前的非最有控制阶段opt t (基本上是大气段)起作用的参数。

()opt x t 处的状态向量完全由0a 决定。

过渡约束可能发生在优化时间为时。

动态方程如下:
t之后空气动力被忽略),M为质量(它是时间的函数)。

F代表推力和重力(
opt
参数
a不随时间变化。

k
1.2 优化条件
与拉格朗日方程的形式相似,我们构建了提高的性能系数如下,详见参考文献【6】。

为了简化方程我们已经忽略了过渡约束项。

我们引入拉格朗日乘子v作为最
λ作为动态约束。

其方程如下:
终约束和状态向量伴随向量()t
需要的优化条件一如下设定给出:
λ如下:为方便起见,我们通常定义Hamiltonian函数(,,,)
H X u t
如果除去中的各项,我们就得到必要的条件:
必须选取控制变量的Pontryagin最大化原则状态来使Hamiltonian函数在随时都为最小。

以下是最小化方程:
1.3
t时的横向条件
opt
初始约束(1.3)可以写作:
这使得横向条件可以重新写作如下形式:
以及

t之前)的伴随向这种关系给出了与位置和速度伴随向量相关的参数(在
opt
量的初始值。

然后就有:
1.4 伴随方程
考虑到如1.6式所述的运载器的动力学,我们可以得到:
我们计算了与状态向量相关的动力学导数。

很多项可以容易的去掉。

伴随方程(1.11)变成:
我们可以认为推力不再取决于高度的变化。

那么第一项就成了重力加速度的函数。

和表述为已考虑参数的函数。

1.5 最小化方程
最优控制将Hamiltonian函数所有可接受的控制都减到了最小。

仅有的取决于控制的项是。

最小化Hamiltonian函数就等价于最小
化,这意味着u和速度伴随向量是在同一条直线上而且方向相反的。

该式给出了轨道上每个点的最有控制的显示表达。

要注意如果空气动力不
可忽略的话就不可能得到这么简易的表达式了。

1.6过渡约束
由Pontryagin 原则可得:
如果约束的时间m t 不是恒定的,应该加入一个附加方程来求解最优值:
与过渡系数j γ和m t 相关的拉格朗日系数j u 是该问题的未知量。

因为这些系
数在横向条件下的作用并不很明显,它们应该被当成系数a 来考虑。

对于每一个相关的j u 都有一个代表着j u 变量对性能提高的影响的伴随向量
系数
在过渡约束与质量下降相关的情况下就可以明确的确定伴随矩阵的阶跃。

系统的Hamiltonian 函数依然是连续的(约束并不取决于时间)而其仅有加速度Γ的变化:
然后我们就要就要解以下以 为未知量的方程:
这可以通过牛顿方法解决。

1.7最终非线性方程组
我们需要积分以下方程组:
初始条件是,最优控制率为,未知量:
最终,我们得到一个参数(7)p q r +++和(6)p q r +++未知的方程。

多余的
未知量是f v ,是随意变化的。

为了关闭系统,我们引入了初始速度时伴随矩阵向量的附加状态:
该状态本质上式对f v 的设定。

现在该问题就等价于0()0F S =的一个方程组。

该方程通过牛顿迭代的方法解决,步长元素为α:
这种方法的收敛半径是有限的,初始条件很重要。

下一段将阐述用于确定
和v 的方法。

1.8 使用最小平方法的初始假设 用户需要定义姿态定律和参数(包括相应于伴随矩阵的阶跃)的简化(不一定是优化)。

轨道(仅有状态动态特性)是通过积分得到的,与状态向量相关的最终约束的梯度和系能指标是由计算得到的。

在横向条件下,可以确定相关的(特殊的)伴随矩阵方程组(未考虑拉格朗日乘子):
1r +个方程组是随着状态和伴随矩阵向量向后积分的。

伴随矩阵方程组是线性的,因此任何对于伴随矩阵方程组的特殊线性联立的解也是具有等同于最终的特殊线性联立解的一个最终解的伴随矩阵方程组的解。

最终的拉格朗日乘子i v 是以使轨道上前向积分和后项积分不同的仅仅某些点处最小化的方法搜索的。

对于这些观测点(s t 时),我们有如下关系:
观测点的数目必须要比我们要确定的系数的数目大。

超静定问题可以通过
最小平方条件和简化关系的方法解决。

1.9 其他特性
OPTAX 是CNES 和ARIANESPACE 在各种工程中非常常用的程序(还有Ariane, Future Launchers,Foreign Launchers comparison 等)。

因此对这种方法实施了很多改进:
——参数优化(代替优化控制),包括Ariane 5种运载器的制导律
——有助于初始设定、提高稳定性、处理多种情况或再次点火任务的混合打靶 ——对由惯性参考系散步引起的导航误差的估计,应用变化传播的方法 ——6自由度互联的Ariane 仿真,安全程序,观测和遥控诊断,飞行动力学程序,相关学科优化工具等
1.10 该方法的优缺点
——收敛的速度。

因为它的控制的显式解是速度伴随矩阵的函数,如果第一次估
计和真实解相当接近的话,Optax 可以在数秒之内对一条弹道进行优化。

与初始过程相联系的快速收敛可以轻易的从一个当地解跳到另一个上去。

也很容易把OPTAX 和各学科优化工具联系起来。

——该解尽可以被几个参数记录(opt λ,k α和v )。

——控制的质量(比如没有噪声等)
主要缺点是:
——初始化需要经验。

初始设定值不是理论上的也不是凭直觉推断的,对一个新
的飞行器完全优化一条新的轨道是一件相当麻烦的事。

——应用新的约束或标准是一件很难的事,为了增加搜索的精确性(以及成功的
几率)需要很多派生项和进一步的可用分析(跟有限的差异相比)。

——该方法不适用于复杂的动态系统,因为其作为伴随矩阵函数的控制的显式解
不容易寻找(例如气动力控制)。

2.扩展梯度法:ORAGE:使用外部扩展梯度法的大气再入优化
ORAGE应用于大气再入仿真。

以前CNES用的很多再入仿真例如反馈控制或同约束剖面的动态求逆(Harpold和Graves方法,详见参考文献【5】)。

如今ORAGE 可以提供考虑达到飞行器最大性能目标的可用的完全优化控制。

2.1 问题的各方面
Bolza形式的性能指标包括积分项和最后时刻估计的数量:
最小值取决于以下条件:
例如,价值函数可以是飞行器的距离(横向或纵向),到达着陆点的距离,最终速度或热流的积分。

最终约束仿真结束时的影像参数(模块,速度的倾斜和方位,纬度,经度等)。

中间约束也是可变的形式:动力学,热量,与控制能力或性能保留相关(滚转)等。

飞行器的运动是由以下的动态变量定义的(半径,纬度,经度,速度,轨道倾角,方位角和质量):
控制变量一般包含以下的姿态角(参见图1):
—— :攻角
——u:倾斜角
2.2 优化条件
我们把性能系数J提高的性能系数ˆJ定义如下:
需要的优化条件是由微分方程得到的。

通过区分我们得到J的灵敏度方程:
同样的方式,我们引入与约束相关的伴随矩阵向量,而且推导出敏感方程如下:
伴随矩阵向量选以结束f dx 和x δ的方式:
以及
ˆdJ
变成:
如果控制u 和最终时间f t 已经经过了优化,那么ˆdJ 对于任何无穷小变量f
dt 和u δ就无意义了。

最终问题变为:
以及横向条件和伴随矩阵方程(2.11)和最终约束(2.4)。

2.3 过渡约束
过渡约束可以以同样的方式作为最终约束加入。

对于每个约束(
是在j t 时
刻的第k 级约束)都已一个伴随矩阵:
结果,我们得到了需要的附加条件:
2.4 梯度方法
该问题是通过一阶梯度方法解决的(详见参考文献【6】)。

初始设定用的
是可能的不可接受的控制的非最优解(0()u t ,0f t )。

方程线性化以后,我们在控制和最终时间的基础上对变量进行迭代。

每一
部我们都将最终约束固定
进行最小化处理。

线性化假设为了保证收敛对u δ和f t δ使用了微小的替换。

这就是为什么我
们对u δ和f t δ项实施惩罚的原因。

以及
,对f t 施加以正常数惩罚系数,对u
施加一个W 惩罚矩阵(正的有限的对称矩阵)。

稳定性状态是由把第一个变量设为0:来进行验证的。

扩展后有:
以及变量:
终止段,我们要确定最终约束的拉格朗日变量i v 。

在式(2.19)中我们用
式(2.20)中得到的u δ和f t δ进行了替换。

最终得到:
对式(2.16)和(2.17)的求解包含在两个轨道的积分中。

前向积分确定
了f t 时的最终状态,伴随矩阵和约束。

后向积分考虑了伴随矩阵方程组以及确定了需要的所有的项(包括i v )。

考虑到通过
造成的约束的改进拉格朗日乘子就可以通过NLP (NLPGR ,使
用减小的梯度方法,由SEGIME S.A.研发)的解法计算出来了。

线性化验证过以后,对u δ和f t δ替换的的计算就会在新的迭代处开始。

2.5 方法扩展
为了解决任何该类问题,ORAGE 进行了算法的改进: ——控制量可以通过Hamiltonian 罚函数进行约束
——可以应用动态系统的中断(质量的抛射,引擎的变化,空气动力改变等),发生时间也可以进行优化
——引入了一个二阶的解法
2.6 该方法的优缺点
ORAGE工具的主要优点是:
——初始设定的稳定性。

与很多梯度方法类似,对于某个解收敛过程相对容易(但不一定是最好的)
——该方法可以应用于任何飞行器,可以处理发杂的动态系统
缺点如下:
——收敛到最优解的速度比间接打靶法慢大约100倍,为了得到比较好的精确性需要进行几千次迭代
——收敛常常需要繁重的管理,需要一个一个的添加删除约束和修正
——结果发现控制噪声比较大,是要进行实时的降噪——这就用到制导方法了。

2.7 OPTAX-H:轨道优化
OPTAX-H是OPTAX使用ORAGE算法(间接打靶法)后的改进版,用来解决大气段和外大气段OPTAX算法(间接打靶法)。

研发这个版本专门用来处理需要控制空气动力(通过攻角,倾斜角等)的可重复使用飞行器的问题,例如水平起飞的飞行器,气动助力转弯等。

3. 通用构架梯度:FLOP/OLGA(ONERA)
ONERA最新的轨道优化工具是FLOP(未来飞行器优化程序,详见参考文献【4】),是以前用来处理特殊应用例如Ariane5类轨道或STAR-H吸气式飞行器轨道工具(OPERA工具)的继承。

这些工具的共同之处是都有一个名为Olga的多用途优化核心,基于梯度方法的变量(详见参考文献【1】),即“通用构架梯度”。

该方法既用来解决最优控制()
u t也用来解参数 。

3.1 FLOP的主要特征
FLOP中轨道优化问题的模型利用了Olga算法的能力来解决多段优化问题,使用的是通用性能指标公式和约束函数。

FLOP中,飞行器的任务被分作一个或几个阶段,经常——但不一定——相应于飞行器的活跃阶段。

大体上讲,Olga/Flop阶段中的某一变化都意味着状态向量的改变(典型例子就是抛射质量的阶段),动力学的改变(例如点火阶段引擎的关闭),或者说是优化问题自身的变化(例如特定时刻路径约束的激活。

轨道的每一阶段都可以以不同的特征进行区分:
——质量,引擎特征(推力,Isp)和空气动力数据库
——控制变量集合。

可能的控制就是空气动力参考坐标系中的姿态角或者欧拉角。

在喷流可调的引擎中推力变化率是个附加的控制量
——路径约束(例如热流和动压)
——终端约束(例如热流要比极限值低,高度,马赫数等)
任务的定义也可能包含任何轨道阶段(过渡段或末段)的结束段的当地约束。

FLOP为满足一次性和可重复使用飞行器(详见图2和图3中的示例)的需要而研发成多用途的工具。

所以它包含了广泛的飞行器模型的数据库,当地和路径约束,终端条件和性能指标。

3.2 Olga全局优化问题中的方程
出于简化的目的,方程为单一轨道阶段优化控制问题而给出。

该阶段有如
下的动力学而无非连续点,时间为
x为状态向量
t为时间,
t为最终时间
f
u为控制向量
为参数向量
Olga解决的全局优化问题包扩在时间上寻找最优控制和最后参数,它们可以:
——最小化性能指标:
——满足以下约束:
可以在包含最终和积分项的通用方程中表达,就像性能指标:约束
i
这个通用方程可以引入相等或不相等的路径约束。

3.3 优化过程的组织
Olga中使用的优化方法的核心是梯度算法的加强版,叫做“通用构架梯度”法。

在经典构架梯度中,性能指标随着每一次迭代而降低,而约束函数却不变。

相反的,Olga中使用的该方法的修改版既降低了性能系数也降低了约束函数。

这里是优化过程的准则。

每一次迭代以下的过程都要经过一次,一直到收敛条件满足。

<1>约束函数的变量的目的是通过解辅助优化问题确定的。

该问题包括计算在全局过程范围内的固定于全局优化问题中的可能的最大变量。

这个全局步长,需要以后再定义,目的是确保敏感度计算的有效性。

<2>在解决当地优化问题是我们计算了可以达到需要的约束变量的目
标和性能指标的参数的控制和参数的最优变量。

的值来自
全局步长的限制(就像)也来自可在算法中实现交换性能系数最小值和满足约束条件的目的这样特殊的选择。

这是在Olga中应用梯度法的主要特征。

当地最优问题的解决取决于变量(CV)的微积分。

经变量用到控制和参数上以后,算法
开始从第一项任务进行循环迭代。

为了更加真实和清晰,这个过程中的计算工作接下来将以倒叙的方法详述,从应用于辅助优化问题的变量的计算和交换位的目标函数/约束开始。

3.4 变量的微积分
用和价值函数以及约束函数同样的定义我们选择了变量微积分来生成以下表达式:
这些表达式对与价值函数和约束函数相关的(q+1)-Hamiltonians使用了通用的定义。

是与价值函数(i=0)以及约束函数(i=1,…,q)相关的伴随矩阵的向量。

它i
们是由来自边界条件的终值进行后向积分计算出来的。

这里将不给出
k完整的表达,由于最优控制问题通用方程的原因它相当复
i
杂。

通用方程考虑了从当前轨道阶段到另一个阶段的转换条件,段与段之间最优状态的不连续性,以及参数化的初始和终值条件。

在简化的情况下,表达式仅包含了价值/约束函数的非积分段:
3.5 当地优化问题
在当地条件下解决的优化问题包括寻找和,因此:
——目标函数的变量被最小化(也就是说,为了减小全局问题的目标函数它
应该是负的)
——约束函数中的变量相当于预定义值。

于是我们就与对q的线性化约束:
——控制和参数的变量在给定的名义步长N之内,这是为了保证敏感度计算的有效性。

所以我们就有以下二次约束:
W和B是缩放矩阵。

价值函数和约束函数的表达来自于对变量的计算(详见参考文献【3.5】)。

上述当地问题是二次线性的问题。

它是以简洁的方法求解的,通过
考虑到包含寻找和派生问题,于是:
——算法的步长最小化:
——的变量等价于预定义值:
——约束函数的变量等价于预定义值:
这个派生问题有趣的特征是它把一个显式解作为和的函数。

如果采
用的话我们可以把它作为原始问题的一个解,因此上述的最小步长问题就等价于在原始问题中确定步长N。

这可以通过解以下的二阶方程来解决:
是q约束的向量。

K函数的函数。

是全局敏感矩阵。

它是Hamiltonians Hi函数和
i
以上方程求解出以后相应于和的控制和参数的最优变量就是:
以及:
可以看出,在全局优化问题的收敛处,向量
等价于全局优化问题中q约束的拉格朗日乘子的向量。

所以,在该过程中,v可以叫做瞬时拉格朗日乘子的向量。

3.6 辅助优化问题
在下一个迭代是,新的约束函数的值必须足够趋近于零,所以我们要把下式最小化:
S是比例矩阵。

约束变量的理想值是使得约束完美满足的值(等于零):
然而,的选择不能以这种方式进行,因为来自于当地优化问题的约束。

由于方程(3.13),变量应该严格的在所选取的名义步长之内,所以我们有以下约束:
是与约束相关的敏感矩阵。

它是全局敏感矩阵Γ的一个子矩阵。

该辅助优化问题在Olga中是以通过使用性能指标最小值和约束满足之间调整优先级的方式解决的(在全局问题中)。

事实上两者之间有所不同:
<1>相应于性能指标和约束向量二者的全局步长为:
<2>仅相应于约束函数变量的约束步长为:
如在方程(3.13)所述,全局步长限制于一个固定的值N。

对于约束步长,它限:
制于不同的值N
ψ
被隐式的表达,所以:
不等约束(3.19)通过近似的选择N
ψ
故辅助优化问题包括寻找,所以:
——以下的二次性能指标被最小化:
——以下的二次相等约束表述为:
这种二次方程式问题可以很容易的解决,它采用了一个显式的解作为与等价约束相关的拉格朗日乘子η的函数:
为了满足优化所需的拉格朗日条件η通过迭代的方法进行计算。

的选择考虑到了两种约束方程(3.23),以及与理想约束变量相N
ψ
应的的值:
的选择把最大优先权赋给了约束的满足(也就是说考虑约束时的可能N
的最大的值),即:
不同的选择造成到了降低约束和降低目标函数之间更平衡的优先权。

一个常见的方程,已应用于在Olga当前版本:
这个选择造成了在优化一开始时性能指标的下降,但是这种下降比起来远不能令人满足的约束还是很有限的。

只有在随后的过程中,在约束几乎被满足时,降低性能指标的目的变得更高了。

3.7 该方法的优缺点
Flop/Olga工具的主要优点:
——具有从解不足满约束条件的地方开始优化过程的能力。

这种能力,事实上是一种直接方法的特征,显然是的初始过程变得简单。

但是它并不能保证可以收敛到最优解,其收敛半径一般的要比间接方法的大。

——Olga完全支持多阶段问题,由动力学和状态向量决定阶段的转化。

此外,它能够引入可以解析积分的非控制轨道弧。

主要缺点:
——收敛可能非常慢(一阶方法)
——作为最终约束的路径约束(对微分方程的积分)的表达有时是的收敛困难——就像使用直接方法的其他方法一样,使用当地敏感计算来改变参数和控制,这种方法会得到当地最优解
4. 结论
CNES和ONERA的优化工具满足了飞行器轨道优化领域的大部分需要。

这些工具要么是处理多种情况的要么是应用于特殊的轨道问题(例如发射或再入段),而且要么使用直接的方法要么使用简介的方法。

虽然没有可重复使用飞行器轨道使用这些方法以外的手段(考虑到初始阶段需要足够的时间),经验表明没有一种优化方法是在各个方面都是真正“完美“的,尤其是在可重复使用飞行器研发的大环境下。

如今的可重复使用飞行器的定义是一件很难的事,而且他们引发了很多不同的轨道优化问题。

此外,混合训练优化(MDO)中轨道计算的快速性非常关键。

一个待解决的重要的问题就是当考虑到整个不同的轨道问题的集合时会造成两个相互矛盾问题的对抗:所找到的优化的质量和初始化工作的容易程度。

对如今的方法和过程很多可能的改进应当考虑,从相关的直接的间接地方法到如今非线性变成领域的进步。

参考文献(略)。

相关文档
最新文档