哈工大现代控制理论基础第十一章 最优控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则宗量的变分定义为
为宗量,
设
是线性赋范空间 上的连续泛函,
若其增量可表示为
式中 则
关于 关于
的线性连续泛函; 的高节无穷小。
称为泛函
的变分。
上式说明泛函变分就是泛函增量的线性主部。
当一个泛函具有变分时, 也称为该泛函可微。
[定理1] 设
是线性赋范空间 上的连续泛函,
若在
处
可微,其中
,则
的变分为:
考虑积分型泛函
其中
上的 维连续可微函数 关于其所有变元连续可微的 标量函数。
初始时刻,对应状态为 末端时刻,对应状态为
[定理3] 泛函 欧拉方程
在 处取得极值的必要条件为
和横截条件
对于最优解 证明略
成立。
11.2.3 泛函的条件极值
考虑积分型泛函
在约束条件
下的条件极值问题。
(1) (2)
[定理4] 泛函(1)在约束条件(2)下的极值问题
哈工大现代控制理论基 础第十一章 最优控制
2020年4月24日星期五
11.1 最优控制问题的一般提法
最优控制研究的主要问题: 根据已建立的被控 对象的数学模型, 选择一个容许控制律, 使得被控 对象按照预定的规律运动,并使某一个性能指标达到 最大或最小。
从数学的观点来看, 最优控制问题是求解一类 带有约束条件的泛函极值问题, 属于变分学范畴。
函数的泛函,记为
。
函数类
称为泛函 的定义域。
[例3] 函数的定积分是一个泛函。设
每给定一个函数 对应。
,就有一个定积分值 与之相
在最优控制问题中, 若取如下形式的积分型性 能指标
则 的数值取决于 维向量函数 , 因此上式 是一种积分型指标泛函。
设 为 维线性赋范空间, 为实数集,若存 在一一对应关系
[例2] 空对空导弹拦截。 假定导弹与目标的运动 发生在同一平面, 即假设导弹能产生足够大的铅垂 方向的升力,以抵消其自身的重力; 假定导弹推力 方向与其速度方向一致, 目标常速、定航向飞行。 这种假定并非过分限制, 实际上,导弹按此种假设
下所形成的控制律飞行, 直至接收到关于目标下一
次新的测量为止,根据新的测量再形成新的控制律, 这样反复进行,直至击中目标。 当量测采样间隔充 分小时, 关于目标常速、定航向的假设离实际情况 相差并不太远。
解得
其中 和 为待定常数。 将边界条件
代入可得
11.1.1 最优控制问题的两个例子
[例1] 飞船的月球软着陆问题。 如图所示,飞船 靠其发动机产生一个与月球重力方向相反的推力 , 使得飞船到月球表面时速度为零, 即实现软着陆。 要求设计推力函数 ,使得发动机燃料消耗最少。
月球
[解]
设飞船的质量为 , 其高度和垂直速度分别为 和 ,月球的重力加速度为常数 ,飞船的自身 质量及所带燃料分别为 和 。
设从 时刻飞船开始进入软着陆过程, 以竖直向上为参考正方向, 可写出运动方程为
其中 为常数。 控制飞船从初始状态为
到某一时刻 实现软着陆,即
控制过程中,推力 最大推力 , 即
不能超过发动机所能提供的
最优控制问题可以描述为: 在满足控制约束的条件 下,寻求发动机推力 ,使飞船的燃料消耗最小,
也就是使得 时刻飞船的质量 为最大, 即
经典的变分法只能解决控制无约束的问题, 即容许控制属于开集的一类最优控制问题。 然而, 工程中的控制常常是有约束的, 即容许控制是属于 闭集的。为了解决这个问题, 20世纪50年代,美国 学者贝尔曼和苏联科学院院士庞德里亚金分别独立 地拓展了经典变分法, 分别给出了动态规划方法和 极大值原理。 它们构成了最优控制的理论基础。
证明略
泛函变分的规则 泛函的变分是一种线性映射, 满足下列性质:
1 2 3 4
[例4] 已知连续泛函为
其中 和 为标量函数,试求泛函的变分。 [解]
四. 泛函的极值
[定义] 给定泛函
及其定义域中的一个变量
,如果对于任何一个与 接近的变量
都有
则称泛函
在 上达到一个相对的极大值。
如果上述关系对于定义域中的所有 均成立,则称
则称
为 到 的泛函算子,记作:
为了对泛函进行运算,经常要求泛函 且有连续性的。
是线性
二. 线性泛函与连续泛函
如果对于任意常数 与 和 的任何变元 和 ,有
定义域中
则称
为线性泛函。
对于任意给定的正数 , 如果存在正数 , 当
时, 有
则称
是在 处具有 阶接近度的连续泛函。
三. 泛函的变分
设
为连续泛函,
[解] 在上述假设下目标的运动方程为
目标的位置坐标, 目标的线速度, 目标运动方向与 轴的夹角,
设 为导弹的质量,
为导弹在坐标平
面内的坐标, 表示导弹的速度, 与 轴的 夹角为 , 表示导弹的侧向控制力。 如果用 表示推进剂秒流量, 可作为一个控制量, 则纵向 推力为 , 其中 为常数。 设 表示导弹的 阻力因子, 且
其中, 目标集 可表示为 性能指标 可表示为 其中 和 为连续可导的标量函数。
11.2 应用变分法求解无约束条件 的最优控制问题
11.2.1 泛函与变分
一. 泛函与泛函算子
所谓泛函,简单地说就是函数的函数,定义如下:
设
为给定的某类函数,如果对于这类函数中的
每一个函数,有某个数 与之相对应, 则称 为这类
等价于下述泛函
拉格朗日乘子
(3) 的无条件极值问题。 拉格朗日函数 [例5] 设卫星姿态控制系统的简化状态方程为
指标泛函取为 边界条件为 试求使指标泛函取极值的轨线 和极值控制 。
[解] 这是一个有等式约束的泛函极值问题。 拉格朗日标量函数为
欧拉方程为
解得
其中 和 为待定常数。 由状态方程可得
Βιβλιοθήκη Baidu
泛函
在 上达到其定义域中的一个绝对极
大值。
极小值的定义完全类似,只是不等号变向。
当 与 具有零阶接近度, 即
很小时, 相应的极值称为强极值;当 与
具有一阶接近度,即
及
均很小时, 相应的极值称为弱极值。
[定理2] 如果具有变分的泛函
在
达到极值, 则
沿着 的变分
证明略
上 为零。
11.2.2 欧拉方程
这里的 和 均为对角线矩阵。
上述性能指标的第一项表示末端时刻导弹与目标距 离的一种度量, 该距离常称为脱靶量; 第二项表示 控制过程消耗的能量。
11.1.2 最优控制的一般提法
设被控系统的状态方程及初始条件为
目标集为 ,求取一个容许控制 使受控系统由给定初始条件出发,在末端时刻 将系统的状态转移到目标集 , 并使性能指标 达到最小。
其中
零升力阻力系数,可以看作是常数 大气密度,也可以看作是常数 导弹的参考面积 将 和 看作是两个独立的控制变量时, 导弹 的运动方程为
取状态变量为 取控制变量为
令 则可得状态方程
这个问题可以归纳为:导弹从已知的初始状态
出发, 通过选择适当的控制律
及
,使得在末端时刻 尽可能地接
近目标, 同时,尽可能地节省控制能量。 为此,取性能指标为