用变分法求解最优控制问题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.2 无约束条件的泛函极值问题
5.2.1 泛函的自变量函数为标量函数的情况
为简单起见,先讨论自变量函数为标量函数
(一维)的情况。我们要寻求极值曲线
,
使下面的性能泛函取极值
(5-1)
为此,让自变量函数 、 在极值曲线 、 附 近发生微小变分 、 ,即
于是泛函J 的增量 可计算如下(以下将*号省去)
;
时的极值轨迹为
。
容易验证
时,
,对应局部极大。
对应局部极小;时,
5.3 有约束条件的泛函极值 ——动态系统的最优控制问题
前面讨论泛函极值问题时,对极值轨迹 没有附 加任何约束条件。但在动态系统最优控制问题中, 极值轨迹必须满足系统的状态方程,也就是要受到 状态方程的约束。考虑下列系统
(5-13)
式中, 为 维状态向量, 为 维控制向量(这 里假定 不受限制.
否则不能用变分法求解,而要用极小值原理或动态
规划法求解)
是n维连续可微的向量函
数。性能指标如下:
(5-14)
这是综合指标。我们要求出最优控制 和满足状 态方程的极值轨迹 ,使性能指标取极值。
在下面的讨论中,假定初始时刻 和初始状态 是给定的,终端则可能有几种情况。我们
将就几种常见的情况来讨论,即 给定, 自 由和 自由, 属于一个约束集。
这里 是实数, 和 是函数空间中的函数。
4、自变量函数的变分:自变量函数 的变分 是指同属于函数类 中两个函数 、 之差
这里, t 看作为参数。当 可用图5-1来表示。
为一维函数时,
图5-1自变量函数的变分
5、泛函的变分:当自变量函数 有变分 时, 泛函的增量为
这里, ,则称 主部。
是 的线性泛函,若
上式中
是高阶项。
(泰勒级数展开)
根据定义,泛函的变分 是 的线性 主部,即
对上式第二项作分部积分,按公式
可得
(5-2)
J取极值的必要条件是 等于零。因 是 任意的,要使(5-2)中第一项(积分项)为 零,必有
(5-3)
上式称为欧拉——拉格朗日方程。
(5-2)式中第二项为零的条件要分两种情况来讨论:
(5-17)
于是有约束条件的泛函 的极值问题化为无约 束条件的增广泛函 的极值问题。 再引入一个标量函数
(5-18)
它称为哈密顿(Hamilton)函数,在最优控制中 起着重要的作用
于是 可写成 对上式积分号内第二项作分部积分后可得 (5-19)
设 、 相对于最优值 别为 和
、 的变分分
因为 自由,故还要考虑变分
。
下面来计算由这些变分引起的泛函 的变分 。
计算增量 ,然后用 泰勒级数 展开到一 阶项即可 得到
为极小的必要条件是:对任意的 、 、 ,变分 等于零。由(5-18)及(5-20 )可得下面的一组关系式
(协态方程) (状态方程) (横截条件) (控制方程)
(5-21) (5-22) (5-24) (5-23)
时,有
是泛函 的变分。 是 的线性
6、泛函的极值:若存在 ,对满足的
一切X,
具有同一符号,则
称在
处有极值。
定理: 在
处有极值的必要条件是对
于所有容许的增量函数 (自变量的变分),
泛函 在 处的变分为零
为了判别是极大还是极小,要计算二阶变分 。但在实际问题中根据问题的性质容易判别
是极大还是极小,故一般不计算 。
1、 固定端点的情况
这时
,它们不发生变化,所
以
。而(5-2)中第二项可写成
(5-4)
当
时,(5-4)式自然为零。
2、自由端点的情况
这时 和 可以发生化,
,
而且可以独立地变化。于是要使(5-2)中第二项
为零,由(wenku.baidu.com-4)式可得
(5-5)
(5-6)
因为这里讨论 是标量函数的情况, 和 也是标量,且是任意的,故(5-5)、(5-6)可化 为
式中
(5-9)
(5-10)
泛函变分由(5-2)式改为 向量欧拉——拉格朗日方程为 式中
(5-11)
横截条件为(自由端点情况)
(分以下
和
两种情况:)
例5-1 求通过点(0,0)及(1,1)且使 取极值的轨迹 。
解 这是固定端点问题,相应的欧拉——拉格朗日方 程为
即
它的通解形式为 式中:
Sht—双曲正弦函数 Cht—双曲余弦函数
5.1 变分法基础回顾
相关的定义: 1、泛函: 如果对某一类函数 中的每一个函数 ,有一个实数值 与之相对应,则称 为依赖于函数 的泛函,记为
简单来说,泛函是以函数为自变量的函数。
2、泛函的连续性:若对任给的
当
时,就有
,存在
则称 在 处是连续的。
3、线性泛函:满足下面条件的泛函称为线性泛函
齐次性: 叠加性:
5.3.1 终端时刻 给定,终端状态 自由
将状态方程(5-13)写成等式约束方程的形式 (5-15)
与有约束条件的函数极值情况类似,引入待定的n 维拉格朗日乘子向量函数
(5-16)
与以前不同的是,在动态问题中拉格朗日乘子 向量 是时间函数。
在最优控制中经常将 称为伴随变量,协态(协状 态向量)或共轭状态。引入 后可作出下面的增 广泛函
(5-21)~(5-24)即为 取极值的必要条件, 由此即可求得最优值 , , 。
(5-22)式即为状态方程,这可由 的定义式 (5-18)看出,实 际解题时无需求 ,只要直接用 状态方程即可,这里为形式上对称而写成(5-22) 式。
(5-7)
(5-8)
(5-7)、(5-8)称为横截条件。
当边界条件全部给定(即固定端点)时,不需
要这些横截条件。当
给定时,不要(5-8
)。当
给定时,不要(5-7)。
5.2.2 泛函的自变量函数为向量函数的情况
现在,将上面对 是标量函数时所得到的公式推 广到 是n维向量函数的情况。这时,性能泛函为
用变分法求解最优控制问题
本章主要内容
➢ 5.1 变分法基础 ➢ 5.2 无约束条件的泛函极值问题 ➢ 5.3 有约束条件的泛函极值——动态系
统的最优控 制问题 ➢ 5.4 小结
在动态系统最优控制问题中,性能指标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面再次列出变 分法中的一些主要结果,可对照微分学中的结果来 理解,以加深印象及理解。
由初始条件
,可得A=0。
再由终端条 件
,可得
,
因而极值轨迹为
例5-2 求使指标
取极值的轨迹 没有限制。
,并要求
,但对
解 这是终端自由的情况。欧拉—拉格朗日方程为
即 于是
常数 是常数, 则是时间的线性函数,令
由
可得
,又终端是自由的,由式
(5-7)可得横截条件为
即
由上式解得 或
。 时的极值轨迹
为