优化理论课件(变分法与最优控制理论)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
优化理论课件(2)
第二部分动态优化:变分法和最优控制理论
变分法是处理动态优化的古典方法,现在较少使用,在蒋中一的书中,变分法的思路可用来解释庞特里亚金最大值原理(一阶条件)。本部分内容主要来自蒋中一《动态最优化基础》。
目录
一、什么是动态优化? (3)
(一)动态优化问题的基本要素 (4)
(二)泛函及其相关概念 (4)
(三)可变终结点 (5)
(四)横截条件 (7)
(五)目标泛函 (7)
二、变分法 (8)
(一)基本问题:固定终结点问题 (8)
(1)基本问题及其假定 (8)
(2)一阶条件:欧拉方程 (8)
(二)推广:多状态变量与高阶导数 (11)
(1)多状态变量 (11)
(2)高阶导数 (11)
(三)可变端点问题 (12)
(1)一般性横截条件 (12)
(2)垂直终结线问题 (13)
(3)水平终结线问题 (14)
(4)终结曲线问题,即错误!不能通过编辑域代码创建对象。 (14)
(5)截断的垂直终结线问题 (14)
(6)截断的水平终结线问题 (14)
(7)多变量和高阶导数情形 (15)
(四)二阶条件(充分条件) (15)
(1)固定端点问题的二阶条件及其二次型检验 (15)
(2)凹凸性充分条件 (16)
(3)变分 (17)
(五)无限期界问题 (18)
(1)收敛性 (18)
(2)横截条件 (19)
(3)充分条件 (19)
(六)带约束的优化问题 (19)
(1)等式约束 (19)
(2)不等式约束 (21)
(3)积分约束(等周问题) (21)
三、最优控制理论 (22)
(一)最优控制理论导论 (22)
(二)最大值原理及其横截条件 (23)
(1)最简单问题及最大值原理(一阶必要条件) (23)
(2)最大值原理的理论基础及其横截条件 (26)
(3)自控问题的汉密尔顿函数不变性 (29)
(4)推广到多变量 (29)
(三)最大值原理的经济学解释及现值的汉密尔顿函数 (30)
(1)最大值原理的经济学解释 (30)
(2)现值的汉密尔顿函数 (32)
(四)充分条件(二阶条件) (32)
(1)曼加萨林定理 (32)
(2)阿罗条件 (34)
(五)无限期界问题 (35)
(1)横截条件与反例 (35)
(2)作为充分条件一部分的横截条件 (36)
(六)有约束的最优控制问题 (36)
(1)涉及控制变量的约束 (37)
(2)状态空间约束 (43)
四、拉姆齐模型 (47)
(一)相关理论发展背景 (47)
(二)最简单的拉姆齐模型及其动力系统 (49)
(三)微分方程定性稳定性判别方法简介 (53)
(1)稳定性与渐进稳定性 (53)
(2)稳定性判别基本定理 (53)
(2)平面动力系统的奇点 (54)
一、什么是动态优化?
例:一个企业将原料从初始状态A通过五道工序,变为总结状态Z,每个阶段的选择对应一个阶段的成本,如何选择路径使得总成本最小化?
从这个例子中可以看到:首先,动态强调的是时期之间的联系,而不仅仅是有时间的顺序;其次,这里也包含了Bellman方程的基本原理。
如果是连续时间呢?(相加变为积分)
(一)动态优化问题的基本要素
由此可见,一个动态优化问题包含以下几个要素:
(1)一个给定的初始点和终点(终点不一定给定,后面详细说明)
(2)一组允许的路径
(3)对应于路径的指标(不同路径之间有什么不同的影响)
(4)特定目标,通过对路径的选择来实现目标。
(二)泛函及其相关概念
和之前的静态优化相比,动态优化的目标依赖于“路径”的选择,而不是某个变量(实数)的选择。从而,这个可优化的目标是“函数”到“实数”的映射,我们称之为“目标泛函”。
我们记为V[y(t)](注意与复合函数相区别),表示目标泛函的值取决于函数y(t)。和微积分中的微分类比,微积分中的微分是自变量做微小变动后所导致的函数值的变动,而这里则是“路径”或者函数本身发生微小变动所导致的“泛函值”的变动,也就是“变分”。后面的变分法也就是这个思路。
(三)可变终结点
除了上文图中的固定终结点之外,还存在以下几种可变终结点:
(1)固定时间问题(垂直终结线问题):终结时间固定,但终结状态自由。
(2)水平终结线问题:终结状态固定,但终结时间自由。(3)终结曲线(曲面)问题
(四)横截条件
相比于固定终结点问题,可变终结点多了一个自由度,因此在确定最优路径的时候我们需要多一个条件,这个条件通常是来描述最优路径在穿过终结时刻时候的状态,被称为“横截条件”。
(五)目标泛函
在优化问题中,我们需要选择一个最优路径,那么最优意味着比较,比较的
是什么,取决于不同的路径如何影响我们关心的问题。
类似前面离散时间问题中不同路径在不同阶段对应着不同的成本,我们抽象
出一个路径在t 时刻,对应着的对优化目标的影响为该时点上的值为F(t,y,y’)。我们可以看到,这意味着在任何一时点,路径本身的值y 和y 对时间的导数y’都会影响我们的目标。将每一时点上的值加总在一起,我们就得到一个积分的形式,这是关于路径y(t)的泛函,是我们优化的目标,即目标泛函:
V[y]=0(,,)T
F t y y dt '⎰