05讲 最优控制-变分法-控制问题
优化理论课件(变分法与最优控制理论)
优化理论课件(2)第二部分动态优化:变分法和最优控制理论变分法是处理动态优化的古典方法,现在较少使用,在蒋中一的书中,变分法的思路可用来解释庞特里亚金最大值原理(一阶条件)。
本部分内容主要来自蒋中一《动态最优化基础》。
目录一、什么是动态优化? (3)(一)动态优化问题的基本要素 (4)(二)泛函及其相关概念 (4)(三)可变终结点 (5)(四)横截条件 (6)(五)目标泛函 (6)二、变分法 (7)(一)基本问题:固定终结点问题 (7)(1)基本问题及其假定 (7)(2)一阶条件:欧拉方程 (8)(二)推广:多状态变量与高阶导数 (10)(1)多状态变量 (10)(2)高阶导数 (10)(三)可变端点问题 (10)(1)一般性横截条件 (11)(2)垂直终结线问题 (12)(3)水平终结线问题 (12)(4)终结曲线问题,即错误!不能通过编辑域代码创建对象。
(12)(5)截断的垂直终结线问题 (12)(6)截断的水平终结线问题 (13)(7)多变量和高阶导数情形 (13)(四)二阶条件(充分条件) (14)(1)固定端点问题的二阶条件及其二次型检验 (14)(2)凹凸性充分条件 (14)(3)变分 (15)(五)无限期界问题 (16)(1)收敛性 (16)(2)横截条件 (17)(3)充分条件 (17)(六)带约束的优化问题 (17)(1)等式约束 (17)(2)不等式约束 (18)(3)积分约束(等周问题) (19)三、最优控制理论 (20)(一)最优控制理论导论 (20)(二)最大值原理及其横截条件 (21)(1)最简单问题及最大值原理(一阶必要条件) (21)(2)最大值原理的理论基础及其横截条件 (23)(3)自控问题的汉密尔顿函数不变性 (26)(4)推广到多变量 (26)(三)最大值原理的经济学解释及现值的汉密尔顿函数 (27)(1)最大值原理的经济学解释 (27)(2)现值的汉密尔顿函数 (28)(四)充分条件(二阶条件) (29)(1)曼加萨林定理 (29)(2)阿罗条件 (31)(五)无限期界问题 (31)(1)横截条件与反例 (32)(2)作为充分条件一部分的横截条件 (32)(六)有约束的最优控制问题 (33)(1)涉及控制变量的约束 (33)(2)状态空间约束 (39)四、拉姆齐模型 (43)(一)相关理论发展背景 (43)(二)最简单的拉姆齐模型及其动力系统 (45)(三)微分方程定性稳定性判别方法简介 (47)(1)稳定性与渐进稳定性 (47)(2)稳定性判别基本定理 (48)(2)平面动力系统的奇点 (49)一、什么是动态优化?例:一个企业将原料从初始状态A通过五道工序,变为总结状态Z,每个阶段的选择对应一个阶段的成本,如何选择路径使得总成本最小化?从这个例子中可以看到:首先,动态强调的是时期之间的联系,而不仅仅是有时间的顺序;其次,这里也包含了Bellman方程的基本原理。
最优控制问题的变分法解析
最优控制问题的变分法解析在控制论中,最优控制问题是寻找系统在给定约束条件下的最佳控制策略,以使所定义的性能指标取得最优值。
变分法是一种重要的数学工具,被广泛应用于解决最优控制问题。
本文将通过对最优控制问题的变分法解析,探讨其原理、应用和解决方法。
一、最优控制问题的基本原理最优控制问题的基本原理可以通过变分法进行分析。
变分法是数学中研究函数极值问题的一种方法,其关键思想是将函数的变分(变化量)与被考察函数的变化率联系起来。
在最优控制问题中,我们希望找到一个控制函数,使得系统的性能指标(如代价函数)取得最优值。
二、最优控制问题的数学描述最优控制问题通常使用微分方程或差分方程来描述系统的动力学行为。
假设系统的动力学方程为:```dx(t)/dt = f(x(t), u(t))```其中,x(t)为系统的状态向量,u(t)为系统的控制向量,f(x(t), u(t))表示系统的动力学行为。
我们的目标是通过选择合适的控制函数u(t)来最小化一个代价函数J,即:```J = ∫ L(x(t), u(t)) dt + Φ(x(T))```其中,L(x(t), u(t))为运动学指标函数,Φ(x(T))为终点状态指标函数。
通过变分法我们可以得到最优控制问题的欧拉-拉格朗日方程:```L_x - d/dt(L_u) = 0```其中,L_x表示L对x的偏导数,L_u表示L对u的偏导数。
三、最优控制问题的解决方法解决最优控制问题的一种常用方法是动态规划。
基本思想是将问题分解为一系列子问题,并利用最优子结构性质递归求解。
通过将最优控制问题转化为一组哈密顿-雅可比-贝尔曼(HJB)方程,可以得到最优控制的解析解。
此外,还可以采用数值方法,如离散化法和优化法,求得数值近似解。
四、最优控制问题的应用领域最优控制问题在许多领域都有着广泛的应用。
在经济学中,最优控制可用于优化投资组合、经济增长模型等;在工程领域,最优控制可用于优化控制系统、自动驾驶等;在生物学中,最优控制可用于优化生态系统管理、生物过程模型等。
变分法与最优控制问题
变分法与最优控制问题在数学和物理学中,变分法是一种用于求解最优化问题的数学方法,特别适用于求解函数als^565^到l=0的极值点。
最优控制问题是指在给定约束条件下,寻找使得控制系统性能指标最优的控制策略。
本文将介绍变分法与最优控制问题的基本概念和应用。
一、变分法的基本概念变分法是一种通过将问题转化为变分问题,再利用变分法原理对变分问题进行求解的方法。
变分法关注的是函数als^565^的泛函ls^565^= ∫f(als^565^, al'=I0'~I1',其中als^565^是取决于一个或多个独立变量al的函数。
变分问题就是要找到使得泛函ls^565^达到极值的函数als^565^。
二、变分法的应用变分法在数学和物理学中有广泛的应用,特别是在最优控制问题中。
最优控制问题是指在给定的系统模型和性能指标下,寻找使得性能指标最优的控制策略。
变分法在最优控制问题中起到了重要的作用。
在最优控制问题中,我们需要根据系统的状态变量和控制变量,构建系统的数学模型。
然后,通过构建性能指标,将最优控制问题转化为求解一个泛函的极小值问题。
利用变分法的原理,我们可以获得泛函的欧拉-拉格朗日方程,从而得到系统的最优控制策略。
最优控制问题的解决可以为实际应用提供最佳的控制策略。
三、变分法与最优控制问题的应用举例为了更好地理解变分法与最优控制问题,我们举一个简单的例子来说明其应用。
假设有一辆汽车行驶在一段道路上,我们的目标是寻找一种最优的加速度控制策略,使得汽车在最短的时间内到达目的地。
在这个问题中,车辆的位置可以用参数x表示,车辆的速度可以用参数v表示,我们的目标是找到使得到达目的地时间最短的速度曲线v(t)。
首先,我们需要建立车辆的数学模型,这里我们假设车辆的运动服从牛顿第二定律。
通过构建性能指标,我们可以得到泛函的表达式:ls^565^ = ∫[1 + (dht/dt)^2]dt其中dht/dt=t。
最优控制变分法
x(t ) x (t ) (t )
将式(1· 2—5)两边对 t 求导,可得
将式(1· 2—5)、(1· 2—6)代入式(1· 2—3),又得
x(t ) x (t ) (t )
(1· 2—6)
J [ x] L[ x (t ) (t ), x (t ) (t ), t ]dt (1· 2—7) 在式(1· 2—7)中,每选择一个 (t ) ,都可作一条 J [x] 曲 线。选择各式各样的容许的 (t ),可以作出一族 J [x] 曲线,
二、固定端点时间、无约束条件的变分问题 这一节,我们讨论一类最简单的变分问题,即无约束条件、 端点时间固定,只有一个自变量函数的拉格郎问题。通过这个问 题来引出欧拉方程和横截条件。 求解变分问题,就是要把使泛函达到极值的那个自变量函数 找出来,这就需要利用欧拉方程和横截条件。因此,欧拉方程和 横截条件是求解变分问题的基础。 在推导欧拉方程和横截条件时要使用一个定理,这个定理叫 作变分法的基本颈备定理。 本节首先介绍基本预备定理,接着推导欧拉方程,然后讨论 横截条件,最后讨论泛函取极值的充分条件。
2. 欧拉方程 现在,我们来推导欧拉方程和相应的横截条件。首先讨论固定 端点问题,然后讨论未定端点问题。 考虑最简单的泛函
(1· 2—3) L 的极值。其中x(t ) 是 t 二次可微函数; [ x(t ), x(t ), t ],是变量 x, x和 t 连函函数,并且有连续二阶偏导数,端点时间 t 0 和 t f 固定。 首先研究容许函数(或曲线)端点固定的情况,即规定 x(t 0 ) x0 和 x(t f ) x f 。图1—4示出了一族容许函数。现在的 的问题是要从这一族容许函数(或曲线)中找出使泛函J取极值的函数(或 曲线),即极值函数或极值曲线。
无穷维空间上的变分方法和最优控制
无穷维空间上的变分方法和最优控制在数学和控制理论中,变分方法和最优控制是两个相关且重要的概念。
它们是为了解决在无穷维空间中的问题而开发的技术和工具。
本文将介绍无穷维空间上的变分方法和最优控制的基本原理和应用。
一、无穷维空间中的变分问题在传统的微分方程理论中,我们通常考虑有限维空间上的问题。
然而,在某些情况下,我们需要考虑无穷维空间上的问题,例如描述连续介质的偏微分方程、描述量子力学的波函数等等。
在无穷维空间上,我们无法通过代数方程来求解问题,而是需要使用变分法。
变分法是一种基于变分原理的数学方法,它通过求解一个函数的极值问题来获得函数的解。
在无穷维空间中,我们需要考虑无穷维函数的变分问题。
其中最基本的概念是泛函,泛函是一个将函数映射到实数的映射。
我们可以定义一个泛函的变分,并通过求解变分问题来得到泛函的极值。
二、无穷维空间中的最优控制最优控制是一种寻找系统在一定性能指标下的最优控制策略的方法。
在有限维空间中,最优控制问题可以使用动态规划等方法求解。
然而,在无穷维空间中,最优控制问题更加复杂。
例如,在描述连续介质的方程中,我们需要确定一个无穷维函数,使得系统在一定约束条件下的性能指标最优。
为了解决无穷维空间中的最优控制问题,我们需要使用变分方法。
首先,我们可以构建一个性能指标函数,它是一个泛函,并且依赖于控制和系统状态。
然后,我们可以通过求解变分问题来得到最优控制策略。
最优控制问题的解通常是一个偏微分方程,这是由于在无穷维空间中,控制策略本身是一个无穷维函数。
三、无穷维变分和最优控制的应用无穷维变分方法和最优控制方法在许多领域中都有广泛的应用。
在物理学中,它们被用来描述量子力学和连续介质的性质。
在工程学中,它们被用来优化控制系统的性能,并设计高级控制策略。
在经济学中,它们被用来优化经济系统的决策和规划。
例如,变分方法和最优控制方法在航空航天领域有重要的应用。
通过应用变分方法,我们可以找到航天器的最佳轨道和姿态控制策略,以实现最佳的任务执行和能源利用。
第6章 用变分法求解最优控制问题
x(t) = x*(t) +εη(t) = x*(t) +δ x(t)
§6-2 泛函与变分的基本概念
3.泛函的变分 ● 泛函的增量 由自变量函数 x(t) 的变分δ x(t)引起泛函 J[ x(t)]的增量
∆J = J[ x*(t) +δ x(t)] − J[x*(t)] 为泛函 J[ x(t)] 的增量。
§6-2 泛函与变分的基本概念
一. 泛函与泛函的变分 1. 泛函的定义 对于某一类函数集合{x(t)} 中的每一个函数 x(t),均有一个确定的数 J 与之对应,则称 J 为依赖于函数 x(t) 的泛函,记作
J = J[x(⋅)] = J[x(t)]
函数值。 例泛函:
J[x(t)] 中的 x(t)应理解为某一特定函数的整体,而不是对应于 t 的
α = ∫ 2[x(t) + δ x(t)]δ x(t)dt α=0
0
1
= ∫ 2x(t)δ x(t)dt
0
1
§6-2 泛函与变分的基本概念
二. 泛函的极值 1. 泛函极值的定义 如果泛函 J[x(t)] 在 x(t) = x (t) 的邻域内,其增量
*
∆J = J[x(t) − x*(t)] = J[x(t)] − J[x*(t)] ≥ 0
∂ J[x*(t) +αδ x(t)] α=0 = 0 ∂α ∂ J[x*(t) +αδ x(t)] α=0 = δ J[x*(t)] = 0 ∂α
§6-3 无约束条件的变分问题
引理:如果函数 F(t) 在区间 [t0, t f ] 上是连续的,而且对于只满足某些 一般条件的任意选定的函数
η(t) 有
第六章 用变分法求解最优控制问题
最优控制问题的变分法解析
最优控制问题的变分法解析最优控制问题是应用数学中的一个重要分支,目标是通过对系统的动力学方程和性能指标进行数学建模,找到使性能指标最优化的控制策略。
在寻找最优控制策略的方法中,变分法起到了至关重要的作用。
本文将对最优控制问题的变分法进行解析,介绍其基本原理和应用方法。
一、变分法的基本原理变分法是数学中的一种计算最优化问题的方法,它基于函数的变分性质进行求解。
在最优控制问题中,我们通过变分法来求解函数的最小值,即找到一条函数曲线使得性能指标达到最优。
变分法的基本思想是将函数曲线看作是一个整体,通过对其进行微小的扰动来求解极值。
二、最优控制问题的变分表述最优控制问题通常可以用一组动力学方程和性能指标函数来表述。
假设已知系统的状态方程为:dx(t)/dt = f(x(t), u(t), t)其中,x(t)表示系统的状态,u(t)表示控制变量,t表示时间。
我们的目标是通过选择合适的控制变量u(t),使得性能指标函数J[x(t), u(t), t]最小化。
性能指标函数通常由目标状态和控制变量的组合表示。
为了求解最优控制问题,首先定义一个泛函:J[u(t)] = ∫L(x(t), u(t), t)dt其中,L(x(t), u(t), t)表示拉格朗日函数,它由性能指标函数和动力学方程组合而成。
通过对泛函J[u(t)]进行变分的方式,我们可以得到最优控制问题的欧拉-拉格朗日方程:δJ[u(t)]/δu(t) = 0三、求解最优控制问题的步骤1. 构建拉格朗日函数L(x(t), u(t), t):根据最优控制问题的具体要求,我们可以选择合适的拉格朗日函数。
通常情况下,拉格朗日函数由系统的动力学方程和性能指标函数组合而成。
2. 求解欧拉-拉格朗日方程:将拉格朗日函数带入欧拉-拉格朗日方程,利用变分法的原理求取控制变量u(t)。
3. 验证最优性条件:通过对极值条件的验证来确定所得到的解是否是最优解。
验证的方法包括极大极小值的判断、边界条件的验证等。
变分法求解最优控制
J (u(t )) (t f , x(t f )) F (t, x(t ), u(t ))dt
t0 tf
性能指标J(u(t))在数学上称为泛函,在控 制系统中称为损失函数。
变分法基本概念
1.泛函
设S 为一函数集合,若对于每一个函数 x(t)∈S有一个实数J 与之对应,则称J 是 定义在S 上的泛函,记作J (x(t))。S 称为 J 的容许函数集。
t0
tf
再令 J 1 0 ,由 便得:
dt f ,x(t f ),x,u, 的任意性,
(i) x * , * 必满足正则方程: 1.状态方程
x H f (t, x, u)
2.协态方程
H x
* *
(ii)哈密顿函数 H (t, x , u, ) 作为u的函数,也 必须满足
定义一个标量函数:
H (t, x, u, ) F (t, x, u) T (t ) f (t, x, u)
称为哈密顿函数。所以新的性 能指标为
J 1 ( x, u, ) (t f , x(t f )) [ H (t, x, u, ) T x]dt
t0 tf
t0 tf
d (dt fy) [t f fF xt ,yxdx , t ) t t f F'( ) y ) ( (, ) , u dy a (
T
b( y )
] [x(t f )] x (t f )
T
T tf
[(x) H x (u) H u ( ) H ( ) x]dt (t f )x t t f (x)T dt t0 f y ( x, y)dx f [b( y), y)]b' ( y) f [a( y), y)]at'0( y)
最优控制第1章 变分法
则称泛函f((x)在 x0 处是连续的。 定义2(泛函的连续性)若对任意给定的 ε > 0 ,总存 在 δ > 0,当 x(t) − x0 (t) ≤ δ 时,就有:
| J [ x(t )] − J [ x0 (t )] |< ε
其中,x(t)为在[0,3]上连续可积函数。J[x]表示由函数x(t) 在区间[0,3]上围成区域的面积。 当 x(t)=t 时,有J[x]=4.5 ;当 x( t ) = e t 时,有 J [ x] = e3 − 1 。 ¾ 通俗地说,泛函就是“函数的函数” 。 ¾ 泛函与函数的区别: 仅在于泛函的宗量(自变量函数) x(t) 是函数,而函数的自变量x是变数(独立变量)。
则称泛函J[x(t)]在 x0(t) 处是连续的。
定义3' (线性函数) 如果函数f(x) 满足: (1)齐次性:f (ax) = af ( x) ∀x ∈Ω, a ∈ R, ax ∈Ω (2)叠加性:f ( x1 + x2 ) = f ( x1) + f ( x2 ) ∀x1, x2 , x1 + x2 ∈Ω 则称函数f(x)是线性函数。 根据定义,容易判断f(x)=2x是线性函数,g(x)=2/x是非线性 函数。 定义3 (线性泛函)如果泛函J[x(t)] 满足: (1)齐次性: J[ax(t )] = aJ[ x(t )] (2)叠加性: J[ x1(t ) + x2 (t )] = J[ x1(t )] + J[ x2 (t )] 则称泛函J[x(t)]是线性泛函。
暂态性能、稳态误差等控制性能。
一、最优控制问题的几个实例 1. 登月舱的月球软着陆问题
为使宇宙飞船在月球表面上实现软着陆,必须寻求着陆过 程中发动机推力的最优控制规律,使燃料的消耗量最少。 设飞船的质量为m(t),离月球表面的高度为h(t),飞船的垂 直速度为v(t),发动机推力为u(t),月球表面的重力加速度 为g,不携带燃料的飞船质量为M,初始燃料的质量为F, 则飞船的运动方程可表示为:
变分法及其在最优控制中的应用
2.欧拉方程的全导数形式
基础知识:设函数 z f (x, y, z)
则: dz f dx f dy f dz dt x dt y dt z dt
在<10>式中, d 为全导数
dt x(t)
令
z
d dt
x
g(x, x,t)
dz dt
d dt
x
x
x
dx dt
x
x
dx dt
t
x
dt dt
当 : x(t) t 2 x(t) 0.2t 时
x(t)
(1,1) (1,0.2) (1,0.1)
t
J 10.2t 3dt 1
0
20
J
1
0.4t
3dt
1
0
10
< 定理1 > 如果泛函J[ y(x)] 是可微的,则泛函的变分为:
J[ y(x)] J[ y(x) y(x)]
0
证明从略,见P 46页 证明进一步,多元函数的变分为: 即:
t0
tf
注: = + t f t f t0 t0
tf t0 t0
t f t f tf
— = — — t0 t0
t0
t0 t0
tf
tf
t0
对 函数 L 在[x, x,t] 处进行泰勒展开,则:
J t f L(x, x,t)dt t0
tf t0
(
L x
h
L x
h)dt
t f L(x, x,t)dt t0
x(t f )
xf t
<4> 端点变动的情况:(3.2.2)
1>自由端点,无约束条件的变分,如图:
用变分法求解最优控制问题
与以前不同的是,在动态问题中拉格朗日乘子 向量(t) 是时间函数。
在最优控制中经常将 (t )称为伴随变量,协态(协状 态向量)或共轭状态。引入 (t) 后可作出下面的增 广泛函
Ja X (t f ),t f
tf t0
FX ,U,t T (t) f (X ,U,t) X
对上式第二项作分部积分,按公式
可得
t f t0
udv uv
tf t0
t f vdu
t0
J
tf t0
F x
d dt
(
F x
)xdt
F x
x
tf t0
(5-2)
J取极值的必要条件是 J 等于零。因 x是 任意的,要使(5-2)中第一项(积分项)为 零,必有
x* (t) sht sh1
例5-2 求使指标
J 1 (x 2 x3 )dt 0
取极值的轨迹 x* (t) ,并要求 x* (0) 0 ,但对 x* (1) 没有限制。
解 这是终端自由的情况。欧拉—拉格朗日方程为
d (2x 3x 2 ) 0 dt即2x Fra bibliotek 3x 2 常数
d dt
(
F X
)
dt
X
T
F X
tf t0
向量欧拉——拉格朗日方程为
F X
d dt
(
F X
)
0
式中
F
x1
F
F X
x
2
F
用变分法求解最优控制问题
tf t0
F
x
x
F x
x
o
(
x)2, (
x)
2
dt
上式中 o[( x)2 , ( x)2 ]是高阶项。
(泰勒级数展开)
根据定义,泛函的变分 J 是 J 的线性
主部,即
J
tf t0
F x
x
F x
x dt
与以前不同的是,在动态问题中拉格朗日乘子 向量(t) 是时间函数。
在最优控制中经常将 (t )称为伴随变量,协态(协状 态向量)或共轭状态。引入 (t) 后可作出下面的增 广泛函
Ja X (t f ),t f
tf t0
FX ,U,t T (t) f (X ,U,t) X
F x
d dt
(
F x
)
0
(5-3)
上式称为欧拉——拉格朗日方程。
(5-2)式中第二项为零的条件要分两种情况来讨论:
1、 固定端点的情况
这时 x(t0 ) x0 , x(t f ) x f ,它们不发生变化,所 以 x(t0 ) x(t f ) 0 。而(5-2)中第二项可写成
第五章 用变分法解最优控制 —泛函极值问题
本章主要内容
5.1 变分法基础 5.2 无约束条件的泛函极值问题 5.3 有约束条件的泛函极值——动态系
统的最优控t f 制问题 5.4 小结
在动态系统最优控制问题中,性能指标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面再次列出变 分法中的一些主要结果,可对照微分学中的结果来 理解,以加深印象及理解。
变分法与最优控制
2.1 变分法概述
1、泛函定义
定义: 如果变量y对于某一函数类中的每一个函数 x(t),都有一个确定的值与之对应,那么就 称变量y为依赖于函数x(t)的泛函,记为: y=J [x(t)]。
说明:由于函数的值是由自变量的选取而确定的,而泛函 的值是由自变量的函数的选取而确定的,所以将泛函理解 为“函数的函数”。
点向较低的B点滑动,如果不考
虑各种阻力的影响,问应取怎样 的路径,才能使所经历的时间最 短?
结论:最速降线是一条圆滚线。
B(xf,yf)
y
在A、B两点所在的竖
直平面内选择一坐标系,
如上图所示。A点为坐 标原点,水平线为x轴, 铅垂线为y轴。
向量欧拉方程
对于向量空间的泛函,也存在着欧拉方程,不 过是欧拉方程组(即向量欧拉方程)。
若给定曲线x(t)的始端x(t0)= x0和终端x(tf)= xf,
J[x(t) ] tf L[x(t)x ,(t)t,]dt t0
达到极值的必要条件是,曲线x(t)满足欧拉方程
Lx ddtLx0 或
欧拉(Euler)方程
其中x(t)应有连续的二阶导数, L[x(t)x ,(t)t,] 则至少应是二次连续可微的。 (证明略)
2.2 无约束最优化问题
1、无约束固定端点泛函极值必要条件
问题 2-1 无约束固定终端泛函极值问题为:
其中, L[x(t),及x(tx)(,tt)]在[t0,tf]上连续可微, t0及tf固定, x(t0)= x0,x(tf)= xf, x(t)Rn
求满足上式的极值轨线x*(t)。
边界条件
定理2-5 则泛函
(证明略)
定理2-2 连续泛函J(x)的二次变分定义为
(证明略)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∂L d ∂L = 0 − ∂y dx ∂y′ f =0
能源与动力学院系统控制与仿真研究室 3
最优控制——变分法 2.1变分法基本概念和原理
能源与动力学院系统控制与仿真研究室
4
能源与动力学院系统控制与仿真研究室
5
能源与动力学院系统控制与仿真研究室
6
最优控制——变分法 2.1变分法基本概念和原理
能源与动力学院系统控制与仿真研究室
33
最优控制——变分法 2.2变分法解最优控制问题
能源与动力学院系统控制与仿真研究室
34
最优控制——变分法 2.2变分法解最优控制问题
∂H x = = f ( x ( t ) , u ( t ) , t ) , x (= t0 ) x0 ∂λ = − ∂H λ ∂x ∂H =0 u ∂ T ∂F ∂N = + t λ γ ( ) f ∂x ( t f ) ∂x ( t f ) T T ∂ ∂ ∂F F N H t = λ T x T T − + x − − γ γ t ( ) ( ) f f tf ∂t f ∂x ( t f ) ∂x ( t f ) ∂N ∂F T = − −γ ∂t f ∂t f
γ )
23
T
能源与动力学院系统控制与仿真研究室
最优控制——变分法 2.2变分法解最优控制问题
能源与动力学院系统控制与仿真研究室
24
最优控制——变分法 2.2变分法解最优控制问题
能源与动力学院系统控制与仿真研究室
25
最优控制——变分法 2.2变分法解最优控制问题
例
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室 18
(波尔扎(Bolza)问题)
最优控制——变分法 2.2变分法解最优控制问题
与前面所讲的变分问题相比较,波尔扎 问题具有下面两个特点:
• 性能泛函有两项 • 属于等式约束的泛函条件极值问题。 •这里的约束是指状态方程,不是控制域
x f ( x (t ) , u (t ) , t ) , t ∈ t0 , t f = tf x (t f ) , t f + ∫ L = u ( ) F x (t ) , u (t ) , t dt J t 0 x (t0 ) = x0 N x (t f ) , t f = 0
26
最优控制——变分法 2.2变分法解最优控制问题
解:
能源与动力学院系统控制与仿真研究室
27
最优控制——变分法 2.2变分法解最优控制问题
最优控制
= 18t − 10 u
∗
最优轨线
x ( t )= 3t − 5t + t + 1 ∗ 2 = − + x t 9 t 10 t 1 ( ) 2
x f ( x (t ) , u (t ) , t ) , t ∈ t0 , t f tf x ( t f ) + ∫ L J = u ( ) F dt t0 x ( t ) , u ( t ) , t x (t0 ) = x0 =0 x N t ( ) f
肖玲斐 lfxiao@
最优控制 前次课程回顾——变分法
泛函极值问题及相关结论
•条件极值问题 •角点问题
能源与动力学院系统控制与仿真研究室
2
最优控制——变分法
重点掌握
用拉格朗日(Lagrange)乘 子法求解条件极值问题
T ′ ′ L ( x= , y , y , λ ) L ( x, y , y ) + λ f ( x, y )
最优控制问题描述 最优控制问题求解 •终端时刻tf固定,终端状态x(tf)受约束 •终端时刻tf自由,终端状态x(tf)受约束
能源与动力学院系统控制与仿真研究室
17
最优控制——变分法 2.2变分法解最优控制问题
最优控制问题求解
• 当容许控制为开集时 • 考虑复合型性能指标最优控制问题
x f ( x (t ) , u (t ) , t ) , t ∈ t0 , t f = tf x (t f ) , t f + ∫ L = u ( ) F dt J t0 x ( t ) , u ( t ) , t x (t0 ) = x0 x (t f ) , t f N =0
∗ 1
能源与动力学院系统控制与仿真研究室 30
最优控制——变分法 2.2变分法解最优控制问题
(3)情形3:
能源与动力学院系统控制与仿真研究室
31
最优控制——变分法 2.2变分法解最优控制问题
最优控制 最优轨线
6 12 u t− = 7 7
∗
1 3 6 2 ∗ x t t t t 1 = − + + ( ) 1 7 7 x ∗ ( t ) = 3 t 2 − 12 t + 1 2 7 7
40
肖玲斐 lfxiao@
能源与动力学院系统控制与仿真研究室 19
最优控制——变分法 2.2变分法解最优控制问题
终端状态的几种情形
能源与动力学院系统控制与仿真研究室
20
最优控制——变分法 2.2变分法解最优控制问题
能源与动力学院系统控制与仿真研究室
21
最优控制——变分法 2.2变分法解最优控制问题
终端时刻tf固定,终端状态x(tf)受约束
能源与动力学院系统控制与仿真研究室
39
思考题
2.6 设系统状态方程为
x ( 0 ) 1, = x (t f ) 0 给定边界条件为 = 求使性能指标 t
1 f 2 2 = J x + u dt ( ) ∫ 2 0
(t ) = x − x (t ) + u (t )
为极小的最优控制和最优轨线
能源与动力学院系统控制与仿真研究室
∗ 1 3 2
能源与动力学院系统控制与仿真研究室 28
最优控制——变分法 2.2变分法解最优控制问题
(2)情形2: 终端时刻固定tf=1且终端状态自由
能源与动力学院系统控制与仿真研究室
29
最优控制——变分法 2.2变分法解最优控制问题
最优控制
u =0
∗
最优轨线
x (t )= t + 1 ∗ = x t 1 ( ) 2
能源与动力学院系统控制与仿真研究室
22
最优控制——变分法 2.2变分法解最优控制问题
泛函极值条件
∂H x = ∂λ λ = − ∂H ∂x ∂H ∂u = 0 ∂N F ∂ = λ (t f ) + ∂x ( t f ) ∂x ( t f
最优化问题的数学描述和解与时间的关 系,可以划分为两类: •静态最优化(与时间无关) •动态最优化(与时间有关) ——最优控制问题
能源与动力学院系统控制与仿真研究室
9
最优控制——变分法 2.2变分法解最优控制问题
静态最优化
动态最优化
能源与动力学院系统控制与仿真研究室
10
最优控制——变分法 2.2变分法解最优控制问题
能源与动力学院系统控制与仿真研究室 32
最优控制——变分法 2.2变分法解最优控制问题
终端时刻tf自由,终端状态x(tf)受约束
x f ( x (t ) , u (t ) , t ) , t ∈ t0 , t f tf x (t f ) , t f + ∫ L = u ( ) F dt J t0 x ( t ) , u ( t ) , t x (t0 ) = x0 =0 x N t t , ( ) f f
能源与动力学院系统控制与仿真研究室
7
最优控制——变分法 2.2变分法解最优控制问题
最优控制问题描述 最优控制问题求解 •终端时刻tf固定,终端状态x(tf)受约束 •终端时刻tf自由,终端状态x(tf)受约束
能源与动力学院系统控制与仿真研究室
8
最优控制——变分法 2.2变分法解最优控制问题
能源与动力学院系统控制与仿真研究室
12
最优控制——变分法 2.2变分法解最优控制问题
最优控制问题的描述
x f ( x (t ) , u (t ) , t ) , t ∈ t0 , t f tf x (t f ) , t f + ∫ L u ( ) x (t ) , u (t ) , t J F dt = t0 x (t0 ) = x0 =0 x t , t ( ) f f N umin ≤ u ≤ umax
最优控制: 最优轨线:
u (t f ) = − 2
∗ ∗
x (t ) = − 2t + 1
∗
1 t = f 终端时刻: 2 1 1 最优泛函值: J = + = 2 2 2
能源与动力学院系统控制与仿真研究室 38
最优控制——变分法 2.1变分法基本概念和原理
重点掌握
最优控制问题求解 横截条件 协态方程 控制方程
能源与动力学院系统控制与仿真研究室 13
最优控制——变分法 2.2变分法解最优控制问题
能源与动力学院系统控制与仿真研究室
14
最优控制——变分法 2.2变分法解最优控制问题