第六章最优控制-PPT精品
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最优控 u*(制 t):满足上述条作 件用 u的 (t)。 控制 最优轨 x*(t线 ):在 u*(t)作用下状态方程的解。 最优指 J*: 标沿最优x*(轨 t),线使性能J所 指达 标到的最
6.2 静态最优控制问题的解 (多元普通函数极值的解法)
静态最优化:J是一个多元普通函数
一、一元函数的极值:
第六章 最优控制
着重介绍最优控制系统的基本概念、基 本理论及其应用。
要点: 1 最优控制的概念 2 变分法 3 极小值原理 4 动态规划 5 线性最优控制器的设计
难点: 线性最优控制器的设计
6.1最优控制问题概述
一、最优控制
(一)最优控制目的
设计一个就某种性能指标或设计指标而言 是最好的系统。即利用u(t)使x(t)选择一条达到 目标的最好途径,即最优轨线。
(二)最优控制问题 一个系统在某些约束条件下寻找它的最好
的控制过程u(t)的问题。
最优控制问题包括:
1、描述受控系统的状方态程
x(t) f x(t),u(t),t
2、评价性能指标目 好标 坏泛 的函数
J=[x(tf
)]
tf t0
L[x(t),u(t),t]dt
式中x(: t),u(t)是t的函数 J是, x(t),u(t)的函数
H
x H
u
H
f x f u
(g x
(g u
g (x,u
)T )T )0
0 0
[例 6- 2]求J使 f(x,u)12xTQ1x12uTQ2u取极x值 *和 u的 *。 它满足约 g(x束 ,u)条 x件 Fud0,其 Q1, 中 Q2均为正 矩阵 F为 ,任意矩阵。
f x2
10 x2
2 x3
6
0
f x3 2 x3 2 x2 2 x1 0
x1 1, x2 1, x3 2
联立解得
故极值点为 x* 1 1 2T 。
又从 2fx 2xf2 得海赛矩阵
4 0 2
2f x2
0
10 2
2 2 2
是正定的x。 1 故 1 -2T为极小x值 *, f的 点极小 f* 值f(x*)0
(3)可变终端: x(t f ) f
其中 f
u(t) j ( x,u)0
是由约束条件 j (x,u) 0所形成的一个目标集。
(二)给出目标函数
1、性能指标表达式:
J
[x(t f )]
tf t0
L[x(t),u(t),t]dt
N 1
J [x(N)] L[x(k),u(k),k]
2、讨论: k0
2.控制作用域 (1)控制集U
U u(t) j (x,u)0
U是在Rr空间中,满足某些约条束件j (x,u) 0
( j 1,2, m)的点u(t)的集合。 (2)容许控制: 属于U的u(t),即u(t) U
3、始端条件:
(1)固定始端:最优的 控初 制始时t刻 0和初始状x态(t0)都给定。
说明: (1)H称为拉格朗日函数是,一它个没有约束的函数 (2)用H所求的极值就是目数标的函极值。
因为可证明,将求x*, 出u的 *,*代入Tg(x,u) 0
(二)拉格朗日函数H极值的解法
H 存在极值的必要条件是
:
பைடு நூலகம்
( 1) H 0,( 2) H 0,( 3) H 0
x
u
将必要条件展开得:
J是函数的函数函 ,数 称, 为简 泛称泛函。
(三)最优控制类型
1、静态最优控制:输出与输入关系为代数方程,目标函 数为普通函数。
2、动态最优控制:输出输入关系为微分方程,J为泛函数。
二、研究最优控制的前提条件 (一)已知约束条件:
1、受控系统的状态方程 连续时间系x(t统 ): f[x(t),u(t),t] 离散时间系x(k统1: ) f[x(k),u(k),k]
(2)自由始端:在给 t0情定况下, x(t0)可以任意取值,不制 受。 限
(3)可变始端x: (t0)0,x(t0)满足某些约束条件
j[x(t0)]0,j 1,2, ,m
相应的始端集0
u(t) j (x,u)0
4、终端条件:
(1)固定终端: t f 和x(t f )都给定
(2)自由终端: t f 给定,x(t f )可任意取值
它取极值的必要必要条
件是 f 0 u
或函数的梯度为零向量
:
f f
fu
[ u1
, u2
,
f ]T = 0 un
取极小值的充要: 条 uf =件 0, u2是 f2 0 即下列海德矩阵矩为阵正定
2 f
u12
2 f u2
2 fu
2 f
u2u1
2 f
unu1
2 f
u1u2
2 f
u22
2 f
unu2
2 f
u1un
2 f
u2un
2 f
un2
[例 6-1]设 f f ( x ) 2 x12 5 x2 2 x33 2 x2 x3 x3 x1 6 x2 3, 试求 f的极值点及其极小值。
解:由极值必要条件 f x 0得
f x1 4 x1 2 x3 0
设J f (u)为定义在闭区间[a,b]上的单值连续可微函数 则存在极值点u*的必要条件是 f (u) uu* 0 u*的极小值点充要条件是f (u) 0, f (u) 0
二、多元函数的极值
设 n 元函数 f f ( u ), u [ u 1 , u 2 u n ]T 为 n 维列向量。
(1)第一项为终端指数 标, 函称为终端项。在 保终 证端时t刻f 时,系统的终端状与 态给 能定的终端状态接 尽近 量。
(2)第二项为动态指数 标, 函称为积分项。系 保统 证的某些
综合性能。
(3)仅有终端项时, J为称终端型性能指标有 ,积 仅分项时,
称J为积分型性能指标。
小结: 最优控制问题可:供就选是择从的容U中 许, 控寻 制 控制向 u(t), 量使受控系统[t0, 在tf ]时 内间 ,域 从x(初 t0) 转移到x(终 tf ) 态 f时,性能 J取指最标小(大)
三、具有等式约束条件极值的解法--拉格朗日乘子法
将具有等式约束条件的极值问题化为约束条件的极值问
题来求解 (一)拉格朗日函数
已知
连续可微的目标函数为
J f (x,u) (1)x n维,u r维
等式约束条件为
g(x,u) 0 (2)gn维向量函数
用乘子向量 乘等式约束并与目 数标 相函 加,构成一个 数H新: HJ Tg f (x,u)Tg(x,u) 是与g同维的列向量。
6.2 静态最优控制问题的解 (多元普通函数极值的解法)
静态最优化:J是一个多元普通函数
一、一元函数的极值:
第六章 最优控制
着重介绍最优控制系统的基本概念、基 本理论及其应用。
要点: 1 最优控制的概念 2 变分法 3 极小值原理 4 动态规划 5 线性最优控制器的设计
难点: 线性最优控制器的设计
6.1最优控制问题概述
一、最优控制
(一)最优控制目的
设计一个就某种性能指标或设计指标而言 是最好的系统。即利用u(t)使x(t)选择一条达到 目标的最好途径,即最优轨线。
(二)最优控制问题 一个系统在某些约束条件下寻找它的最好
的控制过程u(t)的问题。
最优控制问题包括:
1、描述受控系统的状方态程
x(t) f x(t),u(t),t
2、评价性能指标目 好标 坏泛 的函数
J=[x(tf
)]
tf t0
L[x(t),u(t),t]dt
式中x(: t),u(t)是t的函数 J是, x(t),u(t)的函数
H
x H
u
H
f x f u
(g x
(g u
g (x,u
)T )T )0
0 0
[例 6- 2]求J使 f(x,u)12xTQ1x12uTQ2u取极x值 *和 u的 *。 它满足约 g(x束 ,u)条 x件 Fud0,其 Q1, 中 Q2均为正 矩阵 F为 ,任意矩阵。
f x2
10 x2
2 x3
6
0
f x3 2 x3 2 x2 2 x1 0
x1 1, x2 1, x3 2
联立解得
故极值点为 x* 1 1 2T 。
又从 2fx 2xf2 得海赛矩阵
4 0 2
2f x2
0
10 2
2 2 2
是正定的x。 1 故 1 -2T为极小x值 *, f的 点极小 f* 值f(x*)0
(3)可变终端: x(t f ) f
其中 f
u(t) j ( x,u)0
是由约束条件 j (x,u) 0所形成的一个目标集。
(二)给出目标函数
1、性能指标表达式:
J
[x(t f )]
tf t0
L[x(t),u(t),t]dt
N 1
J [x(N)] L[x(k),u(k),k]
2、讨论: k0
2.控制作用域 (1)控制集U
U u(t) j (x,u)0
U是在Rr空间中,满足某些约条束件j (x,u) 0
( j 1,2, m)的点u(t)的集合。 (2)容许控制: 属于U的u(t),即u(t) U
3、始端条件:
(1)固定始端:最优的 控初 制始时t刻 0和初始状x态(t0)都给定。
说明: (1)H称为拉格朗日函数是,一它个没有约束的函数 (2)用H所求的极值就是目数标的函极值。
因为可证明,将求x*, 出u的 *,*代入Tg(x,u) 0
(二)拉格朗日函数H极值的解法
H 存在极值的必要条件是
:
பைடு நூலகம்
( 1) H 0,( 2) H 0,( 3) H 0
x
u
将必要条件展开得:
J是函数的函数函 ,数 称, 为简 泛称泛函。
(三)最优控制类型
1、静态最优控制:输出与输入关系为代数方程,目标函 数为普通函数。
2、动态最优控制:输出输入关系为微分方程,J为泛函数。
二、研究最优控制的前提条件 (一)已知约束条件:
1、受控系统的状态方程 连续时间系x(t统 ): f[x(t),u(t),t] 离散时间系x(k统1: ) f[x(k),u(k),k]
(2)自由始端:在给 t0情定况下, x(t0)可以任意取值,不制 受。 限
(3)可变始端x: (t0)0,x(t0)满足某些约束条件
j[x(t0)]0,j 1,2, ,m
相应的始端集0
u(t) j (x,u)0
4、终端条件:
(1)固定终端: t f 和x(t f )都给定
(2)自由终端: t f 给定,x(t f )可任意取值
它取极值的必要必要条
件是 f 0 u
或函数的梯度为零向量
:
f f
fu
[ u1
, u2
,
f ]T = 0 un
取极小值的充要: 条 uf =件 0, u2是 f2 0 即下列海德矩阵矩为阵正定
2 f
u12
2 f u2
2 fu
2 f
u2u1
2 f
unu1
2 f
u1u2
2 f
u22
2 f
unu2
2 f
u1un
2 f
u2un
2 f
un2
[例 6-1]设 f f ( x ) 2 x12 5 x2 2 x33 2 x2 x3 x3 x1 6 x2 3, 试求 f的极值点及其极小值。
解:由极值必要条件 f x 0得
f x1 4 x1 2 x3 0
设J f (u)为定义在闭区间[a,b]上的单值连续可微函数 则存在极值点u*的必要条件是 f (u) uu* 0 u*的极小值点充要条件是f (u) 0, f (u) 0
二、多元函数的极值
设 n 元函数 f f ( u ), u [ u 1 , u 2 u n ]T 为 n 维列向量。
(1)第一项为终端指数 标, 函称为终端项。在 保终 证端时t刻f 时,系统的终端状与 态给 能定的终端状态接 尽近 量。
(2)第二项为动态指数 标, 函称为积分项。系 保统 证的某些
综合性能。
(3)仅有终端项时, J为称终端型性能指标有 ,积 仅分项时,
称J为积分型性能指标。
小结: 最优控制问题可:供就选是择从的容U中 许, 控寻 制 控制向 u(t), 量使受控系统[t0, 在tf ]时 内间 ,域 从x(初 t0) 转移到x(终 tf ) 态 f时,性能 J取指最标小(大)
三、具有等式约束条件极值的解法--拉格朗日乘子法
将具有等式约束条件的极值问题化为约束条件的极值问
题来求解 (一)拉格朗日函数
已知
连续可微的目标函数为
J f (x,u) (1)x n维,u r维
等式约束条件为
g(x,u) 0 (2)gn维向量函数
用乘子向量 乘等式约束并与目 数标 相函 加,构成一个 数H新: HJ Tg f (x,u)Tg(x,u) 是与g同维的列向量。