第4章 最优控制

合集下载

最优控制理论课件

最优控制理论课件

8
最优控制问题
1.1 两个例子
例1.1 飞船软着陆问题
软着陆 过程开 始时刻 t 为零
h& v
v& u g m
m& K u
m 飞船的质量 h 高度 v 垂直速度 g 月球重力加速度常数 M 飞船自身质量 F 燃料的质量 K 为常数
初始状态 h(0) h0 v(0) v0 m(0)MF
f(x(t),u(t),t) 为n维向量函数
22.03.2020
现代控制理论
24
最优控制问题
1.2 问题描述
(1) 状态方程 一般形式为
x&(t) f (x(t),u(t),t)
x(t) Rn
x(t)|tt0 x0
为n维状态向量
u(t) Rr
为r 维控制向量
f(x(t),u(t),t) 为n维向量函数
求解最优控制的变分方法
泛函与函数的几何解释
22.03.2020
现代控制理论
50
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
22.03.2020
现代控制理论
51
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
泛函的增量 J ( x ( g ) ) J ( x ( g ) x ) J ( x ( g ) ) L ( x , x ) r ( x , x )
J x ( T ) ,y ( T ) ,x & ( T ) ,y & ( T ) x & ( T )
控制
(t)
22.03.2020
现代控制理论

最优控制理论第四章.ppt

最优控制理论第四章.ppt
same as in Example 2.2, namely,
Since (t)-1 on [0,1] and x(0)=1>0, the original
optimal control given by (4.11) is u*(t)=-1. Substituting this into (4.8) we get x(t)=1-t, which is positive for t<1. Thus
In case of first order constraints, h1(x,u,t) is as follows:
With respect to the ith constraint hi(x,t)0, a sub
Interval (1,2) [0,T] with 1< 2 is called an interior
i.e., xi(t) 0, i=1,2,…,n. Constraints exhibiting (4.1) are called pure state variable inequality constraints. The general form is
With (4.1): at any point where a component xi(t)>0, the corresponding constraint xi(t) 0 is not binding and can be ignored.
Clearly, the optimal control u* will be the one that keeps x as small as possible, subject to the state constraint (4.1) and the boundary condition x(0)=x(3)=1. Thus,

最优控制全部PPT课件

最优控制全部PPT课件

J
(x(t f ),t f)
tf t0
F(x(t),u(t),t)dt
为最小。
这就是最优控制问题。
如果问题有解,记为u*(t), t∈ [t0,tf],则u*(t)叫做最优控制(极值控制),相应的轨 线X*(t)称为最优轨线(极值轨线),而性能指标J*=J(u*(·))则称为最优性能指标。
第11页/共184页
目标质心的位置矢量和速度矢量为: xM xM
F(t)为拦截器的推力
x xL xM v xL xM
则拦截器与目标的相对运动方程为:
x v v a(t) F (t)
m(t)
m F (t) c
其中a(t)是除控制加速度外的固有相对加速度,是已知的。
初始条件为: x(t0 ) x0 v(t0 ) v0 m(t0 ) m0 终端条件为: x(t f ) 0 v(t f )任意 m(t f ) me
至于末态时刻,可以事先规定,也可以是未知的。 有时初态也没有完全给定,这时,初态集合可以类似地用初态约束来表示。
第9页/共184页
3:容许控制 在实际控制问题中,大多数控制量受客观条件的限制,只能在一定范围内取 值,这种限制通常可以用如下不等式约束来表示:
0 u(t) umax 或ui i 1,2p
给定一个线性系统,其平衡状态X(0)=0,设计的目的是保持系统处于平衡状态,即 这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。
线性调节器的性能指标为:
J
tf t0
n
xi 2 (t)dt
i 1
加权后的性能指标为:
J
tf t0
n
qi xi 2 (t)dt
i1
对u(t)有约束的性能指标为: J t f 1 [ X T (t)QX (t) uT (t)Ru(t)]dt

第4章(1)线性控制系统的能控性和能观性

第4章(1)线性控制系统的能控性和能观性

第4章(1)线性控制系统的能控性和能观性第四章线性控制系统的能控性和能观性在现代控制理论中,能控性(Controllability)和能观性(Observ- ability)是两个重要的概念,它是卡尔曼(Kalman)在1960年提出的,是最优控制和最优估计的设计基础。

能观(测)性针对的是系统状态空间模型中的状态的可观测性,它反映系统的内部状态x(t)(通常是不可以直接测量的)被系统的输出量y(t)(通常是可以直接测量的)所反映的能⼒。

能控性严格上说有两种,⼀种是系统控制输⼊u(t)对系统内部状态x(t)的控制能⼒,另⼀种是控制输⼊u(t)对系统输出y(t)的控制能⼒。

但是⼀般没有特别指明时,指的都是状态的可控性。

所以,系统的能控性和能观性研究⼀般都是基于系统的状态空间表达式的。

4-1 线性连续定常系统的能控性定义对于单输⼊n 阶线性定常连续系统bu Ax x+= 若存在⼀个分段连续的控制函数u(t),能在有限的时间段 []f t t ,0内把系统从0t 时刻的初始状态()0t x 转移到任意指定的终态()f t x ,那么就称系统在0t 时刻的状态()0t x 是能控的;如果系统每⼀个状态()0t x 都能控,那么就称系统是状态完全可控的。

反之,只要有⼀个状态不可控,我们就称系统不可控。

对于线性定常连续系统,为简便计,可以假设00=t ,()0=f t x ,即00=t 时刻的任意初始状态()0x ,在有限时间段转移到零状态()0=f t x (原点)。

4-2线性连续定常系统的能控性判别4-2-1具有约旦标准型系统的能控性判别 1.单输⼊系统具有约旦标准型系统bu x x+Λ==Λn λλλλ0000000000000321n λλλλ≠≠≠≠ 321即为n 个互异根或bu Jx x+==++n m m J λλλλλλ000000000000000100000000121111m 个重根1λn-m 个互异根n m m λλλ≠≠≠++ 21 例:分析下列系统的能控性(1)u b x x+??=221000λλ[]x c c y 21=解:?=111x xλ 1x 与u ⽆关,即不受u 控制 ?+=u b x x2222λ 2x 为能控状态该系统为状态不完全能控,因⽽为不能控系统。

第4章 最优控制与变分法

第4章 最优控制与变分法
1
第4章 最优控制与变分法
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。
4.1 最优控制问题的数学描述 4.2 无约束条件的动态最优化问题 4.3 带等式约束的动态最优化问题 4.4 用哈密顿函数求解最优控制问题
第4章 最优控制与变分法 3、约束条件的数学描述 、
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。
一般约束条件可用如下的等式约束方程或 不等式约束方程来描述: 不等式约束方程来描述:
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。
的质心距离地面的高度, 解 : 设 x(t)为 M的质心距离地面的高度 , 由牛顿第 为 的质心距离地面的高度
(4-1) )
J = θ ( x, t ) t
(4-9) )
性能指标如式(4-9)所示的问题称为迈耶问题 。 所示的问题称为迈耶问题。 性能指标如式 所示的问题称为迈耶问题 该类问题只关注始端和终端时刻的系统状态, 该类问题只关注始端和终端时刻的系统状态 , 而 不关心系统的运动过程, 因此性能指标只是始端、 不关心系统的运动过程 , 因此性能指标只是始端 、 终端时刻和状态的一个函数。 终端时刻和状态的一个函数。
第4章 最优控制与变分法
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。

清华大学最优控制--课程概述

清华大学最优控制--课程概述
3/4
1. 2. 3. 4. 5. 6.

因材施教:个别讨论、email答疑等
4/4
1
2/4
教学安排

教学安排

教材:最优控制,清华大学出版社
教学管理:作业30% + 开卷笔试70% (课程论文可代替部分或全部笔试) 提交作业要求: 1周内提交

参考书
解学书:最优控制—理论与应用,清华大学出版社 胡中楫等:最优控制原理及应用,浙大出版社 吴受章等:应用最优控制,西交大出版社 王朝珠等:最优控制原理,科学出版社 B.D.O.Anderson and J.B. Moore: Linear Optimal Control, Prentice-Hall F.L. Lewis and V.L. Syrmos: Optimal Control, John Wiley & Sons, INC.
教 学 安 排

最优控制
授课教师:钟宜生

总ห้องสมุดไป่ตู้时 32学时 主要教学内容
第1章 第2章 第3章 第4章 第5章 第6章 第7章 第8章 第9章 最优控制问题的提出和数学描述 函数极值的基本理论 最优控制中的变分法 极大值原理 动态规划 时间最短和燃料最省控制 线性二次型最优调节系统设计 最优状态调节系统的鲁棒稳定性 最优控制系统的渐近特性和加权矩阵的选择

现代控制理论(12-17讲:第4章知识点)

现代控制理论(12-17讲:第4章知识点)

0 1 1 0 0 1 1 1 0 1 0 1 0 0 x y x 0 1 1 1 1 0 0 1 1 0 0 0 1 1 0 0
MIMO系统,n=5,r=5,独立特征向量为2, C阵对应列 (1、4列),线性无关, 故系统状态完全能观。
4-4 线性定常离散系统的能控性和能观性
故系统是不能观测的。
y 3 2 0 x
18
例2:判定如下系统的能观性。
1 0 3 x x 7 u 0 3

0 0 1 y x 0 u 1 1
故系统是能观测的。
特别要注意特征值互异的条件,否则会影 响判定结论的正确性。
解: n=3、 r=1 有

0 2 8 Q c B AB A 2 B 0 0 0 1 3 11
显然:
rankQc 2( n)
4
故系统是不能控的。
3、能控性判据之二 (1)、系统特征值互异的情况:
若线性定常系统: Ax + Bu , 具有n个互不相同的 x 特征值,则其状态完全能控的充分必要条件是,系统经非 奇异变换后的状态方程式:
C 1 1 rankQo rank 1 n CA 5 5
故系统是不能观测的.(detQo=0)
16
例2:判定如下系统的能观性。
2 1 1 x x 1 u 1 3

1 0 y x 1 0
b1 0
故系统状态不可控。
特别要注意特征值互异的条件,否则会影 响判定结论的正确性。
(2)、系统具有重特征值的情况: 若线性定常系统: Ax + Bu , 具有重特征值,且 x 每一个重特征值只对应一个独立特征向量,则其状态完全能 控的充分必要条件是,系统经非奇异变换后的Jordan规范形:

自动化专业概论与职业发展第4章

自动化专业概论与职业发展第4章

推理机
数据库
规则库
输入
-+
PID控制器 误差
-
工业过程
输出
图4.16 由智能决策单元(IDU)来修正控制器
4.7 非线性系统及其控制
自动控制系统由各种环节(元件 组成,而环节或元件按其特性,可 分为线性元件和非线性元件。
输出(V)
0Hale Waihona Puke 输入(误差)(mV)图4.17 电子放大器的静特性图
输出(V)
第四章 基本控制方法
4.1 自动控制系统行为描述
uf uf
ur
0
t
图4.1 自动控制系统中被控制量的振荡
从图4.1上可以看出电炉炉膛温度
uf在t=0冷工件进入后,稍后温度开
始下降,接着就开始产生力图校正 误差的控制作用(图上曲线上的向 上箭头,表示电炉受到的新增电能 供应)。
当uf向上升并与ur的横线相交时uf =ur,△u=0,此时放大器输出为0, 电动机降速至停止转动。
⑵ 非线性系统的平衡运动状态 (即稳态,Steady State),除平衡 点外还可能有周期解;
⑶ 线性系统的输入为正弦函数时, 其输出的稳态过程也是同频率的正 弦函数,两者仅在相位和幅值上不 同。但非线性系统的输入为正弦函 数时,其输出为包含有高次谐波的 非正弦周期函数。
⑷ 复杂的非线性系统在一定条件 下还会产生突变、分岔和混沌等现 象。
扰动补偿
扰动测量
给定
输入+ 误差
给定环节
控制器
+
- 反馈信号
放大环节 执行环节

动 输出
被控对象
反馈环节
图4.6 复合自动控制系统框图
4.3 比例积分微分控制

现代控制理论-第四章

现代控制理论-第四章

二.可观标准型
• 可控系统: x Ax Bu • 特征方程: I A n an1n1 a1 a0 • 通过变换矩阵将系统化成可控标准型
a2 a3 a1 a a3 a4 2 a3 a4 a5 1 T 1 an 1 1 0 0 0 1
A T 1 AT 0 1 A 0 0
3t
te 3t x1 (0) t e 3(t ) e 3t x2 (0) 0 0
3t t
(t )e 3( t ) 0 u ( )d e 3( t ) 1
x1 (t ) e x1 (0) te x2 (0) (t )e 3(t )u ( )d
二.能观性
第二节 线性系统的能控、能观性判据
• • • • • • 一.能控性判据 设系统为: x Ax Bu, y Cx 1.秩判据 Qc B AB A2 B An1B 若rank[Qc]=n,即 I A 0 满秩,则系统可控。 2.对角规范型矩阵 若A是对角阵,且B阵中无全为零的一行,则系统可 控。反之为零一行所对应的状态不可控。 • 3.约当规范型矩阵 • 若A是约当阵,且B阵中与每个约当块最后一行相对 应的行的元素不全为零,则系统可控。反之为零一 行所对应的状态不可控。
0
x2 (t ) e x2 (0) e 3(t )u ( )d
3t 0
t
y (t ) x1 (t ) e x1 (0) te x2 (0) (t )e 3( t )u ( )d
3t 3t 0
t
• 可见:1.两个状态变量中均有输入的作用,可控 • 2.输出中有两个状态变量的出台,输出可以反映初始状态,可测

《现代控制理论基础》讲义教案第4章.docx

《现代控制理论基础》讲义教案第4章.docx

III、综合部分第四早线性多变量系统的综合与设计4.1引言前面我们介绍的内容都属于系统的描述与分析。

系统的描述主要解决系统的建模、各种数学模型(时域、频域、内部、外部描述)Z间的相互转换等;系统的分析,则主要研究系统的定量变化规律(如状态方程的解,即系统的运动分析等)和定性行为(如能控性、能观测性、稳定性等)。

而综合与设计问题则与此相反,即在己知系统结构和参数(被控系统数学模型)的基础上,寻求控制规律,以使系统具有某种期望的性能。

一般说来,这种控制规律常取反馈形式,因为无论是在抗干扰性或鲁棒性能方面,反馈闭环系统的性能都远优于非反馈或开环系统。

在本章中,我们将以状态空间描述和状态空间方法为基础,仍然在吋域中讨论线性反馈控制规律的综合与设计方法。

4. 1. 1问题的提法给定系统的状态空间描述若再给定系统的某个期望的性能指标,它既可以是时域或频域的某种特征量(如超调量、过渡过程时间、极、零点),也可以是使某个性能函数取极小或极大。

此时,综合问题就是寻求一个控制作用u,使得在该控制作用下系统满足所给定的期望性能指标。

对于线性状态反馈控制律u = -Kx + r对于线性输岀反馈控制律u = -Ffy + r其中r e R'为参考输入向量。

由此构成的闭环反馈系统分别为x - {A- BK)x+ Br y-Cx或x = {A-BHC)x+Br y = Cx闭坏反馈系统的系统矩阵分别为九=A — BKA H=A-BHC即工K = (A—BK,B,C)或工〃=(A—BHC,B,C)°闭环传递函数矩阵G K⑶=C '[si-(A-BK)Y] BG H G) = C_,[si-(A-BHOf B我们在这里将着重指出,作为综合问题,将必须考虑三个方面的因素,即1)抗外部干扰问题;2)抗内部结构与参数的摄动问题,即鲁棒性(Robustness)问题;3)控制规律的工程实现问题。

一般说来,综合和设计是两个有区别的概念。

最优控制ppt课件

最优控制ppt课件
称 J (X ) 在 XX*处有极值(极大值或极小值)。
精品课件
定理(变分预备定理):设 ( t )
是时间区间
[t0, t1]上连续的n维向量( t函) 数,
的连续n维向量函数(t,0)且(t1)0

t1
T
(t)(t)dt
,若
0
t0
是任意
则必有
(t)0,t[t0,t1]
精品课件
4.1.2 欧拉方程
LX,XrX,X
这里,LX,X 是X 的线性泛函,rX,X 是关于 X
的 高阶无穷小,则
JLX,X
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
精品课件
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。
定理 设J[x]是线性赋范空间Rn上的连续泛函
返回主目录
精品课件
在动态系统最优控制问题中,性能指标是 一个泛函,性能指标最优即泛函达到极值。解决泛 函极值问题的有力工具是变分法。所以下面就来列 出变分法中的一些主要结果,大部分不加证明,但 读者可对照微分学中的结果来理解。
精品课件
4.1.1 泛函与变分
先来给出下面的一些定义。
1、泛函: 如果对某一类函数X(t)中的每一个函
(1) (L1 L2 ) L1 L2
(2) ( L1L2 ) L2 L1 L1 L2
b
b
(3) a L[ x, x, t]dt a L[ x, x, t]dt
(4) dx d x
dt dt 精品课件
举例:
可见,计算泛函的变分如同计算函数的微分一样。
精品课件
6、泛函的极值:若存在 0 ,对满足的 X X* 一切X,J(X)J(X*)具有同一符号,则

最优控制

最优控制

已知x(t0)=x0, 拉方程和横截条件
* x x(tf)=xf ,则极值曲线 (t ) 应满足如下欧
F d F ( )0 x dt x F F ( )t t f x(t f ) ( )t t0 x(t0 ) 0 x x
其中,
T (t ), t ) L(( x(t ), x(t ), , t )) g ( x(t ), x(t ), t ) f ( x(t ), x
如果t0也自由、x(t0)受约束,即沿着曲线g(t) 则应满足以下横截条件
x(t0 ) g (t0 ) x(t f ) c(t f ) * * T L L ( x , x , t ) ( g x ) 0 t 0 x * * T L L ( x , x , t ) ( c x ) 0 t f x
vdu
t0
tf
J ( )xdt x t t x x dt x
F
d F
F
tf
(4)
0
J取极值的必要条件是 J 等于零。因 x 是 任意的,要使(3-2)中第一项(积分项)为 零,必有
F d F ( )0 x dt x
4.1.1
标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面就来列出变 分法中的一些主要结果,大部分不加证明,但读者 可对照微分学中的结果来理解。
4.1.1 泛函与变分
先来给出下面的一些定义。 1、泛函: 如果对某一类函数X (t )中的每一个函 数 X (t ),有一个实数值J 与之相对应,则称J 为依赖于 函数 X (t ) 的泛函,记为

最优控制理论课件

最优控制理论课件

m 飞船的质量 h 高度 v 垂直速度 g 月球重力加速度常数 M 飞船自身质量 F 燃料的质量 K 为常数
初始状态 终点条件
h(0) h0 h(T ) 0
v(0) v0 v(T ) 0
m(0) M F
控制目标
J m(T )
推力方案
0 u(t) umax
2019年11月25日星期一
指标
J x(T), y(T), x(T), y(T) x(T)
2019年11月25日星期一
现代控制理论
18
最优控制问题
例1.2
导弹发射问题
x F (t) cos (t)
m
y F (t) sin (t)
m
初始条件 x(0) 0 y(0) 0 x(0) 0
2019年11月25日星期一
现代控制理论
1
最优控制理论
东北大学信息科学与工程学院 井元伟教授
二○○九年十一月
2019年11月25日星期一
2
第1章 题第2章 法第3章 第理4章 划第5章 制 第6章 统
最优控制问 求解最优控制的变分方 最大值原 动态规 线性二次型性能指标的最优控 快速控制系
2019年11月25日星期一
现代控制理论
12
最优控制问题
例1.2 导弹发射问题
2019年11月25日星期一
现代控制理论
13
最优控制问题
例1.2 导弹发射问题
最优控制问题
例1.2
导弹发射问题
x F (t) cos (t)
m
y F (t) sin (t)
m
2019年11月25日星期一

高等教育《最优控制理论》课件 第四章

高等教育《最优控制理论》课件 第四章

即:
上式表明,沿最优轨线函数H相对最优控制u*(t)取绝对极小值,这是极小值原理的一 个重要结论.

∂Φ ∂H ∂G T ) Γ = 0 = 0 ⇒ + ( & & & ∂ω ∂ω ∂ω ∂H ∂G T ⇒ = −( ) Γ ∂u ∂u
∂H = 0 不再成立 上式表明,在有不等式约束的情况下,沿最优轨线 ∂u
初始条件
x (t 0 ) = x ( 0 ) , x ∈ Rn , u ∈ Ω ∈ R p ,
为有界闭集,不等式约束为
m≤ p
G [ x (t ), u (t ), t ] ≥ 0, G为m维连续可微的向量函数,
系统从x0转移到终端状态x(tf),tf未给定,终端状态x(tf)满足等式约束
M [ x(t f ), t f ] = 0
M为q 维连续可微向量函数, q ≤ n 性能指标:
J = θ [ x ( t f ), t f ] +

t
f
t0
F [ x ( t ), u ( t ), t ] dt
最优控制问题就是要寻找最优容许控制u(t)使J为极小

& ω (t ) = u (t ) ω (t 0 ) = 0
Z T (t ) = [ z1 (t ), z 2 (t ),L z m (t )] & 且 [ Z (t )]2 = G[ x(t ), u (t ), t ] Z (t0 ) = 0
设控制变量被限制在某一闭集内 即u(t)满足 G [ x ( t ), u ( t ), t ] ≥ 0
u ∈Ω
满足限制条件的u(t)称为容许控制,由于δu不能是任意的,
∂H = 0 的条件已不存在 ∂u

《最优控制》第1章绪论

《最优控制》第1章绪论
自动化学院
2020/8/9
1
第1章 绪论 第2章 求解最优控制的变分方法 第3章 最大值原理 第4章 线性二次型性能指标的最优控制 第5章 动态规划 第6章 状态估计
2
教学要求:
1. 学习泛函变分法,理解最优控制的一般概念 2. 掌握利用变分法求最优控制方法 3. 掌握极大值原理,状态调节器 4. 掌握动态规划
x(t) f [x(t), u(t), t]
(2)边界条件 ①初始时刻t0,初始状态x(t0)一般给定 ②终端时刻tf,变动,固定 ③终端状态x(tf)
12
第1章——绪论
x(tf)一般需满足一个约束方程[x(tf ), tf ] 0
满足约束方程的x(tf)构成一个目标集 x(tf ) S (3)一个衡量系统性能的性能指标
t0
N 1
或J x(N) F[x(k),u(k), k]
k k0
最优控制问题
(控制域) u t x t
J
17
4 常见的最优控制
tf
1.最少时间控制J dt t f t0
它要求设计一个快速控t0制系统,使系统在最短
时x间t0 内从初态终态 xt f
2.最少燃如料:导弹拦截器的轨道转移 。
最优值,J* J[u *(t)] 称为最优性能指标
14
3 研究最优控制的前提条件
1.给出受控系统的动态描述(状态方程)
连续系统 x(t) f [x(t),u(t),t]
离散系统 x(tk1 ) f [ x(tk ), u(tk ), tk ]
2.明确控制域(容许控制)
控制约束 ut 控制域(取值范围)
Mg
设M 1,x1(t) x(t)为高度,x(2 t) x1(t) x(t)

最 优 控 制 教 案第四章 线性二次型性能指标的最优控制问题

最 优 控 制 教 案第四章 线性二次型性能指标的最优控制问题

许多控制问题可以转化为线性二次型问题;其最优解可以写成统一的解析表达式,理论比较成熟第四章 线性二次型性能指标的最优控制问题4.1概述如果所研究的系统为线性,所取的性能指标为状态变量与控制变量的二次型函数,则这种动态系统的最优控制问题,称为线性二次型问题。

设线性时变系统的状态方程为()()()()(),()()()xt A t x t B t u t y t c t x t =+=在工程实际中,希望:系统输出y(t)尽量接近某一理想输出y r (t) 定义误差:e(t)= y r (t)- y(t)求最优控制u *(t),使下列性能指标极小:11()()[()()()()()()]22ft T T T f f t J e t Fe t e t Q t e t u t R t u t dt =++∫F 为对称非负定常阵,Q(t)为对称非负定时变矩阵,R(t)为对称正定时变矩阵,t 0,t f 固定。

上式中系数21是为了简化计算。

指标的物理意义:使系统在控制过程中的动态误差与能量消耗,以及控制结束时的系统稳态误差综合最优。

(1) 状态调节器问题若c(t) = I, y r (t) = 0, 则有e(t)= - y(t)= - x(t)11()()[()()()()()()]22f t T TT f f t J x t Fx t x t Q t x t u t R t u t dt =++∫此时系统可归纳为:当系统受扰动偏离平衡零状态时,要求产生一控制向量,使系统状态x(t)保持在零状态附近。

(2) 输出调节器若 y r (t) = 0, 则有e(t)= - y(t)11()()[()()()()()()]22ft T T T f f t J y t Fy t y t Q t y t u t R t u t dt =++∫ 此时系统可归纳为:当系统受扰动偏离平衡零状态时,要求产生一控制向量,使系统输出y(t)保持在零状态附近。

自动化导论第4章 自动控制系统的基本控制方法

自动化导论第4章 自动控制系统的基本控制方法

修正机构
辨识机构
输入量
控制器
被控对象 环境条件等
输出量
4.4 自适应控制
基本原理——小结
a 辨识被控对象的特性
b 在辨识的基础上作出控制决策
期望的 性能指标
c 按照决策对可调系统实行修正 决策机构
修正机构
辨识机构
输入量
控制器
被控对象 环境条件等
输出量
4.4 自适应控制
基本类型
自适应控制实质上是系统辨识与控制技术的结合,通常有 自校正控制系统、模型参考自适应控制系统两种类型。
拦截导弹最短时间控制
4.3 最优控制
常见的最优控制问题
⑵ 最小燃料消耗问题:控制量u(t)与燃料消耗量成正比。
J tf u t dt min t0
F xt ,u t ,t u t
导弹最小燃料控制
4.3 最优控制
常见的最优控制问题
⑶ 最小能量控制问题:考虑与消耗功率成正比。
被控对象 环境条件等
输出量
4.4 自适应控制
基本原理
然后根据所获得的信息并按照一定的评价系统优劣的性能
准则,判断决定所需的控制器参数或所需的控制信号。
期望的 决策机构
性能指标
性能指标 J t e2 ( )d t0
辨识机构
输入量
控制器
被控对象 环境条件等
输出量
4.4 自适应控制
基本原理
即控制器输出变化的速度与偏差成正比:
du(t) dt SCe(t)
t
u(t) u(0) SC
e(t)dt
0
SC:积分控制作用放大倍数 现象:只要有偏差,控制器输出就不断变化。

最优控制理论

最优控制理论

用数学语言来比较详细地表达最优控制问题 的内容:
(1)建立被控系统的状态方程
X f X (t ),U (t ), t
(1-17)
其中, (t ) 为 n 维状态向量, (t ) 为 m 维控制向量, X U f X (t ),U (t ), t 为 n 维向量函数,它可以是非线性 时变向量函数,也可以是线性定常的向量函数。 状态方程必须精确的知道。
(2)确定状态方程的边界条件。一个动态过程 对应于 n 维状态空间中从一个状态到另一个状态 的转移,也就是状态空间中的一条轨线。在最优 控制中初态通常是知道的,即
X (t0 ) X 0
(1-18)
而到达终端的时刻 t f 和状态 X (t f ) 则因问题而异。
例如,在流水线生产过程中,t f 是固定的;在飞机 快速爬高时,只规定爬高的高度 X (t f ) X f ,而 t f 是自由的,要求 t f t0 越小越好。终端状态 X (t f ) 一 般属于一个目标集 S ,即
二、最优控制发展过程
上世纪五十年代初期布绍(Bushaw)研究 了伺服系统的时间最优控制问题。 以后,拉塞尔(LaSalle)发展了时间最优 控制的理论,即所谓Bang—Bang控制理论。 1953至1957年间美国学者贝尔曼(Bellman) 创立了“动态规划”理论,发展了变分学中的哈密 顿—雅可比(Hamilton—Jacobi)理论。
t [0, t f ]
(1-11) (1-12)
x(0) x0
x0 是初始时刻的商品存货量,且 x0 0。从 x(t ) 的实
际意义来看,显然必须选取生产率使得
x(t ) 0
t [0, t f ]
(1-13)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
便可得到使性能指标取极值的必要条件,即
ˆ (t ),U ˆ (t ), Λ ˆ (t ), t ) ∂H ( X =0 ˆ (t ) ∂U
另一必要条件为
& ˆ =− Λ
∂ ˆ (t ),U ˆ (t ), Λ ˆ (t ), t H X ˆ (t ) ∂X
f
[
]
Λ (t ) t =t = 0
例3.3
) ) ˆ ∂H ( X (t ),U (t ), Λ, t ) ˆ & ˆ (t ) Λ = − H xˆ = − = −2α 2 x ˆ (t ) ∂X
由式(c)、(d)两式消去 Λ 可得
2 α ˆ &− 2 x ˆ=0 u β
(c)
(d)

ˆ & − r2x ˆ=0 u
m(0)=M+F ,飞船的初始高度为 h0=x(t0) ,
初始速度
& (t 0 ) v0 = x
为状态变量,
& (t ), x3 (t ) = m(t ) 选择 x1 (t ) = x(t ), x 2 (t ) = x
可写出飞船的状态方程
&1 (t ) = x 2 (t ) x & 2 (t ) = x u (t ) −g m(t ) & 3 (t ) = m & (t ) = − ku (t ) x
按照控制对象的动态特性,选择一个容许控制,使被控对象按照技 术要求运行,并使给定的性能指标达到最优值。
核心
是选择控制函数 u(x) ,
使
J 取 极值
控制系统最优化问题,包括性能指标的合理选择以及最优化控制 系统的设计,而性能指标在很大程度上决定了最优控制性能和最优控 制形式。
4.2 最优控制问题的提法和数学模型
将上式代入式
δJ = ∫ (δX T
t0
tf
∂F ∂F + δU T ) dt = 0 ∂X ∂U
并令
ˆ (t ),U ˆ (t ), t ) tf ∂F ( X T ˆ dt Λ (τ ) = ∫ Φ (t ,τ ) t0 ˆ ∂X (t )

ˆ (τ ) Λ
τ =t f
=0
引入哈密顿函数
ˆ (t ), U ˆ (t ), t ) + Λ ˆT (t ) f ( X ˆ (t ), U ˆ (t ), t ) H ( X (t ), U (t ), Λ (t ), t ) = F ( X
3.3 求解最优控制问题的变分方法
设系统的状态方程和初始条件为
& (t ) = f ( X , U , t ), X
X ( 0) = X 0
欲求 U (t ),使系统从初态 X (t 0 ) = X 0 转移到终态 X (t f ) ,并使
J = ∫ F ( X , U , t ) dt
t0
tf
达到极小(或极大), 式中 X (t ) 为 n 维状态矢量;U (t ) 为 r 维控制矢量;
且使性能指标 J 为极小 对这样的控制
ˆ (t ) 称为系统的最优控制。 u
最优控制规律通常取决于,初始状态或初始输出、希望的状态或希望的 输出、约束的性质、性能指标的性质等。因此在一种性能指标下的最优 控制对另一种性能指标来说,它不一定是最优的。
3. 性能指标 J
在最优控制问题中,性能指标是非常重要的。因为性能指标的形 式,决定了最优控制的形式和复杂程度,它直接影响到实际系统中实现 最优控制的可能性。 性能指标的确定既要考虑到它能确切地评价系统的性能,又要考虑 到数学上处理的方便以及工程上的可能性。 由于实际系统千差万别,要求又各不相同。因此要提出一个统一的 性能指标是困难的。在一般情况下,应对不同的问题,选择不同型式的 性能指标。 在拉格伦日(Lagrange)问题中,性能指标取以下形式
设如图3-3所示单积分系统的运动方程为
&=u x
试求使系统从状态 x(0) = x0
tf
& u= x
(a)
转移到 x (t f ) = x f
1/S
x
的性能指标
J = ∫ (α 2 x 2 + β 2 u 2 )dt
0
(b)
为极小时的最优控制u 。
解: 将式 (a)、(b)两式与式
& (t ) = f ( X , U , t ), X
f ( X , U , t ) 为 n 维连续可微矢量函数,它应具有一阶偏导数。
为了方便起见,定义 xi (t ), u j (t ) 的一阶变分,分别为 定义J 的一阶变分为
δxi , δui
∂F r ∂F δJ = ∫t0 (∑ δxi )dt + ∑ δu j ∂u j ∂xi j =1 i =1
J 下的最优拦截问题
2. 最优控制问题的描述:
对于状态方程
& (t ) = AX (t ) + B(t )u (t ) X
和约束条件
u (t ) ∈ Ω ⊆ R
m
决定的系统

ˆ (t ) ∈ Ω 最优控制问题是寻求一个满足约束条件的控制矢量 u
使控制系统从
X (t 0 ) = X 0
X (t f ) ∈ S
其初始条件为
x1 (t 0 ) = x10 x 2 (t 0 ) = x 20
可把研究的问题变为: 寻找一个满足约束条件 u (t ) < K 初态 X (t 0 ) = {x10 , x 20 }
T
的控制作用力,使物体在最短的时间内从 终态 X (t f ) = {x1 (t f ), x 2 (t f )} = {0,0}
α(t)是包括空气动力与地心引力所产生的加速度在内的相对加速度向
量,它是x(t)、v(t) 的函数,也可看成是时间的函数。 设 m(t)是拦截器的质量, f(t)是其推力的大小。用 u 表示拦截器推力方向
的单位矢量。C是有效喷气速度,可看作常数。
则 拦截与目标的相对运动方程可写成

& =v x & = α (t ) + v
M 的运动微分方程式
M
u(t)
d2x = u (t ) − g 2 dt
选择
x(t)
& (t ) = x &1 (t ) x1 (t ) = x(t ), x 2 (t ) = x
为状态变量,
可写出 M 的状态方程
dx1 (t ) = x 2 (t ) dt dx 2 (t ) = u (t ) − g dt
J = ∫ F ( X , U , t ) dt
t0
tf
若要突出系统终态性能的影响,性能指标可取
J = Φ X (t f ) + ∫ F ( X , U , t )dt
t0
[
]
tf
二次型性能指标
J = ∫ ( X T QX + U T RU + ⋅ ⋅ ⋅)dt
t0
tf
Q 和 R 是正定实对称矩阵,又称为加权矩阵。
∂f A= ∂X
控制矩阵
∂f B= ∂U
令 Φ (t , t 0 ) 是式(3-17)的状态转移矩阵 状态方程式
∂f ∂f d (δX ) = δX + δU ∂U dt ∂X
t
的非齐次解可以表示为
∂f ( X (τ ),U (τ ),τ ) δU (τ )dτ δX = Φ(t , t0 )δX t =t + ∫ Φ(t ,τ ) 0 t0 ∂U (τ ) t ∂f ( X (τ ),U (τ ),τ ) δU (τ )dτ = ∫ Φ (t ,τ ) t0 ∂U (τ )
取Q和R为对角矩阵,设Q和R的元各为 q1 , q 2 ,..., q n 和 r1 , r2 ,..., rn 。 则二次型性能指标可写为
2 2 J = ∫ (q1 x12 + q 2 x 2 + ⋅ ⋅ ⋅ + r1u12 + r2 u 2 + ⋅ ⋅ ⋅)dt t0 tf
式中的变量可以代表各色各样的物理量。 被积函数中,控制作用u的平方具有能量的意义,使性能指标为最小, 意味着所需的控制能量为最小。用加权矩阵Q和R对这两部分变量加权,以 便使这两部分在性能指标中所占的比重不同。不同的比重表示这两部分中 对那一部分的要求更严格些。如果在控制过程中,还要求其它变量为最 小,可以将这些变量以二次型的形式一一列入性能指标中。
T
∂F ∂F ∂F ∂F = , ,⋅ ⋅ ⋅, ∂U ∂u1 ∂u 2 ∂u n
ˆ (t ) U (t ) = U

ˆ (t ) X (t ) = X
是所求的最优控制和最优轨线,
则性能指标达到极值的必要条件为一阶变分等于零,即
δJ = ∫
tf
t0
∂F T ∂F (δX ) dt = 0 + δU ∂X ∂U
要求控制拦截器从相对目标的初始状态出发,于某终点时刻 tf 与目标相遇(拦截) 即 且应满足
x(t f ) = 0
m(t f ) ≥ me
me 燃料耗尽后火箭的质量
为实现快速拦截,并消耗燃料最少,综合考虑这两种要求,取性能指标为
J=

tf
t0
[C1 + f (t )]dt
问题归结为: 选择 f(t), u(t) 和 tf ,除实现拦截外还要使规定的性能消耗率成 正比的比例常数
初始条件:t=t0时
&1 (t 0 ) = v0 x1 (t 0 ) = h0 , x 2 (t 0 ) = x m(0) = M + F
端点条件: t=tf时
&1 (t f ) = 0 x1 (t f ) = 0, x2 (t f ) = x
相关文档
最新文档