第5章 离散时间系统最优控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.1 离散时间系统最优控制问题的提法
(1) 离散系统举例 考虑一个化工多级萃取过程的最优控制问题。 萃取是指可以被溶解的物质在两种互不相溶的溶剂之间的转移,一般用于化 学实验或化工生产中将想要提取的物质(通常含量较低)从不易分离的溶剂中 转移到容易分离的溶剂(萃取剂)中。多级萃取则是化工生产中提取某种价值 高、含量低的物质的常用生产工艺。 多级萃取过程如图 5.1 所示。含 A 的混合物以流量 V 进入萃取器 1,此时混 合物中 A 物质的浓度为 x(0)。萃取剂以流量 u(0)通过萃取器 1,单位体积萃取 剂带走的 A 物质的量为 z(0)。一般萃取过程萃取物的含量均较低,所以可以认 为通过萃取器 1 后混合物的流量不变,仍为 V。流出萃取器 1 的混合物中 A 物 质的浓度为 x(1)。以此类推至萃取器 N。
k =0 N −1
(5-1-8)
离散系统的最优控制问题就是确定最优控制序列 u*(0),u*(1),…,u*(N-1), 使性能指标 J 达到极小(或极大)值。将最优控制序列 u*(0),u*(1),…,u*(N-1) 依次代入状态方程,并利用初始条件 x(0) = x 0 ,可以解出最优状态序列 x*(1), x*(2),…,x*(N),也称为最优轨线。
* x(k ) = x (k ) + αδ x(k ) * x(k + 1) = x (k + 1) + αδ x(k + 1)
(5-2-2)
其中 α 为参变量, δ x ( k ) 和 δ x ( k + 1) 分别是 x ( k ) 和 x ( k + 1) 的变分,代入 J 有
u(0) V 萃取器 1 x(0) V x(1)
u(1) V 萃取器 2 x(2) x(k-1) V
u(k) V 萃取器 k x(k) x(N-1) V
u(N-1) V 萃取器 N x(N) z(N-1)
z(0)
z(1)
z(k-1)
图 5.1
多级萃取过程
来自百度文库
在萃取过程中,对第 k 个萃取器有如下萃取平衡关系
x(k + 1) = f [ x(k ), u (k ), k ], k = 0,1, L , N − 1 (5-1-6)
和初始状态 x(0) = x 0 (5-1-7)
其中 x (k ) ∈ R n , u ( k ) ∈ R m 分别为状态向量和控制向量,f 为连续可微的 n 维函数 向量。性能指标 J = Φ[ x( N ), N ] + ∑ L[ x(k ), u (k ), k ]
k =0 N −1
(5-3-1)
(5-3-2)
(5-3-3)
(5-3-4)
其中:x(k)∈Rn,u(k)∈Rm。u(k)不受约束,f 为 n 维连续可微向量函数,Ψ是 x(N) 的连续可微 r 维向量函数,Φ是 x(N)的连续可微标量函数,L 为 x(k)、u(k)的连 续可微标量函数,要求最优控制序列 u*(k), k=0,…, N-1,使 J 最小。 与连续系统类似,引入 Lagrange 乘子向量,
(5-2-9)
综上所述,离散 Lagrange 问题(5-2-1)的极值若存在,其极值解 x * (k ) 必 满足 Euler 方程(5-2-7)和横截条件(5-2-8) 与连续时间变分法一样,也可通过 Lagrange 乘子法将等式约束下的极值问 题化为无约束的极值问题。 例 5.1 已知离散系统状态方程及边界条件 x(k + 1) = x(k ) + au (k ) x(0) = 1, x(10) = 0 以及性能指标
(5-2-17)
66
∂Lk = aλ (k + 1) + u (k ) ∂u (k ) ∂Lk −1 =0 ∂u (k ) 因而可以写出 J 的 Euler 方程为
(5-2-18)
(5-2-19)
λ (k + 1) − λ (k ) = 0
aλ (k + 1) + u (k ) = 0 解这两个差分方程,可得
T
T
(5-2-6)
(5-2-7)
65
∂L[x(k − 1), x(k ), k − 1] δ x (k ) =0 ∂x(k ) k =0
k=N T
(5-2-8)
式(5-2-7)称为离散 Euler 方程, (5-2-8)则为离散的横截条件。当初态给定 x(0) = x 0 ,终态 x(N)自由,即 δ x ( N ) 是任意值时,则有横截条件为 x(0) = x0 ∂L[x( N − 1), x( N ), N − 1] =0 ∂x( N )
k =0
N −1
(5-1-4)
引进性能指标
J=
N N −1 p = ∑ [ x(k − 1) − x(k )] − B ∑ u (k ) α V k =1 k =0
= ∑ [ x(k ) − x(k + 1)] − B ∑ u (k )
k =0 k =0
N −1
N −1
(5-1-5)
其中 B =
β 。则该多级萃取过程寻求收益最大化问题就可以描述为一个离散最 αV 优控制问题,即要确定一组最优控制序列 u(k)( k = 0,1,…, N-1),使性能指标 J 达到最大。 (2) 离散系统最优控制问题的提法 给定离散系统状态方程
k =0 N −1
(5-3-6)
(5-3-7)
,得 对上式右边第三项中 λΤ (k + 1) x(k + 1) 进行变换(离散分部积分) J = Φ[ x( N ), N ] + µ Τ Ψ[ x( N ), N ] − λΤ ( N ) x( N ) + ∑ [ H (k ) − λΤ (k ) x(k )] + λΤ (0) x(0)
(5-1-3)
将视为 x(k)状态变量,u(k)视为控制变量,则上式可作为状态方程。 假定 A 物质的单价为 α,萃取剂的单价为 β,则 N 级萃取过程总的收益为
p = ∑ α V [ x(k − 1) − x(k )] − ∑ β u (k )
k =1 k =0 N N −1
= α V [ x(0) − x( N )] − ∑ β u (k )
(5-2-13)
考虑 J 中, Lk = Lk −1 则 ∂Lk = λ (k + 1) ∂x(k ) ∂Lk −1 = −λ ( k ) ∂x(k ) (5-2-16) 1 2 u (k ) + λ (k + 1)[ x(k ) + au (k ) − x(k + 1)] 2 1 = u 2 (k − 1) + λ (k )[ x(k − 1) + au (k − 1) − x(k )] 2 (5-2-14) (5-2-15)
五.离散时间系统最优控制
前面几章所讨论的都是关于连续时间系统的最优控制问题。然而在现实世 界中,很多实际系统本质上是时间离散的,如某些经济、能源系统。更为重要 的是,即使是系统是连续的,因为计算机是基于时间和数值上都离散的数字技 术的,在实行计算机控制时必须将时间离散化后作为离散系统处理。因此,本 章将要讨论离散时间系统的最优控制问题。
J (α ) = ∑ L x * (k ) + αδ x(k ), x * (k + 1) + αδ x(k + 1), k
k =0 N −1
[
]
(5-2-3)
由函数极值必要条件,有
δJ =
可得
∂J (α ) =0 ∂α α =0
∂Lk ∂Lk + δ x (k + 1) =0 ∂x(k ) ∂x(k + 1)
J= 1 9 2 ∑ u (k ) 2 k =0
(5-2-10) (5-2-11)
(5-2-12)
求使 J 达极小值的最优控制和最优轨线。 解:应用 Lagrange 乘子法,构造辅助泛函
9 1 J = ∑ { u 2 (k ) + λ (k + 1)[ x(k ) + au (k ) − x(k + 1)]} k =0 2
k =0 N −1
(5-3-5)
达极小值的问题。 定义离散 Hamilton 函数 H (k ) = H [ x(k ), λ (k + 1), u (k ), k ] = L[ x(k ), u (k ), k ] + λΤ (k + 1) f [ x(k ), u (k ), k ] (k=0,1,…, N-1) 则有 J = Φ[ x( N ), N ] + µ Τ Ψ[ x( N ), N ] + ∑ [ H (k ) − λΤ (k + 1) x(k + 1)]
5.2 离散 Euler 方程
与连续系统 Lagrange 问题
& (t ), t ]dt J = ∫ L[x(t ), x
tf t0
对应,相应的离散系统性能指标为
64
J = ∑ L[x(k ), x(k + 1), k ] = ∑ Lk
k =0 k =0
N −1
N −1
(5-2-1)
其中 Lk = L[x(k ), x(k + 1), k ] 是第 k 个采样周期内性能指标 J 的增量。 假定离散性能指标 J 存在极小值,则式(5-2-1)存在极值解 x * ( k ) (这里 x * 表示极值解序列) 。在 x * ( k ) , x * ( k + 1) 的邻域内 x ( k ) , x ( k + 1) 可表为
(5-2-20) (5-2-21)
λ (k ) = C = 常数
u (k ) = −aC 由(5-2-23)及状态方程有 x(k + 1) = x(k ) − a 2 C 则有 x(1) = x(0) − a 2 C x(2) = x(1) − a 2 C = x(0) − 2a 2 C x(3) = x(2) − a 2 C = x(0) − 3a 2 C ┇ ┇ x(k ) = x(0) − ka 2 C 由边界条件有 x(10) = 1 − 10a 2 C = 0 可解得 C = 1 / 10a 2 则有最优控制 u * (k ) = − k 1 ,最优轨线 x * (k ) = 1 − 10a 10
T
N ∂L ∂Lk = ∑ δ x (k ) k −1 ∂x(k + 1) k =1 ∂x(k ) T k=N T
∑ δ x
k =0
N −1
T
(k )
(5-2-4)
由于
∑ δ x (k + 1)
T k =0 N −1
N −1
∂L ∂L = ∑ δ x (k ) k −1 + δ x (k ) k −1 ∂x(k ) ∂x(k ) k =0
µ = [ µ 1 , µ 2 ,L , µ r ] T
和协态变量序列
λ (k ) = [λ1 (k ), λ 2 (k ),L , λ n (k )]T , k = 1,2,L , N
使问题转化为求使辅助性能指标 J = Φ[ x( N ), N ] + µ Τ Ψ[ x( N ), N ] + ∑ {L[ x(k ), u (k ), k ] + λΤ (k + 1)[ f [ x(k ), u (k ), k ] − x(k + 1)]}
(5-2-22) (5-2-23)
(5-2-24)
5.3 离散极大值原理
与连续系统相似,离散变分法解最优控制问题多有不便,需考虑离散极大 值原理。
67
考虑离散系统状态方程 x(k + 1) = f [ x(k ), u (k ), k ], k = 0,1,· · ·丆N − 1 和初始状态 x(0) = x 0 终态应满足的约束条件 Ψ[ x( N ), N ] = 0 和性能指标 J = φ[ x( N ), N ] + ∑ L[ x(k ), u (k ), k ]
z (k − 1) = Kx(k )
(5-1-1) (5-1-2)
其中,K 为萃取平衡常数。同时有物料平衡关系 V[x (k-1)-x(k)]= u (k-1) z (k-1) 由以上关系可列出萃取物浓度方程
63
x(k ) =
x(k − 1) = f [ x(k − 1), u (k − 1)] K 1 + u (k − 1) V
T
(5-2-5)
k =0
(5-2-5)式称为“离散分部积分” ,代入(5-2-4)有
N −1 k =0
∑δ x
∂L[ x(k ), x(k + 1), k ] ∂L[ x(k − 1), x(k ), k − 1] (k ) + ∂x(k ) ∂x(k )
k=N
∂L[ x(k − 1), x(k ), k − 1] + δ x (k ) =0 ∂x(k ) k =0 由 δ x ( k ) 的任意性,可得极值的必要条件 ∂L[x(k ), x(k + 1), k ] ∂L[x(k − 1), x(k ), k − 1] + =0 ∂x(k ) ∂x(k )