二次型性能指标的线性系统最优控制
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 T e (t )Q (t )e(t ) 代表整个过程中误差 e(t ) 的 2
矩阵 F Q(t ) R(t ) 则是用来权衡各个误差成分及控制分量相对重要 程度的加权阵。这里,Q 及 R 可以是时间函数,以表示在不同时刻 的不以加权。
因此,二次型性能指标的最优控制问题实质上是:要求用较小的控 制能量来获得较小误差的最优控制。
(10-26)
Q, R 为常值矩阵,并满足 Q 为正半定的,R 为正定的。求最优 点控制 u (t ) ,使性能指标 J 为最小。
这里讨论的问题与第二节相比,有以下几点不同:
1.系统是时不变的,性能指标的权矩阵为常值矩阵。 2.端时刻 t f 。在前节讨论已知,即使线性系统是时不变的, 求得的反馈增益矩阵是时变的,这使系统的结构大为复杂。终端时 刻 t f 取作无穷大,目的是期望能得到一个常值反馈增益矩阵。 3. 终值权矩阵 F 0 ,即没有终端性能指标。这是因为人们总在 关注系统在有限时间内的响应,当 t f 时,这时的终值性能指标 就没有多大实际意义了,并且终端状态容许出现任何非零值时,由 于积分限为[t0 , ] ,都会引起必须指标趋于无穷。
因此二次型性能指标的线形系统最优控制问题被广泛应用到 各种工程实际中,例如:导弹的角度控制、电冰箱的温度控制等。
导弹角度控制
电冰箱温度控制
二次型性能指标线性系统最优控制问题可以描述如下:
设线性系统状态方程及输出方程为:
(t ) A(t ) x (t ) B(t )u(t ) x y (t ) G (t ) x (t )
(10-6)
终端时刻 t f 固定。要求寻找最优控制 u (t ) ,使性能指标 J 为最小。
这个问题的求解可以用极小值原理或动态规划法,这里,我们应 用极小值原理来求解。首先列写哈密尔顿函数
H ( x , u, , t ) 1 T 1 x (t )Q (t ) x (t ) u T (t ) R(t )u(t ) 2 2 T (t ) A(t ) x (t ) T (t ) B(t )u(t )
第十章
二次型性能指标的线性系统最优控制
在实际工程问题中,二次型性能指标的线性系统最优控制问题 具有特别重要的意义。这是由于:二次型性能指标具有鲜明的物理 意义,它代表了大量工程实际问题中提出的性能指标要求;在数学 处理上比较简单,可求得最优控制的统一解析表示式;特别可贵的 是可得到状态线性反馈的最优控制规律,易于构成闭环最优控制, 这一点在工程实现上具有重要意义。
最求最优控制 u (t ) ,使性能指标 J 为最小。
解:
Hale Waihona Puke 本例相应的具有关矩阵为:0 1 0 A ,B 0 0 1 1 0 F 0, Q ,R 1 0 0
设:
p11 (t ) P (t ) p21 (t ) p12 (t ) p22 (t )
(10-17)
将式(8-12)、式(8-16)代入式(8-17)
(t ) [ P (t ) P(t ) A(t ) P(t ) B(t ) R 1 (t ) B(t ) P(t )]x (t ) (10-18)
将式(8-16)代入式(8-9)
(t ) [Q(t ) AT (t ) P(t )]x (t )
下面,我们将分别讨论几种特殊情况:
⑴ 状态调节器问题。它对应于 C (t ) I 及 z (t ) 0 的情况。这时要求 用不大的控制能量以保持状态在零值附近。
⑵ 输出调节器问题。它对应于 z (t ) 0 的情况。这时要求用不大的 控制能量以保持输出在零值附近。 ⑶ 跟踪器问题。这时 z (t ) 0 ,它要坟用不大的控制能量使输出量 y (t ) 跟踪 z (t ) 。
(10-12) (10-13)
(t ) Q(t ) x (t ) AT (t ) (t )
这是一组一阶线必微分方程,其边界条件为:
x (t0 ) x(t0 )
(10-14)
及横截条件
(t f )
1 T x ( t ) Fx ( t ) Fx (t f ) f f x (t f ) 2
(10-19)
由此可得:
(t ) P(t ) A(t ) [Q(t ) AT (t ) P(t )]x (t ) [ P P(t ) B(t ) R 1 (t ) BT (t ) P(t )]x (t )
(10-20)
上式应对任何x 均成立,故有
P(t ) P(t ) A(t ) AT (t ) P(t ) P(t ) B(t ) R 1 (t ) BT (t ) P(t )] Q(t )
根据等号两边矩阵的对应元素就相等,可得下列方程:
11 1 p12 p21 p 12 p11 p12 p22 p 21 p11 p22 p21 p
2 22 2 p12 p22 p
已知为p 对称矩阵,故 p12 p21 ,上式可变成:
2 11 1 p12 p 12 p11 p12 p22 p 2 22 2 p12 p12 p
(10-3)
性能指标为
J 1 T 1 tf e (tt ) Fe(tt ) [eT (t )Q (t )e(t ) 2 2 t0 u T (t ) R (t )u(t )]dt
(10-4)
这里,权函数 F ,Q(t ) 为正半定矩阵,R (t )为正定矩阵。假定 t f 固 定。要求寻找最优控制 u (t ) ,使性能指标 J 为最小。
(10-7)
由此可得正则方程
(t ) A(t ) x (t ) B(t )u (t ) x
(t ) H Q (t ) x (t ) AT (t ) (t ) x
(10-8) (10-9)
由于控制不受约束,控制方程满足
H R ( t )u ( t ) B T ( t ) ( t ) 0 u
(10-24)
例10-1
设线性系统状态方程为:
1 (t ) x2 (t ) x 2 (t ) u (t ) x
x1 (0) 1, x2 (0) 0, u(t )不受约束, t f 固定,性能指标为: 初始条件为:
1 tf 2 J [ x1 (t ) u 2 (t )]dt 2 0
(10-21)
该式称为矩阵黎卡提微分方程,它是一个阶非线性矩阵微分方程。
它是一个阶非线性矩阵微分方程。比较式(10-15)及式(1016),可知式(10-21)的边界条件为:
P(t f ) F
(10-22)
由黎卡提微分方程解出 P (t ) 后,代入式(8-11),可得最优控 制规律为:
u (t ) R (t ) B (t ) P(t ) x (t )
第一节
线性连续系统状态调节器问题
设线性系统的状态方程为
(t ) A(t ) x (t ) B(t )u(t ) x u (t ) 不受约束,性能指标为
(10-5)
1 T 1 tf T J x (t f ) Fx (t f ) [ x (t )Q (t ) x (t ) 2 2 t0 uT (t ) R(t )u(t )]dt
(10-15)
由于横截条件中 x (t f ) 与 (t f ) 存在线性关系,而正则方程又是线 性的。因此可以假设,在任何时刻 x 与 均可以存在如下线性关系;
( t ) P( t ) x ( t )
(10-16)
对式(10-16)求导
(t ) P (t ) x (t ) P(t ) x (t )
(10-10)
由此可得:
u (t ) R1 (t ) BT (t ) (t )
(10-11)
由于 R (t ) 的正定性保证了 R 1 (t ) 存在,从而 u (t ) 才可能存在。
将式(10-11)代入正则方程
(t ) A(t ) x (t ) B(t ) R 1 (t ) BT (t ) (t ) x
⑶ P (t ) 是时间函数,由此得出结论,即使线性系统是时不变的, 为了实现最优控制,反馈增益应该是时变的,而不是常值反馈增益。 这一点与经典控制方法的结论具有本质的区别。
⑷ 将最优控制及最优状态轨线代入指标函数,最后可求得性能指 标的最小值为:(证明略)。
J 1 T x ( t0 ) P ( t 0 ) x ( t 0 ) 2
已知 F 0 ,上列方程的终端边界条件为:
p11 (t f ) p12 (t f ) p22 (t f ) 0
上式的求解一般由计算机进行,将 P (t ) 的解代入式(10-23)可得 最优控制为:
p11 (t ), p12 (t ) x1 (t ) u (t ) [0,1] x (t ) p ( t ) p ( t ) 22 12 2 p12 (t ) x1 (t ) p22 (t ) x2 (t )
1 T
(10-23)
下面对以上结论作几点说明: ⑴ 优控制规律是一个状态线性反馈规律,它能方便地实现闭 环最优控制。这一点在工程上具有十分重要的意义。闭环最优控 制的结构原理图如图10-1。
图10-1 闭环最优控制结构图
⑵ 可以证明(略),P (t ) 是一个对称阵。由于它是非线性微分方 程之解,通常情况下难求得解析解,一般都需由计算机求出其数 值解,并且由于具边界条件在终端处。因此需要逆时间方向求解, P (t ) 并且必须在过程开始之前就将 解出,存入计算机以供过程中使 用。由于黎卡提微分方程与状态及控制变量无关,因此在定常系 统情况下,预先算出可能的。
(10-1) (10-1)
式中, x (t )为 n维状态向量, u (t )为 m 维控制向量, y (t )为 r 维输出向量。 y (t ) 与同维数, z (t ) 为理想输出, 假设:n m r 0 ;u (t ) 不受约束; 并定义为误差向量
e( t ) z ( t ) y ( t )
这里,被积函数的第一项 大小。由于 Q(t ) 的正半定性,决定了这一项的非负性;被积函数的 1 第二项 uT (t ) R(t )u(t ) 代表控制功率的消耗,其积分表示整个过程中 2 控制能量的消耗。由于 R (t ) 的正定性,决定了这一项总为正,由于 这个原因,对 u (t ) 往往不需再疑义约束,而常设 u (t ) 为自由的;指 1 T 标函数的第一项 e (tl ) Fe(tl ) 表示终值误差。从理论上讲,被积函数 2 的第一项已经包括了终端误差的万分,但如需特别强调终值误差, 则可加上此项。
将 A, B, Q, R,P 代入式
11 p p 21 12 p p11 22 p p21 p12 0 1 0 0 p11 p21 0 0 1 0 p p22 p 21 22 p11 p12 0 p11 p12 1 0 1 0 1 p 0 0 p p p 22 22 21 21 0 p12 p21 p12 p22 1 0 0 p11 0 2 p22 0 0 0 p21 p11 p12 p22 p22 p11 p12 p22 1 p12 p21 2 p11 p22 p21 p21 p12 p22
第二节 t f 时线性定常连续系统状态调节器问题
设线性系统状态方程为
(t ) Ax(t ) Bu(t ) x
(10-25)
这里, A, B 为常值矩阵,u (t ) 不受约束,性能指标为
1 T J [ x (t )Qx (t ) u T (t ) Ru (t )]dt 2 t0