线性二次型最优控制
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Chapter7 线性二次型最优控制
稳定性是控制系统的一个重要指标,还要考虑诸如调节时间、超调、振荡等动态特性以及控制器所消耗的能量等因素。
通过极点配置可使系统具有期望的稳定性和动态性能,然而并没有考虑控制的能量代价。
用Lyapunov 稳定性理论解决“参数优化问题”,通过选取一个适当的参数,可以在保证系统稳定的前提下,使二次型性能指标最小化,从而使系统的过渡过程具有较好的性能,有必要将这种方法推广到控制器设计。
7.1 二次型最优控制
在控制系统中,为了达到同一个控制目的,可以有多种方案(如多输入系统的极点配置状态反馈控制器是不唯一的),具有最小能量的控制方式更具实际意义。
对于
Bu Ax x
+= Cx y = (7-1) 系统性能和控制能量的要求可以由下列二次型性能指标来描述: ⎰∞
+=0d ][t Ru u Qx x J T T (7-2)
Q 是对称正定(半正定)加权矩阵,R 是对称正定加权矩阵,他们反映了设
计者对状态x 和控制u 中各分量重要性的关注程度。
第一项反映控制性能,这一项越小,状态衰减到0的速度越快,振荡越小,控制性能越好;第二项反映对控制能量的限制。
通常状态x 衰减速度越快,控制能量越大,这是一个矛盾,最优控制的目的就是寻找Q 、R ,调和上述矛盾,问题归结为,对给定系统(7-1)和保证一定性能指标(7-2)的前提下,,设计一个控制器u ,使J 最小。
若系统的状态是可以直接测量的,且考虑的控制器是状态反馈控制器,则可以证明,使性能指标(7-2)最小化的最优控制器具有以下线性状态反馈形式:
Kx u -= (7-3) 将控制器(7-3)代入系统方程(7-1)可得
x BK A x
)(-= (7-4) 若系统是渐近稳定的,矩阵BK A -所有特征值均具有负实部,根据线性时不变系统的Lyapunov 稳定性定理,(7-4)一定存在一个正定对称矩阵P 的二次
型Lyapunov 函数Px x x T =)V (,利用系统的稳定性可得
⎰⎰
∞∞
⋅-⎥⎦
⎤⎢⎣⎡++=00d )(V d d d )(V d d t x t t x t Ru u Qx x J T
T []
{}∞
==∞
--+-++=⎰t t T T T T t x t x P BK A BK A P x Ru u Qx x 00
)]([V d )()(
[]
000d Px x t x P B K PBK P A PA RK K Q x T
T T T T T +--+++=⎰∞
对上式“下划线”部分“+”“-”P B PBR T 1-进行配平方得到
P B PBR P B PBR P B K PBK RK K T T T T T 11---+-- P B PBR P B R K R P B R K T T T T 111)()(------=
可得
[]
00
01d Px x t x P B PBR P A PA Q x J T
T T T +-++=⎰∞
- ⎰∞
----+0
11d )()(t x P B R K R P B R K x T T T T (7-5)
求解最优控制问题,就是选取一个适当的增益矩阵K ,是性能指标J 最小化。
由(7-5)只有第三项依赖于矩阵K ,而且是非负的,只有当第三项等于零J 才能最小,当且仅当
P B R K T 1-= (7-6)
K 依赖于正定对称矩阵P ,特别是当可以找到一个P ,满足Riccati 方程 01=+-+-Q P B PBR P A PA T T (7-7)
此时 00Px x J T
= (7-8)
闭环系统方程为 x P B BR A x
T )(1--= (7-9) 最优状态反馈控制器为 Px B R u T 1--= (7-10) 可以证明,确实有
x P P B BR A P B BR A P x Px x x
P x t
x T T T T T T ])()([d )
dV(11---+-=+= x P B PBR P A P B PBR PA x T Q
T T T ][1)
77(1---=--+-= (利用了P 的对称性)
0][1<+-=-x P B PBR Q x T T (利用了Q 、R 、P 的正定对称性) 这就证明了最优状态反馈控制器(7-10)Px B R u T 1--=是稳定的。
稳定化的最优控制状态反馈控制器的设计步骤小结:
(1)求解Riccati 方程(7-7)01=+-
+-Q P B PBR P A PA T T ,结合利用矩阵正定 性、对称性要求,确定P ;
(2)将求得的正定对称矩阵P 代入(7-10)Px B R u T 1--=
如果二次性能指标中是输出向量,即
⎰∞
+=0d ][t Ru u Qy y J T T Cx y =
⎰∞
+=0
d ][t Ru u x QC C x J T T T 相当于QC C Q Q T ='→
例7-1 (187P 例7.1.2)对如图控制系统u x x x x ⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛1000102121 (虚线框部分方程,显然系统只是“临界”稳定的),设计一个最优状态反馈控制器)()(t Kx t u -=,
使系统性能指标0d 001012>⎥
⎥⎥⎦
⎤
⎢⎢⎢⎣⎡+⎪⎪⎭⎫ ⎝⎛=⎰∞==μμt u x x J R Q T 最小(Q 对称正定)。
解: 写出Riccati 方程01=+-+-Q P B PBR P A PA T T
0001)10)(1(10010000102212
1211
22121211
2212
1211
=⎪⎪⎭⎫
⎝⎛+⎪⎪⎭
⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝
⎛⎪⎪⎭⎫ ⎝⎛⇒μp p p p p p p p p p p p 上式有三个独立方程,再结合利用P 正定性要求,
其解为 ⎪⎪⎭⎫
⎝⎛++=⎪⎪⎭⎫ ⎝⎛21
1
22212
1211
μμp p
p p 于是,系统的最优控制器为
x x x x Px B R u T 221
12
)10(11211+--=⎪⎪⎭
⎫
⎝⎛⎪⎪⎭⎫ ⎝
⎛++⨯⨯-=-=-μμμ 此时,相应的闭环系统为 ⎪⎪⎭
⎫
⎝⎛⎪⎪⎭⎫ ⎝⎛+--=-=-2112110)(x x x P B BR A x T μ ,特征值为 )22(2
1
2,1-±+-=μμs (系统是渐近稳定的)。
7.2 应用Matlab 求解二次型最优控制
在Matlab 中,函数
R)Q,B,lqr(A,]E P,K,[= (7-11) 给出了相应二次型最用控制问题的解。
函数输出变量中的K 是最优反馈增益矩阵,P 是Riccati 方程(7-7)的对称正定解矩阵,E 是最优闭环系统的极点。
例7-2(190
P 例7.2.2)对系统u x x x x x x
⎪⎪⎪⎭
⎫ ⎝⎛+⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛---=⎪⎪⎪⎭⎫ ⎝⎛10092735100010321321 ,设计一个最优状态反馈控制器)()(t Kx t u -=,使系统性能指标⎰∞
==⎥⎥⎦
⎤⎢⎢⎣⎡+=0
12
3d t u x I x J R Q T 最小(Q 为
3阶单位矩阵)。
解:系统为能控标准型,存在状态反馈控制器,执行以下m-文件
]9-27-35-1;000;10[A =; ]10;0;[B =;
]1000;100;01[Q =;
[1]R =;
R)Q,B,lqr(A,]E P,K,[=
可得
0.0676
0.1107
0.0143
K =
0.06760.11070.01430.11072.81502.49570.0143
2.49574.2625P =
1.7110i
1.9859- 1.7110i 1.9859-5.0958-E -+=
因此,系统的最优状态反馈控制器为 x u ]0676.01107.00143.0[-=
检验最优闭环系统对初始状态T x ]001[0=的响应,执行以下m-文件
]9-27-35-1;000;10[A =; ]10;0;[B =;
]0.06760.11070.0143[K =
))3(eye ),3(eye ),3(eye K,*B -A (ss sys =; 8:01.0:0t =
)t ]0;0;1[sys (initial x ,,= x *]001[1x '=; x *]010[2x '=; x *]100[x 3'=;
)
x 1'ylabel(')t(sec)'x label('grid
)x 1t (plot )122(subplot ;;,;,,
)
x 2'ylabel(')t(sec)'x label('grid
)x 2t (plot )222(subplot ;;,;,,
)
x 3'ylabel(')t(sec)'x label('grid
)x 3t (plot )322(subplot ;;,;,,
得到如图响应曲线
例7-3(192
P 例7.2.3)系统u x x x x x x
⎪⎪⎪⎭
⎫ ⎝⎛+⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛--=⎪⎪⎪⎭⎫ ⎝⎛100320100010321321 ,x y )001(=,其
中T T y
y y
x x x x )()(32
1 ==,设r 为参考输入,控制信号Kx r k x k x k x r k u -=+--=1332211)()((如图所示)。
为了获得快速响应,加权系数
R q ii >>,性能指标为⎰∞
=⎥
⎥⎥⎥⎥
⎦
⎤⎢⎢⎢⎢⎢⎣⎡+⎪⎪⎪⎭
⎫ ⎝⎛=02d 01.010*********t u x x J R
Q T
求0=r 条件下系统的最优状态反馈控制器)()(t Kx t u -=,使系统性能指标最小,并检验最优闭环系统在)(1t r =的输出相应。
解:系统为能控标准型,存在状态反馈控制器,当0=r ,执行以下m-文件
]3-2-01;000;10[A =; ]10;0;[B =;
]1000;100;0100[Q =;
[0.01]R =;
R)Q,B,lqr(A,]E P,K,[=
可得
11.6711
53.1200100.0000K =
x u ]6711.1112.53100
[-=
最优闭环系统的状态方程为
r Bk x BK A r k Kx B Ax Bu Ax x
11)()(+-=+-+=+= 输出方程为 x Cx y ]001[== 执行以下m-文件检验)(1t r =的输出响应
]3-2-01;000;10[A =;
]10;0;[B =;
]001[C =;
[0]D =; ]6711.110012.53.0000
100[K -=;
K(3)3k K(2)2k K(1)1k ===;;;
% 闭环系统状态空间模型参数 K *B -A A A =;
k1*B B B =; C CC =;
D DD =;
5:01.0:0t =
)t 1,,DD CC,BB,,AA (step ]t x y [=,,; )y t,(plot grid
)
x 1'y output ylabel(')t(sec)'x label('=;
7.3 离散时间系统的线性二次型最优控制
考虑离散自治系统
)()1(k Ax k x =+ (7-12)
系统的性能指标为 ∑∞==0
)()(21k T
k Qx k x J (7-13)
类似于连续系统参数优化,根据Lyapunov 稳定性理论,对给定的对称正定矩阵Q ,由(7-12)的稳定性,可得离散时间Lyapunov 方程
0=+-Q P PA A T (7-14) 存在一个正定对称解矩阵P ,因此
)()())((k Px k x k x V T = (7-15) 是系统(7-12)的一个Lyapunov 函数。
它沿系统(7-12)任意轨迹的差分
)()()1()1())(())1(())((k Px k x k Px k x k x V k x V k x V T T -++=-+=∆
)(])[()()()()(k x P PA A k x k Px k x k PAx A k x T T T T T -=-= 利用(7-14)可得
)()())(())1((k Qx k x k x V k x V T -=-+ (7-16) (7-16)两边∑∞
=0k 并利用系统的渐近稳定性可得
∑∑∞
=∞=+-==00))]1(())(([21)()(21k k T k x V k x V k Qx k x J
∑∞=-++-=−−
→−0
)
157()]1()1()()([21k T T k Px k x k Px k x (中间相抵消) )0()0(2
1Px x J T
=
(7-17) 这表明,只要能从(7-14)求得正定对称矩阵P ,代入(7-17)就可以求得性能指标J ,而无须求无穷级数(7-13)。
例7-4(195P 例7.3.1)系统⎪⎪⎭
⎫
⎝⎛=⎪⎪⎭⎫ ⎝⎛-=+01)0()(111)1(x k x a k x ,,025.0<≤-a ,确
定参数a ,使I Q k Qx k x J k T
==∑∞=,0
)()(21最小。
解:系统极点是a s +±=12,1,因为025.0<≤-a ,系统的两个极点在单位圆内,系统是渐近稳定的,系统性能指标为)0()0(2
1Px x J T
=
由离散时间的Lyapunov 方程解出对称正定的P
0100111111122121211
22121211
=⎪⎪⎭
⎫
⎝⎛+⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫
⎝⎛⎪⎪⎭⎫ ⎝⎛-p p p p a p p p p a 可得
01222212=++p a ap
0)2(221211=--+ap p a p 0121211=+-p p 三个方程解三个未知数
⎪⎪⎪⎪
⎭
⎫
⎝⎛+-+-+-++-
=)2(3)2(1)2(1)
2(22a a a a a a a a a a a P 对025.0<≤-a 范围内的参数值,0>P ,因此系统的性能指标为
)
2(222101)01(21
)0()0(212
1122121211a a a p p p p p Px x J T +-+==⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛== 222
)2()1(3d d a a a t J +--=
对于025.0<≤-a ,
0d d >t
J
,表明J 单调上升,于是J 在25.0-=a 时达到最小值。
3571.2)
25.02(5.025.022min
=-+=J 以下进一步讨论离散系统的线性二次型最优控制问题。
)()()1(k Bu k Ax k x +=+ (7-18)
二次型性能指标为 ∑∞=+=0
)]()()()([21k T T
k Ru k u k Qx k x J (7-19)
R Q 、均为对称正定矩阵。
希望设计一个线性状态反馈控制器使(7-19)最小。
)()(k Kx k u -= (7-20) 类似可以得到,若(7-18)能控,则线性二次型最优控制问题有解,且最优控制器为: )()()(1k x PA B PB B R k u T T -+-= (7-21) 其中P 满足离散时间的Riccati 方程:
0-)(1=++--Q P PA B PB B R PB A PA A T T T T (7-22) 例7-5(619P 例7.3.2)系统)()()1(k u k x k x +=+,求最优状态反馈控制器,使性
能指标∑∞=+=0
22
)]()([21k k u k x J 最小。
解:系统1=A ,1=B ,且1=Q ,1=R
Riccati 方程为: 01)1(1=++--p p p → 012=--p p
该方程的解为:)51(21±=p ,由于P 是正定的,故取)51(2
1
+=p
最优状态反馈控制器为:
)()15(21)()51(2
1
)51(211)()1()(1
1
k x k x k x p p k u --=+⋅⎥⎦⎤⎢⎣⎡++-=+-=--
最优闭环系统为:)()53(2
1
)()15(21)()()()1(k x k x k x k u k x k x -=--=+=+
显然,该系统是渐近稳定的,闭环系统最小性能指标为
)0()51(4
1
)0(2122x px J +==
Matlab 给出了函数dare 来求解离散时间的Riccati 方程(7-22),函数dlqr 则给出了离散系统线性二次型最优控制问题的解(7-21)。