第7章 随机系统最优控制

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Px' (t0 ) = Px (t0 ) = Px0 。
n
∑ 再考虑 x0T x0 = Tr [x0 x0T ] ,其中Tr [ A] = ai ,表示对 n×n 维方阵 A 的对角线元素 ai 求 i =1
和。则有
∫ J
=
1 Tr{2
Px (t f
)Pt f
+1 2
tf t0
Px (t)Q(t)dt}
另一种是基于线性状态空间模型的随机二次型最优控制。事实上,最小方差控制问题可以看
作是随机线性二次型最优控制问题的特例,所以这里只讨论随机线性二次型最优控制问题。
1. 系统状态对随机作用的响应
设在随机作用下系统状态方程为
x(t) = A(t)x(t) + G(t)w(t)
(7-4-1)
初始状态为
x(t0 ) = x0
Cov[x(t0 ), w(τ )] = E{[x(t0 ) − µ0 ][w(t) − Ew(t)]T } = 0
随机状态反馈调节器问题为寻求最优控制 u*(t),使随机二次型性能指标
∫ J
=
E{1 2
xT
(t
f
)Pt f
x(t
f
)
+
1 2
tf [xT (t)Q(t)x(t) + uT (t)R(t)u(t)]dt}
t0
(7-4-29)
最小。其中 Pt f 、Q(t)为半正定对称矩阵、R(t) 正定对称矩阵, t f 固定。这里假定状态均可
量测,反馈采用全部状态。
可以证明有如下定理:随机型状态反馈调节器的最优控制规律与确定性状态反馈调节器
的最优控制规律完全相同,只是随机型状态反馈调节器的性能指标比确定性状态反馈调节器
Px (t0 ) = E{[x0 − µ0 ][x0 − µ0 ]T} = E[x0 x0T ] − µ0 Ex0T − Ex0µ0T + µ0µ0T = E[x0 x0T ] − µ0µ0T
有 Px '(t0 ) = Px (t0 ) + µ0µ0T
Tr {Px '(t0 )P(t0 )} = Tr{µ0µ0T P(t0 ) + Px (t0 )P(t0 )} = µ0T P(t0 )µ0 + Tr {Px (t0 )P(t0 )}
当 w(t) = 0,Q’(t) = 0,系统初始状态为非零均值随机变量,即有 Ex(t0 ) = Ex0 = µ0 ≠ 0 ,
Var[x(t0 )] = Px (t0 ) ,则
Jቤተ መጻሕፍቲ ባይዱ
=
1 2
µ0T P(t0 )µ0
+
1 2 Tr{Px (t0 )P(t0 )}
(7-4-25)
当 w(t) ≠ 0,Q’(t) ≠ 0,并且系统初始状态为确定性,则有

1 GQ' 2 0
τ >0 τ =0 τ <0
2. 系统状态的随机型性能指标 仍考虑系统 x(t) = A(t)x(t) + G(t)w(t)
及其初始状态
(7-4-10’) (7-4-11’) (7-4-13)
x(t0 ) = x0
(7-4-14)
由于 x(t)是在白噪声 w(t)作用下动力学系统的响应,是一个随机过程,如果采用与确定 性二次型性能指标相同的表示方法,即
(7-4-19)和(7-4-20)式即为确定性系统 x(t) = A(t)x(t) + B(t)u(t) x(t0 ) = x0
当 B(t)=0 时的最优控制所满足的黎卡提方程。
(7-4-20)
若 E[x(t0 )] = µ0 ≠ 0 ,仍定义 Px' (t0 ) = E[x0 x0T ] ,这时由方差
+
d dt
[Px
(t ) P(t )]]dt

[Px
(t
f
)P(t
f
)

Px
(t0
)P(t0
)]}
∫ =
1 2
Tr {Px
(t0
)P(t0
)
+
tf t0
[Px
(t
)Q(t
)
+
Px
(t
)
P (t
)
+
Px
(t
)
P(t
)]dt}
将 x(t)的方差阵 Px (t) 满足的(7-4-9)式代入上式,并注意到 Tr [MN ] = Tr [NM ](M、N 为
相同维数方阵),则上式可改写为
∫ J
=
1 2
Tr {Px
(t0
)P(t0
)
+
t f G(t)Q'(t)GT (t)P(t)dt}
t0
其中,P(t)必须满足矩阵微分方程 P(t) + P(t) A(t) + AT (t)P(t) + Q(t) = 0
以及终值条件
(7-4-18) (7-4-19)
Px (t f ) = Pt f
t0
若采用某种控制规律,有以下负反馈形式,即
u(t) = −K~(t)x(t)
七.随机系统最优控制
以上各章都是以确定性系统为基础讨论最优控制问题,而实际上绝对的确定性系统几乎 不存在,各种工程系统中总是或多或少地存在不确定性。
如何处理系统中的不确定性已经是当前控制理论研究的重要问题。引起不确定性的原因 很多,处理的方法也有很多。
随机系统控制理论考虑不确定性问题中的随机扰动部分,方法是将确定性控制系统理论 与概率论、随机过程理论方法相结合。
(7-4-5)
其中
δ
(t
−τ
)
=

1 ε
,
τ

ε 2
<
t

+
ε 2
,为狄拉克
δ
函数;Q’(t)为动态噪声
w(t)的协方差矩阵。
0 , t 等于其他值
并设 x(t0)与 w(t)无关,即
Cov[x(t0 ), w(τ )] = E{[x(t0 ) − µ0 ][w(t) − Ew(t)]T } = 0
对于定常随机系统
x(t) = Ax(t) + Gw(t) x(t0 ) = x0
(7-4-12)
当其具有与上述相同的噪声统计性能时,x(t)的统计性能有类似于上面公式的表达式。
当 t → ∞ 时 Px (t) → P ,有
i’) x(t)的均值满足矩阵微分方程
d [Ex(t)] = AEx(t) + GEw(t) dt E[x(t0 )] = µ0 ii’) x(t)的方差阵满足矩阵代数方程
∫ J
=
1 2
µ0T P(t0 )µ0
+
1 2
Tr
{
tf t0
G(t)Q'(t)GT (t)P(t)dt}
(7-4-26)
以上讨论表明,随机系统的性能指标总是大于相应的确定性系统性能指标,(7-4-21)式
中右边的后两项分别是由于初始状态的随机性和系统的随机干扰而产生的。
3. 随机状态反馈调节器
考虑随机干扰作用下或系统本身存在随机误差时系统的动力学模型 x(t) = A(t)x(t) + B(t)u(t) + w(t)
x(t0 ) = x0 = µ0 ,则有 Px (t0 ) = 0 ,此时即为确定性系统
x(t) = A(t)x(t) x(t0 ) = x0
的性能指标,由(7-4-21)可得
(7-4-22)
J
=
1 2
µ0T P(t0 )µ0
=
1 2
x0T P(t0 )x0
与前面讨论过的确定性系统二次型最优性能指标完全一致。
则可以证明存在下列有关 x(t)统计性能的关系式: i) x(t)的均值满足矩阵微分方程 d [Ex(t)] = A(t)Ex(t) + G(t)Ew(t) dt
(7-4-6) (7-4-7)
E[x(t0 )] = µ0
(7-4-8)
ii) x(t)的方差阵 Px (t) = Var[x(t)] = E{[x(t) − Ex(t)][x(t) − Ex(t)]T } 满足矩阵微分方程
的性能指标变大了。
证明:
先证明确定性系统的一个预备定理:设确定性系统 x(t) = A(t)x(t) + B(t)u(t)
(7-4-30)
x(t0 ) = x0 和性能指标
(7-4-31)
∫ J
=
1 xT 2
(t
f
)Fx(t
f
)
+
1 2
t f [xT (t)Qx(t) + uT (t)Ru(t)]dt
)+
1 2
t f x T (t)Q(t)x(t)dt}
t0
(7-4-16)
作为性能指标。其中 Pt f 为终值项加权矩阵,Q(t)为积分项加权矩阵,均为对称半正定矩阵。 此式可以考虑表示为另外一种形式。 首先假定 E[x(t0 )] = µ0 = 0 。 令 Px' (t0 ) = E[x0 x0T ] ,表示 对 x0 x0T 取均值, 则 此时有
因此得性能指标的最后形式为
∫ J
=
1 2
µ0T P(t0 )µ0
+
1 2
Tr{Px (t0 )P(t0 )
+
t f G(t)Q'(t)GT (t)P(t)dt}
t0
此式中仍应有 P(t)满足(7-4-19)和(7-4-20)式。
※ 讨论:
(7-4-21)
当 w(t) = 0,Q’(t) = 0(即系统无随机干扰),并且系统初始状态为确定性,即
(7-4-7’) (7-4-8’)
APx + Px AT + GQ'GT=0
iii’) x(t)的协方差阵为
(7-4-9’)
Px (τ ) = Φ(τ )Px Px (−τ ) = PxΦ T (τ )
τ

0

iv’) x(t +τ ) 与 w(t)的协方差阵为
Φ(τ )GQ'
Pxw

)
=
τ

0

(7-4-10)
其中 Φ(t + τ , t) 为系统(7-4-1)的状态转移矩阵。
iv) x(t + τ ) 与 w(t)的协方差阵为
Φ(t + τ ,t)G(t)Q'(t)
Pxw
(t
+
τ
,
t)
=

1 G(t)Q' 2 0
(t
)
τ >0 τ =0 τ <0
(7-4-11)
(7-4-2)
其中 x(t)是 n 维随机状态向量;x0 是 n 维随机初始状态向量,其统计性能为
E[x(t0 )] = E[x0 ] = µ0
(7-4-3)
Var[x(t0 )] = E{[x0 − µ0 ][x0 − µ0 ]T } = Px (t0 ) = Px0
(7-4-4)
w(t)是 m 维零均值高斯白噪声过程,统计性能为 Cov[w(t), w(τ )] = E[w(t)w(τ )T ] = Q'(t)δ (t −τ )
∫ Js
=
1 2
xT (t f
)Pt f
x(t f
)
+
1 2
t f xT (t)Q(t)x(t)dt
t0
(7-4-15)
则 Js 就无法象确定性系统那样是一个确定数值,而是一个随机变量。要求得确定性的性
能指标数值,需要考虑用 Js 的数学期望
∫ J
=
EJ s
=
E{1 2
x T (t f
)Pt f
x(t f
(7-4-27)
x(t0 ) = x0
(7-4-28)
其中 x(t)为 n 维状态向量,w(t)为 n 维零均值高斯白噪声向量,u(t)为 m 维控制向量;
E[x(t0 )] = E[x0 ] = µ0 , Var[x(t0 )] = E{[x0 − µ0 ][x0 − µ0 ]T } = Px (t0 ) = Px0 ; Cov[w(t), w(τ )] = E[w(t)w(τ )T ] = Q'(t)δ (t −τ ) ;
Px (t) = A(t)Px (t) + Px (t) AT (t) + G(t)Q'(t)G T (t) 及初始条件
(7-4-9)
Px (t0 ) = Px0 iii) x(t)的协方差阵为
Px (t + τ ,t) = Φ(t + τ ,t)Px (t) Px (t,t + τ ) = Px (t)ΦT (t + τ ,t)
随机系统最优控制作为随机系统控制理论的重要组成部分,是建立在最优状态估计基础 之上的,因此本章首先讨论最优状态估计问题。
7.1 最优状态估计(最优线性滤波)—Kalman 滤波
1.状态估计问题的提法 2.离散系统线性滤波—Kalman 滤波公式 3.白噪声情况下一般线性系统的 Kalman 滤波公式
7.2 滤波的稳定性问题
1.稳定性的基本概念 2.系统的一致完全能观性和一致完全能控性 3.滤波稳定性定理 4.定常系统滤波稳定性
7.3 连续系统 Kalman 滤波
1.问题提法 2.滤波公式推导方法
7.4 随机系统最优控制
随机系统最优控制的表现形式主要有两种,一种是基于输入输出模型的最小方差控制,
(7-4-17)
∫ 在 上 式 右 边 加 上 一 项
1{ tf 2 t0
d dt
[Px
(t)P(t)]dt

[Px
(t
f
)P(t
f
)

Px
(t0
)P(t0
)]}
=
0
,并令
Px (t f ) = Pt f ,则上式可表示为
∫ J
=
Tr
{1 2
Px
(t
f
)Pt f
+1 2
tf t0
[ Px
(t )Q(t )
(7-4-23)
当 w(t) ≠ 0,Q’(t) ≠ 0,系统初始状态为零均值随机变量,即有 Ex(t0 ) = Ex0 = µ0 = 0 ,
Var[x(t0 )] = Px (t0 ) ,则有
∫ J
=
1 2
Tr {Px
(t0
)P(t0
)
+
t f G(t)Q'(t)GT (t)P(t)dt}
t0
(7-4-24)
相关文档
最新文档