自适应控制-鲁棒控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
B ( z 1 ) C ( z 1 ) y( k d ) u( k ) v(k d ) 1 1 A( z ) A( z ) d 1 C ( z 1 ) z E z ( ) 1 D( z ) 其中 1 A( z ) A( z 1 )
(2)
显然v(k), v(k-1), …与输出观测量y(k), y(k-1), … 相关,而v(k+1), …, v(k+d)与它们无关。
其中的x(k)、u(k)均为向量,Q0(k)≥0, Q1(k) ≥ 0, Q2(k) > 0
2012-4-17
概述—自适应控制发展背景
随机最优问题
满足状态方程和关于{w(k)、v(k),x(0)} 的统计特性的条件下,找出使性能指标 最优的控制律 u*(k)=u[x(k),k] 如果 {w(k)}与{v(k) }是高斯分布的情况, 称之为LQG问题。
2012-4-17
设
概述—自适应控制基本特点和分类
自适应控制系统基本特点
在线辨识对象模型(直接或间接) 综合最优控制律,以达到期望性能指标 自动修正控制器参数
即通过在线辨识获得自适应能力。
自适应控制系统的分类
具有对象数学模型在线辨识的自适应系统
(自校正控制) 模型参考自适应控制系统
模型辨识—递推最小二乘估计
基本思想: 分析第 N 次和第 N+1 次参数估计
间的关系,得出最小二乘法的递推算式。 T T 1 ˆ 由 N ( X N X N ) X N YN T T 1 ˆ (X X ) X Y
N 1 N 1 N 1 N 1 N 1
其中
YN YN 1 y( n N 1)
自适应控制 (Adaptive Control)
内容概要
概述—自适应控制发展背景 自校正控制器 自校正调节器—STR 自校正控制器—STC 模型参考自适应控制—MRAS
2012-4-17
概述—自适应控制发展背景
回顾—线性系统最优控制
对象与环境确定——精确的数学模型 控制要求——用性能指标描述 控制作用——对性能指标求极值(最优 控制律) 是一种系统而精确的设计方法
A(z ) y(k) B(z )u(k d ) C(z )v(k)
寻找一个控制策略,使系统输出的方差为 最小,故称为最小方差控制。
1
1
1
2012-4-17
最小方差控制
设被控对象的数学模型 1 1 1 A( z ) y ( k ) B ( z )u( k d ) C ( z )v ( k ) (1) 由于被控对象存在d步的纯滞后, k时刻的u(k)只 能影响(k+d)时刻的输出y(k+d)。所以
2012-4-17
概述—自适应控制发展背景
考虑不确定性(1)、(2)对系统的影响,产
生了随机最优控制。 系统的状态方程和量测方程为
x ( k 1) A( k ) x ( k ) B ( k )u ( k ) w( k ) y (k ) C (k ) x(k ) v(k )
其中被控对象模型为 A( z 1 ) y ( k ) z d B( z 1 ) u( k ) C( z 1 ) v ( k ) A( z 1 ) 1 a1z 1 ana z na B ( z 1 ) b1 z 1 bnb z nb
其中噪声w(k)、v(k)和状态初值x(0)的统 计性质已知
2012-4-17
概述—自适应控制发展背景
随机型性能指标为
min J E{ [x T ( k )Q1 ( k ) x( k ) uT ( k )Q2 u( k )]
k 0
N 1
x T ( N )Q0 ( N ) x( N )}
2012-4-17
模型辨识—闭环可辨识条件
v(k)
r(k)
控制器
被控对象
u(k)
ቤተ መጻሕፍቲ ባይዱ
C ( z 1 ) 滤波器 A( z 1 )
y(k)
Q( z 1 ) F ( z 1 )
z d A( z 1 ) B ( z 1 )
参数计算
ˆ
参数估计器
闭环稳定的单输入输出系统
2012-4-17
模型辨识—闭环可辨识条件
最优控制 在对象模型、干扰统计特性已知情况下,
计最优控制律。 一旦设计完成,在控制过程中控制规律不再 改变。 自适应控制----控制对象是不确定性系统 模型结构与参数未知或时变 干扰随机与突发,统计特性未知 最优控制律:在控制过程中根据系统运行信 息,应用在线辨识,使模型逐步完善,控制 律亦不断得到改进。
2012-4-17
最小方差控制
用长除法将
C ( z 1 ) v(k d ) 1 A( z )
分解为与观测量相关
与不相关两部分
B ( z 1 ) E ( z 1 ) 1 y( k d ) u ( k ) v ( k ) D ( z )v ( k d ) 1 1 A( z ) A( z )
由实时的y(k)、u(k)序列 →(估计算法)估 ˆ (k) →(性能指 计未知参数 ˆ (k)和未知状态 x 标)求取最优控制律u(k) →施作用于系统。 反复进行上述过程,使性能指标不断保持最 优。
2012-4-17
自校正控制
特点:
--利用过程的输入和输出信号,对过程的数学 模型进行在线辨识 --修正控制策略,改变调节器的控制作用 --反复辨识、修正,直到控制性能指标达到或 接近最优
需要解决的问题
--在线与闭环模型辨识 --性能指标的确定 --控制策略及其算法
2012-4-17
自校正控制
常用的辨识算法 递推最小二乘(RLS) 递推广义最小二乘(RELS) 递推极大似然(RML) 递推扩展并联结构模型参考(REPM)等 常用的控制算法
最小方差、广义最小方差、极点配置、模型跟 随、PID、最小时间(拍)等
2012-4-17
模型辨识—一次完成最小二乘估计
特点
(1) 观测到 N 组数据以后,根据上式一次求得 参数估计值 ˆ (故称为一次完成法); (2)这种方法无法在线辨识 ˆ ; (3) 随着数据的增多,即使离线辨识也变得困 难。 要解决在线辨识问题,需引入递推辨识算 法
2012-4-17
2012-4-17
模型辨识—一次完成最小二乘估计
设系统由下列n阶差分方程描述
y(k)+a1y(k-1)+…+ any(k-n)= b0u(k)+…+ bnu(k-n)+v(k) 或写成: A(z-1)y(k)=B (z-1)u(k)+v(k) 其中 A(z-1)=1+ a1 z-1 +…+ an z-n B(z-1)=b0 +b1 z-1 +…+ bn z-n 问题:阶次n已知, {v(k)}是不可测随机干扰,在离 散时间序列{y(k)}、{u(k)} 得到后,要估计模型参数 ˆ =[a1,…, an,b0 ,b1,…,bn]T
2012-4-17
概述—自适应控制发展背景
典型最优控制——线性二次型最优控制
系统状态方程和初始条件: A (t ) x B (t )u x x (t 0 ) x 0 性能指标为二次型泛函:
1 min J 2
t1
t0
( x T Q ( t ) x u T R ( t ) u ) dt
其中Q与R连续、对称,Q半正定,R正定, u * (t ) R 1 (t ) B T (t ) P (t ) x (t ) 则有最优控制解析解: P(t)为Riccati方程的解。
2012-4-17
概述—自适应控制发展背景
实际的动态过程常存在“不确定性”:
(1)随机扰动输入 (2)量测噪声 (3)系统模型结构与参数的不确定性
2012-4-17
概述—自适应控制发展背景
随机最优控制考虑了不确定性(1)、(2)对
系统的影响,对不确定性(3)却无能为力
自适应控制在随机最优控制基础上考虑系
统不确定性(3)发展而来
最优控制与自适应控制的相同点
基于模型和性能指标 综合出最优控制律
2012-4-17
概述—最优控制与自适应控制的区别
2012-4-17
模型辨识—闭环可辨识条件
闭环可辨识条件:
(1)闭环稳定。否则{y(k)}不是平稳随机过程(j
即过程的统计特性不随时间的平移而变化)。 ( 2 )调节器的阶次 nf 大于等于 na ,或 nq 大于等 于nb(- d)。
2012-4-17
最小方差控制
最小方差控制的目标
对给定的CARMA模型
2012-4-17
模型辨识—一次完成最小二乘估计
取性能指标
T J e 2 ( k ) V N V N (Y N X N ˆ )T (Y N X N ˆ ) k n1 n N
对性能指标求偏导,可以取到使J最小的 ˆ T T 1 ˆ ( X N X N ) X N YN T 为保证 X N X N 满秩,要求N≥2n+1
利用矩阵求逆定理,得
PN 1
PN x ( n N 1) x T ( n N 1) PN PN T 1 x ( n N 1) PN x ( n N 1)
其中, PN 的物理意义是参数估计误差之方差。
2012-4-17
模型辨识—递推最小二乘估计
若定义中间变量KN+1,即
推导可得最小二乘估计的递推公式
ˆ
N 1
2012-4-17
模型辨识—递推最小二乘估计
递推算式特点
每次求新的参数估计值 ˆ N 1 用新的实际测量值y(n+N+1)与基于老模型 T ˆ 间的偏差 进行预测得到的量 x ( n N 1) N 对老的参数估计值 ˆ N 加以修正得到 修正系数阵为KN+1。
2012-4-17
模型辨识—一次完成最小二乘估计
设k时刻前的n次采样数据记为
xT(k)=[-y(k-1), …, -y(k-n), u(k), …,u(k-n)] 则系统可写成 y(k)= xT(k)ˆ +v(k) 将 k=n+1, n+2, … , n+N共N步采样数据代入 上式,组成N个方程,用矩阵形式表达 YN=XN +VN XN为N×(2n+1)维矩阵
C ( z 1 ) 1 c1 z 1 cnc z nc
控制器多项式为 n F ( z 1 ) 1 f 1 z 1 f n f z f
Q ( z ) q 0 q1 z 1 q nq z 1
nq
v(k) 是零均值白噪声。
(3)
设多项式所有零点都在单位圆内或单位圆上,由(1) 1 d 1 A ( z ) z B ( z ) (4) 有 v(k ) y( k ) u( k ) 1 1
C(z ) C(z )
将(4)式代入(3), 并注意到(2),得
E ( z 1 ) B ( z 1 ) D ( z 1 ) 1 y( k d ) y ( k ) u ( k ) D ( z )v ( k d ) (5) 1 1 C(z ) C(z )
XN X N 1 T x (n N 1)
2012-4-17
模型辨识—递推最小二乘估计
定义: PN
(X
T N T
X
N
) 1
1
T 1
PN 1 ( X N 1 X N 1 )
T
= ( X N X N x ( n N 1 ) x ( n N 1))
K N 1
则
PN x ( n N 1) T 1 x ( n N 1) PN x ( n N 1)
PN 1 PN K N 1 x ( n N 1) PN
T ˆ N K N 1 [ y ( n N 1) x ( n N 1)ˆN ]
2012-4-17
自校正控制
自适应控制系统中应用最为广泛的一类 理论基础:估计理论与随机最优 系统由被控过程、辨识器和控制器组成:属随
机自适应控制系统。
被控对象 u(k)
^θ(k)
ξ(k)
最优控制
辨识器
^x(k)
y(k)
具有模型在线辨识的自适应控制系统
2012-4-17
自校正控制
工作原理
(2)
显然v(k), v(k-1), …与输出观测量y(k), y(k-1), … 相关,而v(k+1), …, v(k+d)与它们无关。
其中的x(k)、u(k)均为向量,Q0(k)≥0, Q1(k) ≥ 0, Q2(k) > 0
2012-4-17
概述—自适应控制发展背景
随机最优问题
满足状态方程和关于{w(k)、v(k),x(0)} 的统计特性的条件下,找出使性能指标 最优的控制律 u*(k)=u[x(k),k] 如果 {w(k)}与{v(k) }是高斯分布的情况, 称之为LQG问题。
2012-4-17
设
概述—自适应控制基本特点和分类
自适应控制系统基本特点
在线辨识对象模型(直接或间接) 综合最优控制律,以达到期望性能指标 自动修正控制器参数
即通过在线辨识获得自适应能力。
自适应控制系统的分类
具有对象数学模型在线辨识的自适应系统
(自校正控制) 模型参考自适应控制系统
模型辨识—递推最小二乘估计
基本思想: 分析第 N 次和第 N+1 次参数估计
间的关系,得出最小二乘法的递推算式。 T T 1 ˆ 由 N ( X N X N ) X N YN T T 1 ˆ (X X ) X Y
N 1 N 1 N 1 N 1 N 1
其中
YN YN 1 y( n N 1)
自适应控制 (Adaptive Control)
内容概要
概述—自适应控制发展背景 自校正控制器 自校正调节器—STR 自校正控制器—STC 模型参考自适应控制—MRAS
2012-4-17
概述—自适应控制发展背景
回顾—线性系统最优控制
对象与环境确定——精确的数学模型 控制要求——用性能指标描述 控制作用——对性能指标求极值(最优 控制律) 是一种系统而精确的设计方法
A(z ) y(k) B(z )u(k d ) C(z )v(k)
寻找一个控制策略,使系统输出的方差为 最小,故称为最小方差控制。
1
1
1
2012-4-17
最小方差控制
设被控对象的数学模型 1 1 1 A( z ) y ( k ) B ( z )u( k d ) C ( z )v ( k ) (1) 由于被控对象存在d步的纯滞后, k时刻的u(k)只 能影响(k+d)时刻的输出y(k+d)。所以
2012-4-17
概述—自适应控制发展背景
考虑不确定性(1)、(2)对系统的影响,产
生了随机最优控制。 系统的状态方程和量测方程为
x ( k 1) A( k ) x ( k ) B ( k )u ( k ) w( k ) y (k ) C (k ) x(k ) v(k )
其中被控对象模型为 A( z 1 ) y ( k ) z d B( z 1 ) u( k ) C( z 1 ) v ( k ) A( z 1 ) 1 a1z 1 ana z na B ( z 1 ) b1 z 1 bnb z nb
其中噪声w(k)、v(k)和状态初值x(0)的统 计性质已知
2012-4-17
概述—自适应控制发展背景
随机型性能指标为
min J E{ [x T ( k )Q1 ( k ) x( k ) uT ( k )Q2 u( k )]
k 0
N 1
x T ( N )Q0 ( N ) x( N )}
2012-4-17
模型辨识—闭环可辨识条件
v(k)
r(k)
控制器
被控对象
u(k)
ቤተ መጻሕፍቲ ባይዱ
C ( z 1 ) 滤波器 A( z 1 )
y(k)
Q( z 1 ) F ( z 1 )
z d A( z 1 ) B ( z 1 )
参数计算
ˆ
参数估计器
闭环稳定的单输入输出系统
2012-4-17
模型辨识—闭环可辨识条件
最优控制 在对象模型、干扰统计特性已知情况下,
计最优控制律。 一旦设计完成,在控制过程中控制规律不再 改变。 自适应控制----控制对象是不确定性系统 模型结构与参数未知或时变 干扰随机与突发,统计特性未知 最优控制律:在控制过程中根据系统运行信 息,应用在线辨识,使模型逐步完善,控制 律亦不断得到改进。
2012-4-17
最小方差控制
用长除法将
C ( z 1 ) v(k d ) 1 A( z )
分解为与观测量相关
与不相关两部分
B ( z 1 ) E ( z 1 ) 1 y( k d ) u ( k ) v ( k ) D ( z )v ( k d ) 1 1 A( z ) A( z )
由实时的y(k)、u(k)序列 →(估计算法)估 ˆ (k) →(性能指 计未知参数 ˆ (k)和未知状态 x 标)求取最优控制律u(k) →施作用于系统。 反复进行上述过程,使性能指标不断保持最 优。
2012-4-17
自校正控制
特点:
--利用过程的输入和输出信号,对过程的数学 模型进行在线辨识 --修正控制策略,改变调节器的控制作用 --反复辨识、修正,直到控制性能指标达到或 接近最优
需要解决的问题
--在线与闭环模型辨识 --性能指标的确定 --控制策略及其算法
2012-4-17
自校正控制
常用的辨识算法 递推最小二乘(RLS) 递推广义最小二乘(RELS) 递推极大似然(RML) 递推扩展并联结构模型参考(REPM)等 常用的控制算法
最小方差、广义最小方差、极点配置、模型跟 随、PID、最小时间(拍)等
2012-4-17
模型辨识—一次完成最小二乘估计
特点
(1) 观测到 N 组数据以后,根据上式一次求得 参数估计值 ˆ (故称为一次完成法); (2)这种方法无法在线辨识 ˆ ; (3) 随着数据的增多,即使离线辨识也变得困 难。 要解决在线辨识问题,需引入递推辨识算 法
2012-4-17
2012-4-17
模型辨识—一次完成最小二乘估计
设系统由下列n阶差分方程描述
y(k)+a1y(k-1)+…+ any(k-n)= b0u(k)+…+ bnu(k-n)+v(k) 或写成: A(z-1)y(k)=B (z-1)u(k)+v(k) 其中 A(z-1)=1+ a1 z-1 +…+ an z-n B(z-1)=b0 +b1 z-1 +…+ bn z-n 问题:阶次n已知, {v(k)}是不可测随机干扰,在离 散时间序列{y(k)}、{u(k)} 得到后,要估计模型参数 ˆ =[a1,…, an,b0 ,b1,…,bn]T
2012-4-17
概述—自适应控制发展背景
典型最优控制——线性二次型最优控制
系统状态方程和初始条件: A (t ) x B (t )u x x (t 0 ) x 0 性能指标为二次型泛函:
1 min J 2
t1
t0
( x T Q ( t ) x u T R ( t ) u ) dt
其中Q与R连续、对称,Q半正定,R正定, u * (t ) R 1 (t ) B T (t ) P (t ) x (t ) 则有最优控制解析解: P(t)为Riccati方程的解。
2012-4-17
概述—自适应控制发展背景
实际的动态过程常存在“不确定性”:
(1)随机扰动输入 (2)量测噪声 (3)系统模型结构与参数的不确定性
2012-4-17
概述—自适应控制发展背景
随机最优控制考虑了不确定性(1)、(2)对
系统的影响,对不确定性(3)却无能为力
自适应控制在随机最优控制基础上考虑系
统不确定性(3)发展而来
最优控制与自适应控制的相同点
基于模型和性能指标 综合出最优控制律
2012-4-17
概述—最优控制与自适应控制的区别
2012-4-17
模型辨识—闭环可辨识条件
闭环可辨识条件:
(1)闭环稳定。否则{y(k)}不是平稳随机过程(j
即过程的统计特性不随时间的平移而变化)。 ( 2 )调节器的阶次 nf 大于等于 na ,或 nq 大于等 于nb(- d)。
2012-4-17
最小方差控制
最小方差控制的目标
对给定的CARMA模型
2012-4-17
模型辨识—一次完成最小二乘估计
取性能指标
T J e 2 ( k ) V N V N (Y N X N ˆ )T (Y N X N ˆ ) k n1 n N
对性能指标求偏导,可以取到使J最小的 ˆ T T 1 ˆ ( X N X N ) X N YN T 为保证 X N X N 满秩,要求N≥2n+1
利用矩阵求逆定理,得
PN 1
PN x ( n N 1) x T ( n N 1) PN PN T 1 x ( n N 1) PN x ( n N 1)
其中, PN 的物理意义是参数估计误差之方差。
2012-4-17
模型辨识—递推最小二乘估计
若定义中间变量KN+1,即
推导可得最小二乘估计的递推公式
ˆ
N 1
2012-4-17
模型辨识—递推最小二乘估计
递推算式特点
每次求新的参数估计值 ˆ N 1 用新的实际测量值y(n+N+1)与基于老模型 T ˆ 间的偏差 进行预测得到的量 x ( n N 1) N 对老的参数估计值 ˆ N 加以修正得到 修正系数阵为KN+1。
2012-4-17
模型辨识—一次完成最小二乘估计
设k时刻前的n次采样数据记为
xT(k)=[-y(k-1), …, -y(k-n), u(k), …,u(k-n)] 则系统可写成 y(k)= xT(k)ˆ +v(k) 将 k=n+1, n+2, … , n+N共N步采样数据代入 上式,组成N个方程,用矩阵形式表达 YN=XN +VN XN为N×(2n+1)维矩阵
C ( z 1 ) 1 c1 z 1 cnc z nc
控制器多项式为 n F ( z 1 ) 1 f 1 z 1 f n f z f
Q ( z ) q 0 q1 z 1 q nq z 1
nq
v(k) 是零均值白噪声。
(3)
设多项式所有零点都在单位圆内或单位圆上,由(1) 1 d 1 A ( z ) z B ( z ) (4) 有 v(k ) y( k ) u( k ) 1 1
C(z ) C(z )
将(4)式代入(3), 并注意到(2),得
E ( z 1 ) B ( z 1 ) D ( z 1 ) 1 y( k d ) y ( k ) u ( k ) D ( z )v ( k d ) (5) 1 1 C(z ) C(z )
XN X N 1 T x (n N 1)
2012-4-17
模型辨识—递推最小二乘估计
定义: PN
(X
T N T
X
N
) 1
1
T 1
PN 1 ( X N 1 X N 1 )
T
= ( X N X N x ( n N 1 ) x ( n N 1))
K N 1
则
PN x ( n N 1) T 1 x ( n N 1) PN x ( n N 1)
PN 1 PN K N 1 x ( n N 1) PN
T ˆ N K N 1 [ y ( n N 1) x ( n N 1)ˆN ]
2012-4-17
自校正控制
自适应控制系统中应用最为广泛的一类 理论基础:估计理论与随机最优 系统由被控过程、辨识器和控制器组成:属随
机自适应控制系统。
被控对象 u(k)
^θ(k)
ξ(k)
最优控制
辨识器
^x(k)
y(k)
具有模型在线辨识的自适应控制系统
2012-4-17
自校正控制
工作原理