二级倒立摆系统的最佳控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)
式中:m1,J1,l1 分别是下摆质量,转动惯量, 质心到A的距离;m2,J2,l2 分别是上摆质量,转 动惯量,质心到B的距离;L1 是下摆长度;m0是小 车和驱动系统的等效质量;g0,g1,g2分别是小车 磨擦系数,下摆、上摆磨擦力矩系数;K是控制力 系数,u是控制电压;g是重力加速度。
在 S=φ1=φ2=0 以及 S’=φ1’=φ2’=0 附 近,对方程(1)作线性化处理,并略去高阶小量,可 得系统状态方程为:
m2l2S”–m2l2L1φ1”–(J2+m2l22)φ2”+g2φ1’–g2φ2’+m2l2gφ2=0 (m1l1–m2L1)S”–(J1+m1l12–m2L12)φ1”+m2l2L1φ2”+
–(g1+g2)φ1’+g2φ2’+(m1l1+m2L1)gφ1=0 (m0+m1+m2)S”–(m1l1+m2L1)φ1”–m2l2φ2”+g 0 S’–Ku=0
*************************************************
(上接第 61 页)
仿真结果证明,应用现代控制理论对二级倒立 摆这样的不稳定系统进行控制,有较强的控制能力。 但是对于不同的离散时间和不同的 Q、R 矩阵得出 的结果是不完全相等的。在设计中如何选取离散时 间有可参考的原则,如何取 Q、R 矩阵等,只有对 得到的结果进行分析,选取一组较好的参数才行。
+Λ
Λ
+
=
Σ
⎨ ⎪T
Aτ
∞
(AT)i
(4)
⎪⎪Bd = (∫ edτ)B = TΣ B
⎪⎩0
i = 0 (i +1)!
T—离散时间。
从 (4) 式 可 求 出 等 效 的 离 散 控 制 系 统 状 态 矩 阵
Ad,Bd。等效的离散控制系统结构如图 2。
Bd +
u
-H
Z-1
X
CLeabharlann Baidu
Y
Ad
Xˆ Xˆ 状态重构变量
制量调节波门,从而实现随目标特征变化波门的自 识别。启动鼠标导引功能一段时间之后,控制流程
动调节。调节波门之后,波门内部图像的平均亮度 切出鼠标导引控制,进入其他的图像处理和跟踪控
特征更接近于目标的亮度特征,有助于目标的稳定 制流程。以红外跟踪为例,部分控制流程如图 2。
输出跟踪状态 目标截获信号
输出目标距离
L2
Xˆ
图 3 离散控制系统观测器
由上节知最佳反馈量是 u(K)=-H(K),这里 H
—最佳反馈阵; Xˆ —状态估值,而 Y=CX。
设 g(K)=C1X
(11)
⎡C ⎤ ⎢⎣C1⎥⎦
为
非奇异阵
。
令[L1
L2]=
⎡C ⎤ ⎢⎣C1⎥⎦
-1
(12)
从而状态估值是
Xˆ (K)
=
[L1
L2
⎡Y(K)⎤
]⎢⎣gˆ (K)
兵工自动化 2006 年第 25 卷第 1 期
测控技术 Measurement and Control Technique
O. I. Automation 2006, Vol. 25, No. 1
文章编号:1006-1576(2006)01-0060-02
二级倒立摆系统的最佳控制
阮治明 (国营 5308 厂,江苏 扬州 225009)
(9)
式(9)中 P 是 Riccati 方程的稳态解。
对离散控制系统而言,Riccati 方程为:
P(K)=Q+AdTP(K+1)(I+BdR-1BdT P(K+1))-1Ad
(10)
P(N)=0
选取了一定的 Q,R 阵且取离散时间 T=0.02s
后 , 代 入 具 体 参 数 可 得 最 佳 反 馈 阵 H= [2.3984, -559.8893, -122.6814, 2.3467, -64.4182, -23.8309], 此离散最佳反馈系统闭环特征值为:(0.8119, 0.8423,
参考文献:
0.6 0.4 0.2 0 -0.2 -0.4 -0.6 系列 1
1 0.5 0 -0.5 -1 方位跟踪误差 0.16mil 系列 2 高低跟踪误差 0.10mil
图 3 截取自动跟踪数据
[1] Furuta K, Ochiai T, Ono N. Altitude Control A Triple Inverted Pendulum [J]. Int. J. Control, 1984, 39 (6): 1351-1365.
Keywords: Optimal control; Double inverted pendulum; Unstable system
1 引言
单级倒立摆是复杂的、多变量、非线性不稳定 系统,其控制方法众多。现用最佳控制理论给离散 后的二级倒立摆系统进行状态重构,合理选择 Riccati 方程中的 Q、R 阵,设计降维观测器,以实 现该不稳定系统的最佳反馈控制。
制系统仿真计算后的状态变量轨迹描绘在图 4。
y Φ2
10
u
s
t
4
Φ1
图 4 倒摆系统状态变量轨迹图
5 结论
(下转第 63 页)
·61·
兵工自动化 2006 年第 25 卷第 1 期
测控技术 Measurement and Control Technique
O. I. Automation 2006, Vol. 25, No. 1
⎡ 0.870 0.001 0.000 ⎤
D
=
⎢ ⎢
0.050
0.910
0.004
⎥ ⎥
⎢⎣− 0.113 − 0.003 0.919⎥⎦
D 的 特 征 值 为 : (0.8698+i 0.0000, 0.9147+
i-0.0025, 0.9147+i0.0025)。可见,矩阵 D 是稳定的。
设计了观测器后,二级倒立摆等效离散最佳控
半 自自 动动 发现目标
红外是否可靠 N 提取目标?
Y 自动跟踪
目标进入激光测程 后启动激光测距
半自动跟踪目标
用操纵杆将目标拉到屏 幕中心区域后切换自动
启动鼠标导引和自适应阈值波门并 控制图像处理进入相应处理流程
输出跟踪信息 分割识别阈值 目标亮度值等
延时一段时间(本 例 20 帧图像时间)
切出鼠标导引
D=C1A dL2-LkCAdL2 E=C1AdL2LK-LKCAdL2LK+C1AdL1-LKCAdL1 G=C1Bd-LkCBd
(15)
到此,降维观测器的三个矩阵D,E,G可以计
算得到。只要选择好系数矩阵LK,就能计算出D,E, G,观测器也就设计出来了。为节省篇幅,具体矩
阵不一一列写了,只把矩阵D及其特征值列出:
⎧X = AX + Bu
⎩⎨Y = CX
(2)
X=[x1 x2 x3 x4 x5 x6]T=[S φ1 φ2 S’ φ1’ φ2’ ]T Y=[y1 y2 y 3]T=[S φ1 φ2 ]T
矩阵 A、B、C 是 6×6、1×6、3×6 的矩阵。
3 最佳反馈控制系统
若用经典控制理论,即设计通常的 PID 调节器, 难以达到最佳反馈控制。对于二级倒立摆这样的不 稳定系统,为了达到最佳控制性能,应用最佳控制
关键词:最佳控制;二级倒立摆;不稳定系统 中图分类号:TP273.1 文献标识码:A
Optimal Control of Double Inverted Pendulum System
RUAN Zhi-ming (The National 5308th Factory, Yangzhou 225009, China)
0.8791, 0.9387, 0.9518, 0.9627)。系统是稳定的。
4 倒摆系统观测器
现已得出离散最佳反馈控制系统,但只有x1、 x2、x3状态变量可量测,为实现最佳反馈须对x4、 x5、x6状态变量重构,应设计离散控制系统降维观 测器,如图 3。
Y(k) E
+
G
U(k)
Z-1
+ D
Lk
+
摘要:二级倒立摆系统的最佳控制利用最佳控制理论对其状态重构,构建最佳反馈离散控制器,并合理选择 Riccati 方程中的 Q、R 矩阵,设计离散控制降维观测器获得最佳反馈矩阵。由于不同离散时间和相应的不同矩阵其 结果不完全相等,故对得到结果进行计算分析,最终选取一组较好参数作为离散时间和相关矩阵,以实现最佳控制。
H(K) 为 最 佳 反 馈 阵 , 即 最 佳 状 态 调 节 器 , 以
H(K)表示。
X(K+1)=(Ad-BdH)X(K)=(Ad-BdR-1BdTP
(I+BdR-1BdTP)-1Ad)X(K)
(7)
令Ad=Ad-BdR-1BdTP(I+BdR-1BdTP)-1Ad
(8)
则X(K+1)=AdX(K)
2 系统描述及数学模型
二级倒立摆控制系统由上摆、下摆及小车组 成,如图 1 所示。
Φ2
B
Φ1
A
m0
S
C
D
图 1 二级倒立摆控制系统示意图
A—下摆电位计;B—上摆电位计 C—小车位移传感器;m0—代表小车 Φ1—下摆转过的角度,取向左摆为正值 Φ2—上摆转过的角度,取向左摆为正值 S—小车的移动,向右为正;D—电机 根据动力学原理经简化后可推导出二级倒立
测控技术 Measurement and Control Technique
O. I. Automation 2006, Vol. 25, No. 1
连续控制系统的等效离散控制系统为:
X(K+1)=AdX(K)+Bdu(K)
(3)
式中
⎧(AT)2 ∞ (AT)i
⎪
⎪⎪⎪2A!d
=
eAT = I + AT != 0 i!
⎥ ⎦
(13)
根据现代控制理论推导可得
(K)=F(K)+LkY(K) F(K+1)=(C1A dL2-LkCAdL2)F(k)+(C1AdL2LK-LKCAdL2LK
+C1AdL1-LKCAdL1)Y(K)+(C1Bd-LkCBd)u(k)=
DF(K)+EY(K)+Gu(K)
(14)
F(0)=0
(14)式中三个矩阵是:
图 2 离散最佳反馈控制系统结构图
对离散控制系统而言,在最小二次型性能指
标函数 J 的约束下,可求出最佳调节器。
J
=
Jmin
=
N−1
∑(
1
k=0 2
XT (K)QX(K)
+
1 2
uT (K)Ru(K))
(5)
最佳调节器为:
u(K)=-H(K)X(K)
(6)
H(K)=R-1BdTP(I+BdR-1BdTP)-1Ad
Abstract: The optimal control of double inverted pendulum system is that State variables are reconstructed by optimal control theory, optimal feedback discrete controller is set up. The matrix Q, R of Riccati equation and discrete time are rationally selected, discrete reduced observer is designed to obtain optimal feedback control matrix. The obtained results were calculated and analyzed due to different results brought on different discrete time and different matrix, and a set of better parameter was selected to use as discrete time and correlation matrix, and then optimal control of double inverted pendulum system is realized.
红外截获目标是否有效?
Y 自动跟踪
N
目标亮度值是否低于
图像最低分割阈值?
输出跟踪状态 目标截获信号
结束
目标进入激光测程 后启动激光测距
输出目标距离
图 2 红外跟踪部分控制流程示意图
3 试验分析
该自适应控制方法适用于复杂背景下目标特别 是弱小目标的稳定跟踪。在多云的复杂背景下,能 对 24km 左右的弱小目标实施跟踪和数据采集,截取 自动跟踪部分数据绘制方位、高低跟踪误差曲线, 如图 3 所示。由方位、高低的跟踪误差曲线图和计 算所得的跟踪误差可以看到,基于图像处理自适应 阈值跟踪波门技术和鼠标导引功能的跟踪控制流程 在实际跟踪控制中的跟踪效果是很稳定的、有效的。
摆的动力学方程如下:
理论,能设计出具有最佳反馈的离散控制系统。其
收稿日期: 2005-05-30;修回日期:2005-07-08 作者简介:阮治明(1942-),男,江苏人,1967 年硕士研究生毕业于北京航空航天大学,从事导弹制导与最佳控制研究。
·60·
兵工自动化 2006 年第 25 卷第 1 期
式中:m1,J1,l1 分别是下摆质量,转动惯量, 质心到A的距离;m2,J2,l2 分别是上摆质量,转 动惯量,质心到B的距离;L1 是下摆长度;m0是小 车和驱动系统的等效质量;g0,g1,g2分别是小车 磨擦系数,下摆、上摆磨擦力矩系数;K是控制力 系数,u是控制电压;g是重力加速度。
在 S=φ1=φ2=0 以及 S’=φ1’=φ2’=0 附 近,对方程(1)作线性化处理,并略去高阶小量,可 得系统状态方程为:
m2l2S”–m2l2L1φ1”–(J2+m2l22)φ2”+g2φ1’–g2φ2’+m2l2gφ2=0 (m1l1–m2L1)S”–(J1+m1l12–m2L12)φ1”+m2l2L1φ2”+
–(g1+g2)φ1’+g2φ2’+(m1l1+m2L1)gφ1=0 (m0+m1+m2)S”–(m1l1+m2L1)φ1”–m2l2φ2”+g 0 S’–Ku=0
*************************************************
(上接第 61 页)
仿真结果证明,应用现代控制理论对二级倒立 摆这样的不稳定系统进行控制,有较强的控制能力。 但是对于不同的离散时间和不同的 Q、R 矩阵得出 的结果是不完全相等的。在设计中如何选取离散时 间有可参考的原则,如何取 Q、R 矩阵等,只有对 得到的结果进行分析,选取一组较好的参数才行。
+Λ
Λ
+
=
Σ
⎨ ⎪T
Aτ
∞
(AT)i
(4)
⎪⎪Bd = (∫ edτ)B = TΣ B
⎪⎩0
i = 0 (i +1)!
T—离散时间。
从 (4) 式 可 求 出 等 效 的 离 散 控 制 系 统 状 态 矩 阵
Ad,Bd。等效的离散控制系统结构如图 2。
Bd +
u
-H
Z-1
X
CLeabharlann Baidu
Y
Ad
Xˆ Xˆ 状态重构变量
制量调节波门,从而实现随目标特征变化波门的自 识别。启动鼠标导引功能一段时间之后,控制流程
动调节。调节波门之后,波门内部图像的平均亮度 切出鼠标导引控制,进入其他的图像处理和跟踪控
特征更接近于目标的亮度特征,有助于目标的稳定 制流程。以红外跟踪为例,部分控制流程如图 2。
输出跟踪状态 目标截获信号
输出目标距离
L2
Xˆ
图 3 离散控制系统观测器
由上节知最佳反馈量是 u(K)=-H(K),这里 H
—最佳反馈阵; Xˆ —状态估值,而 Y=CX。
设 g(K)=C1X
(11)
⎡C ⎤ ⎢⎣C1⎥⎦
为
非奇异阵
。
令[L1
L2]=
⎡C ⎤ ⎢⎣C1⎥⎦
-1
(12)
从而状态估值是
Xˆ (K)
=
[L1
L2
⎡Y(K)⎤
]⎢⎣gˆ (K)
兵工自动化 2006 年第 25 卷第 1 期
测控技术 Measurement and Control Technique
O. I. Automation 2006, Vol. 25, No. 1
文章编号:1006-1576(2006)01-0060-02
二级倒立摆系统的最佳控制
阮治明 (国营 5308 厂,江苏 扬州 225009)
(9)
式(9)中 P 是 Riccati 方程的稳态解。
对离散控制系统而言,Riccati 方程为:
P(K)=Q+AdTP(K+1)(I+BdR-1BdT P(K+1))-1Ad
(10)
P(N)=0
选取了一定的 Q,R 阵且取离散时间 T=0.02s
后 , 代 入 具 体 参 数 可 得 最 佳 反 馈 阵 H= [2.3984, -559.8893, -122.6814, 2.3467, -64.4182, -23.8309], 此离散最佳反馈系统闭环特征值为:(0.8119, 0.8423,
参考文献:
0.6 0.4 0.2 0 -0.2 -0.4 -0.6 系列 1
1 0.5 0 -0.5 -1 方位跟踪误差 0.16mil 系列 2 高低跟踪误差 0.10mil
图 3 截取自动跟踪数据
[1] Furuta K, Ochiai T, Ono N. Altitude Control A Triple Inverted Pendulum [J]. Int. J. Control, 1984, 39 (6): 1351-1365.
Keywords: Optimal control; Double inverted pendulum; Unstable system
1 引言
单级倒立摆是复杂的、多变量、非线性不稳定 系统,其控制方法众多。现用最佳控制理论给离散 后的二级倒立摆系统进行状态重构,合理选择 Riccati 方程中的 Q、R 阵,设计降维观测器,以实 现该不稳定系统的最佳反馈控制。
制系统仿真计算后的状态变量轨迹描绘在图 4。
y Φ2
10
u
s
t
4
Φ1
图 4 倒摆系统状态变量轨迹图
5 结论
(下转第 63 页)
·61·
兵工自动化 2006 年第 25 卷第 1 期
测控技术 Measurement and Control Technique
O. I. Automation 2006, Vol. 25, No. 1
⎡ 0.870 0.001 0.000 ⎤
D
=
⎢ ⎢
0.050
0.910
0.004
⎥ ⎥
⎢⎣− 0.113 − 0.003 0.919⎥⎦
D 的 特 征 值 为 : (0.8698+i 0.0000, 0.9147+
i-0.0025, 0.9147+i0.0025)。可见,矩阵 D 是稳定的。
设计了观测器后,二级倒立摆等效离散最佳控
半 自自 动动 发现目标
红外是否可靠 N 提取目标?
Y 自动跟踪
目标进入激光测程 后启动激光测距
半自动跟踪目标
用操纵杆将目标拉到屏 幕中心区域后切换自动
启动鼠标导引和自适应阈值波门并 控制图像处理进入相应处理流程
输出跟踪信息 分割识别阈值 目标亮度值等
延时一段时间(本 例 20 帧图像时间)
切出鼠标导引
D=C1A dL2-LkCAdL2 E=C1AdL2LK-LKCAdL2LK+C1AdL1-LKCAdL1 G=C1Bd-LkCBd
(15)
到此,降维观测器的三个矩阵D,E,G可以计
算得到。只要选择好系数矩阵LK,就能计算出D,E, G,观测器也就设计出来了。为节省篇幅,具体矩
阵不一一列写了,只把矩阵D及其特征值列出:
⎧X = AX + Bu
⎩⎨Y = CX
(2)
X=[x1 x2 x3 x4 x5 x6]T=[S φ1 φ2 S’ φ1’ φ2’ ]T Y=[y1 y2 y 3]T=[S φ1 φ2 ]T
矩阵 A、B、C 是 6×6、1×6、3×6 的矩阵。
3 最佳反馈控制系统
若用经典控制理论,即设计通常的 PID 调节器, 难以达到最佳反馈控制。对于二级倒立摆这样的不 稳定系统,为了达到最佳控制性能,应用最佳控制
关键词:最佳控制;二级倒立摆;不稳定系统 中图分类号:TP273.1 文献标识码:A
Optimal Control of Double Inverted Pendulum System
RUAN Zhi-ming (The National 5308th Factory, Yangzhou 225009, China)
0.8791, 0.9387, 0.9518, 0.9627)。系统是稳定的。
4 倒摆系统观测器
现已得出离散最佳反馈控制系统,但只有x1、 x2、x3状态变量可量测,为实现最佳反馈须对x4、 x5、x6状态变量重构,应设计离散控制系统降维观 测器,如图 3。
Y(k) E
+
G
U(k)
Z-1
+ D
Lk
+
摘要:二级倒立摆系统的最佳控制利用最佳控制理论对其状态重构,构建最佳反馈离散控制器,并合理选择 Riccati 方程中的 Q、R 矩阵,设计离散控制降维观测器获得最佳反馈矩阵。由于不同离散时间和相应的不同矩阵其 结果不完全相等,故对得到结果进行计算分析,最终选取一组较好参数作为离散时间和相关矩阵,以实现最佳控制。
H(K) 为 最 佳 反 馈 阵 , 即 最 佳 状 态 调 节 器 , 以
H(K)表示。
X(K+1)=(Ad-BdH)X(K)=(Ad-BdR-1BdTP
(I+BdR-1BdTP)-1Ad)X(K)
(7)
令Ad=Ad-BdR-1BdTP(I+BdR-1BdTP)-1Ad
(8)
则X(K+1)=AdX(K)
2 系统描述及数学模型
二级倒立摆控制系统由上摆、下摆及小车组 成,如图 1 所示。
Φ2
B
Φ1
A
m0
S
C
D
图 1 二级倒立摆控制系统示意图
A—下摆电位计;B—上摆电位计 C—小车位移传感器;m0—代表小车 Φ1—下摆转过的角度,取向左摆为正值 Φ2—上摆转过的角度,取向左摆为正值 S—小车的移动,向右为正;D—电机 根据动力学原理经简化后可推导出二级倒立
测控技术 Measurement and Control Technique
O. I. Automation 2006, Vol. 25, No. 1
连续控制系统的等效离散控制系统为:
X(K+1)=AdX(K)+Bdu(K)
(3)
式中
⎧(AT)2 ∞ (AT)i
⎪
⎪⎪⎪2A!d
=
eAT = I + AT != 0 i!
⎥ ⎦
(13)
根据现代控制理论推导可得
(K)=F(K)+LkY(K) F(K+1)=(C1A dL2-LkCAdL2)F(k)+(C1AdL2LK-LKCAdL2LK
+C1AdL1-LKCAdL1)Y(K)+(C1Bd-LkCBd)u(k)=
DF(K)+EY(K)+Gu(K)
(14)
F(0)=0
(14)式中三个矩阵是:
图 2 离散最佳反馈控制系统结构图
对离散控制系统而言,在最小二次型性能指
标函数 J 的约束下,可求出最佳调节器。
J
=
Jmin
=
N−1
∑(
1
k=0 2
XT (K)QX(K)
+
1 2
uT (K)Ru(K))
(5)
最佳调节器为:
u(K)=-H(K)X(K)
(6)
H(K)=R-1BdTP(I+BdR-1BdTP)-1Ad
Abstract: The optimal control of double inverted pendulum system is that State variables are reconstructed by optimal control theory, optimal feedback discrete controller is set up. The matrix Q, R of Riccati equation and discrete time are rationally selected, discrete reduced observer is designed to obtain optimal feedback control matrix. The obtained results were calculated and analyzed due to different results brought on different discrete time and different matrix, and a set of better parameter was selected to use as discrete time and correlation matrix, and then optimal control of double inverted pendulum system is realized.
红外截获目标是否有效?
Y 自动跟踪
N
目标亮度值是否低于
图像最低分割阈值?
输出跟踪状态 目标截获信号
结束
目标进入激光测程 后启动激光测距
输出目标距离
图 2 红外跟踪部分控制流程示意图
3 试验分析
该自适应控制方法适用于复杂背景下目标特别 是弱小目标的稳定跟踪。在多云的复杂背景下,能 对 24km 左右的弱小目标实施跟踪和数据采集,截取 自动跟踪部分数据绘制方位、高低跟踪误差曲线, 如图 3 所示。由方位、高低的跟踪误差曲线图和计 算所得的跟踪误差可以看到,基于图像处理自适应 阈值跟踪波门技术和鼠标导引功能的跟踪控制流程 在实际跟踪控制中的跟踪效果是很稳定的、有效的。
摆的动力学方程如下:
理论,能设计出具有最佳反馈的离散控制系统。其
收稿日期: 2005-05-30;修回日期:2005-07-08 作者简介:阮治明(1942-),男,江苏人,1967 年硕士研究生毕业于北京航空航天大学,从事导弹制导与最佳控制研究。
·60·
兵工自动化 2006 年第 25 卷第 1 期