迭代学习控制(汇总).pptx
迭代学习控制方法

迭代学习控制方法迭代学习控制方法是一种通过反复试验和调整参数来逐步优化系统性能的控制方法。
迭代学习控制方法可以应用于各种不确定性和非线性的系统中,通过不断学习和改进来逐步提高控制系统的性能。
迭代学习控制方法主要包括模型无关法和模型相关法两种类型。
模型无关法是指在系统没有可用的数学模型时,通过试验和调整参数来直接改进控制系统的性能。
这种方法不需要系统的具体模型,只需要通过试验来收集系统的性能数据,通过试验数据来调整参数,并根据试验数据来改进控制策略。
模型无关法最大的优点是适合于复杂的非线性系统,但是其缺点是需要大量的试验数据和系统响应时间较长。
模型相关法是指在系统具有可用的数学模型时,通过试验和调整参数来优化控制系统的性能。
这种方法可以充分利用系统的数学模型来进行预测和优化,通过试验数据和模型预测来调整参数,并更新模型参数和控制策略。
模型相关法的优点是可以充分利用系统模型来进行预测和优化,系统响应时间较短,但是其缺点是对系统模型的准确性要求较高。
在迭代学习控制方法中,主要的算法包括模型参考自适应控制算法、增强型模型参考自适应控制算法和无模型自适应控制算法等。
模型参考自适应控制算法是最基本的迭代学习控制算法,其通过比较系统输出和参考模型输出的误差来调整参数,并更新控制策略。
增强型模型参考自适应控制算法在模型参考自适应控制算法的基础上加入了增益调整和鲁棒性改进等技术,以提高系统的稳定性和性能。
无模型自适应控制算法是一种不依赖数学模型的迭代学习控制算法,其通过试验数据和模型预测来调整参数,并逐步提高控制系统的性能。
迭代学习控制方法在各种控制系统中具有广泛的应用。
例如,在机器人控制系统中,迭代学习控制方法可以通过不断试验和调整参数来提高机器人的运动精度和轨迹跟踪性能。
在智能电网控制系统中,迭代学习控制方法可以通过试验和调整参数来提高电网的稳定性和负荷均衡性。
在医疗设备控制系统中,迭代学习控制方法可以通过不断试验和调整参数来提高设备的性能和治疗效果。
第1章随机迭代学习控制

第 1 章 随机迭代学习控制
本章综述了随机迭代学习控制方面的相关研究进展. 迭代学习控制适用于可以 不断重复完成指定任务的系统. 在过去三十年中, 迭代学习控制在理论和实际两方 面都取得了许多重要的进展. 而在迭代学习控制中, 与随机信号有关的研究成果还 比较少. 这里的随机信号包括系统噪声、量测噪声、随机数据丢包等各种在实际系 统中普遍存在的信号. 本章从关键技巧的角度综述了相关进展, 包括三个方面: 线 性随机系统、非线性随机系统和其他随机信号. 进而介绍了几个有潜力的研究方向, 包括点对点迭代学习控制、变轨迹迭代学习控制以及分散式/分布式迭代学习控制.
1.1 迭代学习控制
在生活中, 有这样一种认识, 一件事情重复去做, 通常会做得越来越好. 例如定 点投篮, 当一个人进行定点投篮时, 一开始他可能投不中, 但随着不断练习, 他很有 可能很快就会命中. 这里一个很重要的原因就是, 投篮者可以不断地从已有经验中 学习. 具体地说, 投篮者可以根据之前投篮的偏差来调整下一次投篮的角度和力度, 从而使得篮球逐渐接近篮筐乃至命中. 迭代学习控制便是基于这样一种朴素的想 法发展起来的控制分支. 粗略地说, 迭代学习控制是通过对之前过程信息的学习来 改善系统的表现性能的.
智能控制学习控制迭代学习控制PPT课件

μ a βm /a 2βm , v a a βm /a 2βm,
ud(t)
xd(t)
第27页/共50页
3. 迭代学习控制策略
• 为防止反馈增益系数d 过大,引入一个前馈控制器,并由迭代学习获得。
28/51
第28页/共50页
迭代学习控制的稳定性
• 定理6-3:记控制输入uj(t)为第j次迭代中反馈控制和前馈控制两项的线性组合,即
6.1 迭代学习控制
迭代学习控制的基本思想 线性时变系统的迭代学习控制 一类非线性动态系统的迭代学习控制 多关节机械手的迭代学习控制
迭代学习控制面临的挑战
1/51
第1页/共50页
基本思想
• 迭代学习(Iterative learning)的基本思想在于总结人类学习的方法,即通过多次的训练,从经验中学会某种 技能。
(t))
32/51
第32页/共50页
实际迭代算法
• 问题:
一般不能获取。
ud (t)
• 利用已知的
去代替未知的
:
ubj (t)
udj
(t
)
u
j f
(t
)
u
j 1 f
(t
)
u
j f
(t
)
ubj
(t
)
33/51
第33页/共50页
学习结构图
34/51
第34页/共50页
实际迭代算法的收敛性
• 定理6-4:假设 和
模又需要高精度轨迹控制的场合是非常有意义的。
3/51
第3页/共50页
6.1 迭代学习控制
迭代学习控制的基本思想 线性时变系统的迭代学习控制 一类非线性动态系统的迭代学习控制 多关节机械手的迭代学习控制
迭代学习控制方法

迭代学习控制方法
迭代学习控制方法是一种基于迭代更新的学习算法,通常用于解决复杂的控制问题。
这种方法通过反复调整控制策略,以逐渐逼近最优解。
迭代学习控制方法通常包括以下几个步骤:
1. 设定初始控制策略:首先需要确定一个初始的控制策略,这可以是随机生成的,也可以是基于经验或先验知识的策略。
2. 执行控制策略:使用当前的控制策略来执行控制动作,以获取系统的反馈。
3. 评估控制策略的性能:根据系统的反馈信息,评估当前控制策略的性能,通常使用某种性能指标来衡量。
4. 更新控制策略:根据评估的结果,对当前的控制策略进行调整和更新,以使性能指标得到改进。
5. 重复上述步骤:反复执行上述步骤,直到控制策略收敛到最优解或达到满意的性能水平。
迭代学习控制方法可以应用于各种控制问题,包括机器人控制、智能系统控制、自动驾驶等。
它通常基于强化学习、优化算法或进化算法等技术,能够在复杂的
环境中实现自适应和优化控制。
因此,迭代学习控制方法在实际应用中具有广泛的应用前景。
迭代学习控制

迭代学习控制 1、前言迭代学习控制(Iterative Learning Control ,简称ILC )是指不断重复一个同样的轨迹的控制尝试,并以此修正控制律,以得到非常好的控制效果的控制方法[1]。
迭代学习控制是学习控制的一个重要分支,是一种新型学习控制策略。
它通过反复应用先前试验得到的信息来获得能够产生期望输出轨迹的控制输入,以改善控制质量。
与传统的控制方法不同的是,迭代学习控制能以非常简单的方式处理不确定度相当高的动态系统,且仅需较少的先验知识和计算量,同时适应性强,易于实现;更主要的是,它不依赖于动态系统的精确数学模型,是一种以迭代产生优化输入信号,使系统输出尽可能逼近理想值的算法。
它的研究对那些有着非线性、复杂性、难以建模以及高精度轨迹控制问题有着非常重要的意义。
最初的学习控制-迭代学习控制(ILC ),由日本学者首倡于1978年。
不像其他的的控制方法从线性受控对象起步,迭代学习控制开门见山就把非线性系统作为研究对象,且要在有限区间[0,T]上实现输出完全追踪的控制任务。
这里完全追踪(perfect tracking )指系统的输出自始至终,无论是暂态还是稳态,都和目标轨道保持一致。
显然,迭代学习控制的起点要比其它控制方法高出一截可是,从二十年的发展历程看,起点过高也有不利的一面:发展空间不足以及难以和主流控制方法相融合。
而事实上,只要任务是可重复的,或系统干扰是周期性的,都可用ILC 来解决实际问题。
从迭代学习控制方法的产生至今已有二十多年的历史它已经发展成为智能控制领域的一个新的发展方向,它的研究对那些有着非线性、强耦合、难以建模以及高精度轨迹控制的问题有非常重要的意义。
迭代学习控制适用于具有重复运动性质的被控系统,它的目标是实现有线区间上的完全跟踪任务。
它通过对被控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号,使得系统的跟踪性能得以提高。
迭代学习控制的研究对具有较强的非线性耦合、较高的位置重复精度、难以建模和高精度轨迹跟踪控制要求的动力学系统有着非常重要的意义。
智能控制第十一章 迭代学习控制 PPT课件

11.3.4 鲁棒性问题 迭代学习控制理论的提出有浓厚的工程背景,因此仅仅在无干扰
条件下讨论收敛性问题是不够的,还应讨论存在各种干扰的情形下系 统的跟踪性能。一个实际运行的迭代学习控制系统除了存在初始偏移 外,还或多或少存在状态扰动、测量噪声、输入扰动等各种干扰。鲁 棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地 说,一个迭代学习控制系统是鲁棒的,是指系统在各种有界干扰的影 响下,其迭代轨迹能收敛到期望轨迹的邻域内,而当这些干扰消除时 ,迭代轨迹会收敛到期望轨迹。
干扰项为d 0.3sin t
0.1 1 et
T
机器人系统参数为 d1 d2 1 kg ,l1 l2 0.,5m,lc1 lc2 0.25m ,I1 I2 0.1 kg m2
g 9.81 m/s2
采用三种闭环迭代学习控制律,其中M 1 为D型迭代学习控制,M 2
为PD型迭代学习控制,M 3为变增益指数D型迭代学习控制。
t
0
G t,
t
0
CtΦt, B L
ek d
uk1(t) L(uk (t), ek1(t))
式中,L为线性或非线性算子。
(11.5)
11.2 基本迭代学习控制算法
Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律[24]
uk1(t) uk (t) Γe&k (t)
(11.6)
迭代学习控制

基本原理
输入变量(控 制量)
输出变量 期望轨迹
误差
通过对被控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号, 使得系统的跟踪性能得以提高。新的控制量存入存储器,刷新旧控制量;在施加控制时,需从 存储器中取出控制量。可以看到迭代学习控制算法可利用的信息要多余常规的反馈控制算法。
目标
迭代学习神经网络对非线性系统的控制可 使未知的非线性特性能被线性参数化渐近 仿真模型描述出来。对照早期的全球网络 或本地网络,例如 RBF 神经网络在规定空 间内分布的神经元,给出了一个独立的神 经网络在时间轴上的轨迹。因而,通过迭 代学习控制,轨迹上的每一点的跟踪性能 通过多次跟踪相同轨迹能得到改善。且在 设计中,每一个本地神经系统网络的学习 是独立的。这种结构,使部分学习变成可 能。在很多情况中部分学习是非常有用的。
谢谢大家
应用效果
选取系统参数 m 10kg , l 2.5m, J m
4 1 ml 2 , s ml 。取系统输出为 y (t) x2 (2 sint) ,设理想输 3 5
PD 型 迭 代 学 习 控 制 律
出 为 yd (t) t t 2 , 取 x1 (0) 0, x 2 (0) 0, u1 (t) 1 , 选 取 开 闭 环
强化优势
针对粉碎机生产过程,分析了磨机生产工况变化造成的负荷特 性的非线性,提出将模糊控制与迭代学习控制相结合用于这一 生产过程的控制方法,它克服了常规PID控制中难以适应负荷 特性的非线性,不能及时克服系统扰动等缺陷。实验表明,系 统的稳态精度和动态性能都得到了改善。
在注塑机控 制中的应用
最优迭代学习控制应用于注塑机这样存在干扰和具有不确定初 始设定值的场合,可以使系统达到较好的鲁棒性,并且保证系 统的收敛性,从而使系统取得较好的效果。
15自适应迭代学习控制理论及其

三、研究方法及缺陷
自适应控制研究方法及其缺陷 迭代学习控制理论研究的主要方法及其限制 自适应迭代学习控制的研究方法
自适应控制研究方法及其缺陷
线性自适应控制系统的设计理论和分析方法 1. 基于稳定性理论的设计和分析(Narendra, 1989, MRAC,连续时间系统) 2. 基于确定性等价原理及关键性引理和鞅理 论的设计与分析(Goodwin, 1984,STR/STC,离 散时间系统)
拟人化机器人系统、军用机器人,水
下机器人系统 过程工业稳态优化控制 自适应控制的应用
谢 谢!
控 制 器
放大 环节
执行 环节
被控 对象
反馈环 节
控制科学的发展简史
从基于物理和(或)数学模型的控制理论到基于 信息的智能控制理论,再到基于行为化方法的一 般控制理论。
经典控制理论:SISO, 数学工具:传递函数和复变函数理论。 现代控制理论:MIMO, 数学工具:线性代数, 微分方程, 随 机过程、微分几何, 变分法及泛函分析等。 智能控制理论:3C问题,基础工具:动力系统,人工智能, 知识工程,神经网络,模糊数学,进化算法、行为化理论等。
迭代学习控制理论研究方法及限制
ILC的缺陷:
非线性函数须满足Lipschitz条件 线性系统的第一个 Markov参数CB不为零 需要知道理想的输入 初值误差的鲁棒性问题 跟踪目标是固定的
自适应迭代学习控制理论研究方法
AILC的研究方法: 1. 离散型AILC方法: 在迭代域设计自适应率, 如: Owens, 1993, 2000; Xu, 2000, 2002, 2. 连续型AILC方法: 在每次迭代的时间域设计自适应率, 如French 2000;Li & Yang 2002;Li & Daniel 2003 3. 混合型AILC: 将上述两种方法有机结合设计混合型的 自适应率, 如Choi, 2001, Xu, 2004, Sun,2006. 缺陷: 适合于固定目标的跟踪,无法应用于变化的目标跟踪 问题.
智能控制--第11章 迭代学习控制

(11.6)
式中,Γ 为常数增益矩阵。在D 型算法的基础上,相继出现了P 型、
PI 型、PD 型迭代学习控制律。从一般意义来看它们都是PID型迭代
学习控制律的特殊形式,PID迭代学习控制律表示为
k (t ) Φek (t ) Ψ ek ( )d uk 1 (t ) uk (t ) Γe
迭代学习控制(ILC,Iterative Learning Control)的思想最初由
日本学者Uchiyama于1978年提出[23],于1984年由Arimoto等人
[24]做出了开创性的研究。这些学者借鉴人们在重复过程中追求满意 指标达到期望行为的简单原理,成功地使得具有强耦合非线性多变量
的工业机器人快速高精度地执行轨迹跟踪任务。其基本做法是对于一
输出误差的校正项,即
uk 1 (t ) L(uk (t ), ek (t ))
(11.4)
闭环学习策略是:取第K+1次运行的误差作为学习的修正项,即
uk 1 (t ) L(uk (t ), ek 1 (t ))
(11.5)
式中,L为线性或非线性算子。
11.2 基本迭代学习控制算法
Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律[24]
(11.10)
(2)闭环PD型:
d t q k 1 t uk 1 t uk t Kp qd t qk 1 t Kd q
(11.11)
(3)指数变增益D型:
d t q k 1 t (11.12) uk 1 t uk t Kp qd t qk 1 t Kd q
复杂机电系统的人工智能控制技术:第七章 迭代学习控制

7.1 迭代学习控制概述
5.在线控制负担小进行快速的运动控制,实 时性好
6.具有记忆功能,遇到类似的控制功能时, 它能根据记忆录中的任务,快速调整控制 任务。
7.对干扰和系统的变化量有一定的鲁棒性。
7.1 迭代学习控制概述
四.适用工业领域 具备重复运动的场合:
➢计算机搬运, ➢装配, ➢生产线焊接工业, ➢喷涂工艺, ➢机器人数控加工中间的送进。
u(t) +
K1
-
Km Tms 1
y (t )
K2
(1)系统描述
该闭环系统用微分方程表示为: y(t) ay(t) bu(t)
其中 a (1 K1K2Km ) / Tm b K1Km / Tm
• 当初始时刻取为零时,方程的解为:
➢在ILC中,控制用的学习是通过对以往控制经验 (控制作用与误差的加权和)的记忆实现的,算 法的收敛性依赖加权因子w的确定。
➢这种ILC的核心是系统不变的假设以及基于记忆 单元间断的重复训练过程,学习规律极为简单。
uk (t)
第
-
反馈通道
k
+
控制器
被控对象
次 操
+
作
+
uk (t)
加权因子
-
ek (t)
7.1 迭代学习控制概述
二.ILC的定义
1.从控制的角度定义
它是通过对具有重复性的被控对象系统, 利用先前的控制经验尝试,以输出的轨迹与给
定的期望轨迹偏差修正不理想的控制信号, 最终找出一个理想的输入特性曲线, 使得系统跟踪期望输出结果的能力提高,最终
达到所期望的输出或接近于许可的输出。
7.1 迭代学习控制概述
第七章 迭代学习控制
智能控制-迭代学

智能控制-迭代学习控制朱芳来第一章绪论1.1 迭代学习控制技术及其发展概况•从根本上来看,控制器的设计问题可以归为两大类:调节问题和跟踪问题,而调节问题也可以看成是跟踪问题的特殊情况。
•迭代学习控制的一个主要任务就是,实现被控系统的输出零误差地跟踪期望轨迹。
•研究具有学习能力的控制器,以达到对期望轨迹的跟踪,一直是控制工程师们探索的问题。
•迭代学习控制的概念最早(1978年)由日本学者Uchiyama在一篇有关机器人控制的论文提出,但因为文章是以日文发表的,所以但是并没有引起人们的注意。
•1984年,另一个日本人Arimoto及其合作者们将Uchiyama的思想加以完善,建立了实用的算法,并提出了更为正规的迭代学习理论,并以英文发表了其研究成果,从而使迭代学习控制成为引人注目的课题。
•迭代学习控制是智能系统中具有严格数学描述的一个分支,特别适用于具有重复性质的控制对象,它的目标是实现有限区间上的完全跟踪任务。
1.2 迭代学习控制的研究内容及其基本原理迭代学习控制的主要研究内容包括:学习算法的稳定性与收敛性、学习速度、学习律及对学习系统结构的研究、学习过程的鲁棒性等。
迭代学习控制的基本原理设被控对象的动态过程为其中x ∈R n , y ∈R m ,u ∈R r 而f,g 为相应维数的向量函数。
要求系统在时间t ∈[0,T]内的输出y(t)跟踪期望输出y d (t)。
假定期望输出u d (t)存在,即:在给定的初始状态x(0)下u d (t)是式(1.1)当y(t)=y d (t)的解存在,则迭代学习控制的目标就是通过多次重复的运行,在一定的学习律下u(t) →u d (t), y(t)→y d (t).⎩⎨⎧==),,(),,(u x t g y u x t f x (1.1)在第k 次运行时(1.1)表示为输出误差为e k (t)=y d (t)-y k (t) (1.3)其中下表表示第k 次迭代。
13章迭代学习控制

k
xk 0 x0 k 1,2,3,
, y 0 0 y d 0
时,有
y k t yd t
其中
Γ, L
, Ψ 为学习增益矩阵。
11.5.2 控制器设计及收敛性分析
定理1 若由式(11.13)和式(11.14)式描述的系统满足如下条
件[24]:
(1) I C t B t Γ t 1 ;
(2)每次迭代初始条件一致,即 则当 证明: 由式(11.13)及条件式(2)得 则
11.3.2 初始值问题
运用迭代学习控制技术设计控制器时,只需要通过重复操作
获得的受控对象的误差或误差导数信号。在这种控制技术中,迭
代学习总要从某初始点开始,初始点指初始状态或初始输出。几
乎所有的收敛性证明都要求初始条件是相同的,解决迭代学习控 制理论中的初始条件问题一直是人们追求的目标之一。目前已提 出的迭代学习控制算法大多数要求被控系统每次运行时的初始状 态在期望轨迹对应的初始状态上,即满足初始条件:
(11.12)
11.4.2 仿真实例 针对二关节机械手,介绍一种机器人PD型反 馈迭代学习控制的仿真设计方法。针对二关节机 器人控制系统式(11.9),各项表示为:
D dij
22
d11 d1lc21 d 2 l12 lc22 2l1lc 2 cos q2 I1 I 2 d12 d 21 d 2 lc22 l1lc 2 cos q2 l2
y k (t ) g (xk (t ), uk (t ), t )
表示为:
xk (t ) f (xk (t ), uk (t ), t )
迭代学习控制综述

压缩映射方法 即系统要求满足全局
条件和相同的初始条件 如果
则有
可知算法是单调收敛的 该方法依赖于范数的选择
常用的有 范数 范数 范数及 范数 在收敛性
证明过程中常用到
引理
谱半径条件法 如果
则有
即
频域分析方法
从频域的角度分析和设计迭代学习算法 与
时域分析方法一样受到关注 因为频域分析方法中
收敛条件可从无限频带放松到有限频带 所以在迭
代学习控制鲁棒性分析和实际应用中 广泛使用频
域分析方法
对一类具有扰动的线性系
统
其中 和 分别为负载扰动和量测扰动 提出的学
习 算法为
使用频域方
法分析得到了收敛条件为
分析了滤波器
的选择对
系统稳定性的影响及其扰动的消除 并对算法的鲁
棒性作了分析
基于 理论的分析方法
迭代学习控制系统的学习是按两个相互独立的
如基于神经网络的迭代学习控制 基于模糊技术的
迭代学习控制 基于小波分析的迭代学习控
制
等
迭代学习控制除了在理论上获得了很大发展
外 同时也广泛应用于实际控制工程领域 其中最主
要的应用之一就是在机器人控制方面 如刚性机器
手控制 机器人视觉伺服控制 另外 迭代学习
控制还用于许多实时性要求较高的工业控制过程
中
同的初始条件 未来迭代学习控制的研究将从基本
概念和分析方法上解决系统复杂性和收敛多样性所
带来的问题
收敛性和收敛速度始终是迭代学习控制研究的
重要课题之一 如何利用系统的先验知识及其先前
学习的信息提高收敛速度 如何将特定研究的系统
类型扩展到含有时滞 不确定系统 都是很有价值的
13章迭代学习控制解析

11.3.2 初始值问题
运用迭代学习控制技术设计控制器时,只需要通过重复操作
获得的受控对象的误差或误差导数信号。在这种控制技术中,迭
代学习总要从某初始点开始,初始点指初始状态或初始输出。几
乎所有的收敛性证明都要求初始条件是相同的,解决迭代学习控 制理论中的初始条件问题一直是人们追求的目标之一。目前已提 出的迭代学习控制算法大多数要求被控系统每次运行时的初始状 态在期望轨迹对应的初始状态上,即满足初始条件:
y k (t ) g (xk (t ), uk (t ), t )
表示为:
xk (t ) f (xk (t ), uk (t ), t )
(11.2)
(11.3)
跟踪误差为
ek (t ) y d (t ) y k (t )
迭代学习控制可分为开环学习和闭环学习。 开环学习控制的方法是:第k+1次的控制等于第k 次控制再加上第k次输出误差的校正项,即
测得的误差信息修正控制输入,使得该重复任务在下一次操
作过程中做得更好。如此不断重复,直至在整个时间区间上 输出轨迹跟踪上期望轨迹。
迭代学习控制适合于具有重复运动性质的被控对象,
通过迭代修正达到某种控制目标的改善。迭代学习控制方 法不依赖于系统的精确数学模型,能在给定的时间范围内, 以非常简单的算法实现不确定性高的非线性强耦合动态系 统的控制,并高精度跟踪给定期望轨迹,因而一经推出, 就在运动控制领域得到了广泛的运用。 迭代学习控制方法具有很强的工程背景,这些背景包
迭代学习控制(ILC,Iterative Learning Control)的思 想最初由日本学者Uchiyama于1978年提出[23],于1984年
由Arimoto等人[24]做出了开创性的研究。这些学者借鉴人们
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最新.
13
开闭环PD型迭代学习控制
由于开环迭代学习控制只利用了系统前次运行的信息,而忽略了系统当前的信息,使得系统对被 控制对象无镇定作用,闭环迭代学习控制往往又需要高增益反馈从而影响了系统迭代收敛速度。同时 利用开闭环的 PD 型迭代学习控制律,使其在单自由度机器人系统中取得良好的应用效果。
最新.
5
目标
实现有限区间上的完全跟踪任务,希望实现被控系统的输出零误差地完 全跟踪期望轨迹
使用范围
具有重复运动特征的被控系统,具有较强的非线性耦合、较高的位置重复精 度、难以建模和高精度轨迹跟踪控制要求的动力学系统
勤奋务实
最新.
6
在倒立摆控制 上的应用
在机器人 中的应用
在生产机械 与其他先进控制
(0)=0.5, (0)=5.0,
mw3kg, mp源自2kg, l0.6m
初始控制为u0 (0)=0, t 0, 20
取 5,8 ,经过 3 次学习后,倒立摆在t 0, 20 s 内保持稳定,其状态角 与控制 u 见图:
角度 (t) 与角速度 (t)
控制 u (t)
最新.
11
Part 2
在机器人中的应 用
中的应用
技术的结合
最新.
7
Part 1
在倒立摆控制 上的应用
最新.
8
闭环D型迭代学习控制
01
取闭环 D 型学习控制算法:
闭环D型
迭代学习 03
控制
倒立摆示意图
04
uk 1(t) u k (t) ek 1(t) u k (t) x k 1(t)
最新.
9
状态空间方程
其对应的微分方程为:
17
Part 3
在生产机械中的 应用
最新.
18
在生产机械中的应用
在机械压力 机滑块位置 控制中的应
用: 强化优势
自我补课 在丝杆运动 误差控制中 的应用:
压力机气动系统具有很强的非线性和时滞性,且很难建立精确 的数学模型,而压力机滑块位置的调整具有反复性,因此适合 采用迭代学习法进行控制,采用适当的迭代算法控制滑块停止 位置,可以减少调整次数,提高定位精度。
( yd (t) 为期望轨迹)
学习律: uk 1(t) L(uk (t), ek (t))
最新.
4
基本原理
输入变量(控 制量)
输出变量
期望轨迹
误差
通过对被控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号, 使得系统的跟踪性能得以提高。新的控制量存入存储器,刷新旧控制量;在施加控制时,需从 存储器中取出控制量。可以看到迭代学习控制算法可利用的信息要多余常规的反馈控制算法。
x1
0
J
1 m
u
最新.
15
应用效果
选取系统参数 m
10kg, l
2.5m, J m
4 ml 2 , s 3
ml
。取系统输出为
y(t)
1 5
x2 (2 sint)
,设理想输
出 为 yd (t) t t2 , 取 x1(0) 0, x2 (0) 0, u1(t) 1 , 选 取 开 闭 环 PD 型 迭 代 学 习 控 制 律
x1 x2
x2
g sin x1
mwl mw mp
sin
x1
cos(x1x
2 2
)
mw
3l 4
mwl mw mp
cos2
x1
1 mp
u cos x1
其中
x1 x2
最新.
10
应用效果
倒立摆控制的任务是施加控制u ,在一时间区间上倒摆杆稳定直立,即 0, 0 ,设初始状态为
x1 x2
迭代学习控制策略结构与算法简单,參数便于确定,容易实现, 不需要对误差进行显式建模,通过学习既能对丝杠运动误差进 行预报,又能获取丝杠运动误差特性缓慢变化的信息,从而始 终保持良好的运动误差补偿性能。
最新.
最新.
3
数学描述
考虑重复运行的动力系统如下表示:
xk yk
(t) (t)
f(xk (t), uk (t), t) g(xk (t), uk (t), t)
其中: xk 为系统的第 k 次运行的状态; yk 为输出变量;uk 为输入变量(控制量)
输出误差: ek (t) yd (t) yk (t)
前馈控制器采用开环学习律 u ff ,k 1 (t) u k (t) h ff 1(ek (t))
反馈控制器为 u fb,k (t)= h fb (ek (t))
开闭环 PD 型迭代学习控制律为 uk 1(t) u ff ,k 1(t) u fb,k (t)
u k (t) Lp (t) ek (t) Lp (t) ek 1(t) Ld (t) ek (t) Ld (t) ek 1(t)
迭代学习控制(ILC)的应用
某某某
最新.
1
目录
01
简单介绍
应用
02
03 总结
最新.
2
提出
人们在研究高速运动的工业机械手的控制问题时,提出了这样一个思想:不断重复一个同样轨 迹的控制尝试,并以此修正控制律,可能可以得到非常好的控制效果。Arimoto等人于1984年 正式提出了迭代学习控制(iterative learning control,简称ILC)方法。
Ld 100, Lp 50
开闭环PD型迭代学习误差曲线
最新.
16
应用效果
采用开闭环PD型学习律的的输出曲线
采用开闭环P型学习律的输出曲线
运用开闭环 P 型理论,系统在迭代至少 17 次后才逐渐实现跟踪期望输出的目的,因而开闭环
PD 型迭代学习控制在运行速度、有效性等方面更具 最新有 . 一定的优越性和可行性。
最新.
14
状态空间方程
考虑单关节机器人系统,其动态系统模型为
Jmq(t) sgsin(q(t))= f(t)
其中 f (t) 为作用于节点的力矩,g 为重力加速度,q(t) 为力臂旋转角度,令
q x1, q x2 , u(t) f(t)
则系统可描述为
x1 x2
x2 J m1sg sin
最新.
12
由于机器人是高度的非线性、强耦合的动力学系统,而且在许多情况 下系统的动力学模型是未知的,或者不是完全己知的,因此利用传统 的控制理论很难实现对机器人的高精度跟踪控制。近年来,迭代学习 控制理论由于在不精确已知受控对象动力学特性的情形下具有综合结 构简单、在线计算量小等特点,因此受到了控制界的广泛关注,人们 针对各种机器人系统的跟踪控制提出了相应的有效算法。