第3章 智能控制中的神经网络控制-控制基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3章 神经网络控制
第2部分 控制基础
221
3.5 神经网络控制基础
3.5.1 神经网络控制简介
① ② ③ ④ ⑤
人工神经网络(ANN)用于控制系统的优越性 并行分布处理。 非线性映射。 通过训练学习。 适应与集成。 硬件实现。
222
历史发展 1960年,B. Widrow和M. E. Hoff首先把ANN 用于控制系统;B. Kilmer和W. S. McCulloch 等人提出了 KMB 神经网络模型,并在阿波罗登 月计划中应用,取得良好的效果。 1964年,Widrow和Smith等人利用ANN对小车 倒立摆系统控制取得了成功。 20世纪 60年代末期至 80 年代中期,神经网络控 制与整个神经网络研究一样,处于低潮,研究成 果很少,甚至被许多人所遗忘。 80年代后期以来,随着人工神经网络研究的复苏
工程实践中,被控对象的动态特性未知或仅部分已 知,借助标准的控制技术设计出合适的控制器极其 困难,但人们可根据对象的输出状态和经验知识提 供恰当的控制信号,实现良好控制。 基于规则的专家控制和模糊控制可用以解决此类问 题,神经网络控制则基于学习的原理也可有效解决 此类问题。
通过对人工或传统控制器进行学习,然后用神经网络 控制器取代或逐渐取代原控制器的方法,称为直接学 习神经网络控制,也称为神经网络学习控制,或监督 式神经控制,或神经网络监督控制,或COPY控制。
232
基于传统控制器的改进型神经网络监督控制系统 神经网络控制器是前馈控制器,建立被控对象的 逆模型。
神经网络控制器基于传统控制器的输出,在线学 习调整网络的权值,使反馈误差������ 或 ������������ 趋近于零, 从而使神经网络控制器逐渐在控制作用中占据主 导地位,最终取消反馈控制器的作用;一旦系统 出现干扰,反馈控制器重新起作用。
-
图中,深蓝色虚线对 应人工控制器;红色 实线对应传统控制器
人工/传统 控制器
������������
+
对象
������
人工反馈 自动反馈
231
期望输出
神经网络 控制器
������������
-
深蓝色虚线对应人工 控制器;红色实线对 应传统控制器
���
人工/传统 控制器
两个阶段可以独立完成,也可以交替进行。
227
几种较具代表性的神经网络控制系统
直接学习神经网络控制;
神经网络直接逆控制;
神经网络自适应控制;
神经网络内模控制; 神经网络预测控制; 神经网络自适应评判控制; 神经网络混合控制。
228
3.5.2.1 直接学习神经网络控制
动机
237
改进结构方案之二
������������ (������) ������ −1
神经网络 控制器
������(������)
������
对象
������(������)
������(������)
评价函数
用评价函数������(������)作为性能指标,调整神经网络控
制器的权值,可选为������ ������ =
������
-
常规控制 器
������
对象
������
假定被控对象为仿射非线性系统:������ = ������ + ������������ 若利用神经网络对非线性函数������和������进行离线辨识, 得到具有足够逼近精度的估计值������ 和������,则常规控 制器可直接给出为: ������������ − ������ ������ = ������
������ −1
������
缺点:无反馈,用作控制器的神经网络逆模型不 准确时,抗干扰能力差,缺乏鲁棒性。 改进考虑:使网络具有在线学习能力,即作为逆 模型的 ANN 的参数能在线调整,从而使 ANN 对逆 模型的模拟真实度提高。
235
改进结构方案之一
������ −1
神经网络 控制器1
������������ (������)
该方案由于利用了反馈控制的思想,又可在线学 习新的系统信息,可确保控制系统的稳定性和鲁 棒性,有效提高系统的精度和自适应能力。
233
期望输出
神经网络 控制器
������������
������ −1
������������
+ -
������
传统控 制器
+
+
������
������������
对象
这种方案中,ANN一般采用离线训练。训练所需样本 数据采用人们执行人工控制或传统控制器时的输入-输 出数据。输入数据一般是传感器检测出的、被控对象 的实际输出数据(或与期望输出的偏差值),输出数 据则是人们根据经验或直接检测传统控制器的输出确 定出来的、施加在被控对象上的控制量。
神经网络 控制器
������������
������(������) ������(������)
+ -
������
对象
������(������)
������(������)
������ −1
辨识器2
������������ (������) 神经网络
在开环结构的基础上增加了神经网络 2 ,用于辨 识被控对象的动态逆模型,其学习训练可采用离 线方式或在线方式;但显然要求网络具有较好的 初始权值,否则起初的权值不当可能导致控制系 统的不稳定。
������������ 息 ) 才能通过误差反向传播算法修正网络权值, ������������
229
基本原理图
������ 人工控制或 传统控制 ������ ������
被控对象
利用人工控制经验或 传统的简单控制规律
������
神经网络
������
被控对象
������
两种控制结构
基于人工/传统控制器的简单神经网络监督控制系统
基于传统控制器的改进型神经网络监督控制系统
230
基于人工/传统控制器的简单神经网络监督控制系统
������������
+
对象
������
人工反馈 自动反馈
该方案中,神经网络学习的是人工控制作用 / 传统控制器 的正向模型,并输出与人工/传统控制器相似的控制作用。 ANN 的学习实现的是传感输出 ( ������ 或 ������ ) 到人工控制作用 / 传 统控制器输出的映射。 缺点是,学成后的神经网络控制器独立作用于对象上,构 成开环控制方式或简单的闭环控制,前者使得系统的稳定 性和鲁棒性得不到保证,后者使得神经网络的优越性丧失。
对象
控制目的:使实际输出������跟踪期望输出������������ 。神经网 络控制器的作用是使被控对象和参考模型输出之差 的二次型为最小来调整网络的权值,从而使被控对 象的输出跟踪参考模型的输出。当对于任意的系统
242
输入(设定值),二者的输出之差趋于零时就实现了 完全的模型匹配,也即:被控对象与控制器组成的 闭环系统的动力学特性与给定的参考 (期望)模型完 全一致。
对模型参考自适应控制,一般应设计参考模型为渐 近稳定的系统,这样通过学习与参考模型的动力学 特性趋于一致的闭环被控系统也是渐近稳定的。 图中,若 ������������ = 0 ,则 ������ = ������������ ,进而有 ������ = ������ − ������������ , 该量作为神经网络控制器的输入、产生控制作用。 该控制方案要求知道对象的数学模型(Jacobian信
223
和发展,对神经网络控制的研究也十分活跃。主 要集中在神经网络自适应控制方法、模糊神经网 络控制及其在机器人控制中的应用上。
① ②
研究进展 基于神经网络的系统辨识。 神经网络控制器。可对不确定或未知系统进行有 效的控制。 优化计算。 控制系统的故障诊断。 神经网络与其他算法相结合。
③ ④ ⑤
1 2
������������ ������ − ������ ������
2
。
当性能指标为 0 时,神经网络控制器即为对象的 逆模型。(该方案同样要求网络具有较好的初始权值)
238
3.5.2.3 神经网络自适应控制
分类
自适应控制的对象常含未知因素。
直接自校正控制 自校正控制 间接自校正控制 直接模型参考自适应控制 模型参考自适应控制 间接模型参考自适应控制
或故障诊断而构成的控制。
注: 神经网络应用于控制系统设计主要是针对系统的非线性、不确定 性和复杂性进行的。
226
3.5.2 神经网络控制系统的结构类型
在神经网络控制系统中,网络的运行通常分为学
习期和控制期两个阶段。
在控制期,网络结构和权值已知且不变,各神
经元根据输入信息和状态信息产生输出; 在学习期,网络按一定的学习规则调整其内部 连接权重,使给定的性能指标达到最小或其它 最优。
234
此时再从反馈回路看,有:������ = ������������ − ������ = 0。
3.5.2.2 神经网络直接逆控制
将对象的神经网络逆模型直接与被控对象串联起 来,使期望输出与对象实际输出之间的传递函数 为1。
������������
神经网络 控制器
������
对象
������
������
������
������
图中,������������ 是������的函数,������是������的函数,������是������ 的函数,������ 又 是网络权值的函数,因此������������ 最终是网络权值的函数。 故可通过使������������ 逐渐趋于0来调整网络权值。 当������������ = 0时,从前馈通路看,有: ������ = ������ ������ = ������ ������������ = ������ ������ −1 ������������ = ������������ ,
神经网络自校正控制:根据系统正向模型或逆模 型的建模结果,直接调节神经或传统控制器的内 部参数,使系统满足给定的指标。
神经网络模型参考自适应控制:闭环控制系统的 期望性能用一个稳定的参考模型描述,控制的目 的是使被控对象的输出逐渐趋于参考模型的输出。
239
神经网络直接自校正控制:由一个神经网络控制器和 一个可进行在线修正的神经网络辨识器组成,调整的 是神经网络控制器本身的参数,本质等同于神经网络 直接逆控制。
241
神经网络直接模型参考自适应控制
期望输出 稳定的参 考模型
������������ (������) ������������ (������) ������(������)
参考模 型输入
+ ������(������)
������(������) +
������(������)
-
神经网络 控制器
236
神经网络控制器1复制了神经网络2的完全相同的 网络结构和权值参数,即亦为被控对象的逆模型。 当网络 2在线学习时,整个系统为具有在线自学 习能力的一种神经网络自适应控制。
特性论证: 系统通过偏差������ 调整两个网络的权值。当������ = 0时, 网络具有对象的逆特性,因为此时意味着������ = ������������ , 故 对网络2: ������������ = ������ −1 (������); 对网络1: ������ = ������ −1 (������������ ); 显然, ������ −1 ������ = ������ −1 (������������ ) ⇒ ������ = ������(������ −1 (������������ )) = ������������
224
① ②
存在问题 神经网络的稳定性与收敛性问题。 神经网络控制系统的稳定性与收敛性问题。
③
④
神经网络学习算法的实时性。
对于神经网络控制器和辨识器,如何选择合适的 ANN及确定模型的结构。
225
神经网络控制的概念 所谓神经网络控制,是将ANN与控制方法相结合而 产生的一种智能控制方法,指在控制系统中采用 ANN这一工具对难以描述的复杂非线性对象或进行 建模、或充当控制器、或优化计算、或进行推理、
神经网络间接自校正控制:由一个常规控制器和一个 神经网络辨识器组成,神经网络辨识器用作过程参数 或某些非线性函数的在线估计器,神经网络估计器需 要较高的建模精度,主要用来调整常规控制器的参数。
神经网络间接自校正控制
结构图为:
240
期望输出
������, ������
神经网络 估计器
������������ +
第2部分 控制基础
221
3.5 神经网络控制基础
3.5.1 神经网络控制简介
① ② ③ ④ ⑤
人工神经网络(ANN)用于控制系统的优越性 并行分布处理。 非线性映射。 通过训练学习。 适应与集成。 硬件实现。
222
历史发展 1960年,B. Widrow和M. E. Hoff首先把ANN 用于控制系统;B. Kilmer和W. S. McCulloch 等人提出了 KMB 神经网络模型,并在阿波罗登 月计划中应用,取得良好的效果。 1964年,Widrow和Smith等人利用ANN对小车 倒立摆系统控制取得了成功。 20世纪 60年代末期至 80 年代中期,神经网络控 制与整个神经网络研究一样,处于低潮,研究成 果很少,甚至被许多人所遗忘。 80年代后期以来,随着人工神经网络研究的复苏
工程实践中,被控对象的动态特性未知或仅部分已 知,借助标准的控制技术设计出合适的控制器极其 困难,但人们可根据对象的输出状态和经验知识提 供恰当的控制信号,实现良好控制。 基于规则的专家控制和模糊控制可用以解决此类问 题,神经网络控制则基于学习的原理也可有效解决 此类问题。
通过对人工或传统控制器进行学习,然后用神经网络 控制器取代或逐渐取代原控制器的方法,称为直接学 习神经网络控制,也称为神经网络学习控制,或监督 式神经控制,或神经网络监督控制,或COPY控制。
232
基于传统控制器的改进型神经网络监督控制系统 神经网络控制器是前馈控制器,建立被控对象的 逆模型。
神经网络控制器基于传统控制器的输出,在线学 习调整网络的权值,使反馈误差������ 或 ������������ 趋近于零, 从而使神经网络控制器逐渐在控制作用中占据主 导地位,最终取消反馈控制器的作用;一旦系统 出现干扰,反馈控制器重新起作用。
-
图中,深蓝色虚线对 应人工控制器;红色 实线对应传统控制器
人工/传统 控制器
������������
+
对象
������
人工反馈 自动反馈
231
期望输出
神经网络 控制器
������������
-
深蓝色虚线对应人工 控制器;红色实线对 应传统控制器
���
人工/传统 控制器
两个阶段可以独立完成,也可以交替进行。
227
几种较具代表性的神经网络控制系统
直接学习神经网络控制;
神经网络直接逆控制;
神经网络自适应控制;
神经网络内模控制; 神经网络预测控制; 神经网络自适应评判控制; 神经网络混合控制。
228
3.5.2.1 直接学习神经网络控制
动机
237
改进结构方案之二
������������ (������) ������ −1
神经网络 控制器
������(������)
������
对象
������(������)
������(������)
评价函数
用评价函数������(������)作为性能指标,调整神经网络控
制器的权值,可选为������ ������ =
������
-
常规控制 器
������
对象
������
假定被控对象为仿射非线性系统:������ = ������ + ������������ 若利用神经网络对非线性函数������和������进行离线辨识, 得到具有足够逼近精度的估计值������ 和������,则常规控 制器可直接给出为: ������������ − ������ ������ = ������
������ −1
������
缺点:无反馈,用作控制器的神经网络逆模型不 准确时,抗干扰能力差,缺乏鲁棒性。 改进考虑:使网络具有在线学习能力,即作为逆 模型的 ANN 的参数能在线调整,从而使 ANN 对逆 模型的模拟真实度提高。
235
改进结构方案之一
������ −1
神经网络 控制器1
������������ (������)
该方案由于利用了反馈控制的思想,又可在线学 习新的系统信息,可确保控制系统的稳定性和鲁 棒性,有效提高系统的精度和自适应能力。
233
期望输出
神经网络 控制器
������������
������ −1
������������
+ -
������
传统控 制器
+
+
������
������������
对象
这种方案中,ANN一般采用离线训练。训练所需样本 数据采用人们执行人工控制或传统控制器时的输入-输 出数据。输入数据一般是传感器检测出的、被控对象 的实际输出数据(或与期望输出的偏差值),输出数 据则是人们根据经验或直接检测传统控制器的输出确 定出来的、施加在被控对象上的控制量。
神经网络 控制器
������������
������(������) ������(������)
+ -
������
对象
������(������)
������(������)
������ −1
辨识器2
������������ (������) 神经网络
在开环结构的基础上增加了神经网络 2 ,用于辨 识被控对象的动态逆模型,其学习训练可采用离 线方式或在线方式;但显然要求网络具有较好的 初始权值,否则起初的权值不当可能导致控制系 统的不稳定。
������������ 息 ) 才能通过误差反向传播算法修正网络权值, ������������
229
基本原理图
������ 人工控制或 传统控制 ������ ������
被控对象
利用人工控制经验或 传统的简单控制规律
������
神经网络
������
被控对象
������
两种控制结构
基于人工/传统控制器的简单神经网络监督控制系统
基于传统控制器的改进型神经网络监督控制系统
230
基于人工/传统控制器的简单神经网络监督控制系统
������������
+
对象
������
人工反馈 自动反馈
该方案中,神经网络学习的是人工控制作用 / 传统控制器 的正向模型,并输出与人工/传统控制器相似的控制作用。 ANN 的学习实现的是传感输出 ( ������ 或 ������ ) 到人工控制作用 / 传 统控制器输出的映射。 缺点是,学成后的神经网络控制器独立作用于对象上,构 成开环控制方式或简单的闭环控制,前者使得系统的稳定 性和鲁棒性得不到保证,后者使得神经网络的优越性丧失。
对象
控制目的:使实际输出������跟踪期望输出������������ 。神经网 络控制器的作用是使被控对象和参考模型输出之差 的二次型为最小来调整网络的权值,从而使被控对 象的输出跟踪参考模型的输出。当对于任意的系统
242
输入(设定值),二者的输出之差趋于零时就实现了 完全的模型匹配,也即:被控对象与控制器组成的 闭环系统的动力学特性与给定的参考 (期望)模型完 全一致。
对模型参考自适应控制,一般应设计参考模型为渐 近稳定的系统,这样通过学习与参考模型的动力学 特性趋于一致的闭环被控系统也是渐近稳定的。 图中,若 ������������ = 0 ,则 ������ = ������������ ,进而有 ������ = ������ − ������������ , 该量作为神经网络控制器的输入、产生控制作用。 该控制方案要求知道对象的数学模型(Jacobian信
223
和发展,对神经网络控制的研究也十分活跃。主 要集中在神经网络自适应控制方法、模糊神经网 络控制及其在机器人控制中的应用上。
① ②
研究进展 基于神经网络的系统辨识。 神经网络控制器。可对不确定或未知系统进行有 效的控制。 优化计算。 控制系统的故障诊断。 神经网络与其他算法相结合。
③ ④ ⑤
1 2
������������ ������ − ������ ������
2
。
当性能指标为 0 时,神经网络控制器即为对象的 逆模型。(该方案同样要求网络具有较好的初始权值)
238
3.5.2.3 神经网络自适应控制
分类
自适应控制的对象常含未知因素。
直接自校正控制 自校正控制 间接自校正控制 直接模型参考自适应控制 模型参考自适应控制 间接模型参考自适应控制
或故障诊断而构成的控制。
注: 神经网络应用于控制系统设计主要是针对系统的非线性、不确定 性和复杂性进行的。
226
3.5.2 神经网络控制系统的结构类型
在神经网络控制系统中,网络的运行通常分为学
习期和控制期两个阶段。
在控制期,网络结构和权值已知且不变,各神
经元根据输入信息和状态信息产生输出; 在学习期,网络按一定的学习规则调整其内部 连接权重,使给定的性能指标达到最小或其它 最优。
234
此时再从反馈回路看,有:������ = ������������ − ������ = 0。
3.5.2.2 神经网络直接逆控制
将对象的神经网络逆模型直接与被控对象串联起 来,使期望输出与对象实际输出之间的传递函数 为1。
������������
神经网络 控制器
������
对象
������
������
������
������
图中,������������ 是������的函数,������是������的函数,������是������ 的函数,������ 又 是网络权值的函数,因此������������ 最终是网络权值的函数。 故可通过使������������ 逐渐趋于0来调整网络权值。 当������������ = 0时,从前馈通路看,有: ������ = ������ ������ = ������ ������������ = ������ ������ −1 ������������ = ������������ ,
神经网络自校正控制:根据系统正向模型或逆模 型的建模结果,直接调节神经或传统控制器的内 部参数,使系统满足给定的指标。
神经网络模型参考自适应控制:闭环控制系统的 期望性能用一个稳定的参考模型描述,控制的目 的是使被控对象的输出逐渐趋于参考模型的输出。
239
神经网络直接自校正控制:由一个神经网络控制器和 一个可进行在线修正的神经网络辨识器组成,调整的 是神经网络控制器本身的参数,本质等同于神经网络 直接逆控制。
241
神经网络直接模型参考自适应控制
期望输出 稳定的参 考模型
������������ (������) ������������ (������) ������(������)
参考模 型输入
+ ������(������)
������(������) +
������(������)
-
神经网络 控制器
236
神经网络控制器1复制了神经网络2的完全相同的 网络结构和权值参数,即亦为被控对象的逆模型。 当网络 2在线学习时,整个系统为具有在线自学 习能力的一种神经网络自适应控制。
特性论证: 系统通过偏差������ 调整两个网络的权值。当������ = 0时, 网络具有对象的逆特性,因为此时意味着������ = ������������ , 故 对网络2: ������������ = ������ −1 (������); 对网络1: ������ = ������ −1 (������������ ); 显然, ������ −1 ������ = ������ −1 (������������ ) ⇒ ������ = ������(������ −1 (������������ )) = ������������
224
① ②
存在问题 神经网络的稳定性与收敛性问题。 神经网络控制系统的稳定性与收敛性问题。
③
④
神经网络学习算法的实时性。
对于神经网络控制器和辨识器,如何选择合适的 ANN及确定模型的结构。
225
神经网络控制的概念 所谓神经网络控制,是将ANN与控制方法相结合而 产生的一种智能控制方法,指在控制系统中采用 ANN这一工具对难以描述的复杂非线性对象或进行 建模、或充当控制器、或优化计算、或进行推理、
神经网络间接自校正控制:由一个常规控制器和一个 神经网络辨识器组成,神经网络辨识器用作过程参数 或某些非线性函数的在线估计器,神经网络估计器需 要较高的建模精度,主要用来调整常规控制器的参数。
神经网络间接自校正控制
结构图为:
240
期望输出
������, ������
神经网络 估计器
������������ +