第5章 神经网络在控制中的应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
J
(1) wij
ˆ ) w (j2) H ' xi ( y y
7
5.1 神经网络辨识
5.1.3. 递归神经网络系统辨识
( 0) w1
x1
(1) w11
( 2) w11
y1
x2
y2
……
xn
( 0) wn
(1) wnl
ym
( 2) wlm
递归神经网络结构
8
5.1 神经网络辨识
递归神经网络的输入输出关系可以描述为:
15
5.2 神经网络控制
(2)神经网络模型参考间接自适应控制
在直接自适应控制的基础上,引入了一个神经网络辨识器(NNI)来对 被控对象的数学模型进行在线辨识,这样可以及时地将对象模型的变化 传递给NNC,使NNC可以得到及时有效的训练。
16
5.2 神经网络控制
(3) 神经网络间接自校正控制
自校正调节器的目的是在控制系 统参数变化的情况下,自动调整 控制器参数,消除扰动的影响, 以保证系统的性能指标。在这种 控制方式中,神经网络(NN)用 作过程参数或某些非线性函数的 在线估计器。
2
5.1 神经网络辨识
5.1.1 神经网络系统辨识的原理
系统辨识的原理就是 通过调整辨识模型的 结构来使e最小。
对象
u
y
e源自文库
辨识模型
ˆ y
在神经网络系统辨识中,神经网络用作辨识模型,将对象的输入输出状 态u,y看作神经网络的训练样本数据,以J=1/2e2作为网络训练的目标, 则通过用一定的训练算法来训练网络,使J足够小,就可以达到辨识对 象模型的目的。
4
5.1 神经网络辨识
u(t) 对象
y(t-1) Z-1
y(t)
… …
多层前向BP网络系统辨识原理图
5
…
Z-1 y(t-n) Z-1 u(t-1) Z-1
ˆ (t ) y
BP
… …
…
u(t-n)
5.1 神经网络辨识
网络的输出可以通过下式计算得到:
( 2) n m1 (1) ˆ (t ) w j ( y wij xi ) j 1 i 1
神经网络学习控制系统将神经网络与常规误差反馈控制结合起来,首先用 NN学习对象的逆动力学模型,然后用NN作为前馈控制器与误差反馈控制器 构成复合控制器来控制对象。系统以反馈控制器的输出作为评价函数来调节 神经网络的权值。这样,在控制之初,反馈控制器的作用较强,而随着控制 过程的进行,NN得到越来越多的学习,反馈控制器的作用越来越弱,NN控 制器的作用越来越强。
+
e( k )
动态对象
y(k )
10
5.2 神经网络控制
神经网络在控制中主要起以下作用:
(1)基于精确模型的各种控制结构中充当对象的模型; (2)在反馈控制系统中直接充当控制器的作用; (3) 在传统控制系统中起优化计算作用; (4)在与其它智能控制方法和优化算法相融合中, 为其提供对象模型、 优化参数、推理模型及故障诊断等。
13
5.2 神经网络控制
5.2.3 神经网络内模控制
将对象模型与实际对象相并联,控制器逼近模型的动态逆。 一般有两种方法: 1) 两个神经网络分别逼近模型和模型的逆; 2) 采用神经网络逼近模型,然后用非线性优化方法数值计算内模控制量。
14
5.2 神经网络控制
5.2.4 神经网络自适应控制
(1)神经网络模型参考直接自适应控制
18
5.2 神经网络控制
5.2.6神经网络PID控制
19
经典增量式数字PID 的控制算法为:
u(k ) u(k 1) k p (e(k ) e(k 1)) k i e(k ) k d (e(k ) 2e(k 1) e(k 2))
NN 是一个三层BP 网络, 有 M个输入节点、N 个隐含节 点、3 个输出节点。输入节 点对应所选的系统运行状 态量, 输出节点分别对应 PID 控制器的3 个可调参数 kp , ki , kd 。 网络根据性能指标J=1/2(r-y)2进行在线学习,则可以及时更新PID控制 器的参数,使系统误差在不确定严重的情况下保持最小。
假设被控对象的模型为 yk+1=f(yk)+g(yk)· uk 则用神经网络对非线性函数f(yk)和g(yk)进行辨识,假设其在线计算估计 值fd(yk)和gd(yk),则调节器的自适应控制律为 uk=(yd -fd(yk)/gd(yk) 此时系统的传递函数为1
17
5.2 神经网络控制
5.2.5 神经网络学习控制
11
5.2 神经网络控制
5.2.1 神经网络直接反馈控制系统
学习算法
期望值r
e 神经网络控制器 被控对象
y
神经网络直接用作误差闭环系统的反馈控制器,神经网络控制器首 先利用其它已有的控制样本进行离线训练,而后以系统的误差的均 方差为评价函数进行在线学习。
12
5.2 神经网络控制
5.2.2 神经网络逆控制
定义网络训练的目标函数为:
ˆ (t )) 2 J1 ( y ( t ) y 2
则网络训练的BP算法可以描述为:
w (j2) (t 1) w (j2) (t ) 1 J w (j2)
(1) (1) wij (t 1) wij (t ) 2
J
(1) wij
n m1 (1) ˆ y J ˆ )H ( y y wij xi ˆ w ( 2) w (j2) y i 1 j J
l
X [ x1 , x2 ,, xnm1 ]
[ y(t 1), y(t 2),, y(t n), u(t ), u(t 1),, u(t m)]
H(*)表示隐层神经元的激发函数 Wij(1),Wj(2)分别表示网络第1-2层和2-3层的连接权值
6
5.1 神经网络辨识
模型参考自适应控制的目的是:系统在相同输入激励r的作用下,使被控对象 的输出y与参考模型的输出ym达到一致。这样通过调整参考模型,可以调整系 统的动态特性。
神经网络控制器(NNC)先离线学习被控对象的逆动力学模型,与被 控对象构成开环串联控制,而后神经网络根据参考模型输出与被控对象 输出的误差函数进行在线训练,使误差函数最小。
yk
j 1
l
2) w (jk H
n
i 1
(1) wij ( xi (t )
wi(0) xi (t
1))
H(*)表示隐层神经元的激发函数 Wij(1),Wjk(2)分别表示网络第1-2层和2-3层的连接权值 Wi(0)表示网络第一层的递归权值
9
5.1 神经网络辨识
20
神经网络在控制中的应用 神经网络辨识技术 神经网络控制技术
1
5.1 神经网络辨识
系统辨识是自适应控制的关键所在,它通过测量对象的输入输出状态 来估计对象的数学模型,使建立的数学模型和对象具有相同的输入输 出特性。 神经网络对非线性函数具有任意逼近和自学习能力,为系统的辨识, 尤其是非线性动态系统的辨识提供了一条十分有效的途径。 神经网络系统辨识实质上是选择一个适当的神经网络模型来逼近实 际系统的数学模型。
3
5.1 神经网络辨识
5.1.2多层前向BP网络的系统辨识
假设非线性对象的数学模型可以表示为:
y(t ) f ( y(t 1), y(t 2), y(t n), u (t ), u (t 1), , u (t m))
其中f是描述系统特征的未知非线性函数,m,n分别为输入输出的阶 次。则可以利用多层前向BP网络来逼近非线性函数,进而估计对象 的模型。
逆动力学 期望值r NNC 被控对象 输出值y
目标函数
自适应逆控制的基本思想就是用被控对象传递函数的逆模型作为串联 控制器对控制对象实施开环控制。 神经网络先离线学习被控对象的逆动力学模型,然后用作对象的前馈 串联控制器。由于开环控制缺乏稳定性,所以神经网络还需要根据系 统的反馈误差在线继续学习逆动力学模型
由于递归神经网络本身具有动态反馈环,可以记录以前的状态,因此用 递归神经网络来对非线性对象进行辨识时只需以对象当前的输入状态 u(t)和前一时刻的输出状态y(t-1)作为网络的输入即可,与前向多层神经 网络相比,网络的结构较为简单。
学习算法
递归网络
ˆ (k ) y
u (k )
y (k 1)
z
1