第五章神经网络控制

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第二阶段是工作阶段，即根据输入运行网络得到合适的输出，这实质上是按照某种机制将知识提取出来。
目前神经网络的学习方法有多种，按有无导师来分类，可分为有教师学习，无教师学习和再励学习等几大类。
要使神经网络具有学习能力，就是使神经网络的知识结构变化，目前主要是指通过一定的学习算法实现对权值的调整，使其达到具有记忆、识别、分类、信息处理和问题优化求解等功能。
Hebb学习规则（无教师）
刻第 i 个输入上的加权（ 1≤i≤n ），
0(k)为k时刻的阈值
（2）输入一组样本X=(x1, x2, …, xn)和期望的输出d，如果X属于A类，则d=1，否则d=-1。
（3）计算感知器实际输出：
y
f(
n
i
xi
)
1,
i0
1,
n
i xi 0
i0
n
i xi 0
i0
（4）按下式修正权值：
（1）异步方式（2）同步方式
异步方式
每次只有一个神经元节点进行状
态的调整计算，其他节点的状态均保
持不变，即：
n
xi (k 1) f wij x j (k) i
j1
xj (k 1) x j (k), j i
同步方式
所有神经元节点同时调整状态，
即：
n
xi (k 1) f wij xj (k) i ,i
解决BP网络陷入局部极小的方法: ➢ Additional Momentum ➢ Self-adaptive learning rate ➢ Dynamic error segmentation
5.3.3 RBF网络
径向基函数神经网络也称RBF神经网络。是一种局部逼近的神经网络。它的特点是，对于输入空间的某个局部区域，只有少数几个连接权影响网络的输出，从而使局部逼近网络具有学习速度快的优点。
Boltzmann机网络的结构
Boltzmann机网络是一个相互连接的神经网络模型（简称BM网络）如下图，具有对称的连接权系数，即ij=ji，且ii= 0。
ui uo
Boltzmann机的一种连接模式
每个神经元都根据自己的能量差 ΔEi随机地改变自己或为1或为0的状态，即当神经元的输入加权和发生变化时，神经元的状态随之改变。
j1
离散Hopfield网络实质上是一个离散的非线性动力学系统。因此，如果系统是稳定的，则它可以从一个初态收敛到一个稳定状态。
当稳态是一个记忆样本，则网络改变的过程是从部分信息找到全部信息，即联想记忆。若稳态是优化计算的目标函数，则网络改变过程是优化计算过程。
同步方式对连接权的要求更高，若不满足非负定对称阵的要求，则网络可能出现自持振荡，即极限环。
wij :表示从神经元j到i的连接权值
i :阈值
f () :激发函数或作用函数
常用的激活函数有如下几种：
（1）阈值型函数
f(x)
1, x 0
1
f (x) 0, x 0
0
sgn(x)
f
(x)
1, -1,
x0 x0
f(x) 1
0 -1
（2）饱和型函数
1,
f (x) kx,
-1,
x 1 k
i (k 1) i (k) [d(k) y(k)]xi
i 0, 1, 2, L , n
（5）选取另外一组样本，重复上述（2）~（4）的过程，直到权值对一切样本均稳定不变为止，学习过程结束。
感知器的学习算法收敛的条件是，要求函数是线性可分的。
激励函数是阈值函数
多层感知器网络
x1(Q)
各单元之间状态的更新是异步的，
可用概率来描述。神经元i的输出为1
的概率为
1
1
pi p1 1 eEi /T 1 esi /T
神经元i的输出为0时的概率
p0
1
p1
eEi /T 1 eEi /T
1
esi /T esi
/
T
Boltzmann机的运行分为两个阶段：第一阶段是学习和训练阶段，即
根据学习样本对网络进行训练，将知识分布地存储于网络的连接权中。
第五章神经网络控制
5.1 神经网络概述 5.2 人工神经网络的基本概念 5.3 前馈网络 5.4 反馈网络 5.5 神经网络控制 5.6 NN与GA的系统思维特性
5.1 概述
人脑共有 1010－1012 个神经元
人工神经网络是由许多处理单元，
即神经元，按照一定的拓扑结构相互
连接而成的一种具有并行计算能力的
神经网络在控制系统中的作用
➢ 神经网络逼近非线性函数的能力为自动控制理论发展提供了生机
➢ 从控制角度，对神经网络的要求更注重其实时学习训练能力和网络结构的简单性
5.2 神经网络的基本概念
5.2.1 神经网络的基本原理 5.2.2 神经元模型 5.2.3 神经网络模型 5.2.4 神经网络的学习方法
RBF网络
j
(
x)
exp[
(
x
c
2 j
j
)2
],
j 1, 2,L , q
q
yi ij j (x), i 1, 2,L , r j 1
RBF网络的学习过程与BP网络的学习过程类似，两者的主要区别在于各使用不同的作用函数。BP网络中隐含层使用的是S型函数，所以是全局逼近的神经网络，而RBF网络中使用的是高斯函数，因此是局部逼近的神经网络。
（1）前馈型神经网络
又称前向网络（Feedforward NN）神经元分层排列，有输入层、隐层和输出层，每一层的神经元只接受前一层神经元的输入。大部分前馈网络都是学习网络，常用的有感知器网络和 BP网络。
输入层
隐层
输出层
前馈型神经网络结构
（2）反馈型神经网络（Feedback NN）
Wi
Delta学习规则（有教师）
5.3 前馈网络
5.3.1 感知器 5.3.2 BP网络 5.3.3 RBF网络
5.3.1 感知器（perceptron）
一个具有单层神经元的神经网络，并由线性阈值元件组成，是最简单的前向网络，主要用于模式分类
y1
y2
yn
1
2
n
x1
x2
xn
单层感知器网络
x1 1
(3) 单元的输出函数
yi (t) fi (Ii (t))
该输出函数将当前激活值 Ii(t) 映射成一个输出信号。
(4) 单元之间连接模式通常情况下认为，每个单元都向
它的连接单元提供了一个可加入性输入。因此，一个单元的总输入就是与它输入连接的各单元的输出加权和，只要确定了系统的各连接的权值，就能表示出整个连接模式
x2(Q)
xn(Q)
x1(0)
x2(0)
xn(0)
或者采用Kernel used in nonlinear Support Vector Machine
5.3.2 BP网络（Back-Propagation）
误差反向传播神经网络，简称BP 网络,是一种单向传播的多层前向网络，在模式识别、图像处理、系统辨识、函数拟合、优化计算、最优预测和自适应控制等领域有着较为广泛的应用。
若总结点（神经元）数为N，则每个节点有N个输入和一个输出，即所有节点都是一样的，它们之间都可以相互连接。 Hopfield 神经网络是典型的反馈型网络。
反馈型神经网络
5.2.4 神经网络的学习方法
体现神经网络智能特征的主要标志，使神经网络具有自适应、自组织和自学习的能力。
5.2.1 神经网络的基本原理
(1) 处理单元任何一种神经网络都是以一组基
本处理单元为基础构造出来的。神经网络根据处理单元的不同处理功能，将处理单元分成输入单元、隐藏单元和输出单元。
(2) 单元集合的激活状态系统在t时刻的状态用一个N维实
矢量I(t)表示，又称为处理单元集上的激活模式。每一分量 Ii(t) 表示对应单元在t时刻的激活值。系统处理过程实际上就是单元集上的激活模式随时间变化的过程。
一种联想式学习方法。两个神经元同时处于激发状态时，它们之间的连接强度将得到加强。
ij (k 1) ij (k) Ii I j
Delta学习规则（有教师）
设误差准则函数如下：
E
1 2
P
(d p -yp )2
p1
P
Ep
p1
则学习的基本思想是沿着E的负梯度方
向不断修正W值，直到E达到最小。
W (- E )
神经网络与计算机相比的特点
(1) 以大规模模拟并行处理为主 (2) 具有较强的鲁棒性和容错性 (3) 具有较强的自学习能力 (4) 是一个大规模自适应非线性动力学
系统，具有集体运算的能力
神经网络在控制系统中的作用
(1) 在基于模型的各种控制结构中充当对象的模型
(2) 用作控制器 (3) 在控制系统中起优化计算的作用
(5) 学习规则在神经网络中，改变处理过程或
知识结构，就需修改相互连接模式。实际上，一切修改都可以归结为通过学习规则修改连接强度。所有学习规则都是从Hebb学习规则派生出来的
Hebb学习规则一般形式如下：
Wij g(Ii (t),ti (t))h(y j (t),Wij )
其中，g是单元i的激活值Ii(t)与教师输入ti(t)的函数，h是单元j的输出值yj(t)与连接强度Wij的函数。
5.2.2 神经元模型
神经元: 对生物神经元的一种模拟与简化神经网络的基本处理
一个多输入、单输出的非线性元件。
生物神经元
一种简化神经元结构模型
x1 1i
x2 2i
f(·)
yi
xn ni
i
x0=1
n
Ii wij x j i j 1
yi f (Ii )
xj ( j 1, 2,L , n) :从其他神经元传来的输入信号
5.4 反馈网络
5.4.1 Hopfield网络 5.4.2 Boltzmann机网络 5.4.3 Kohonen网络
5.4.1 Hopfield 网络
Hopfield 网络的拓扑结构是一种全连接加权无向图，可分为离散型和连续型两种类型。
Hopfield神经网络
1
2
n
Hopfield神经网络有如下两种工作方式：
-1 x 1
kLeabharlann Baidu
k
x-1 k
f(x) 1
0 -1
（3）双曲函数
f (x) tanh(x)
f(x) 1
0 -1
（4）S型函数
f(x)
1
f
(x)
1
1＋exp(-
x)
,
0
0
（5）高斯函数
f(x)
f
(x)
-x2
e
2
0
5.2.3 神经网络模型
神经网络是以工程技术手段来模拟人脑神经元网络的结构与特征的系统。并利用神经元可构成各种不同拓扑结构的神经网络，它是生物神经网络的一种模拟和近似。
误差反向传播（学习算法）
-+
输入层隐含层输出层信息流
BP网络
误差反向传播的 BP算法
BP算法的基本思想是最小二乘算法。它采用梯度搜索技术，以期是网络的实际输出值与期望输出值的误差均方值为最小。
BP算法的学习过程由正向传播和反向传播组成。在正向传播过程中，输入
信息从输入层经隐层逐层处理，并传向输出层，每层神经元（节点）的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出，则反向传播，将误差信号沿原来的连接通路返回，通过修改各层神经元的权值，使得误差信号最小。
x2 2
f(·)
y
xn n
x0=1
由于按不同特征的分类是相互独立
的，因而可以取出其中的一个神经元
讨论。令x0=1, - = 0，则感知器的输
入输出关系为：
n
y f ( i xi ) i0
当其输入的加权和大于或等于阈值时，
输出为1，否则为-1。
感知器的一种学习算法：
（1）随机地给定一组连接权i(0) （较小的非零值），这里i(k)为k时
网络系统。
每个神经元有3104种连接
人工神经网络试图通过模拟人脑
神经网络处理信息的方式，从另一角
度，来获得具有人脑那样的信息处理
能力。常称之为神经网络 (Neural
Network, NN)。
共有
3104 1012 种连接。人脑是一复杂巨系统
神经网络的基本属性
(1) 非线性：人脑智慧的非线性 (2) 非局域性：神经元相互作用 (3) 非定常性：自适应、自组织 (4) 非凸性：系统演变多样性
异步工作方式比同步方式有更好的稳定性，实用时多采用异步工作方式。其缺点是，失去了神经网络并行处理的优点。
5.4.2 Boltzmann机网络
神经网络是由大量神经元组成的动力学系统。从统计观点分析，可寻找网络系统中某神经元状态的概率分布，分布的形式与网络结构有关，其参数则是权系数。
G.E.Hinton等人借助统计物理学方法提出了Bolzmann模型，Boltzmann机可用于模式分类、预测、组合优化及规划等方面。

第五章 神经网络控制

第五章神经网络控制