5.第五章_神经网络 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

也就是数据在神经元之间的流动方向是单向的，没有循环。
这种网络而在分类过程中数据只能向前传
送，直到到达输出层，层间没有向后的反馈信号，因此被称为前馈网络。
后向传播是在多层前馈神经网络上学习的。
10
什么是反馈式神经网络？
反馈式神经网络是指数据在神经元之间的流动方
向是双向关系，神经元会输出到其他所有的神经元，也会接收其他神经元的输出成为输入。
11
什么是自组织网络 ( SOM ,SelfOrganizing Neural Networks )
自组织神经网络是一种无监督学习网络。它通
过自动寻找样本中的内在规律和本质属性，自组织、自适应地改变网络参数与结构。
12
什么是层？
类神经网络的分为输入层、输出层和隐藏
层，三层连结形成一个神经网络。
（neuron）、层（layer）和网络（network）三个部份所组成。
整个类神经网络包含一系列基本的神经元，
通过权重（weight）相互连接。
这些单元以层的方式组织，每一层的每个
神经元和前一层、后一层的神经元连接。
6
后向传播神经网络
神经元
输入层
7
隐藏层 (可多层)
输出层 (决策层)
什么是后向传播？
23
+1
0
S 函数
24
4、分段线性启动函数
1, I j 1 f I j I j , 0 I j 1 0, I j 0
+1
0
分段线性函数
25
5、高斯启动函数
f I j e

I2 j V
钟型曲线（bell-shaped curve），输出值在0和1之间，其中，I j 是均值，V是函数事先定义的方差。
27
神经网络学习就是不断调整权重的过程。训练之前，必须将数据集分为训练数据集
和测试数据集，将权重指定给第一层的神经元。
大多数软件包使用向后传播方法(Back
propagation)，任何一种后向传播算法的最重要部分都是使用误差度量来调整权重。
28
六、权重和偏置的调整
后向传播神经网络通过更新权重和偏置使得网络预测的误差达到最小。具体步骤如下：
第五章类神经网络
1
什么是类神经网络
类神经网络（Neural Network，NN）类似人类神经
结构，是“一种基于脑与神经系统研究，所启发的信息处理技术”。它具有人脑功能基本特性：学习、记忆和归纳。神经网络中的几个术语：
树突(Dendrites)：神经元中负责把神经脉冲传递至细胞体
前向传播：在前向传播过程中，神经网络中的
8
所有突触的权重都是固定不变的。
什么是前馈神经网络：
不同的信息流向导致不同类型的网络，可区分
为”前馈神经网络”（feed forward neural network）和”反馈式神经网络”（feedback neural network）。
9
前馈神经网络是指信息只朝一个方向流动，
总输入信号：I j wij Oi j
i
1 转换输出信号：O j = I 1+e j
神经元4：
总输入信号：I 4 wi 4Oi 4 1*0.2 0*0.4 1*(0.5) 0.4 0.7
i
转换输出信号：O4 =
1 1 0.332 I4 0.7 1+e 1+e
杂性，以能够模拟复杂的非线性关系。
隐藏层的多少要适当，过多容易过度拟合。
一层加权神经元的网络称单层感知器，多
层加权神经元的网络称多层感知器（multi-layer perceptrons）。
14
神经网络的形式：
一个输出元的两层神经网络
15
一个输出元的三层神经网络
3
2016/9/13
Vj
y
4
2016/9/13
神经网络的特点：
类神经网络和回归分析不同，没有任何假
设的概率分布，是模式识别和误差最小化的过程，在每一次经验中提取和学习信息。
类神经网络可以处理连续型和类别型的数
据，对数据进行预测。
神经网络是有监督学习。
5
二、类神经网络的架构
类神经网络主要结构是由神经元
四、启动函数f(•)类型
1、线性启动函数：
f I j I j
启动函数就是负责将神经元接受的输入脉冲总和，转换成输出脉冲，但是人类神经在处理外部刺激时，输出信号是有极限的，否则可能会因为输出信号过强而造成对神经元的伤害。
因此，类神经网络在选取启动函数时，不能够使用传统的线性函数，通常来说会选择兼具正向收敛与负向收敛的函数。
的神经纤维。神经核(soma)：神经元的中央处理部位。轴突(Axon)：神经元中负责把神经脉冲从细胞体往外传递的神经纤维。突触(Synapse)：神经元之间的连结机制。
2
类神经网络，类似人类神经元结构。神经元的主要功能是接受刺激和传递信息。神经元通过传入神经接受来自体内外环境变化的刺激信息，并对这些信息加以分析、综合和储存，再经过传出神经把指令传到所支配的器官和组织，产生调节和控制效应。
i 4 5
0.105
转换输出信号：O6 = 1 1 0.474 I6 0.105 1+e 1+e
34
4、此时，输出值0.474与真值1不一致，我们可以计算神经元6的误差项。Errorj =Oj (1 Oj )(Tj Oj ) Errork 神经元6的误差项：
Error6 =O6 (1 O6 )(T6 O6 ) 0.474(1 0.474)(1 0.474) 0.1311
1
+1
0

-1 阶梯函数对称阶梯函数
22
3.Sigmoid（或称S型）启动函数
f
I
j
1 I j 1 e
Sigmoid启动函数输出值界于-1和1，或是0和1之间，是单调递增函数，函数型数有许多种，最常用的是Logistic函数。
式中α是正常数（一般为零），Sigmoid 启动函数是最常用启动函数，非线性函数，但是易于微分和了解。
神经元5：
总输入信号：I5 wi 5Oi 5 1*(0.3) 0*0.1 1*0.2 0.2 0.1
i
பைடு நூலகம்
转换输出信号：O5 =
33
1 1 0.525 I5 0.1 1+e 1+e
3、根据隐藏层输出信号，计算输入层神经元的输出信号。神经元6
总输入信号：I 6 wi 6Oi 6 0.332*(0.3) 0.525*( 0.2) 0.1
20
2.阶梯（step）启动函数的一般形式：
f I j ,Ij 0 ,Ij 0
阶梯启动函数又称阈值（threshold）启动函数。当 1, 0 时，得到
1 f I j 0 , Ij 0 , Ij 0
21
当 1, 1 时，得到对称阶梯函数。即： 1, I j 0 f I j 1, I j 0
j * Errorj
24
* j j j
* w25 0.1 0.9(0.0065) *0 0.1 * w34 0.5 0.9(0.0087) *1 0.492 * w35 0.2 0.9(0.0065) *1 0.206
学习速率：通常是介于 * w 0～1之间，当其数值越大， 46 0.3 0.9(0.1311) *0.332 0.339 每次权数的修正量就越大。 w* 0.2 0.9(0.1311) *0.525 0.138 56 不能太小或太大。经验设 * 4 0.4 0.9(0.0087) 0.392 置为1/t，t为迭代次数。 * 目前调整权重的方法是 5 0.2 0.9(0.0065) 0.206 一种最陡坡降法。 6* 0.1 0.9(0.1311) 0.218 36
通过输入节点将输入变量加以标准化，标
准化后的变量数值落在0和1之间，或者是-1 和1之间。
将网络权重初始值设定为0（或随机产生）。
通过各节点的函数，估计数据的目标变量值。
29
比较实际值和估计值之间的误差，并根据
误差值重新调整各权重和偏置。
重新执行第二步骤，反复执行，一直到实
际值和估计值之间的误差值最小，此时才停止学习，此时获得最佳权重。
30
举例说明权重和偏置的调整过程
31
1、首先利用随机的方式，产生各神经元
间的权重，以及隐藏层与输出层神经元的偏置。
w14 0.2 w15 -0.3
θ4 -0.4
w24 0.4
θ5 0.2
w25 0.1
θ6 0.1
w34 -0.5
w35 0.2
w46 -0.3
w56 -0.2
32
2、根据输入信号，计算各隐藏层神经元的输出信号，假设输入的样本是(X1,X2,X3,Y)=(1,0,1,1)。
16
多个输出元的三层神经网络
17
三、神经元的结构
一个神经元 j，有阈值，从上一层连接的
神经元得到n个输入变量X，每个输入变量附加一个链接权重w。
输入变量将依照不同权重加以合并（一般
是加权总和），链接成组合函数（combination function），组合函数的值称为电位（potential）；然后，启动（转换、激活、赋活)函数（activation function）将电位转换成输出信号。
Error4 =O4 (1 O4 ) Errori w4i 0.332(1 0.332)*0.1311*( 0.3)
i
5、将此误差项反馈至隐藏层，此时可以计算隐藏层神经元误差值。 Errorj =Oj (1 Oj ) Errork wjk k 神经元4误差项：
0.0087
Error5 =O5 (1 O5 ) Errork w5k 0.525(1 0.525)*0.1311*( 0.2)
k
神经元5误差项：
0.0065
35
6、最后根据神经元误差项，更新各神经元的权重以及偏置，假设学习速率为0.9。 * w14 0.2 0.9(0.0087) *1 0.208 wij * Errorj Oi * w15 0.3 0.9(0.0065) *1 0.294 * wij wij wij w* 0.4 0.9(0.0087) *0 0.4
后向传播是一种按误差逆传播算法训练的多层
前馈网络的学习算法。这个神经网络包括输入层、隐藏层和输出层。
这种学习算法下的神经网络是一组连接的输入/
输出单元，其中每个连接都与一个权相连。它的学习规则是使用最速下降法，按照误差纠正规则反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小，从而使得能够预测输入样本的正确类标号。
26
五、类神经网络的训练
类神经网络学习前，必须建立出一个训练样本
（training pattern）使类神经网络在学习的过程中有一个参考，训练样本的建立来自于实际系统输入与输出或是以往的经验。
例如：洗衣机洗净衣服的时间，与衣服的质料、数量、
肮脏的程度有关，因此我们必须先针对不同质料、数量、肮脏的程度的衣服统计出洗衣所需的时间，建立训练样本。不同衣服的质料、数量、肮脏程度就是类神经网络的输入，而洗衣所需的时间则为类神经网络的目标值（target），也就是类神经网络的参考输出。
输入层只从外部环境接收信息，该层的每
个神经元相当于自变量，不完成任何计算，只为下一层传递信息。
输出层生成最终结果，为网络送给外部系
统的结果值。
13
隐藏层介于输入层和输出层之间，这些层
完全用于分析，其函数联系输入层变量和输出层变量，使其更拟合(fit)资料。
隐藏层的功能主要是增加类神经网络的复
18
xi
o1
o2
w1j w2j
j
Ij
n
f(Ij)
n表示变量的个数
Oj
：
： on
Oi表示第i个输入值(X)
Wij表示第j个神经元的
wnj
I j wij oi j
i 1
第i个输入值的权重
19
j 是第j个神经元的偏置（偏差）：偏差有增大或者减小激活函数的净输入的作用，取决于该偏差是负值还是正值。 I j 表示第j个神经元的输入值(组合函数)。 f（•）是神经元的启动（激活或赋活）函数 Oj=f(Ij)是第j个神经元的输出值(Y)。