第三章前馈神经网络模型

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

感知器的学习
输入X 第三步输入 3，得 WT(2)X3=(0.7,0.8,-0.6,0)(-1,-1,1,0.5)T=-2.1 O3(2)=sgn(-2.1=-1 W(3)= W(2)+η[d3- o3(2)] X3 =(0.7,0.8,-0.6,0)T+0.1[1-(-1)](-1,-1,1,0.5)T =(0.5,0.6,-0.4,0.1)T 返回到第一步，第四步返回到第一步，继续训练直到dp- op=0，p=1,2,3。
多层感知器的结构
输入层隐含层输出层
多层感知器的分类能力
一个单层感知器构成一个半平面判定区域，一个两层感知器可以构成任意无边界的空间区域，这些判定区域有的是凸多边形，有的是无边界的凹区域。凸区域是多层感知器中第一层各个神经元所构成的半平面判定区域（即判定区域）相交而成。
多层感知器性能等价问题
感知器的学习
输入X 第二步输入 2，得 WT(1)X2=(0.7,0.8,-0.6,0)(-1,0,1.5,-0.5)T=-1.6 o2(1)=sgn(-1.6)=-1 W(2)= W(1)+η[d2- o2(1)] X2 =(0.7,0.8,-0.6,0)T+0.1[-1-(-1)](-1,0,1.5,-0.5)T =(0.7,0.8,-0.6,0)T 由于d 由于 2= o2(1)，所以，所以W(2)= W(1)。。
例一用感知器实现逻辑“与”功能用感知器实现逻辑“
感知器结构
x1 x2
○ ○
0.5 0.5
○
0.75 -1
y
wix1+w2x2 -T=0 0.5x1+0.5x2-0.75=0
例二用感知器实现逻辑“或”功能用感知器实现逻辑“
逻辑“ 逻辑“或”真值表
x1 0 0 1 1
x2 0 1 0 1
y 0 1 1 1
x1 * * * * * * * * * O O O O O O O O x2 O
w1j x1 = Tj - w2j x2 x1 = (Tj -w2j x2) / w1j = - ( w2j/ w1j ) x2 +Tj / w1j = a x2 +c
* *
感知器的功能
x1 (2)设输入向量设输入向量X=(x1,x2,x3)T 设输入向量 x2 x3
“异或”的真值表异或” 异或
x1 0 0 1 1
x2 0 1 0 1
y 0 1 1 0
x1
∗
O
O
∗
x2
感知器的局限性
关键问题就是求
T Wj X
=0
感知器的学习
式中，当实际输出与期望值相同时，权值不需要调整。感式中，当实际输出与期望值相同时，权值不需要调整。知器学习规则代表一种有导师学习。知器学习规则代表一种有导师学习。
第一层中的神经元就像一单层感知器，所形成的凸区域的边数最多和第一层神经元个数一样多。一个三层感知机能够形成任意复杂的判定区域，也能把那些相互渗透的区域分开。
例子一
1、用单层感知器实现简单逻辑运算。 (1) y = x1 ∧ x2 （与）等价于y = x1 + x2 − 2，即
w =1; w2 =1;θ = 2 1
感知器模型结构
o1 … oj … om 感知器的模型结构如图所示。感知器是指只有一层处理单元的感 W1 ○ Wj ○ Wm○ 知器，如果包括输入层在内，应为两层。图中输入层也称为感知层，有n个神经元节点，这些节点 ○ ○ ○ 只负责引入外部信息，自身无信 ○ 息处理能力，每个节点接收一个 x1 x2 … xi … xn 输入信号，n个输入信号构成输入列向量X。输出层也称为处理层，有m个神经元节点，每个节点均具有信息处理能力，m个节点向外部输出处理信息，构成输出列向量O。两层之间的连接权值用权值列向量Wj表示，m个权向量构成单层感知器的权值矩阵W。 3个列向量分别表示为：
感知器的学习
单计算节点感知器，个输入给定3对训练样个输入。例三单计算节点感知器，3个输入。给定对训练样本对如下：本对如下： X1 = (-1，1，-2，0)T ，，， X2 = (-1，0，1.5，-0.5)T ，，， X3 = (-1，-1，1，0.5)T (-1，-1，1， d1 =−1 − d2 = − 1 d3 =1
感知器模型结构
X = (x1,x2,...xi ,...,xn )
O = (o1,o2,...oi ,...,om)
T
T
T
j=1,2,…,m
W j = (w1 j ,w2 j ,...w ,...,w ) ij nj
感知器模型结构
net j =
∑w x
i =1
n
iwk.baidu.com i
o j = sgn(net j − T j ) = sgn(
-1
oj
1 输出：输出： j = o − 1
w1 j x1 + w2 j x2 − T j > 0 w1 j x1 + w2 j x2 − T j < 0
w1jx1+w2jx2-Tj=0 则由方程确定了二维平面上的一条分界线。确定了二维平面上的一条分界线。
感知器的功能
w1j x1+w2j x2 – Tj = 0
感知器的学习规则
感知器学习规则的训练步骤：感知器学习规则的训练步骤： (1) 对各权值 0j(0),w1j(0),┄,wnj(0)，j=1, 2,┄,m 对各权值w ┄ ，（m为计算层的节点数）赋予较小的非零随机数；为计算层的节点数）赋予较小的非零随机数；为计算层的节点数 (2) 输入样本对{Xp,dp}，其中Xp=(-1,x1p,x2p,┄,xnp)，输入样本对{X }，其中X )， dp为期望的输出向量（教师信号），上标代表为期望的输出向量（教师信号），上标p代表），上标样本对的模式序号，设样本集中的样本总数为，样本对的模式序号，设样本集中的样本总数为P，则p=1,2,┄,P；
例二用感知器实现逻辑“或”功能用感知器实现逻辑“
感知器结构
x1 x2
○
1
1
○
0.5 -1
y
○
wix1+w2x2 -T=0 x1+x2-0.5=0
思考
分界线的方程是什么？感知器的模型如何表示？ – 数学表达式？
感知器的局限性
Rosenblatt已经证明，如果两类模式在分布空间中可以找到一个超平面将它们分开，那么感知器的学习过程就一定会收敛。否则判定边界就会振荡不休，永远不会稳定，这也正是单层感知器所无法克服的缺陷，所以它连最简单的异或（XOR）问题也解决不了。
(2) y = x1 ∨ x2 （或）等价于 y = x1 + x2 −0.5，即
w =1; w2 =1;θ = 0.5 1
(3) y = x （非）等价于 y = −x + 0.5，即
w = −1;θ = −0.5 1
例子二
∑
i =0
n
wij xi ) = sgn(W T X ) j
感知器的功能
一个最简单的单计算节点感知器具有分类功能。其分类原理是将分类知识存储于感知器的权向量（包含了阈值）向量（包含了阈值）中，由权向量确定的分类判决界面将输入模式分为两类。决界面将输入模式分为两类。
感知器的功能
x1 (1)设输入向量设输入向量X=(x1 ,x2)T 设输入向量 x2
内容提要
感知器多层感知器自适应线性元模型 BP算法
第一节感知器
线性阈值单元
线性阈值单元是前向网络（又称前馈网络）中最基本的计算单元，它具有n个输入（x1,x2,…,xn），一个输出y，n个连接权值（w1,w2,…,wn），且
wi xi ∑Ө y
感知器简介
1958年，美国心理学家Frank Rosenblatt提出一种具有单层计算单元的神经网络，称为Perceptron，即感知器。感知器是模拟人的视觉接受环境信息，并由神经冲动进行信息传递的层次型神经网络。感知器研究中首次提出了自组织、自学习的思想，而且对所能解决的问题存在着收敛算法，并能从数学上严格证明，因而对神经网络研究起了重要推动作用。感知器的结构与功能都非常简单，以至于在解决实际问题时很少采用，但由于它在神经网络研究中具有重要意义，是研究其它网络的基础，而且较易学习和理解，适合于作为学习神经网络的起点。
第二节多层感知器
多层感知器简介
多层感知器（Multilayer Perceptron）是一种在输入层与输出层之间含有一层或多层隐含神经元的具有正向传播机制的神经网络模型。多层感知器克服了单层感知器的许多局限，单层感知器只能实现线性可分问题和简单布尔函数，多层感知器可以实现线性不可分问题和任意布尔函数。
第三章
前馈神经网络模型
前馈神经网络：由一层或多层非线性处理单元组成。相邻层之间通过突触权阵连接起来。由于前一层的输出作为下一层的输入，因此此类神经网络为前向神经网络。在前向神经网络结构中输入输出之间包含着一层或多层隐含层。前向神经网络可以看成是一种一组输入模式到一组输出模式的系统变换，这种变换通过对某一给定的输入样本相应的输出样本集的训练而得到，为了实现这一行为，网络的权系数在某种学习规则下进行自适应学习，也就是有导师指导学习。
感知器的学习规则的训练步骤
1.初始化：权值初始化为一个较小的随机非零值。 2.将一模式送入输入神经元，并给出理想输出值。 3.计算神经网络模型的实际输出： 4.调节权值:
∆wi =η(d − y)xi
5.转2，直到这次迭代完所给定的所有输入样本。 6.计算结束判据。条件符合，结束；否则转2。
则由方程 w1jx1+w2jx2+…+wnj –Tj=0 确定了n维空间上的一个分界平面。确定了维空间上的一个分界平面。维空间上的一个分界平面 (3.6)
(3.5)
例一用感知器实现逻辑“与”功能用感知器实现逻辑“
逻辑“ 逻辑“与”真值表
x1 0 0 1 1
x2 0 1 0 1
y 0 0 0 1
感知器的功能
w1j x1+w2j x2 +w3j x3– Tj = 0
x1 * * * * * * * * O O x3 O O O * * O O x2 O
x1 = a x2 +b x3 +c
*
感知器的功能
(3) 设输入向量设输入向量X=(x1，x2,…，xn)T
w 输出：输出： 1jx1+w2jx2+…+wnj –Tj=0
设初始权向量W(0)=(0.5,1,-1,0)T，η=0.1。注意， η=0.1。注意，设初始权向量输入向量中第一个分量x 恒等于-1，输入向量中第一个分量 0恒等于，权向量中第一个分量为阈值，试根据以上学习规则训练该感知器。量为阈值，试根据以上学习规则训练该感知器。
感知器的学习
输入X 得解：第一步输入 1，得 WT(0)X1=(0.5,1,-1,0)(-1,1,-2,0)T=2.5 o1(0)=sgn(2.5)=1 W(1)= W(0)+η[d1- o1(0)] X1 =(0.5,1,-1,0)T+0.1(-1-1)(-1,1,-2,0)T =(0.7,0.8,-0.6,0)T
-1
oj
1 w1 j x1 + w2 j x2 + w3 j x3 − T j > 0 输出：输出： o j = − 1 w1 j x1 + w2 j x2 + w3 j x3 − T j = 0
则由方程 w1jx1+w2jx2+w3j –Tj=0 确定了三维空间上的一个分界平面。确定了三维空间上的一个分界平面。
感知器的学习规则
(3)计算各节点的实际输出 jp(t)=sgn[WjT(t)Xp], j=1,2,... ；计算各节点的实际输出o ...,m；计算各节点的实际输出 ... (4)调整各节点对应的权值，Wj(t+1)= Wj(t)+η[djp-ojp(t)]Xp, 调整各节点对应的权值，调整各节点对应的权值 j=1, 2,┄,m, 其中η为学习率，用于控制调整速度，太为学习率，用于控制调整速度，大会影响训练的稳定性，太小则使训练的收敛速度变慢，大会影响训练的稳定性，太小则使训练的收敛速度变慢，一般取0＜η≤1； (5)返回到步骤输入下一对样本，周而复始直到对所有返回到步骤(2)输入下一对样本返回到步骤输入下一对样本，样本，感知器的实际输出与期望输出相等。样本，感知器的实际输出与期望输出相等。

第三章 前馈神经网络模型

第三章前馈神经网络模型