第5章自组织竞争网络

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

训练前先对竞争层权向量随机初始化。初始状态，单位圆上的“*”是随机分布的。前已证明，两个向量的点积越大，两者越近似，因此以点积最大获胜的神经元对应的权向量应最接近当前输入模式。从图，如果当前输入模式用“o”表示，单位圆上各“*”点代表的权向量依次同“o”点代表的输入向量比较
距离，结果是离得最近的那个*获胜。
人工神经网络及应用
第五章自组织竞争神经网络
主讲何东健
人获得大量知识常常是靠“无师自通”，即通过对客观事物的反复观察、分析与比较，自行揭示其内在规律，并对具有共同特征的事物进行正确归类。
自组织神经网络的无导师学习方式类似于大脑中生物神经网络的学习，其最重要的特点是通过自动寻找样本中的内在规律和本质属性，自组织、自适应地改变网络参数与结构。
将上式展开，并利用单位向量的特点，可得
可见，欲使两单位向量的欧式距离最小，须使两
向量的点积
最大。
(3)网络输出与权值调整
算法规定，获胜神经元输出为1，其余输出为0。
即只有获胜神经元才有权调整其权向量wj，调整后权向量为
α∈(0，1]为学习率，其值随着学习的进展而减小。可以看出，当j≠j*时，权值得不到调整，实质是“胜者” 对它们进行了强侧抑制，不允许兴奋。
获胜神经元有最大权值调整量，邻近神经元有稍小调整量，距离越大，权的调整量越小，到某一距离R时，调整量为0。距离再远，调整量略负，更远时又回到0
由a中2个曲线合成墨西哥帽函数与生物系统相似但计算复杂
大礼帽函数
厨师帽函数
4.2.3 SOFM网的运行原理与学习算法
1．运行原理: 训练和工作两个阶段。训练阶段:随机输入样本。对某个输入模式，输出层会有某个神经元获胜。获胜神经元周围的神经元因侧向相互作用也产生较大响应，于是获胜神经元及其优胜邻域内神经元所连接的权向量均向输入向量的方向根据距离作程度不同的调整。大量样本调整网络的权值，最后使输出层各神经元成为对特定模式类敏感的神经细胞，对应的内星权向量成为各输入模式类的中心向量。当两个模式类的特征接近时，代表这两类的神经元在位置上也接近。从而在输出层形成样本模式类分布情况的有序特征图。
1．拓扑结构
SOFM网共有两层，输入层各神经元通过权向量将外界信息汇集到输出层的各神经元。输入层形式与BP相同，神经元数与样本维数相等。输出层也是竞争层，神经元的排列有多种形式，如一维线阵、二维平面阵和三维栅格阵，常见的是前两种类型。
2．权值调整域
用Kohonen算法，是胜者为王算法改进而成的，区别:调整权向量与侧抑制方式不同。
3．侧抑制与竞争
在人的视网膜中，存在着一种“侧抑制” 现象，即一个神经细胞兴奋后，通过它的分支会对周围其他神经细胞产生抑制。这种侧抑制使神经细胞之间出现竞争，虽然开始阶段各个神经细胞都处于程度不同的兴奋状态，由于侧抑制的作用，各细胞之间相互竞争的最终结果是：兴奋作用最强的神经细胞所产生的抑制作用战胜了它周围所有其他细胞的抑制作用而“赢”了，其周围的其他神经细胞则全“输”了。（胜者为王）
对于一般的分类问题，一个输出神经元就能代表一个模式类，用一维线阵意义明确且结构简单；
而对于机器人手臂控制问题，按三维栅格排列的输出神经元更能反映出手臂运动轨迹的空间特征。
2．权值初始化问题
权值一般初始化为较小的随机数。但在某些应用中，样本整体上相对集中于高维空间的某个局部区域，权向量的初始位置却随机地分散于样本空间的广阔区域，训练时必然是离整个样本群最近的权向量被不断调整，并逐渐进入全体样本的中心位置，而其他权向量因初始位置远离样本群而永远得不到调整。如此训练的结果可能使全部样本聚为一类。
=0.65
W32=0.1+0.5(0.2-0.1)
=0.15
4.2 自组织特征映射神经网络(SOFM)
1981年Kohonen提出，又称Kohonen网。他认为，一个神经网络接受外界输入模式时，将会分为不同的对应区域，各区域对输入模式具有不同的响应特征，且该过程自动完成。特点与人脑的自组织特性相类似。
述，模式类是具有某些共同特征的模式的集合。
分类（有导师指导）：是在类别知识等导师信号的
指导下，将待识别的输入模式分配到各自的模式类中去。
聚类（无导师指导）：将相似的模式样本划归一类，
而将不相似的分离开，其结果实现了模式样本的类内相似性和类间分离性。对一组输入模式，只能根据它们之间的相似程度分为若干类，因此相似性是输入模式的聚类依据。
自组织网络结构上属于层次型网络，有多种类型，其共同特点是都具有竞争层。输入层负责接受外界信息并将输入模式向竞争层传递，起“观察”作用，竞争层负责对该模式进行“分析比较”，找出规律以正确归类。
5.1 竞争学习的概念与原理
5.1.1 基本概念
1．模式、分类、聚类与相似性
模式：是对某些感兴趣的客体的定量描述或结构描
学习算法流程如图，源程序见附录A和B。
实例1 动物属性特征映射
实例2 SOFM用于字符排序
4.2.4 SOFM网的设计基础
输出层及网络参数的设计比BP复杂，是网络设计的重点。 1．输出层设计两个问题：神经元数、神经元排列的设计。
神经元数与训练集样本有多少模式类有关。
神经元数少于模式类数，则不足以区分全部模式类，训练的结果势必将相近的模式类合并为一类，相当于对输入样本进行“粗分”。
4.2.1 SOFM生物学基础
生物视网膜中有许多特定的细胞对特定的图形比较敏感，当视网膜中有若干个接收单元同时受特定模式刺激时，就使大脑皮层中的特定神经元开始兴奋，输入模式接近，对应的兴奋神经元也相近。大脑皮层中神经元的这种响应特点是通过后天的学习自组织形成的。
4.2.2 SOFM网的拓扑结构与权值调整域
C2为0～1之间的常数，B2为大于1的常数。
4.4.3 学习向量量化神经网络
学习向量量化(Learning Vector Quantization， LVQ) 将竞争学习思想和有监督学习算法相结合，克服了自组织网络采用无监督学习算法带来的缺乏分类信息的弱点。
4.3.1 向量量化
向量量化是对标量量化的扩展，适用于高维数据。
解决思路：尽量使权值的初始位置与输入样本的大致分布区域充分重合。
图中两种初始权值的分布情况，显然，当初始权向量与输入模式向量整体上呈混杂状态时，不仅不会出现所有样本聚为一类的情况，而且会大大提高训练速度。
方法一：从训练集中随机抽出m个输入样本作为初始权值，即
办法二：先计算出全体样本的中心向量
4．向量归一化向量归一化的目的是将向量变成方向不变长度为1 的单位向量。比较时，只需比较向量的夹角。归一化后的向量用 ^标记。
4.1.2 竞争学习原理 1.竞争学习规则典型竞争学习规则称为胜者为王。算法分3个步骤。
(1)向量归一化对输入模式向量X和竞争层中各神经元对应的内星权向量wj进行归一化处理。 (2)寻找获胜神经元 X输入给网络时，竞争层的所有神经元对应的内星权向量Wj均与X进行相似性比较, 将与X最相似的内星权向量判为竞争获胜神经元，其权向量记为Wj*。测量相似性的方法是对Wj和X计算欧式距离(或夹角余弦)
式中C1为与输出层神经元数m有关的正常数，B1为大于1的常数，tm为预先选定的最大训练次数。
4．学习率η(t)的设计
η(t) 在训练开始时可以取值较大，之后以较快的速度下降，这样有利于很快捕捉到输入向量的大致结构。然后又在较小的值上缓降至趋于0值，这样可以精细地调整权值使之符合输入空间的样本分布结构，按此规律变化的 η(t) 表达式如下
调整后，获胜*点的位置进一步移向o点及其所在的簇。显然，当下次出现与o点相像的同簇内的输入模式时，上次获胜的*点更容易获胜。
依此方式经过充分训练后，单位圆上的4个*点会逐渐移入各输入模式的簇中心，从而使竞争层每个神经元的权向量成为一类输入模式的聚类中心。当向网络输入一个模式时，竞争层中哪个神经元获胜使输出为1，当前输入模式就归为哪类。
在该中心向量基础上叠加小随机数作为权向量初始值，也可将权向量的初始位置确定在样本群中。
3．优胜邻域Nj*(t)的设计
Nj*(t)的设计原则：使邻域不断缩小，邻域的形状可以是正方形、六边形或圆形。
优胜邻域的大小用邻域半径r(t)表示，r(t)的设计无数学方法，凭经验选择。两种计算式：
线性变化
指数变化
工作：训练结束后SOFM可作模式分类器。当输入
一个模式时，网络输出层代表该模式类的特定神经元将产生最大响应，从而将该输入自动归类。输入不属于网络训练时见过的任何模式类时，SOFM网将它归入最接近的模式类。
2．学习算法
(1)初始化
对输出层各权向量赋小随机数并进行归一化处理；建立初始优胜邻域Nj*(0)；学习率η赋初始值。 (2)接收输入
神经元数多于模式类数，可能将类别分得过细，另一种可能是出现“死神经元”（权向量从未得到调整)。
类别数不确定时，可先设置较多的输出神经元，以较好映射样本拓扑结构，如果分类过细再酌情减少输出神经元。
输出层的神经元排列成哪种形式取决于实际应用的需要，排列形式应尽量直观反映出实际问题的物理意义相似性测量
欧式距离法和余弦法。 (1)欧式距离法
欧式距离，即两个模式向量的欧式距离越小，两个向量越接近，因此认为这两个模式越相似，当两个模式完全相同时其欧式距离为零。对各个模式向量间的欧式距离作出规定，则最大欧式距离T就成为一种聚类判据。同类模式向量的距离小于T，异类模式向量的距离大于T。
从训练集中随机选取一个输入模式并进行归一化处理，得到，Xp ，p∈{1，2，…，P}。
(3)寻找获胜神经元
计算Xp与Wj的点积，从中选出点积最大的获胜神经元j*；如若输入模式未经归一化，应计算欧式距离，找出距离最小的获胜神经元。
(4)定义优胜邻域Nj*(t)
以j*为中心确定t时刻的权值调整域，一般初始邻域Nj*(0)较大，训练过程中Nj*(t)随训练时间逐渐收缩。
竞争学习算法示例
0
0
1
0
1
2
j
4
0.3 0.6
0.2
0.7
0.7 0.1
0.3
0.6
0.6
0.2
j
WX
1 0.36+0.06=0.42
2 0.12+0.14=0.26
3 0.42+0.02=0.44
4 0.18+0.12=0.30
第3个神经元获胜
设a=0.5
w31=0.7+0.5(0.6-0.7)
胜者为王:只有竞争获胜神经元才能调整权向量
SOFM网:获胜神经元及周围神经元也要程度不同地调整权向量。（函数如图）
以获胜神经元为中心设定一个邻域半径，该半径圈定的范围称为优胜邻域。优胜邻域内的所有神经元均按其离开获胜神经元的距离远近不同程度地调整权值。优胜邻域开始定得很大，但其大小随着训练次数的增加不断收缩，最终收缩到半径为0。
权向量经调整后不再是单位向量，因此需要对调整后的向量重新归一化。步骤(3)完成后回到步骤(1)继续训练，直到学习率α衰减到0或规定的值。
2．竞争学习原理
设输入模式为二维向量，归一化后其矢端可以看成分布在单位圆上的点，用“o”表示。竞争层4个神经元对应的 4个内星权向量归一化后在单位圆上用 *表示。输入模式点分布大体上聚集为 4簇，可分4类。而训练样本中无分类指导信息，网络如何自动发现样本空间的类别划分?
(5)调整权值
对优胜邻域Nj*(t)内的所有神经元调整权值
η(t)可采用t的单调下降函数，下图给出几种可用的类型。这种随时间单调下降的函数也称为退火函数。
(6)结束检查
SOFM训练不存在类似 BP网中的输出误差概念，训练何时结束是以学习率 η(t) 是否衰减到零或某个预定的正小数为条件，不满足结束条件则回到步骤 (2)。
(2)余弦法计算两个模式向量夹角的余弦，两个模式向量越接近，其夹角越小，余弦越大。对模式向量间的夹角作出规定，就为一种聚类判据。适合模式特征只与向量方向相关的相似性测量。
n维空间欧式距离公式
d=sqrt( ∑(xi1-xi2)2 )
i=1,2...n
xi1表示第一个点的第i维坐标,
xi2表示第二个点的第i维坐标。