SelforganizingmapinR自组织映射网络在R中的实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自组织映射网络在R 中的实现
Self organizing map in R
一,结构和主要原理
自组织映射网络是由T. Kohonen 于1980提出的,参考陈桂霞,黄重光《自組織映射圖網路簡介》一文。
其原理主要是基于竞争性的同类相聚,即同类的神经元或者说数据节点具有相同的数据特征。
自组织映射网络主要包含输出层,输入层和网络连接加权。
输出层即网络拓扑,最常见的几种网络拓扑结构矩形图,六边形图。
下图所示为8 x 8的平面网络拓扑。
它代表神经元。
在SOM 自组织网络映射中,输入层为单一的数据维度。
在训练中,样本直接进入输出层单元。
网络连接加权值代表着点与点之间的相似性情况,SOM 网络会通过距离函数施加对邻近数据点的影响。
常用的正态分布函数和指数分布函数,函数呈现递减的趋势。
总体来说,拓扑结构和距离函数共同控制着神经元数据节点的相似度。
拓扑结构本身是对于数据节点的一个距离定义。
距离函数将节点之间的拓扑距离做映射,使得神经元数据节点实现了近同远异的变化模式,从而模拟了人神经元相似相聚的特点。
二,过程简述
预定义的参变量包括:影响半径R ,半径收缩常数R_factor ,初始学习率ETA ,学习效率收缩常数ETR_factor, 网络拓扑结构,初始化的权重矩阵。
24
681234
5
67pos[, 2]
p o s [, 1]
1
234567
8
1
234
5678
pos[, 2]
p o s [, 1]
实例简介参考陈桂霞,黄重光《自組織映射圖網路簡介》,实现方式为R语言平台。
模拟数据为平面内四个半径为5的圆内随机点,如下图所示:
R语言代码如下
x=runif(200,5,15) #从5到15的均匀分布中随机取200个点
y=runif(200,35,45)
d=sqrt((x-10)^2+(y-40)^2) #求其距离
c1=cbind(x,y,d)
c1=c1[c1[,3]<=5,] #筛选出圆内点
c1=c1[,1:2]
x=runif(200,30,40)
y=runif(200,30,40)
d=sqrt((x-35)^2+(y-35)^2)
c2=cbind(x,y,d)
c2=c2[c2[,3]<=5,]
c2=c2[,1:2]
x=runif(200,0,10)
y=runif(200,0,10)
d=sqrt((x-5)^2+(y-5)^2)
c3=cbind(x,y,d)
c3=c3[c3[,3]<=5,]
c3=c3[,1:2]
x=runif(200,35,45)
y=runif(200,5,15)
d=sqrt((x-40)^2+(y-10)^2)
c4=cbind(x,y,d)
c4=c4[c4[,3]<=5,]
c4=c4[,1:2]
dat=rbind(c1,c2,c3,c4)
plot(dat,pch=8,cex=.5,col=4)
四个圆的圆心分别为(10,40)(35,35)(5,5)(40,10),利用SOM的分类学习特点将其分类。
R=0.05 #影响半径
R_rate=0.8 #收敛速率
R_factor=1 #初始值
ETA=1 #学习初始值
ETA_rate=0.8 #学习效率
dist=rep(0,map_col*map_row)
d=rep(0,map_col*map_row)
totaldis=rep(0,totalnum)
totalnum=50; #total training number
count=0; #recording training number
topology="rectangle" #拓扑结构
#四个圆,故而精确的设置为四类2x2矩阵
map_col=2 #拓扑横向数据节点数
map_row= 2 #拓扑纵向数据节点数
#构建网络拓扑结构,网络拓扑结构的本质在于顺序和距离。
所以本例中,用一个数据定义拓扑网络的#顺序,而其对应的另一个矩阵变量则包含其对应的网络坐标。
本质上,六变形拓扑也是一种不同的距离定#义。
map=matrix(1:(map_col*map_row),map_row,map_col,byrow=T)
pos=matrix(1:(map_col*map_row*2),map_row*map_col,2) #the coodinate of the topology map
if(topology == "rectangle"){
for(i in 1:(map_col*map_row)){
for(j in 1:nrow(map)){
for(k in 1:ncol(map)){
if(map[j,k]==i){
pos[i,1]=k; #横坐标
pos[i,2]=j; #纵坐标
}
}
}
}
}
if(topology == "hexgonal") {
for(i in 1:(map_col*map_row)){
for(j in 1:nrow(map)){
for(k in 1:ncol(map)){
if(map[j,k]==i){
pos[i,1]=k;
pos[i,2]=j;
}
}
}
}
mode=0;
for(i in 1:(map_col*map_row)){
if(i %% map_col ==1){
mode=mode+1;
}
for(j in 1:nrow(map)){
for(k in 1:ncol(map)){
#从矩形拓扑中演化出六边形拓扑,此处纯粹是本人的理解。
if((map[j,k]==i) && (i<=map_col)){
pos[i,1]=j;
pos[i,2]=k;
}
if((map[j,k]==i) && ((mode%%2)==0) && (i > map_col)){
pos[i,1]=pos[i-map_col,1]+sin(2*pi/3);
pos[i,2]=pos[i-map_col,2]+0.5;
}
if((map[j,k]==i) && ((mode%%2)==1) && (i > map_col)){
pos[i,1]=pos[i-map_col,1]+sin(2*pi/3);
pos[i,2]=pos[i-map_col,2]-0.5;
}
}
}
}
#plot(pos[,2],pos[,1],col=c(1:map_col))
}
#随机化输入矩阵,
y=sample(1:nrow(dat))
dat1=dat
for(i in 1:nrow(dat)){ dat1[i,]=dat[y[i],]}
dat=dat1[1:200,]
#以平均值初始化权重矩阵
weight=matrix(runif(map_col*map_row*ncol(dat),min(dat),max(dat)),map_col*map_row,ncol(dat))
作形象化的概念理解,网络拓扑如上图的网格点,权重即为每个节点的上的蓝线,这些蓝线代表了所
属类型的典型数据特征,同训练数据具有相同的数据维度。
右侧凌乱的短线为训练数据,通过的训练数据的归类和对权重的修改,使得事先定义的距离最小化,以完成收敛过程。
W(i)=W(i)+ETA*(w[i,m]-weight[n,m])*R_factor
ETA=ETA*ETA_factor
plot(1:50,1:50,xlim=c(0,50),ylim=c(0,50),type="n")
while(count < totalnum) { #完成训练次数
for(i in 1:nrow(dat)) {
for(k in 1:nrow(weight)){
for(j in 1:ncol(dat)) {
d[k]=d[k]+(weight[k,j]-dat[i,j])^2; 计算距离
}
d[k]=sqrt(d[k])
}
i_min=which.min(d)
#caluculate the nearest distance
for (m in 1:nrow(pos)){
dist[m]=sqrt((pos[m,1]-pos[i_min,1])^2+(pos[m,2]-pos[i_min,2])^2)
}
for (n in 1:nrow(weight)){
for(m in 1:ncol(weight)){
R_factor=exp(-dist[n]/R)
weight[n,m]=weight[n,m]+ETA*(dat[i,m]-weight[n,m])*R_factor #权重矩阵的调整公式}
}
for(s in 1:nrow(weight)){
points(weight[s,1],weight[s,2],col=s)
}
totaldis[count]=totaldis[count]+d[i_min]
}
ETA=ETA_rate*ETA;
R=R_rate*R
count=count+1;
}
将权重的变化plot如下图,四个权重精确的匹配到圆心。
9.817267 39.643520
34.795443 34.952146
5.265513 4.776607
40.444490 9.532965
调整初始的影响半径R=2, 茹下图,收敛速度减慢,以四个圆心的平均值散射。
在半径不变的情况下R=2,R_factor由0.8调整为0.08,如上右图所示,收敛速度加快。
以训练次数为横轴,训练集到各自距离最小圆心距离之和为纵轴,看出20次左右训练后,总体稳定。