基于免疫RBF神经网络的逆运动学求解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于免疫RBF神经网络的逆运动学求解
魏娟;杨恢先;谢海霞
【摘要】求解机械臂逆运动学问题可以采用神经网络来建立逆运动学模型,通过遗传算法或BP 算法训练神经网络的权值从而得到问题的解,在求解精度和收敛速度上有待进一步改进.采用人工免疫原理对RBF 网络训练数据集的泛化能力在线调整隐层结构,生成RBF 网络隐层.当网络结构确定时,采用递推最小二乘法确定网络连接权值.由此对神经网络的网络结构和连接权进行自适应调整和学习.通过仿真可以看出,用免疫原理训练的神经网络收敛速度快,泛化能力强,可大幅提高机械臂逆运动学求解精度.
【期刊名称】《计算机工程》
【年(卷),期】2010(036)022
【总页数】3页(P192-194)
【关键词】机械臂;免疫原理;RBF 神经网络;逆运动学求解
【作者】魏娟;杨恢先;谢海霞
【作者单位】湘潭大学,信息工程学院,湖南,湘潭,411105;湘潭大学,材料与光电物理学院,湖南,湘潭,411105;琼州学院物理系,海南,五指山,572200
【正文语种】中文
【中图分类】TP241
1 概述
机械臂逆运动学是指根据给定的机械臂末端执行器的位置和姿态求解各个关节变量。
传统的逆运动学求解的方法很难满足实时性的要求,神经网络可以很好地解决这一问题。
用神经网络求解机械臂运动学逆解所需计算与机械臂的自由度无关,而是依赖于网络的结构。
因此,研究基于神经网络的机械臂逆解需要解决2个关键问题:(1)选择合适的网
络结构,确定网络的层数及每层的神经元数。
(2)产生合适的训练数据集。
2 RBF神经网络
RBF神经网络是以函数逼近为基础构造的一类前向神经网络。
它的作用函数采用
的是径向基函数,具有输出对参数局部线性的特点,网络训练可避开非线性优化,不存在局部极小问题。
在学习过程中即可确定网络的拓扑结构,使网络权系数计算的复杂性得以降低,学习过程得以加速[1]。
在网络结构中待定的参数有2类:
(1)径向基函数中心ci和宽度ri。
(2)网络输出层与隐层之间的连接权重wi。
当ci和ri确定之后,即可通过解线性方程得到连接权。
目前常用的几种 RBF网络训练算法很难找到中心和宽度的全局最优值。
同时,这
些训练算法无法自动地确定隐层节点数目,往往会为了达到一定的逼近能力而使得隐层节点数目过多,从而导致网络的规模过大和泛化能力的下降。
本文针对免疫系统与RBF神经网络的相似[2],通过人工免疫原理对RBF网络训练数据集的泛化能力,在线调整隐层结构,生成RBF网络隐层。
当网络结构确定时,采用递推最小二乘法确定网络连接权值。
由此对神经网络的连接权和网络结构进行自适应调整和学习,使网络收敛速度快,求解精度高,泛化能力强。
两者相似对应关系如表1所示。
表1 RBF神经网络与免疫系统对比RBF神经网络免疫系统样本集抗原隐层节点i
免疫系统第i类B细胞(抗体)函数中心ci 免疫记忆单元i宽度ri 第i类细胞的浓度
3 算法实现
3.1 控制原理
该系统由学习和控制两阶段组成[3]。
在学习阶段利用训练样本的关节角度和末端
执行器的位置,通过免疫算法对神经网络进行学习。
在控制阶段,将末端执行器的理想位置输入已训练好的神经网络,神经网络则输出与理想位置相对应的关节角度,完成对机械臂的控制。
控制原理如图2所示,图中ˆθ为机械臂关节角的实际输出。
图1 控制原理
从RBF网络和生物免疫系统的特性出发,提出采用免疫原理在线训练神经网络。
借鉴自然免疫系统的动态覆盖特点,利用RBF网络隐层节点的局部逼近特性,根
据样本变化调整隐层节点,实现初步免疫应答。
同时将RBF网络的训练过程转变
为使用免疫模型逐步逼近期望映射空间的过程,通过免疫操作提高算法的动态能力和性能。
仿真实验表明,该算法表现出良好的精度和泛化能力。
3.2 隐层结构的调整
隐层结构的主要调整步骤描述如下:
(1)监测输入输出映射改变,判断 RBF网络是否需要调整,用训练样本对当前RBF 网络的性能进行评估,如果网络的实际输出和期望输出的误差超过一定阈值,则RBF网络需要调整,转入步骤(2)。
(2)利用免疫原理对RBF网络进行免疫操作。
根据样本变化调整隐层节点,构成初始的RBF网络。
1)亲和力函数的确定。
抗体之间通过竞争获得生存的权利,竞争程度通过亲和力来衡量。
而衡量神经网络性能的主要指标是网络的实际输出值与期望的输出值之间的误差平方和,误差平方和越小则表示该网络的性能越好。
对于机械臂来说,选取亲和力函数为:
其中,θd、分别为关节角期望输出与实际输出;M为样本数。
与抗原亲和力高的抗体通过克隆选择原理进行克隆分裂。
克隆产生的抗体会经历一个变异的过程,通过变异消除亲和力过低的抗体。
最后,在这个克隆集合里,选择亲和力最高的抗体成为记忆抗体,加入到原来的网络中。
2)新隐层节点的生成。
神经网络新样本的输入类似于免疫系统遭受到新抗原,算法通过免疫记忆抗体的记忆检测和免疫系统对其响应来决定是否加入新的隐层节点(B 细胞)。
首先计算各样本x与免疫记忆抗体的亲和度,找出与x亲和度最大的记忆抗体。
比较其亲和力与记忆阈值的大小以及其免疫力是否小于免疫力阈值。
若亲和力小于记忆阈值,则现有记忆抗体不能充分识别新侵入的抗原;若免疫力小于免疫力阈值,则表示目前的B细胞集不能很好地清除新侵入抗原。
于是诱导B细胞克隆扩增产生新的B细胞,即新的隐层节点。
(3)在免疫应答的基础上,对RBF网络的参数进行调整。
1)隐层节点中心的确定。
令RBF网络隐层节点数p=p+1。
将网络中亲和力最大的数据中心C克隆N个,产生一个隐层节点中心克隆集L。
对L中N个相同的数据中心进行变异,形成突变集L'。
其中,lβ为突变率。
重新计算xi与L'中所有数据中心的亲和力,选择与xi亲和力最大值对应的数据中心,构成数据中心集L''。
各新增隐层节点的数据中心与L''中各元素相对应。
2)隐层节点宽度的确定。
在免疫系统中,若某类抗体被抗原或其他抗体刺激,则将产生更多的同类抗体;反之,抗体将被抑制。
这种抗体促进、抑制现象和RBF网络中宽度的作用相似。
如果 RBF网络逼近的函数在某段区域内快速多变,那么在
这个区域中需要大量分布紧密的隐层节点,以获得准确的逼近。
同时,各宽度应较小,使得各隐层节点只在邻近的区域产生响应;相反,若各隐层节点分布较远,为获得良好的泛化能力,相应的宽度应较大,类似于免疫系统中抗体浓度的概念。
于是定义RBF网络新增隐层节点的宽度:
其中,κ为距离因子;p为已有的隐层节点数;ci是新隐层节点的数据中心;c为与 ci距离最近的已有隐层节点的数据中心;Si,,j为B细胞i与B细胞j之间的相似度,定义为:
(4)检查是否删除冗余隐层节点。
通过隐层节点重要度衡量,即该节点对输出的贡献[4]。
当重要度小于指定的阈值时,删除RBF网络的隐层节点,这一过程类似B 细胞的凋亡;否则,保留该隐层节点。
以此优化隐层结构,提高学习效率和预测精度。
(5)收敛判别。
判断调整是否结束,如果RBF网络达到期望目标,或达到最大迭代次数,完成对RBF网络的调整,返回步骤(1)。
否则,继续免疫操作。
3.3 连接权的确定
当网络增加或删除隐层节点时,对网络连接权的计算相当于增加或删除回归项,此时若完全采用递推最小二乘法RLS可能导致算法的不稳定。
因此,网络增加或删除隐层节点后,算法采用最小二乘法 LS重新计算网络连接权;若网络结构不变,为提高收敛速度,采用 RLS实时更新网络连接权。
4 仿真结构及结果分析
为了验证算法的有效性,以 SCARA机械臂为例进行仿真分析。
SCARA有4个自由度,关节1、关节2、关节4为旋转关节,关节3为移动关节。
由简化的运动学模型知,求位姿逆解时求关节角θ1和关节角θ2即可。
参考文献[5],将空间位置
作为网络的输入,逐次以每个关节变量θi作为网络的输出。
为训练网络,利用正运动学求出与机械臂关节空间所对应的位置空间,从而得到学习样本。
对训练好的网络,用关节角正解得出的空间位姿进行神经网络逆解,得到计算值[6]。
网络训练成功后,将待测数据分别送入2个网络,进行神经网络计算。
仿真结果与期望值的对比如图2所示。
同时也可以采用传统的 BP算法和基于遗传算法(GA)的神经网络来求解机械臂运动学逆解。
其与基于免疫原理(IP)的神经网络算法求解结果对比如表2所示。
从表2中可以看出,用遗传算法优化神经网络求运动学逆解,其收敛速度和求解精度要优于 BP算法。
而本文采用的基于免疫原理的神经网络算法,通过对网络结构和连接权进行优化,无论在收敛速度还是在求解精度方面,都要优于前2种方法。
图2 仿真结果输出图
表2 3种算法求解结果比较
5 结束语
本文提出一种基于免疫原理的神经网络算法。
此算法具有较高的训练精度,同时泛化能力好,有较高的测试精度。
如果能将学习规则同时优化,并对算法的稳定性、鲁棒性、计算复杂度评价等进行研究,算法将会更完善,期待取得更好的结果。
参考文献
[1]臧小刚, 宫新保, 常成, 等. 一种基于免疫系统的RBF网络在线训练方法[J]. 电子学报, 2008, 36(7): 1396 -1400.
[2]林金星, 沈炯, 李益国. 基于免疫原理的径向基函数网络在线学习算法及其在热工过程大范围工况建模中的应用[J]. 中国电机工程学报, 2006, 26(9): 14-19. [3]盛党红, 温秀兰, 黄文良. 基于免疫进化神经网络的机械手逆运动控制[J]. 中国机械工程, 2007, 18(3): 282-285.
[4]蒋华刚, 吴耿锋. 基于人工免疫原理的RBF网络预测模型[J]. 计算机工程, 2008, 34(2): 202 -205.
[5]张培艳, 吕恬生, 宋立博. 基于径向基函数网络的 MOTOMAN机械手运动学逆解[J]. 机械科学与技术, 2004, 23(5): 523-525.
[6]魏海坤, 丁维明, 宋文忠, 等. RBF网的动态设计方法[J]. 控制理论与应用, 2002, 19(5): 673-680.。