基于神经网络的移动机器人路径规划方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
。
对于环境已知 、 障碍物静止的情况 ,孙增圻利用前馈神经网
收稿日期 :2006211228 ; 修回日期 :2007206220 。 基金项目 : 国家自然科学基金资助课题 (60675044)
作者简介 : 宋勇 (19782) ,男 ,实验师 ,硕士研究生 ,主要研究方向为移动机器人导航技术 ,机器人控制 。E2mail : songyong @sdu. edu. cn
Abstract : To investigate t he pat h planning met hods of mobile robot in dynamic environment , a met hod is proposed based on recurrent neural networks in real2time environment . The arrangement of t he neurons coin2 cides wit h t he discretized rep resentation of co nfiguration space. The target neuron has t he maximal po sitive neu2 ral activity , which is damply pro mulgated to t he whole state space via local lateral connectio ns of neurons. The activities of t he neurons , in obstacle fields and t he local neighborhoods , are made to zero . The target globally att ract s t he robot , and t he ro bot can avoid obstacles locally. The robot can generate t he optimal trajectory in dy2 namic environment . Simulatio n result s demo nst rate t hat t he met hod has high adaptability to dynamic environ2 ment and real2time ability.
w ∑
j
ij
x j ( t) + w x i ( t) + Ii )
Biblioteka Baidu
( 1)
式中 , x i ( t) 为第 i 个神经元在 t 时刻的活性值 , N 为第 i 个 神经元邻域内的神经元个数 。w 为较小的正数 , 表示第 i 个神经元当前时刻的活性值受其前一时刻状态的影响程 度 。∑w ij x i ( t) + w x i ( t) 和 I i 分别表示第 i 个神经元在 t 时刻的激励输入和抑制输入 。w ij 为第 j 个神经元到第 i 个 神经元的连接权 , 计算公式如式 ( 2) 所示 。
( 1. 山东大学控制科学与工程学院机器人研究中心 , 山东 济南 250061 ; 2. 山东大学威海分校现代教育技术部 , 山东 威海 264209 ; 3. 山东理工大学计算机科学与技术学院 , 山东 淄博 255012)
摘 要 : 针对动态环境下移动机器人路径规划 ,提出了一种基于递归神经网络的实时路径规划方法 。利用神 经网络表示机器人的工作空间 ,每个神经元都只有局部侧连接 。目标点位置神经元具有全局最大的正活性值 ,该 活性值通过神经元之间的局部侧连接逐渐衰减地传播到整个状态空间 , 障碍物及其周围区域神经元活性值则被 抑制为零 。目标点全局地吸引机器人 ,障碍物局部地将机器人推开实现避障 ,从而能够在动态环境下产生最优规 划路径 。仿真结果表明该方法具有较好的环境适应性和实时性 。 关键词 : 移动机器人 ; 路径规划 ; 递归神经网络 ; 状态空间 中图分类号 : TP 24 文献标志码 : A
一个由一 系 列神 经 元 状 态 向 量 组 成的 离 散 时 间 动 力 学 系统 。
1. 2 神经元动态特性
神经网络的第 i 个神经元代表结构空间的第 i 个位置 状态 , 用向量 qi 表示 , qi ∈R2 , 则第 i 个神经元离散时间动 态方程为
N
x i ( t + 1) = f (
Path planning methods of mobile robot based on neural net work
SON G Yo ng1 , 2 , L I Yi2bin1 , L I Chun2 , L I Cai2ho ng1 , 3
( 1 . S chool of Cont rol S cience an d Engi neeri n g , S han don g Uni v . , J i nan 250061 , Chi na; 2 . Dept. of M odern Education Technolog y , S handong Uni v . at W ei hai , W ei hai 264209 , Chi na; 3 . S chool of Com p uter S cience and Technolog y , S handong Uni v . of Technolog y , Zibo 255012 , Chi na)
[8 ]
1 , x ≥1
式中 , 函数 f ( x ) 为传递函数 , 它是一个单调递增的函数 , k ∈( 0 , 1) 。根据神经元的外部输入 , f ( x ) 保证了目标点位 置神经元具有全局最大的正神经元活性值 , 障碍物区域神 经元的活性值则被抑制为零 。利用式 ( 1 ) 和式 ( 3 ) , 目标点 位置正的神经元活性值能够通过神经元的局部侧连接逐渐 衰减地传播到整个状态空间 , 并且目标点神经元活性值在 传播的过程中如果遇到障碍物就会被阻断 , 从而保证目标 点全局地吸引机器人 , 而障碍物只是在局部将机器人推开 实现避障 。
Keywords : mobile robot ; pat h planning ; recurrent neural network ; configuratio n space
0 引 言
路径规划是移动机器人自主导航中一个十分重要的问 题 ,由于在传统机器人学和人工智能方法中 ,移动机器人路 径规划方法都是基于外部环境的结构化以及符号推理 , 那 么当机器人处于动态的 、 非结构化的环境中的时候 , 传统的 人工智能系统就缺乏必要的实时性与鲁棒性[ 1 ] 。目前国内 外在基于神经网络的机器人路径规划方面已经做了大量的 研究工作 ,提出了许多用于路径规划的神经网络模型
第2期
宋勇等 : 基于神经网络的移动机器人路径规划方法
・ 317 ・
数的设置没有行之有效的方法 , 只能进行反复地试验[ 7 ] 。 由于移动机器人的目标就是要走向非结构化的 、 未知的自 然环境 ,机器人就必须具有很好的环境适应能力和自主能 力 ,能够在动态环境下做出实时地反应 。 本文提出了一种基于递归网络的机器人路径规划神 经网络模型 。移动机器人的结构空间用神经网络组成的 拓扑结构来表示 ,神经网络中所有神经元之间只存在局部 的侧连接 ,每个神经元的活性值表示其相应位置的势场 值 。目标节点具有全局最大的正外部输入 , 从而使目标点 神经元产生全局最大的正活性值 ,该活性值在全局范围内 逐渐衰减地向整个工作空间其他节点传播 , 在所有和目标 节点存在连通路径的节点上产生正的输出 ; 障碍物及其周 围局部区域节点的输出被抑制为零 。这样可以保证每个 和目标点存在连通路径的节点 ,都可以沿着最快梯度上升 方向到达目标节点 。该方法可以用来在动态环境中实时 地生成避障路径 , 并且可以对移动的目标点进行有效地 跟踪 。
[ 227 ]
络来描述环境约束并计算碰撞能量函数 , 将迭代路径点集 的碰撞能量函数与距离函数的和作为优化目标函数 , 通过 求优化目标函数的极值 , 使迭代路径点集趋向于最优规划 路径[ 2 ] 。Chen Huahua 将神经网络和遗传算法结合起来进 行移动机器人路径规划[ 3 ] , 该方法很难保证实时性要求 。
第 30 卷 第2期 2008 年 2 月
文章编号 : 10012506X(2008) 0220316204
系统工程与电子技术 Systems Engineering and Elect ro nics
Vol. 30 No . 2 Feb. 2008
基于神经网络的移动机器人路径规划方法
宋 勇1 , 2 , 李贻斌1 , 栗 春2 , 李彩虹1 ,3
0 , x ≤0
f ( x) = kx , 0 < x < 1 ( 3)
机器人工作空间为二维有界环境 , 允许对环境的障碍 物信息完全未知 , 对障碍物形状不做凸假设 。利用局部连 接的递归神经网络来表示机器人工作的结构空间 , 神经网 络中每个神经元与其邻域内神经元的连接形式都相同 , 其 中第 i 个神经元与其邻域内神经元的连接形式如图 1 所 示 。神经网络具有高度并行的体系结构 , 神经元之间信息 的传播是双向的 , 每个神经元节点对应于离散化结构空间 中的一个位置 。由于 8 连通路径更接近 Euclidean 距离 长度 ( 最短路径) , 根据邻近的离散化状态之间的连通性 , 神经网络 中 每 个 神 经 元节 点 与 其 邻 域 内 8 个 相 邻 节 点 连接 。
由于神经网络模型为离散时间非线性时不变动力学系 统 , 则系统稳定性可由李亚普诺夫稳定性定理进行证明 。
・ 318 ・
系统工程与电子技术
第 30 卷
由式 ( 3) 给出的函数 f ( x) 为收敛 , 即对系统平衡状态以外 的所有状态有 ‖f ( x ( t) ) ‖ < ‖x ( t) ‖ 则取李亚普诺夫函数为
w ij =
e
-η |q
i
- qj |
2
,
| qi - qj | ≤ r | qi - qj | > r
0,
( 2)
1 神经网络模型
1. 1 神经网络体系结构
式中 , | qi - qj | 为结构空间中向量 qi 和 q j 之间的 Euclidian 距离 ,η和 r 为正的常数 , 显然 w ij = w ji , 即 w ij 为对称的 。
Glasius R 和 Komoda A 提出了一种基于 Hopfield 网络的
实时 、 动态避障神经网络模型[ 4 ] ,该模型能够避免局部最小 点 ,但是很难适应高速的动态环境 。Dmit ry V. Lebedev 提 出了动态环境下移动机器人路径规划神经网络模型[ 5 ] , 该 模型相关参数对规划器性能的影响非常大[ 6 ] , 而且这些参
图1 二维离散结构空间神经元 8 连通图
经元活性值 , E 的值应该远远大于神经元的输入总和 。由 于神经元侧连接输入与自反馈输入总和最大可能值为 9 , 所以 E 的取值应为远大于 9 的常数 。
1. 3 神经网络的稳定性分析
神经网络中神经元某一时刻的活性值只与其邻域内的 神经元状态和它自身前一时刻的状态有关 。设第 i 个神经 元邻域内神经元的活性值状态用向量 x i 表示 , xi = ( x i1 , …, x in ) ; 第 i 个神经元与其邻域内神经元之间的连接权用 向量 wi 表示 , wi = ( w i1 , …, w in ) ; 则可以将神经网络看作是
E, Ii = - E, x i ( t) = target x i ( t) = obst acle ( 4)
0,
其他
式中 , Ii 为第 i 个神经元的外部输入 , 是由目标点和障碍物 的位置信息在神经网络拓扑结构中映射产生的 。障碍物区 域对应的神经元具有负的外部输入 , 目标点神经元具有正 的外部输入 。参数 E 决定了障碍物区域和目标点对应的神 经元的外部输入值 , 为了保证目标点神经元具有全局最大 的神经元活性值 , 而障碍物区域神经元具有全局最小的神