基于有限状态机的足球机器人行为设计与综合
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
角速度的计算公式如下:
附 加 一 个 随 动 轮。 小 车 主 要 由 电 机、踢 球 机 构、抓 手、电池、电源板等构成。其中,踢球机构可以将球 弹出,抓手用于带球移动。
(2)感知系统 机器人的感知系统包括激光和摄像机两部分
(超声波传感器为可选的配置)。激光用于探测障碍 物与机器人的距离。摄像机通过颜色来识别球、对 方和己方的球门,由于摄像机的视角有限,我们采用 USB 接口和 PCI 接口两个摄像机来扩大视野。 (3)通讯系统 机器人采用基于无线局域网(遵守 IEEE802 . ll 标准)的通讯技术。每个机器人和场外计算机作为 网络的节点,共同构成一个无线局域网络系统,高达 llmbps 的无线网络为机器人之间的信息传递提供 了一个快捷通道。 (4)控制系统 控制系统由上、下位机两部分组成。上位机采 用研华 PCm-9574 型工控机主板。上位机通过串口 与下位机、激光传感器进行通讯,通过 PC / l04 接口 与无线网卡相连,可以和场外计算机进行无线通讯。 下位机采用磬英 PIA-43l 型工控机主板。它通 过串口与上位机实现通讯,通过 ISA 总线与运动控 制卡连接,以实施对电机的控制。 !." 软件系统 软件系统是整个机器人系统的核心。在软件的 整体设计上,我们采用了基于优先权的分布式框架 结构。整个系统包括一个主进程和 3 个辅助进程。 4 个进程相互独立地工作,形成了 分 布 式 的 结 构。 在系统资 源 分 配 时,它 们 之 间 又 有 优 先 权 的 区 别。 分布式的结构减少了各进程间的相互干扰,单个进 — 62 —
如果球突然丢失,机器人可以根据前一时刻记 忆的球的位置很快找到球。例如,机器人 # 时刻突 然丢失球,如果 # - l 时刻球的标志位为“ + ”,那么, 机器人就会逆时针旋转(向左转)找球,而这个方向 也是球最有可能在的位置。如果丢球时间太长(大 于 20s),球的标志位将被置零,直到机器人再次看到
0 引言
自主移动机器人的目标是在没有人的干预,无 需对环境作任何规定和改变的条件下,有目的地移 动并完成相应的任务。其中,一类重要的应用场合 是动态不确定的环境[l]。这种环境对机器人的实时 性和鲁棒性提出了很高的要求。在软件结构的设计 上,系统要具有一定的鲁棒性,小的故障不能影响系 统基本功能的实现;在控制算法上,机器人要能够利 用有限的感知,快速处理动态环境下出现的各种情 况。目前,训练和制造全自主机器人进行足球赛是 人工智能和机器人领域的研究热点之一[2,3]。它要 求机器人自主地在动态环境下通过有限的传感器信 息,完成搜索球、接近球、射门、防守等任务,已成为 研究 动 态 不 确 定 环 境 下 决 策 问 题 的 一 种 标 准 平 台[4]。
设计者也加控制的复杂性。
动态环境下,自主机器人经常需要处理多个行
机器人的基本行为包括:找球、运动向球、绕到
为的协调问题。通常的解决方法是先将整个任务分 球后、带球找门、射门、回防和紧急避障。机器人完
解为多个与球有关的子任务,将行为分解为避障和 成整个任务的控制算法可以用有限状态机来描述
完全反应式的控制特点是不需要记忆,优点是 反应速度快。大量而长期的记忆一方面会增加对系 统硬件的要求,另一方面,由于传感器信息的不确定 性,大量的记忆也可能导致错误的决策。但是,适当 的记忆能够提高机器人的决策能力。针对机器人足 球和本系统的特点,我们在基于行为的控制中引入 短期的记忆。记忆的具体内容见表 l,表 l 中角度! 的含义可以用图 3 来表示,图 3 中 ! 表示机器人的 前进方向,! 是球中心与 " 轴正向夹角,! 的范围由 摄像机视角决定,本系统中 60!!!l20,单位为度。 机器人每次看到球时,都会对球的标志位进行更新。
BALL NEAR:机器人离球较近。 BALL FAR:机器人离球较远。
标点。这也就保证了系统反应的快速性。另外,目 标的产生只需要局部的环境信息,避免了全局规划 对环境模型较高的要求。
机器人最终的指令输出是线速度( V)、角速度
(!)以 及 抓 手 起 停 和 踢 球 的 指 令。 其 中,线 速 度 和
在这类系统的设计中,一个重要的问题是:如何 利用有限的局部感知,处理动态环境下多行为的协 调问题。机器人在场上运动时,经常会遇到同一时 刻有多 个 目 标 要 完 成 的 情 况。 例 如 机 器 人 既 要 避 障、又要 运 动 向 球。 常 用 的 解 决 方 案 可 分 为 两 类。 一类是仲裁的方法[5],即根据各种行为的优先权或 通过竞争从多个行为中选择一个行为。这类方法的 优点是控制的意义明确且加入新的行为并不影响系 统的复杂性,但是不同行为之间的硬切换会导致系
贾建强等:基于有限状态机的足球机器人行为设计与综合
球。不过,在实际比赛中,机器人看到球的机会是比 较多的,丢球时间一般不长。
图 ! 规划与控制结构图
的方法对两类行为处理而产生。这样,实际上是人
为地将决策分为两层:在第一层,每个子任务产生一
个行为,第二层选择或合成一个最终的行为。从人
的行为角度考虑,我们在完成类似的任务时,并没有
操纵球两类。每个子任务的完成将产生一个与球有 (见图 4)。每一种状态对应一个行为集合,根据该 关的行为,机器人最终的行为需要通过融合或仲裁 状态的不同情况,不同的行为将被触发。
— 63 —
高技术通讯 2004.4
图 ! 机器人的状态切换
4 种状态的触发条件定义如下:
记忆自动转向球最有可能在的位置,这就实现了状
个任务分解为 4 个子任务,对应于机器人的四种状 态:找球、快速接近球、取球射门和避障。
当机器人处于前 3 个状态时,它不需要避障就 可以操纵球。当机器人必须避障时,它将处于避障 状态。这时,机器人将产生一个由局部路径规划实 现的避障行为。不同于通常的避障行为,在避障状 态中,机器人不关心球处于何处,它只是以最大的速 度运动到目标点,即机器人只产生一个行为。这样 做的结果 是 使 机 器 人 快 速 地 脱 离 多 行 为 冲 突 的 状 态,回到可以直接操纵球的状态。可见,这种简单的 避障行为使机器人由不能直接操纵球的状态切换到 可以直接操纵球的状态,也就是实现了机器人状态 的自然过渡。而且,经过这样的任务分解,机器人在
本文介绍了自主开发的全自主移动机器人软、 硬件系统,面向动态环境,采用了一种基于有限状态 机的行为选择方法。同以往的方法比较,该方法简 化了控制流程,提高了系统反应的速度。其有效性 在“2002 中国机器人竞赛”中得到了验证。
l 系统配置与结构
!.! 硬件系统 本次比赛我们的参赛队员是自主开发的“交龙”
中型自主移动机器人(见图 l)。它的硬件系统主要 由以下几部分构成:机器人小车系统、感知系统、通 讯系统和控制系统。下面对各部分做简单的介绍。
(l)机器人小车系统 机器人小车采用双轮差速的方式,两个驱动轮
" 863 计划(200lAA422l40,200lAA422200)与国家自然科学基金(60l05005)资助项目。 ! 男,l976 年生,博士生;研究领域:智能机器人,多机器人协调控制;联系人。
统最终行为的抖动,且行为之间的过渡也不平滑[7]。 另一类是 融 合 的 方 法[6,7],即 将 多 个 并 发 的 行 为 矢 量合成,合成的结果作为机器人最终的行为。这类 方法可以使最终的行为比较平滑,它的主要缺点是 控制意义不明确,加入新的行为比较困难。另外,矢 量合成还带来许多需要调整的参数以及诸如局部极 小这样的新问题[7]。文献[7]引入了平滑技术对第 一类方法进行改进,但是该方法更多考虑的是行为 的平滑性,而没有考虑快速性。对于机器人足球这 类应用于动态不确定环境下的任务来说,简单、快速 且有效的控制方法是必需的,而以上两类方法在应 用中的效果都难以令人满意。
球
60!!!90 90 <!!l20 丢球时间太长
+
-
0
(球在左边)(球在右边)
在动态变化的环境中,如果采用全局的路径规 划,这就需要比较精确的全局模型,在具体的实现上 涉及到 多 传 感 器 融 合 和 多 机 器 人 的 通 信 问 题。 显 然,全局规划会增加控制的复杂度。例如在机器人 足球赛中,机器人总是处在一个动态的不确定环境 中,某一时刻的可行路径可能在很短时间内变得不 可行,当机器人数量增加时尤其如此,因此,全局规 划的意义并不大。基于这种考虑,规划模块完成的 只是局部的路径规划:使机器人运动到障碍后的某
一点。这个行为的实现只需要障碍物与机器人的相 对位置信息。实验和比赛的结果也证明,局部规划
每一种状态下产生的行为就是机器人最终的行为, 并不需要对多个行为做出选择。这样,多行为的协
不仅实现简单,保证了系统反应的快速性,而且也提 调问题得以解决,控制流程将变得十分简单。另外,
高了机器人的决策能力。 !.! 基本行为和行为综合
这样的分 层 决 策 而 是 一 个 非 常 自 然 的 行 为 过 渡 过
程。如果我们在设计这样的系统时,能够使每个子
图 " 机器人短期记忆
任务产生的行为就是机器人最终的输出,那么,整个 决策就只有一层,控制流程将变得非常简单。
表 # 机器人的短期记忆
基于这样的考虑,我们以机器人足球为例,将整
! 标志位
(收稿日期:2002-08-29)
— 6l —
高技术通讯 2004.4
程出现错误不会导致整个系统的崩溃。当传感器类 型变更或者个数增减时,只需要变更或增减相应的 进程即可,系统其他的进程并不受影响。如果各进 程在使用资源时发生冲突,进程的优先权又保证了 系统基本功能的实现。
2 自主行为设计与综合
图 ! “交龙”足球机器人
".! 面向动态环境的混合式体系结构 目前常用的控制结构有三种:反应式、规划型和
混合式的控制结构。反应式的结构具有快速的反应 能力,鲁棒性强,但完成复杂任务的能力较差。传统 的规划方法往往基于完整的环境信息,不适于高度 动态的环境。为了弥补上述两种结构的不足,近年 来提出了一种混合式的体系结构[8],兼容了反应式 和规划型结构的优点,既能通过规划完成比较复杂 的任务,同时又具有快速反应的能力。但是,混合式 的结构在具体应用上又各有不同。例如,多次获得 RoboCup 中型组冠军的德国 Freiburg 队[9]足球机器 人控制系统就采用混合式的结构。整个控制系统包 括感知、路径规划和基于行为的控制三部分。它的 行为设计较少考虑底层各行为之间的过渡关系,行 为的调度更依赖于上层的感知和规划,往往要求多 个传感器的复杂处理来获得精确的环境模型。本文 所采用的控制结构(见图 2)与其类似,不同之处有 两点: (l)在基于行为的控制中加入简捷而有效的短 期记忆; (2)规划模块只完成局部的路径规划。
贾建强等:基于有限状态机的足球机器人行为设计与综合
基于有限状态机的足球机器人行为设计与综合!
贾建强! 陈卫东 席裕庚
(上海交通大学自动化研究所 上海 200030)
摘 要 介绍了一个面向动态环境作业的全自主移动机器人系统。该机器人系统集成了 包括视觉、激光雷达、声纳环、里程仪在内的多传感器系统,双轮独立驱动的移动小车以及 高速无线局域网,并通过车载控制系统进行实时决策。控制系统采用递阶的混合式结构, 在上层利用基于有限状态机的行为选择方法实现行为规划,在低层采用基于行为的控制 技术。通过对指定任务的分解,该方法实现了动态环境下多行为的协调,使机器人具有较 高的决策智能,同时又保证了快速的反应能力。动态环境下的实验和比赛结果证明了该 方法的有效性。 关键词 移动机器人,多传感器,行为,有限状态机,动态环境
NO BALL:机器人看不到球。
态的自然过渡。需要说明的是,由于机器人有尺寸
NO OBST:前进方向无障碍。 OBST ON ROAD:有障碍挡在目标前或机器 人与障碍距离太近。
约束,因此,避开障碍(机器人)并不需要运动很远的 距离。假 设 机 器 人 在 距 离 障 碍 lm 时 进 入 避 障 状 态,那么,它将在 2 ~ 3S 内(lm / S 的速度)运动到目