视觉导航综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
视觉导航及实验验证平台综述摘要:本文概述视觉导航技术。
视觉导航通过图像采集设备收集近距离的环境信息,并利用计算机视觉技术进行图像处理获得环境信息,实现导航。
首先比较了各种导航方式的优缺点,分析视觉导航的意义。
接着概述了视觉导航的应用领域和研究现状,然后分析比较了视觉导航中的一些关键技术,简单介绍了视觉导航领域的SLAM问题。
最后,综合国内外视觉导航技术研究存在问题,提出进一步研究方向和应用途径。
关键词:视觉导航;移动机器人;智能车辆;图像匹配;路径识别
0 引言在当今世界的先进技术领域里,往往存在这样的问题:为了完成某种特殊的任务,需要在已知或者未知环境中,使特殊的能完成既定任务的实验设备或平台按照既定的且满足最
优条件的路径运动或者到达既定目的地,这一类的问题便是导航。
对于一般的导航系统,在给定命令的前提下,结合环境中的各种探测信息,并根据自身位姿信息作出决策使运动体而到达目标,在运动过程中,还需要不断优化全局路径。
导航系统需要完成的任务包括以下三点:一,获取信息;二,处理信息;三,作出决策(即路径规划)。
目前广泛使用的导航方法有[1]:航标法,航位推算法,天文导航,惯性导航,无线电导航,卫星定位导航和组合导航等。
下文对各种导航方法对比说明。
航标法习惯称之为目视方法,它借助于信标和参照物对运动物体进行引导。
目前仍在应用,但是这种方法过于依赖经验,受天气、地理条件的影响。
航位推算法是通过一系列的速度增量来确定位置的,是一种自主导航方法,保密性强。
但是随着时间推移会产生误差积累。
天文导航是通过仪器设备对天体的位置精确测定,根据地理关系算出位置的相对导航方法,其缺点是误差积累受时间和气象条件限制,定位时间长,操作计算复杂[1]。
惯性导航通过加速度测量技术和积分技术的综合应用得到运动体的速度和位置信息。
这种导航技术完全依靠载体上的设备自主完成导航任务,因此隐蔽性好,不受外界条件限制。
但是加速度及精度和误差积累严重限制该方法的应用。
目前,惯性导航常常和其他系统综合使用。
无线电导航通过测量信号的相位和相角定位,但其易受干扰。
卫星导航利用卫星发射无线电波到地面接收器的时间来推算地面接收器所在的经纬度,其中GPS是目前真正实用的一种卫星导航和定位系统,但其技术为美国所垄断,我国也正在致力于这方面的研究[2]。
而自主照相机和图像处理技术的发展促使视觉导航技术的发展。
视觉导航是通过摄像机对周围环境进行图像采集,并对图像进行滤波和计算,完成自身位姿确定和路径识别,并做出导航决策的一种新的当行技术。
由于视觉导航的采用被动工作方式,设备简单,成本低廉,其应用范围很广。
最主要的特征是视觉导航的自主性和实时性。
它不依靠外界任何设备,只需对储存系统和
环境中的信息进行计算就可以得出导航信息。
文中后续部分将会介绍视觉导航的应用领域及国内外研究现状和视觉导航的关键技术,其次针对视觉导航同时定位和地图绘制技术(SLAM)做简单介绍。
1 从仿生学角度看视觉导航
图1:人取书的视觉反馈导航系统方块图在视觉生物的行为当中,利用视觉信息经过大脑处理的反馈控制随处可见。
如图1所示,人用取书就是一个简单的利用视觉信息导航完成既定任务的过程。
下面通过解剖手从桌上拿书的动作过程,透视该过程所映射的视觉导航系统的简单机制和原理。
首先,人眼连续观察周围环境确定书和人相对于在环境中的位置,并将这个信息输入大脑(称为位置反馈信息);然后由大脑判断手和书之间的距离(称之为偏差信号),并根据其大小,发出控制手臂移动的命令,逐渐使手和书之间的距离减小,并最终拿到书[3]。
自主照相机,图像处理,计算机和机械系统的综合使用可以模仿人拿书的过程,原理图如图2.
图2:仿生物视觉导航系统方块图
但是生物特别是高度进化人的视觉反馈系统是一个连续的多重反馈的生物性系统,且在对图像的处理之中,人的经验对视觉信息的删选和利用有很大的帮助,这是物理系统难以复制甚至仿照的。
研究这些只能带给我们原理上的启发,但是在对更贴近机械的昆虫的生物行为的研究却具有现实的意义。
例如,蚂蚁视觉导航的研究表明,蚂蚁在第一次经过某环境时,会在大脑里储存大量的关于该环境的图像信息,之后就使用复合地标和对整个地图的记忆来导航。
这有助于我们开发自动控制系统的开发[2]。
其次文献[2]中所提到的蜜蜂的导航对飞行器的导航控制系统研究也有重要意义。
2 视觉导航的应用领域和研究现状
视觉导航在交通运输、自动化仓库和生产线的运输小车等方面已经得到较好的应用。
对移动机器人和智能车辆的导航研究取得了较好的成果,最终,视觉导航将应用在空间飞行器和星际探测器上。
2.1移动机器人导航
移动机器人是一种在复杂的环境下工作的有自规划、自组织、自适应能力的机器人。
为实现机器人的智能化和自主移动性,导航技术是其中的关键。
视觉导航的特点非常适合自主移动机器人,通常,在机器人上安装单目或双目照相机,获取环境中局部图像,实现自我位姿确定,从而做出导航决策。
目前国内外有很多学者从事基于视觉导航的自主移动机器人研究。
移动机器人的研究始于20 世纪60年代末,以斯坦福研究院(SRI)开发的第一台移动机器人Shakey为标识[2],主要目标是研究复杂环境下机器人系统的实时控制问题。
具有代表性的还有喷气推进实验室(Jet Propulsion Laboratory,JPL)研究的Urban Robot战术机器人,如图3所示,配备了双目立体视觉系统进行障碍物检测,处理器由两台高性能计算机组成,体积小,易携带,并具有爬楼梯的功能[3]。
从上世纪80年达开始,我国也致力于地面智能机器人的而研究。
2.2智能车辆的导航
智能车辆是当今世界车辆工程领域的研究前沿和热点。
智能车辆是集环境感知、规划决策、辅助驾驶等功能于一体的综合智能系统,是计算机视觉、人工智能、控制理论和电子技术等多个技术学科交叉的产物,代表了未来车辆的发展方向,具有十分广阔的应用前景[5]。
计算机视觉系统是智能车辆感知局部环境的重要“器官”,它以地面上涂设的条带状路标作为路径标识符,运用计算机视觉快速识别路径,其最优导向控制器能够保证对路径进
行准确跟踪[6]。
清华大学计算机系统智能技术与系统国家重点实验室从1988年开始研制THMR(Tsinghua Mobile Robot)系列智能车系统,经过一系列的发展,研制的新一代智能车THMR-V,如图3所示,兼有面向高速公路和一般路面的能力。
车体装配彩色摄像机和激光测距仪组成的道路和障碍物检测系统[],目前能够在校园的非结构化道路环境下进行道路跟踪和自主避障。
图3:Urban Robot 图4:THMR-V
2.3航天器导航
除了地面智能车辆,也可以利用视觉导航对航天器或星际探测器进行导航,例如月球车。
月球车具有高度自主性,并适于在复杂的非结构化月面环境中执行探测任务,它是目前对月球进行近距离探测的最直接有效的工具[18]。
月球车具有自主漫游和探测功能,能够在月球表面自动行驶几百米甚至是几百公里,通过自身携带的科学仪器可实现对月球表面环境的简单直接勘测。
月球巡视探测器要进行自主巡游,需要有路径规划、定位、避障、运动控制等基本功能。
月球车立体视觉系统是月球车认知月面环境的
工具,也是月球车在复杂环境下赖以生存的重要信息源,利用立体视觉系统,不仅可以对环境地形重构、实时避障,而且还可以利用其得到的立体序列图像进行月球车自运动估计。
3 视觉导航中的关键技术
视觉导航在利用一只或多只摄像机获得场景的二维的图像信息,然后通过图像处理,计算机视觉、模式识别等算法,确定运行信息,从而进行导航。
其中关键技术包括摄像机标定、立体图像匹配、路径识别和三维重建。
3.1 摄像机标定
摄像机标定是视觉导航中图像处理的基础之一。
计算机立体视觉应能从摄像机获取的像平面图像信息出发,计算三维环境物体的位置、形状等几何信息,并由此识别环境中的物体。
而像平面上的点与该点对应的空间点的三维位置有关。
这些位置的几何关系,与摄像机的几何模型有关,决定该几何模型的参数称为摄像机参数。
而摄像机参数包括内部参数和外部参数:内部参数描述摄像机内部的几何和光学特性,如图像中心、焦距、图形畸变以及其他系统误差参数等。
外部参数指的是摄像机坐标系相对于某一世界坐标系之间的相对旋转和平移。
由实验和计算确定这些参数的过程称作摄像机标定。
摄像机参数已知是所有视觉问题的解决前提,同时这一过程的精度直接影响导航的准确性。
摄像机的标定技术按是否有参照物可以分为基于
标定靶标定和自标定,按照摄像机模型建立时是否考虑镜头畸变分为线性标定,非线性标定和两部标定。
目前摄像机自标定的方法几乎都是基于绝对二次曲线或者它的对偶绝对二次曲面的方法[17]。
具有代表性的摄像机标定方法有:Tsai方法,线性方法,Ahmed方法和张正友方法。
4.2 立体图像匹配
在立体视觉系统中,图像匹配是指在两幅或多幅从不同角度观察得到的图像上寻找空间坐标中物体上的同一点的图像坐标,并将它们一一对应起来的过程,也称为对应点匹配或立体图像配准。
图6表示SIFT特征点的提取匹配结果。
完成图像匹配需要解决两
图6:SIFT特征点匹配效果图
个问题:1)提取适当的图像特征作为匹配基元;2)选择适当的计算方法准确地、可靠的匹配这些基元。
对应特征点选取方法和
匹配计算方法的问题。
目前的相关研究中,特征的选取主要包括直接根据图像的灰度信息和根据图像中物体的结构特征两大类。
其对应的匹配计算方法也包括两大类:基于图像的区域相关匹配(Area-based Matching)和基于景物特征的图像特征匹配(Feature-based Matching)。
前者直接利用图像的灰度信息,具有实现简单、定位精度高、恢复视差密度大等优点。
其缺点是对景物的成像条件比较敏感,并且由于使用耗尽型搜索匹配技术,算法计算量大且耗时多,对噪声敏感,对于图像纹理较少或纹理重复度高的情况容易产生误匹配;而后者较多地利用了景物的结构信息,可利用不同尺度下的景物特征来分析景物,从而避免了前者的缺陷[17]。
3.3 路径识别
视觉导航的一项关键技术就是精确可靠的识别出行走路径。
摄像头采集的信息由于受到光照变化、摄像头振动和图像采集传输等因素的影响,不可避免的混入噪声成分。
在图像处理之前,首先进行图像预处理,包括灰度变换和噪声消除等。
路径识别的关键在于能够通过视觉图像处理,找到导航路标的位置和方向,这是视觉导航的最关键一步。
图6表示路径识别流程图。
图6:路径识别流程图
4 移动机器人同时定位和地图创建(SLAM)概述
机器人的位姿确定依靠已知的环境背景,而为了创建地图,又要求机器人在环境中的位姿信息是已知的。
因此,当一个机器人在未知的环境中导航时,同时要求机器人进行相对于环境的定位和地图创建,由起始已知地图确定位姿,在确定状态下导航运动同时对新环境进行地图创建,再进行位姿确定,如此重复,达到对新环境的地图创建和在未知环境中运动。
这个问题便是同时定位和地图创建问题,称作SLAM或者CML,是视觉导航中发展迅速且很有潜力的方向。
SLAM概念形成之后,研究者们主要针对SLAM
的计算效率、数据关联、环境表示、循环识别等方面进行研究。
近十年来SLAM发展迅速,多种方法已得到成功的实践,硕果累累。
其主要工作是在保证一致、精确的地图估计及机器人位姿估计的前提下,提高算法的计算效率。
其次,注入数据关联、非线性、特征匹配等方面也得到了许多研究者的关注。
近期对SLAM的研究领域集中在计算复杂度,数据关联境表示方面。
而今后的研究将主要致力于将SLAM成功的应用于大规模、动态的自然环境中,如机器人在大城市中自主穿越,火星探测器在火星表面精确定位和地图创建等。
5 结论和展望
视觉导航因其精度高、信号探测范围宽、自主性实时性好等特点,在工业生产、智能车辆等方面得到广泛应用,其在飞行器应用购方面的研究还有待进一步的发展。
但是,视觉导航依赖于计算设备的特点使其易受运算速度和储存容量的限制。
由于计算设备和传感器大都装载在运动体上,图形识别、路径规划等问题都由车载计算机完成,所以车载计算机的工作量较大,延时问题较为明显。
对于一个导航系统而言,必须同时具有实时性、鲁棒性、经济性这三个技术特点。
实时性要求视觉形同的处理速度快于移动速度;鲁棒性则要求能系统能得到稳定收敛的结果;经济性要求在成本、效益等方面能适应本国国情。
随着计算机图像处理能力提高和视觉处理相关技术的发展,在图像处理的实时性与鲁棒性得到解决之后,视觉导航方式将会得到广泛的应用,成为未来导航的一个重要发展方向。