关于运动目标检测的发展现状研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

前沿技术

1 引言

随着人工智能的发展和智能机器人的产生,人们将依赖机器去完成大量复杂繁琐的工作。信息技术发展面临的难题之一是对海量数据的处理,而相当一部分数据是多媒体数据,图像数据在其中占有很大部分,自然成了信息处理的主要对象。运动目标检测(Moving Object Detecting)是图像处理、计算机视觉学科的重要分支,又是近年的理论和应用的研究热点。运动目标检测是指在视频或图像序列中把感兴趣的并且运动着的目标与背景或其他不感兴趣的运动目标进行区分。传统的图像分割(Image Segmentation)与这部分工作相似,就是从静止图像中抽取感兴趣的目标,把图像分为若干部分,每部分具有同质性(Homogenization)的过程。因此,图像分割是运动目标检测的基础。

关于运动目标检测的发展现状研究*

许志良 深圳信息职业技术学院周智恒 曹英烈 华南理工大学电子与信息学院彭革新

中国电子科技集团第七研究所

收稿日期:2008年4月23日

十多年来,基于图像分割产生了许多运动目标检测算法,包括阈值分割、统计检验和检测滤波器三大类,它们的主要缺点在于:分割效果对噪声敏感;运算复杂、处理速度慢;算法不灵活,只能处理某一类图像,阈值只能根据具体图像而定。最近几年,基于几何曲线、曲面演化的运动目标检测算法逐渐取代了传统算法,其思想是把检测问题转化为能量泛函的建立和优化,并通过求解偏微分方程在视频或图像序列中分割出运动目标。

运动目标检测已得到广泛应用。首先,新一代基于内容的多媒体数据压缩编码国际标准MPEG-4第一次提出了基于对象的视频编码新概念。为了实现基于内容的交互,MPEG-4的首要任务就是把视频图像分割成不同目标或者把运动目标从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩。其次,在视频智能交通网络系

统中,自动实时的视频目标分割和跟踪使交通管理更高效可靠。再次,若把二维的曲线演化推广到三维的曲面演化,还能实现图像的三维重构。

*本文得到国家自然科学基金重点项目(U0635001),中国博士后科学基金(20060390728),广东省自然科学基金(07006490),深圳市科技计划项目(szkj0604)的资助。

前沿技术

2 国内外研究现状及分析

运动目标检测追踪是图像处理和计算机视觉学科的一个分支,在理论和实践上都有重大意义,长久以来一直被国内外学者关注。

运动目标检测追踪包含观测者静止(Static Observer)和观测者移动(Mobile Observer)两种情况。在观测者静止的情况中,需要分辨出环境中的静止目标(一般作为背景)和运动目标,还要跟踪目标运动。区分静止与运动目标:主要有两种途径对序列图像前后连续两帧的研究;利用无运动目标的环境的先验知识。而在观测者移动的情况中,需要对目标与观测者间的相对运动和观测者运动的几何特性进行分析。

2.1 运动目标检测

早期的运动目标检测算法都是基于时间域变化的检测。最初提出的是基于帧间差异(Inter-frame Difference)的阈值算法[1],该算法考虑像素级的差异或者为了增强鲁棒性而考虑图像块的差异,一般适用于观测者静止的情形。若要把它推广到观测者移动的情况,则需考虑通过建立补偿序列(Compensated Sequence)来实现。为适应图像特征的变化,还出现了对某些参照帧使用Kalman滤波器的算法。在阈值方法的基础上,进一步假设基于时间域变化的检测与运动检测是等价的,同此可以得到统计检验算法(Statistical Tests),这种算法可以对位移量较大或投影纹理化信息比较充足的目标进行处理。

另一方面,许多研究工作用“时间域变化检测模板”(Temporal Change Detection Masks)[3]提高变化检测(Change Detection)算法的效率,特别在已知运动目标大小先验信息的情况下。但是,因为受目标的大小和亮度的影响很大,且需要具备前后环境(Context-based)的先验知识,这种算法难以建立通用性好的模型,所以应用面较窄。后来,为了利用空间域的信息,使用了基于MAP (最大后验概率)的MRF模型来解决模型通用性的问题[2]。N.Paragios[3]等把在图像分割中有重要应用的活动轮廓方法(Active Contours)、测地活动区域方法(Geodesic Active Contours)引入到这个问题上来,更好地解决了非刚性运动目标的检测追踪。

从图像分割的角度,可以把运动目标检测的算法按以下方法进行分类:

(1)基于区域演化的分类

首先是基于“马尔可夫随机场-最大后验估计”框架的算法。其思想是在最大后验(MAP, Maximum A Posterior)准则下,通过使用马尔可夫随机场(MRF,Markov Random Field)建立目标函数进行图像分割。它把图像分割看成一个动态规划问题,对处理带噪图像有比较好的鲁棒性。

为了解决MAP难以估计的问题,Bouman[4]提出了序列MAP的多尺度贝叶斯算法,这种算法对MRF的无监督参数估计(Unsupervised Parameter Estimation)也十分有效。MRF-MAP方法虽然具有较好的鲁棒性,但由于解空间很大,导致运算量也相当可观。另一种基于区域的算法是各向异性扩散(Anisotropic Diffusion),而最近的研究工作是把偏微分方程和水平集方法与区域增长的分水岭(Watershed)算法相结合的分割算法[5];还有基于神经网络和聚类方法彩色图像的监督和无监督分割算法。

(2)基于曲线演化的分类

早期用到的曲线都是些比较简单的几何曲线,如直线、圆、椭圆等,通过改变它们的参数,让它们拼接起来,可以逼近目标边界。这种方法应用起来简单,鲁棒性好,但应用面窄,而且事实上很大部分形状难以用刚性曲线拼接形成。

在这方面有开创意义的是M.K a s s提出的活动轮廓(Snakes: Active contour models)模型方法[6]。它通过优化一个由内部和外部能量组成的能量泛函,得到一个曲线演化方程(Curve Evolution Equation),再利用曲线演化方程确定的正则曲线流去逼近目标真实边界。这类算法计算量相对少,能有效地提供算法的实时性。为了进一步减少计算量,更有研究将活动轮廓模型与B-样条逼近和Fourier展开结合,控制基函数的参数,以逼近目标边界。

传统活动轮廓模型有两个缺点:其一,模型是非本征的(Non-intrinsic),即曲线的参数化不与目标的几何属性直接相关;其二,曲线演化时是拓扑不变的,不适于对图像中

关于运动目标检测的发展现状研究

相关文档
最新文档