视频运动跟踪技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
视频运动目标跟踪算法研究
摘要:视频图像中的运动物体跟踪技术是计算机视觉、计算机科学、视频监控等学术领域的一个重要课题。该技术将数字图像处理领域中对静态图像的分析扩展到动态图像中。运动物体识别和跟踪技术的研究成果不仅在社会日常生活和工作中有着广泛的应用前景,而且在军事、交通、医学和科研等领域发挥着日益重要的作用。运动物体识别与跟踪算法的设计将直接影响识别和跟踪效果的准确性及稳定性,对于精确度高、鲁棒性好的算法研究一直是计算机视觉和数字图像处理等领域的热点问题。
关键词:目标跟踪,Mean shift算法,目标检测,粒子滤波
1 研究现状
视频目标跟踪技术已经得到了广泛的应用,主要应用有以下几个方面:智能视频监控、人机交互、机器人视觉、自动驾驶。其背后存在的学术价值和蕴藏的经济价值更是得到了很多人员的青睐,很多学术机构、大型公司以及一些科研人员正在投入大量的人力和财力进行各种开发和科研。
Fukunaga等人早期就提出了Mean shift跟踪算法,他们提出了一种概率密度函数的估计方法。不过在后来相当长的时间里并未受到大家的关注,直到1995年,随着Cheng对其进行近一步的研究并成功将其推广到计算机视觉领域中,这才得到了许多专业人士和科研人员的重视。目前存在很多经改进的Mean shift 算法。另外,在算法融合方面,有许多学者也做了相应的研究,K. NuInmiaro提出了将Mean shift算法和粒子滤波算法相融合,从而提高了目标跟踪的鲁棒性和准确性。
标准卡尔曼算法是在线性系统下滤波的,对于非线性、非高斯的系统没有效果。为此,人们开发出各种非线性滤波算法。一种是扩展卡尔曼算法进行滤波与估算,只适用于滤波误差和预测误差很小的情况;另一种是粒子滤波器[1],它是近些年出现的解决非线性问题的有效算法。粒子滤波技术通过非参数化的蒙特卡罗模拟方法来实现递推贝叶斯滤波,适用于任何能用状态空间模型以及传统的卡尔曼滤波表示的非线性系统,精度可以逼近最优估计。
在目标模型选取上,也有一些专家进行了探索。1)通过对粒子滤波的研究,将颜色作为目标模型并用粒子滤波跟踪,结果表明该方法可以增加遮挡情况下的鲁棒性。但是这种方法有些欠缺,即如果目标和背景有一定的相似度,则跟踪精度容易下降。2)将目标的边缘特征提取出来来代表目标进行跟踪,结果显示这种方法直观地增强了跟踪的鲁棒性。鉴于颜色描述目标色彩信息,边缘代表目标的轮廓,因此将这两种互补信息结合来代表目标可以改善跟踪效果。3)用局部线性嵌入流形(LLE)将问题降为二维空间,然后进行解决。4)利用一定的判别准则来有效分离目标和背景,并建立有明显区别的目标模板,最后成功用于跟踪中。5)通过Adaboost方法练习得到若干弱分类器,然后用系统集成的方法将其形成强分类器,然后用它们来区别目标和背景,以此用特定的方法获得目标的状态,并跟踪出目标运动的轨迹。
视频目标跟踪的难点主要包括以下几个方面[2]:1)目标外观变化。目标运动过程中发生形状的变化,加上相对于摄像机的视角、尺寸变化,造成目标在图像平面上复杂的外观变化,增加了目标建模的难度。2)复杂背景。变化的光照、与目标颜色相似的背景以及杂乱的变化环境使得较难将目标从背景中区分开来。3)遮挡问题。遮挡包括背景的遮挡和目标之间的遮挡。部分遮挡造成目标部分外观特征检测不到,而且引入了遮挡物的干扰;完全遮挡需要跟踪算法要有重新恢复的机制,当目标再次出现时能重新定位。4)目标的复杂运动。非线性的目标运动使得跟踪算法难以预测目标的运动状态,增加了跟踪算法的搜索计算量。
2 视频运动跟踪概述
视频目标跟踪系统的基本框架如下图,
目标检测,也就是对目标进行特征提取,是一种对目标进行分割的技术。它可以把对目标的认知、识别和分割统一起来,其确定性和鲁棒性可以用来评价一个系统性能的好坏。特别是在某些背景混乱的情况下,就要将采集到的很多目标及时识别,在此目标的快速检测尤为具有实际价值。目标跟踪就是通过数字图像处理、传感器等各种技术将视频通信信号进行识别、分析和处理,最后确定目标的行为姿态,以此来完成更加高级的行为活动。
3 目标跟踪算法研究
目标跟踪算法可以分为基于检测的跟踪算法、基于滤波的跟踪算法、基于匹配的跟踪算法3类。
3.1 基于检测的跟踪算法
3.1.1 背景差分法
背景差分法是最常用的一种检测方法。它的本质是利用当前帧图像与背景图像相减,通过阈值来检测运动区域,其基本原理如下图,
3.1.2 帧间差分法
帧间差分法是将相邻两帧的对应像素值进行差值计算,在背景变化不大的情况下,如果差值结果很小,则认定该处无目标,反之则认定有运动目标出现,从而在实时图像中检测出运动目标,并对其进行跟踪。具体算法为:前一帧图像I1(x,y,t1)与后一帧图像I2(x,y,t2),两者之问的二值差分图像表示为
如果差的绝对值小于某一阈值T,则没有目标运动,R取值为0;反之,当大于或者等于阈值时,存在运动目标,R取值为1。
3.1.3 光流法
基于光流法的目标检测,是利用运动目标在视频图像里变化的光流特性的理论,根据一定的约束条件估算出运动所对应的光流,计算出巾贞间像素的位移来提取运动目标。光流法计算量大、没有良好的抗噪性能,没有特别的硬件装置支持下,光流法几乎无法应用于检测的实时处理。
3.2 基于滤波的跟踪算法
这里以粒子滤波为例,粒子滤波算法的原理为:首先初始化得到前一时刻的粒子集,通过重要性采样得到新的粒子,然后通过计算得到每个粒子对应的权值并归一化,最后按照粒子权重重采样得到权值高的粒子,如此重复直到结束。粒子滤波法是指通过寻找一组在状态空间传播的随机样本对概率密度函数进行近似,以样本均值代替积分运算,从而获得状态最小方差分布的过程。
3.3 基于匹配的跟踪算法
这里以Mean-Shift均值漂移算法为例,Mean-Shift算法的主要思想是根据目标颜色的概率分布直方图,在领域中通过相似性度量计算自动寻找最佳候选目标,从而达到跟踪目标的目的。
3.3.1 无参数密度估计
常用的非参数概率密度估计包括核函数法、直方图法、最近邻域法等。
最近领域法:令输出的值等于最近的输出值,该算法简单,但是容易受到局部噪声点的影响,给模型的估计带来很大的困难。
直方图法:根据数据的范围将其分成若干个相等的区间,被采样的数据根据区间整理成若干组。以区间值作为横坐标,以频数为纵坐标做直方块所绘制出的矩形条图。
核密度估计法:核密度估计法的原理和直方图法相似,对于一组采样数据,把数据的值域分为若干个相等的区间,每个区间就是一个Bin,每个Bin中的数据个数与总参样个数的比率就是每个Bin的概率值。相比于直方图法,它多了个用于平滑的核函数。核函数也被称为“窗口函数”,常用的二维空间中的核函数如下图,分别为Uniform(均勾)核函数、Triangle(三角)核函数、Epanechikov(依潘涅契科夫)核函数、Gaussian(高斯)核函数。
3.3.2 Mean-Shift 向量
均值漂移算法的核心思想就是样本点通过均值漂移向量持续的向样本中心点移动,不断迭代以致达到收敛的目的。其密度梯度估计为,