视觉跟踪技术发展和难点问题的分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息技术与信息化
计算机技术与应用
63
视觉跟踪技术发展和难点问题的分析
The Tendency of the V isual Tracking and the Analysis of Tr oubles
张 进3
ZHAN G J in
摘 要
本文介绍了计算机视觉领域里的一种新兴技术即视觉跟踪技术。其中,主要介绍了视觉跟踪技术的产生、发展,同时也提到了跟踪技术中难点问题和解决思路。
关键词
视觉跟踪 目标检测 目标识别 目标跟踪
Abstract I n this paper,it describes a new technol ogy which called visual tracking of the computer visi on
field .The text intr oduces that the new technol ogy ’s e mergence and devel opment,at the sa me ti m e,it refers s ome p r oble m s of this technol ogy and how t o res olve these p r oble m s.
Keywords V isual tracking Object detecti on Object identificati on Object tracking
3山东建筑大学信电学院 250010
在当今的信息化社会中,随着计算机网络、通信以及微电子技术的发展,计算机图像以其直观形象、内容丰富的特点备受人们青睐。然而,在很多应用领域,人类在全部依赖视觉获得信息的同时,也需要付出艰辛的劳动。需要一种智能计算机系统技术,来模拟人眼获取外界信息图像,并模拟人脑进行视觉信息的分析和理解,从而做出相应的响应,这种技术的研究越来越受到诸多学者专家的厚爱,它就是我要介绍的视觉跟踪技术。
视觉跟踪技术用途广泛,目前它已经应用于计算机视觉等许多领域,如:视频监控、视觉用户接口、虚拟现实、智能大楼、基于目标跟踪的视频压缩等。这种技术的研究同时也为高层次的计算机视觉的研究打下基础,如3-D 目标的识别与重建等。
1 研究的主要内容和目的
视觉跟踪技术主要完成的工作有以下三个:目标的检测,目标的识别和目标的跟踪。
1.1 目标检测
目标检测是从图像序列中将前景运动区域从背景中提取出来。目标检测是运动物体的分类与跟踪以及运动人体动作分析与理解的基础,该阶段处理结果直接影响到后续处理的效果,所以运动检测在人体运动分析中的作用非常重要。然而,实时多变的外界条件如天气,光照,运动物体的影子及混乱干扰的影响给运动检测带来了困难。目前几种常用的运动检测方法有:背景减除法,时域差分法和光流法。
1.2 目标识别
目标的识别即目标的分类,一般把检测到的运动目标分为两类:人和非人,其中人体跟踪的目的是从检测的运动区域中将人的运动区域提取出来。常用的分类方法有基于形状特征的分类
(利用检测的运动区域的形状特征进行分类),比如:区域的分散
度,面积,宽高比等作为特征;基于运动特性的分类,比如:利用人的运动具有周期性作为特征。为了得到更准确的分类效果,可以将上述两种方法结合起来使用,还可以考虑运动物体的色彩和运动特征。
1.3 目标跟踪
运动目标的跟踪是指在连续帧的图像间建立基于位置、形状和颜色等有关特征的匹配问题。简单来说,就是在序列图像中,为运动目标定位。目前视频监控系统己经广泛应用到了对安全要求非常敏感的场合和机构,如银行,商场,飞机场等,但是目前的应用并没有发挥它实时主动的监控作用。因为现阶段的视频监控系统大部分只提供视频录像和回放的功能,往往是当异常事件发生后,相关人员才通过记录的结果来观察曾经发生的事,但此时往往为时己晚。人们需要的监控系统是能够实行实时监控,并能自主分析摄像头捕捉的视频信息,若发生异常情况,可以及时报警,从而避免意外发生,同时也减少了雇佣大量监视人员所需要的物力和财力。
2 视觉跟踪技术的发展
近年来,随着运动分析的硬件的发展(包括视频获取设备如摄像头,图像采集卡,处理器和计算机等),基于视频信息的分析迅速渗透到人民生活的各个方面。巨大的商业价值和应用价值使越来越多的公司和学术机构致力于这种技术的研究。美国,英国等国家己经展开了大量相关项目的研究。
1997年,由美国国防高级研究项目署DARP A (Defence Ad 2vanced Research Pr ojects Agency )领头,以美国卡耐基梅隆大学为
首,麻省理工学院等高校参与了视频监控系统项目VS AM [1]的研究开发,并于2000年基本完成.此项目主要研究用于战场及普通民用场景进行监控的自动视频理解技术:分布于各个不同位置的摄像头获取的视频信号通过一个分布式的网络连接汇集到操作
中心,只需要一个操作人员就可以监控一个相当广阔的空间范
计算机技术与应用
信息技术与信息化
64 2008年第6期
围。同时,在很大程度上减少了操作人员的劳动强度,系统能够自主检测异常情况的发生,而且只有在检测到异常的情况下系统才会发出信号,提醒操作人员作相应的处理。
实时视觉监控系统W 4[2]能够定位人和分割出人的身体部分,还可以实现人的跟踪,并可以判断人是否携带物体等简单行为。在国内,中国科学院、浙江大学、武汉大学人工智能研究所在目标跟踪,人的手势识别,步态识别等方面有一定的成就[3,4]。
3 视觉跟踪技术中的难点问题和解决思路
3.1 阴影消除问题
在前面提到的背景差法或帧差法中有时(特别是光线充足且是侧面光时较为明显)得到的是带有阴影的人体区域。这是因为在人体运动的过程中,影子也是跟着在动的,背景检测到的运动目标是包括影子的,即无法实现影子与人体的分离。这样就造成了前面所说的阴影检测现象。然而阴影区会对后续的跟踪处理带来很大的误差。所以我们必须单独把阴影区域去除掉。如何去除监测区域中的影子是必须解决的问题。
关于这一问题的解决思路是:由于一个物体被阴影遮挡住后跟遮挡前相比其像素的亮度(intensity )变暗,但是其色度(chr o 2
maticity )具有一定的不变性。我们可以利用这一原理将检测到的
人体的阴影与人体分开并去除掉。
这里,对于一个点i (r,g,b ),来说,我们可用r,g,b 三个分量的比例来表示色度:
r c =r/(r +g +b ) g c =g /(r +g +b )
在实际运动检测中,对于背景中的每一个点,在建立初始背景模型的同时,建立一个色度模型(μrc ,μgc )。然后对于每一帧图像得到的运动区域,计算其中每一点的色度(y rc ,y gc ),并通过下式判断其是否属于阴影区域:
D i =
1,If ((y r c -μrc )>threshold or (r gc -μgc )>threshold )0,else
其中标记点O 属于阴影,标记点1属于人体,这样就可以将阴影从前置阴影区域中去除了。
3.2 目标跟踪中提高运算速度问题
在目标检测中,通过第一帧图像与背景作差获得了动态目标信息,如何将得到的目标信息在接下来的每一帧中快速找到,以节省运算量和运算时间是非常重要的。要知道,如果视觉场景中有多个运动目标的话,如果运算量不够小,运算速度不够快很可能导致系统崩溃。这也是目标跟踪的一个优化问题。
关于这一问题一般采用的方法是线性Kal m an 滤波技术。线性卡尔曼滤波是美国工程师Kal m an 在线性最小方差估计的基础上,提出的在数学结构上比较简单的最优线性递推滤波方法,具有计算量小、存储量低、实时性高的优点。
其数学模型为:
X (k +1)=φ(k +1,k )X (k )+г(k +1,k )W (k )(1)Z (k )=H (k )X (k )+V (K )
(2)
式(1)中X (k )为系统状态矢量,W (k )为系统噪音矢量,φ
(k ),г(k )为系统矩阵。式(2)中Z (k )为系统观测矢量,H (k )为
系统观测矩阵,V (k )为系统观测噪音矩阵。关于系统的随机性,一般假定,系统噪音{W (k ),k Ε0}和观测噪音{V (k +1),k Ε0}是不相关的零均值高斯白噪声。
具体思路是:根据K 时刻以前的所有状态量X (k )通过最大后验概率计算得到一个状态量的估计值 X (k +1),得到的这个估计值 X (k +1)即为预测值,在对X (k +1)位置预测时将起到预判出现位置的效果。将这个新的观测量 X (k +1)与实际得到的状态量X (k +1)进行比较并更新数据库,从而对X (k +2)位置的预测做出准备,以此类推。这样,就可以避免在状态检测中整帧图像里做全局搜索,从而提高运算速度,节省运算时间。
4 总结
实现一个具有鲁棒性、准确性的视觉跟踪系统是当前视觉跟踪技术努力的方向。但视觉跟踪技术在这几个方面中每前进一步都是非常困难的,因为该技术的发展与人的感知特性的研究紧密联系在一起。由于目前对人的感知特性没有一个主流理论,其数学模型更是难以建立。同时,在计算机视觉中大多数问题是不适定的,这就更增加了视觉跟踪技术发展的难度。但是,视觉跟踪技术具有广阔的应用前景,并不仅仅局限于前面所介绍的几个方面。随着计算机技术的不断发展,视觉跟踪技术作为计算机视觉领域中的核心技术之一,在一些关键技术中具有越来越重要的作用。
参考文献:
[1] Robert T .Collins,A lan J.L i p t on,Peter Burt and La mbert
W ixs on,“A Syste m f or V ideo Surveillance and Monit oring ”,The Robotics I nstitute,Carnegie M ell on University,Pittsburgh P A The Sarn off Cor porati on,Princet on,NJ,C MU -R I -TR -00-12.
[2] Is mail Haritaoglu,me mber,I EEE,David Har wood,me mber,
I EEE,and Larry S .Davis,Fell ow,I EEE,“W 4:Real -Ti m e Surveillance Of Peop le And Their Activities,”I EEE Transec 2ti ons On pattern Analysis And Machine I ntelligence,VOL22,NO.8,August 2000.
[3] 侯志强,韩崇昭.“视觉跟踪技术综述”.自动化学报,第32
卷,第4期,2006年7月.
[4] 徐海黎,王孙安,庄健,张兴国.“视觉跟踪系统控制结构的
研究”.机械设计与制造,第5期,125-127,2005年5月.
(收稿日期:2008-04-30)