第二章 运动目标监测和跟踪
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 运动目标监测和跟踪
2.1运动目标检测
运动目标检测(Mot ion Detection )是指在输入视频图像中判断与背景图像相比是否存在相对运动的前景目标和物体,并根据灰度、边缘、纹理等二维图像特征将运动前景进一步分割为若干独立目标。
在实际应用中,一个好的运动目标检测算法,通常应该具有以下几个特征【12】:
◆不受环境的变化(如天气和光照变化等)而影响结果;
◆不受背景中个别物体的运动(如水波、风吹树动等)而影响结果; ◆不受目标及背景中的阴影而影响结果;
◆对复杂背景和复杂目标仍然有效;
◆检测的结果应满足后续处理(跟踪分析)的精度要求;
图2-1描述了检测算法的一般流程图。常见的运动目标检测算法有:帧间差分法、背景差分法及光流法等,以下将分别进行介绍。
Fig.2—1Flo w char t of detection algorithm
2.1.1帧间差分法
帧间差分法[23-241就是将视频序列中相邻的两帧或几帧做象素域上的减法运算,以得到帧间的不同图像的信息。在摄像头固定的情况下,对连续的图像序列中的相邻两帧图像采用基于像素的帧差法来提取图像中的运动区域,设k 帧和第k+l帧(或者看做21t t 和时刻)采集到同一背景下的两幅运动图像的灰度值为1),(+k k f y x f 和,则差分图像的定义为:
),(),(),(11y x f y x f y x D k k k -=++ (2.1)
对上式的差分结果进行阈值处理,就可以提取出运动物体。对差分图像),(y x f d 二值化,当某一像素的灰度值大于给定阈值T时,认为该像素为目标像素,即该像素属于运动目标;反之,则属于背景。这一步的目的就是为了区分背景像素和目标像素,得到:
T y x D T y x D k k k y x R >≤+++=),(),(1
0111{),( (2.2)
其中,l表示前景像素值,0表示背景像素值。
然后再对),(1y x R k +进行连通性分析,就可以得到连通区域的面积。当某一连通区域面积大于预定值时,则认为该区域属于同一个运动目标。
帧间差分法实验如图2-3,在实验时由于第100帧图像与101帧图像相差不大,因此改采用第102帧图像与100帧图像进行差分。
显而易见,在帧间差分法中阈值的选择非常关键,这是因为阈值过低则不能有效地抑制图像中的噪声,阈值过高将误判图像中有用的变化。阈值选择分为全局阈值和局部阂值,通常图像不同光照区域引起的噪声也不相同,因此采用局部阈值能更好的抑制噪声。
帧间差分法进行目标检测的主要优点是:算法实现简单;实现程序设计复杂度低;易于实现实时监视;基于相邻帧差方法,由于相邻帧的时间间隔一般比较短,因此该方法对场景光线的变化一般不太敏感。
最基本的帧间差分法可以检测到场景中的变化,并且能够提取出目标,但是在实际应用中,帧问差分法的结果精度不高,难以获得目标所在区域的精确描述。当运动目标的运动速度较快时,实际检测时可能会将一个运动目标误为两个运动目标:当运动目标速度较慢时,会在检测结果中造成空洞,这是由于运动目标的颜色或灰度在一定区域内较均匀。在实际应用中我们总希望下一步进行目标跟踪中,提取的目标尽量接近目标的真实形状,也就是说,我们提取的目标应是完整的,同时也应该是尽量少地包括背景像素点。但是~般情况下广泛应用该算法时对两帧间目标的重叠部分也是不容易被检测出来的,即只检测出目标的一部分或者出现了较大比例的空洞,这是由于我们直接用相邻的两帧相减后,保留下来的部分是两帧中相对变化的部分,所以两帧间重叠的部分就很难被检
测出来。
为了获得两帧重叠的部分图像,解决相邻帧差法存在的问题,人们在其基础上又提出了一种三帧差分法。该方法需要提取连续三帧图像来计算两个差分图像,再令这两个差分图像的对应像素相与,从而可以提取出运动目标。设连续三帧视频图像分别为),(),(),,(11y x f y x f y x f k k k +-和
则三帧差分法检测流程如图2—4所示。
2.1.2背景差分法
背景差分法【25】【26】是目前视频监控中最常用的一种方法,它的基本思想是将输入图像与背景模型进行比较,通过判定灰度特征的变化,或用直方图等统计信息的变化来判断异常情况的发生和分割运动目标。传统的背景差分算法包括三大步骤:首先,为背景中每个象素进行统计建模;然后将当前图象和背景模型进行比较,找出一定阈值限制下当前图像中出现的偏离背景模型值较大的那些象素,据此,再对图象进行二值化处理,从而得到前景象素集合(运动目标);此外,模型还要进行周期性的背景更新以适应动态场景变化。背景差分法算法具体如下:
计算视频序列中当前帧五与背景瓯的差值,得到差分后的图像k D : ),(),(y x b y x f D k k k -= (2.3) 对差分图像k D 进行二值化,当某一像素的灰度值大于给定阈值T时,认为该像素为目标像素,即该像素属于运动目标;反之,则属于背景。这一步的目的就是为了区分背景像素和目标像素,得到
T y x D T y x D k k k y x R >≤=),(),(1
0{),( (2.4)
其中,1表示前景像素值,0表示背景像素值。
对),(y x R k 进行连通性分析,就可以得到连通区域的面积。当某一连通
区域面积大于预定值时,则认为该区域属于同一个运动目标。
采用背景差分法的实验效果如图2-6所示。
背景差分法的优点是其原理和算法设计简单、检测速度快、能够得到
比较精确完整的运动目标信息,如位置、大小、形状,但是运算量大,且通常会遇到如下一些问题:
背景获取:背景图像的获取最简单的办法就是在场景没有任何运动目标的情况下进行拍摄,但是在实际应用中较难满足这种要求,如对公路和城市效能的监控等,所以需要一种方法就能够在场景存在运动目标的情况下获得真实“纯净”的背景图像。
背景的扰动:跟帧间差分法相同,当背景中含有轻微的扰动对象(如树枝、树叶摇动,水波等),扰动部分很容易就被误判为前景运动目标。
外界光照条件的变化:一天中不同时间段光线、天气等的变化对检测结果的影响。
背景中固定对象的移动:背景里固定对象可能移动,如:场景中的一辆车被开走等,对象移走后的区域在一段较短的时间内可能被误认为是运动目标,但不应该永远被看做是运动目标。
前景运动目标长久停留在背景中:前景运动目标可能长久停留在背景中,如:城市交通中的红灯时间,智能小区的车库监控中车辆入库等,当原来的运动转为静止之后的一段短时间内可能被误认为还是运动目标,但不应该永远被看着是运动目标。
背景更新:背景中固定对象的移动、前景运动目标成为背景中的长久停留物或者外界光照条件的变化等因素都会使背景图像发生变化,需要引入恰当的背景更新机制才能达到合理检测的目的。
由此可见,背景差分法的难点在于如何建立背景模型和维持背景,以适应实际环境中的变化。常用的背景估计方法有如下几种。
1.基于自适应的方法
即通过使用自适应方程,对图像序列加权平均,生成一个近似背景。这种方法通常在目标移动比较迅速的场景中十分有效。但是当场景中存在移动缓慢的物体时,检测效果较差。同时它不能检测双峰背景。当背景中有物体移入、移出时,背景恢复十分缓慢。常有的该类方法包括:
(1)均值背景法将最近捕获的N帧视频图像的平均值作为当前背景。这种方法在监控场景不是很复杂、且场景中存在的变化较少时检测效果较好。
(2)中值背景法即记录最近N个象素值,用这N个值的中值作为背景;
(3)自适应变化检测生成背景的方法首先使用帧差法检测场景中的变化区域,在确定变换区域后通过自适应算法更新背景;在VSAM系统中通过对图象序列中的当前背景和当前帧加权平均,自适应地生成背景。
(4)基于Kalman 滤波器理论的背景生成方法文献【36】提出了一种基于Kalman滤波理论的渐消记忆递归最小二乘的背景重建算法,它适用于背景变化较慢的视频场景。它将运动目标视为对背景的随机扰动,应用Kalman滤波器在零均值的退化公式,即渐消记忆递归最小二乘法来更新和重建背景。
2.基于分布模型的方法
(1)参数模型即根据数据找到一个与之匹配的已知概率模型。具体过程就是根据已知的一系列数据和参数为θ的分布)
(θ
η,找到参数θ的最优
估计
∧
θ,这样就能得到估计概率密度函数∧f。这种方法的优点是,可以只用几个
参数就能描述出整个概率分布,将大量数据压缩成几个简单的参数,用参数代