基于动态阈值的核密度估计前景检测算法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基于动态阈值的核密度估计前景检测算法
杨大勇;杨建华;卢伟
【摘要】为解决煤层气开采(CBM)现场中抽水机往复运动和风吹草动等动态环境对前景检测的干扰及核密度估计(KDE)目标检测法实时性差的问题,提出了一种改进核密度估计前景检测算法.该方法先用背景差分法(BS)融合三帧差算法将图像分割成动态背景区与非动态背景区,对于动态背景区再用核密度算法分割前景.分割前景时提出了一种新的动态阈值求取方法,综合了相邻样本绝对差均值和样本方差来确定窗宽,并用定时更新与实时更新相结合的策略更新第二背景模型,在替换样本时用随机抽取策略代替先进先出(FIFO)方式.仿真结果表明,改进核密度估计算法与核密度估计法和背景差分核密度估计(BS-KDE)法相比,平均每帧图像算法耗时分别降低了94.18％和15.38％,识别的运动目标也更为完整.实验结果表明所提算法在煤层气开采场景中能准确检测到前景,并基本满足标清视频监控实时性要求.
【期刊名称】《计算机应用》
【年(卷),期】2015(035)007
【总页数】6页(P2033-2038)
【关键词】煤层气开采;往复运动干扰;核密度估计;动态阈值;窗宽;背景更新
【作者】杨大勇;杨建华;卢伟
【作者单位】大连理工大学控制科学与工程学院,辽宁大连116023;大连理工大学控制科学与工程学院,辽宁大连116023;大连理工大学控制科学与工程学院,辽宁大连116023
【正文语种】中文
【中图分类】TP391.413
0 引言
煤层气是一种清洁能源［1］。

开采现场多位于山区、田野等地且处于无人值守状态，目前主要靠人工方式巡检，不能实时了解现场情况，因此在财产安全上存在重大隐患。

设计一种无线远程监控系统可以节省人力物力且安全可靠，而目标检测算法优劣关系到系统性能的好坏。

将准确、快速的目标检测算法应用于煤层气开采现场可以对目标闯入、火灾和机器倒塌等情况立即报警，通过第三代移动通信(3rd-Generation，3G)网络将包含异常情况的图片上传监控中心。

目前，静态场景下的目标检测算法有多种。

背景差分法(Background Subtraction，BS)［2］是一种广泛应用的前景分割方法，通过计算当前帧与背景图像之差来获
得前景区域，处理速度很快，但对复杂场景中干扰抑制能力不强，影响了准确度。

Friedman 等［3］和Colombari 等［4］认为背景模型是高斯模型(Gaussian Model，GM)，即把像素点背景模型看成是高斯分布，但现实场景包含多种噪声
且环境复杂，单一高斯模型不能够准确表示每个像素的背景模型，因此，Stauffer 等［5］提出了混合高斯模型(Gaussian Mixture Model，GMM)背景建模法，该模型下像素点背景模型由3 到5 个带有权重的高斯模型表示，对外界环境有一定
适应能力，但初始化时需假定模型参数，学习时间较长，计算量较大。

为此，Suhr 等［6］提出了改进GMM 算法，该算法采用Bayer 图像进行计算以提高算
法速度，但现实中的图像采集模块不一定都能把图像转换为Bayer图像，如果用
软件编程方式转换，也是很耗时的。

针对本文所述的实际环境，抽水机往复运动及风吹草动等动态环境影响，背景较为复杂，如图1 所示。

目标检测算法要能够排
除这些无关扰动，及时检测到运动目标、火灾和设备倒塌等情况。

Elgammal 等［7］提出的核密度估计(Kernel Density Estimation，KDE)背景建模法较为合适，因为它是基于样本驱动的无参数背景建模法，合理选取样本可以使像素点背景模型包含多种背景信息(如抽水机、远山、天空等)，在数据上由样本估计出的总体分布比假定成高斯或混合高斯分布要更具说服力。

但核密度法运算量大，实时性差［8］，因此本文提出了一种改进的核密度估计前景检测算法。

图1 煤层气开采现场
1 核密度估计算法回顾
核密度估计背景建模法，是用来解决未知背景模型无法准确表示的问题，它是一种无参数的背景建模方法。

一经提出便引起了许多学者兴趣。

算法的核心思想如下。

1)背景模型定义与初始化。

每个像素的背景模型由M 个样本组成，设BM，j(t)代表t 时刻像素j 处的背景模型，xi 代表背景模型中的样本点，i 的取值为1 到M，则BM，j(t)可以用集合来表示，即:
在初始化时，取前M 帧图像，以像素点j 处前M 帧图像像素值作为背景模型的样本值。

2)前景检测。

对当前待检测图像用Parzen 方法［9］计算每一个像素点的概率密度，并按照一定的阈值确定它属于背景点还是前景点。

Parzen 方法计算下一时刻t +1 观察到像素j 处的像素值为xt+1 的概率密度为:
其中:Kh 是窗宽为h 的核函数，M 为每个像素点背景模型的样本点数。

选取高斯
核函数，为了减少计算量，将彩色图像先转化成灰度图像，那么式(2)就可以简化为:
其中:xt+1，xi 分别为观察到的像素点灰度值和样本值，h 是对应灰度图像的窗宽。

若满足式(4)，则认为是前景点;否则为背景点。

其中Th 为全局阈值。

3)背景更新。

有盲目更新与选择性更新两种方式。

盲目更新会使运动目标参加到背景更新过程中，带来检测不准确的问题，而选择性更新可能使误检一直存在。

在更新方式上，采用先进先出(First In First Out，FIFO)方法，即新像素点加入到背景
模型中，同时剔除模型中最早时刻的样本。

由KDE 算法核心描述可以看出，这种方法充分考虑了先前时刻背景样本信息，可
以适应复杂的背景环境，尤其是对于本文中实际情况，抽水机往复运动干扰，运动轨迹上像素的背景模型可以包含抽水机在或不在此点处的信息，从而在下一刻区分前景时，不会将往复运动看成是运动前景。

2 算法改进
根据文献［7］可知，核密度算法运算量较大，所以很耗时。

为此文献［8］提出
了一种改进算法，运用递归的方式求取核密度估计以减少计算量和存储空间，这种方式化简式(3)时用泰勒展开，只保留了一次项，必然会降低精度。

实际上对每个像素点都经过核密度估计来区分前景是没有必要的，也是很耗时的。

文献［10］提出了基于背景差分核密度估计(Background Subtraction Kernel Density Estimation，BS-KDE)检测算法，很有实际意义。

非动态背景区完全可以由背景差分法来过滤，因为这部分场景变化较小。

对于动态背景区再由核密度估计来分割前景。

但是，背景差分法也会存在运动目标检测不完整的情况，而且它对核密度估计中窗宽选取和阈值确定没有进行深入研究，背景更新方式上较KDE 方法
也没有改进。

因此，本文采用两种背景模型来逐步分割前景，即每个像素点包含两个背景模型，
称为第一背景模型和第二背景模型，第一背景模型初始化为前M 样本点的像素均值，第二背景模型初始化如前所述。

背景差分法应用第一背景模型把图像分割成动态背景区域和非动态背景区域。

在这一步为了保证运动目标区域的完整性，需要放宽判断动态背景区域的条件，这里采用的是三帧差算法和背景差分法结合，条件取或判断动态背景区域。

通过这一步，能有效过滤非典型运动像素点，减少了计算量，同时，避免第二背景模型选择性更新由于误检带来的死锁。

设想如果单一核密度背景模型，把某点背景误检为前景，由于是选择更新，这点处背景模型不会改变，则该点会被一直认为是前景点。

但是本文采用了两个背景模型，第一背景模型通过背景差分就可以把该点判断为背景，使死锁解开。

核密度算法应用第二背景模型在动态背景区域分割前景。

在前景分割时采用一种动态阈值，该动态阈值是由总体概率密度函数求出的，有较高的准确度和自适应能力，在包含复杂信息的像素点(如抽水机运动轨迹上的像素点)处也能准确识别运动前景。

在背景更新时，第一背景模型采用渐进式更新策略［11］，第二背景模型更新采
用定时更新与实时更新结合策略，即正常情况每隔一段时间更新一次背景，若发现运动目标，则立即更新背景。

在替换背景模型样本时，用随机选择方法抽取样本，保证公平对待每个样本。

算法流程如图2 所示。

2.1 窗宽选择
窗宽表示单个样本在以自己中心的多大范围内对整体概率密度有贡献，选择合适的窗宽很重要［12］。

Elgammal 等［7］提出了一种经典的求取窗宽的方法，即根据相邻样本点像素值的绝对差中位数(Median Absolute Deviation，MAD)m 动
态求取窗宽。

用这种方法求取窗宽时需要对相邻样本点绝对差进行排序，显然是耗费时间的，而且没有充分利用每个样本点的贡献。

鉴于此，可以综合所有相邻样本点像素值绝对差，即以所有绝对差均值代替绝对差中位数，计算公式为:
其中:mi 表示第i 个样本与第i + 1 个样本像素值绝对差。

此外，还有另一种方法，以样本点的标准差作为窗宽的方法，即:
其中:μ 为样本均值，M 为样本点数。

这种方法的好处是不必排序，占用存储空间少，计算速度快，且综合了各个样本信息，有较高的准确度。

图2 算法流程
大多数情况下，像素点沿时间轴上的分布是正态分布，此时采用式(6)是窗宽的最
优估计。

如果像素沿时间轴分布不是正态分布，采用式(5)则适应性更强，因此，
本文综合了以上两种方法，在算法初始化阶段，将像素点进行数理统计上的偏度和峰度检验，判断是否符合高斯分布。

当像素点沿时间轴的分布不是高斯分布时采用式(5)计算;否则采用式(6)，这样增加了窗宽估计的准确性和鲁棒性。

2.2 前景目标检测
2.2.1 检测步骤
首先应用第一背景模型分割动态背景与非动态背景区域，这一步可以称为运动前景的粗提取。

设Di(t + 1)为t + 1时刻像素点i 当前帧与背景帧比较后的二值化像素值，则:
其中:
T 为由噪声决定的阈值，T1 代表三帧差法阈值。

Ii(t)代表t 时刻像素i 取值，B1，i(t)代表第一背景模型相应的像素值，则区分后，对于Di(t +1)为0 处的像素点设
为区域BC1，是非动态背景区域。

对于Di(t +1)为1 处的像素设为区域FC，是动态背景区域，这部分区域的确定是由背景差分和三帧差算法阈值条件取或决定的，如式(7)所示。

因为三帧差算法包含了帧间差别信息，能够消除运动目标的“重
影”，使运动目标轮廓清晰，也可以补充单纯采用背景差分时不全面的运动目标区域。

动态背景区域包含两种情况:1)由抽水机往复运动或者风吹草动产生的运动背
景设为区域BC2，此区域也应看作背景;2)前景运动目标设为区域FC'，这一区域
是要分割的运动前景，因此，对于Di(t +1)为1 的像素点要作进一步处理。

应用
核密度算法就可以将真正的运动前景区域FC' 分出来，这一步就是运动前景的精
提取。

对于动态背景区域FC 中的像素点由式(3)计算概率密度，得到概率密度后需要与
一定的阈值比较来区分前景点还是运动背景点，KDE 算法和BS-KDE 算法所选取
的阈值都是定阈值，即全局阈值。

这种方法对复杂环境的适应能力不强，易造成误检。

针对本文的实际干扰:抽水机的往复运动和风吹草动等，应该使用一种动态阈值来
检测前景点。

考虑到窗宽与样本变化范围有关，即样本变化范围越大(如抽水机运
动轨迹处的像素点，它们的样本变化范围较大)，窗宽越大，此时计算出的概率密
度偏小，所以阈值也应该取得小一些才不会造成误检。

可见，窗宽与阈值是成负相关的。

文献［13］提出了一种动态阈值求取方法，将阈值看作窗宽的反比例函数，如式(8)所示。

在实验对比中也给出了不错的效果。

其中，k 代表一个常量，可由实验测试选定，一般取0.005 左右。

这种方法较定阈值方法比较，分割的前景更为完整;但这种反比关系是靠经验选取的，因此本文寻
求在理论推导上求出准确的动态阈值。

2.2.2 动态阈值求取
假设像素点j 样本集BM，j(t)内包含M 个样本点，每个样本xi 以自身为中心，一个宽度范围内对总体分布作出一定的贡献。

离中心xi 越远，对总体分布贡献越小。

所以贡献可以看成是中间最大，两边越来越小的函数形式［13］。

由于时间轴上
两个相邻的样本点(xi，xi+1)通常来源于相同的局部分布，可以假设这个局部分布服从N(μ，σ2)［7］。

所以这个两边越来越小的函数，可以认为是高斯密度函数，其示意图如图3 所示。

图3 样本对总体分布贡献
像素点的模型分布可以看成是所有样本贡献的加权，这就是求取f(xt+1)时式(3)所代表的意义。

阈值Th 其实就是一个核密度的临界值，如果能从总体概率密度函数中找到这样一条直线Lth，如图3，它与密度函数交点值足够小，就可以将交点作为阈值，即图中xbegin 或xend 处的总体概率密度。

而xbegin或xend 可以用
如下方法求取:将M 个样本点按升序排序，可以认为图中x1 到xM 已经排序，其
中最小值为xmin，最大值为xmax，则:
其中:D代表常量，取2.5 左右，可以根据实际需要选择合适的值;h 表示窗宽。

之
所以这样做，是因为样本的贡献看成了高斯函数，所有样本的贡献有相同的窗宽h，即图中的贡献或称为函数是等大小的，只是中心不同。

若D取2.5，对于其中一个样本xi 贡献来说，如果观察值xt+1 与xi 的距离大于2.5h，则在xt+1 处该样本
对总体概率密度贡献微乎其微，已经小于0.006 2，参见标准正态分布表，即:
又由于对样本进行了排序，则xmin 或xmax 的贡献距离图中总体概率函数中心x = μ 是最远的，函数下降的形状也是与总体密度函数最接近的，将它们向外扩展2.5h 处对应的总体概率密度值，可以认为是足够小的阈值，这就是直线Lth 与总
体密度函数交点。

将xbegin 或xend 代入式(3)就求出了动态阈值Th。

注意，实
际中xbegin 或xend 的概率密度可能不相等，因为总体分布未知，但相差不会太大，本文将xend 代入式(3)，即:
2.3 背景更新
由于像素点包含两种背景模型，对应地也有两种背景更新。

第一背景模型可以及时跟随外界环境变化，消除外界物体进入背景后静止而成为背景而带来的误检，同理也能消除背景物体离开而带来的误检。

第一背景模型采用渐进更新策略，更新区域为非动态背景区域BC1。

第二背景模型采用选择性更新，更新区域为被核密度算法识别为背景的BC2，并在此基础上作了改进，采用定时更新与实时更新相结合策略。

2.3.1 非动态背景更新
这一区域的更新采用渐进式更新方式。

设B1，i(t)代表t时刻像素i 的第一背景模型，用计数器Ci(t)记录像素未发生变化的连续帧数:
其中Di(t)为像素i 背景差分后的二值化值。

设定一个计数器阈值CT 来对第一背景模型更新，可以用式(13)表示:
其中，α 为更新速率，当未发生连续变化的帧数Ci(t)达到阈值CT 时对第一背景模型更新，然后对计数器清零操作。

采用这种方法，在背景差分时就有很高的识别精度，也过滤了非动态背景区域，减少了计算量。

2.3.2 动态背景更新
经典核密度方法背景更新是实时进行的，这也是核密度算法耗时的一个原因。

实际上，第二背景模型在一段时间内变化并不大。

为了提高算法的实时性，本文提出定时更新与实时更新相结合的方法，即初始化开始后定时更新背景，定时间隔可以人为选定;发现运动目标后立即更新整幅图像背景。

实时更新可以弥补定时更新带来的背景模型滞后，设想定时间隔内背景发生反复突变，此时第一背景模型对干扰抑制急剧下降。

第二背景模型如果只是定时更新，则误检一直存在到下一更新时刻，
而实时更新作为补充就可以及时更新第二背景模型，从而消除误检。

在更新方式上，随机地从M 个样本点中抽取一个样本用新像素值代替它。

这种随机抽取的策略，公平对待了每个样本点，与先进先出方法相比，排除了主观因素和时间因素的干扰，因为背景模型在一段时间内变化不大，在时间轴上靠前的样本不一定就不符合背景模型了。

设Tg 代表计时器，Ts 代表第二背景模型更新时间间隔，Fp 代表检测到前景像素点数占整幅图像像素点总数的百分比，Fs 代表有运动前景的百分比阈值，则像素点i 处第二背景模型BM，i(t)更新可以由式(14)来表示:
其中，集合相交运算代表了随机选择策略，更新完成后计时器Tg 和前景百分比Fp 都清零。

3 实验结果对比
目标检测算法的优劣主要体现在准确性、鲁棒性和快速性几个方面［14］。

为验证改进算法效果，本文从准确性和快速性两个方面与经典核密度估计(KDE)算法和基于背景差分的核密度估计(BS-KDE)算法作比较，实验环境为DELL OPTIPLEX 780 主机，CPU 主频3.2 GHz，内存2 GB，编程平台Matlab 2009Ra。

所选取的视频有两段:一是中联煤层气公司山西地区开采现场视频，主要干扰是抽水机往复运动;二是来自标准视频HOUSE 的一段视频序列，主要干扰是风吹草动。

两段视频分辨率均为320 ×240，第一背景模型更新速率α 为0.1，背景差分阈值255 ×0.15，计数器阈值CT 为50;第二背景模型初始化M 取40。

3.1 准确性比较
准确性是指在外界干扰存在的情况下，目标检测算法能否抑制干扰，准确地检测到前景运动目标，同时，鲁棒性越好，对干扰的抑制能力也就越强。

本文选取的实验视频都具有一定外界干扰，背景环境较为复杂。

煤层气开采视频中背景情况抽水机
作往复运动。

为了精确地分割前景，根据实验情况，令式(9)中的D 为2.5，即xend = xmax +2.5h，然后代入式(3)求取动态阈值。

图4 给出了在抽水现场目标检测算法比较。

从测试结果可以看出KDE 算法对往复运动干扰抑制较差，这是由于在前景检测时使用固定阈值，且在背景更新时将前景信息也加入到了背景，影响了检测准确性。

而且KDE 算法包含样本较多，将当前
样本信息包含到背景模型并产生作用需要一段时间。

BS-KDE 算法和本文的算法效果较好，这是因为都是先经过了背景差分法的过滤，使得非动态背景区域没有进入到核密度检测阶段。

但是本文较之BS-KDE 算法运动目标区域更为完整，准确性更高，这是因为在背
景差分时结合了三帧差算法，有效填充了运动目标区域，使运动目标轮廓更为明显。

此外，在核密度分割前景时采取了更为准确的动态阈值分割前景，所选取的阈值是基于所有样本贡献的，即在总体概率密度函数上选取的，有很高的准确度，能适应不同像素点背景模型。

BSKDE 算法中应用的是全局阈值。

在背景更新上，本文的
实时更新可以尽快地更新第二背景模型，比BS-KDE 算法更快地适应背景环境。

图4 3 种算法的准确性比较(开采现场视频)
需要注意的是，式(9)中参数D 的选取会对运动目标的准确和完整产生影响，D 越大，阈值越小，对干扰抑制能力越强，但同时也可能使部分运动目标像素点被判断为背景，使得运动目标不完整，因此合适的D 值也影响了运动目标的完整性。

图5 的场景来自HOUSE 标准视频，背景中周围草木随风摆动幅度很大，前景运
动目标包括人和车子。

本文算法依然能准确检测运动目标，如前所述由于本文采用了较为准确的动态阈值，对噪声的抑制能力较KDE 算法和BS-KDE 算法要强。

图5 3 种算法的准确性比较(HOUSE 标准视频)
3.2 实时性比较
实时性也是检验一个算法好坏的重要指标，对于目标检测算法，当然要求越快越好。

在实时性方面，表1 给出了本文算法与KDE 算法和BS-KDE 算法处理当前帧所用时间的比较。

从表1 可以看出，KDE 算法对每一像素点都作了核密度估计，计算
量大，处理时间长，每帧的处理时间相差不大，是均匀的。

表1 3 种算法用时比较 ms视频帧序号 KDE 算法BS-KDE 算法本文算法煤层气开采现场视频(320 ×240)206 865 73 45 354 894 60 41 435 894 330 115 551 851 250 101 HOUSE标准视频(320 ×240)177 906 125 64 198 876 112 61 1 046 914 407 161 1 059 871 320 136
BS-KDE 算法和本文算法相比KDE 算法处理速度提高很多，但每帧处理时间差别
较大。

这是因为两种算法都经过了背景差分，只对动态背景区域FC 进行了核密度估计，每帧的处理时间与动态背景区域占整幅图像区域比例有关。

背景差分后的动态背景区域越大，则处理时间越长。

煤层气开采现场视频帧中，没有前景目标情况下(第206 帧和第354 帧)处理时间明显少于有目标情况(第435 帧和第551 帧);HOUSE视频帧中，运动目标小(第177 帧和第198 帧)比运动目标大(第1 046 帧和第1 059 帧)处理时间要少。

而本文算法对比BS-KDE 算法处理速度上又有所提高，这是因为采用了定时更新
与实时更新相结合的策略，定时间隔内只需计算核密度，节省了运算量;有前景目
标时，实时更新作为补充，也只会在有运动目标的几帧上增加运算量。

窗宽选择上综合了式(5)～(6)的优点，更新样本时用随机抽取代替先进先出，两者都减少了排
序所耗费的时间。

测试发现，统计两段视频前1 000 帧算法处理时间，在运动目标出现时耗时增加，而在没有运动目标情况耗时只是在20 ms左右。

经过计算，平均每帧耗时分别为50.23 ms 和54.85 ms，每秒能处理20 帧左右。

与前两种算法比较，平均耗时分别降低了94.18%和15.38%。

鉴于本文算法最终应用到无线视频监控系统中，由
于带宽限制所传输的图像为标清，每秒10 帧左右的处理速度就能够满足现场需要。

4 结语
本文提出了一种改进的KDE 目标检测算法，该算法采用两种背景模型，先用背景差分和三帧差算法区分出动态背景区域，再用KDE 分割前景。

这样可以有效过滤非动态背景区域，减少核密度估计计算量，也能避免核密度算法选择性更新误检带来的死锁，同时，提出了一种基于总体概率密度函数的动态阈值求取方法，使得目标识别准确度提高;第二背景更新上采用定时更新与实时更新结合方法，在替换样本时用随机抽取代替先进先出策略，在保证准确度的情况下提高了算法速度。

从现场视频和标准视频测试中可以看出，本文算法能够排除现场抽水机往复运动干扰和风吹草动等动态环境影响，并基本上满足标清视频的实时性要求，为下一步应用于视频监控系统打下了算法基础。

参考文献:
［1］ CUI L， SUN J， HU Z， et al. Coal bed methane extraction significance and theory analysis ［J］. Science and Technology Innovation Herald，2009(22):120 -120.(崔璐，孙娇鹏，胡忠亚，等.煤层气开采意义及原理分析［J］.科技创新导报，2009(22):120 -120.)
［2］ ARSENEAU S， COOPERSTOCK J R. Real-time image segmentation for action recognition ［C］// Proceedings of the 1999 IEEE Pacific Rim Conference on Communications， Computers and Signal Processing. Piscataway: IEEE，1999: 86 -89.
［3］ FRIEDMAN N， RUSSELL S. Image segmentation in video sequences: a probabilistic approach ［C］// Proceedings of the Thirteenth Conference on Uncertainty in Artificial Intelligence. Burlington: Morgan Kaufmann Publishers，1997: 175 -181.
［4］ COLOMBARI A， FUSIELLO A， MURINO V. Segmentation and。