基于Hough森林的多特征快速行人检测

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基于Hough森林的多特征快速行人检测
谷灵康;周鸣争
【摘要】为了快速检测行人，根据人体头顶特性快速找出头顶候选点，依此为基
点利用边缘检测算法提取目标轮廓，将其作为待测区域；然后利用改进的颜色自相似特征、结合区域边缘直方图和一致模式LBP26，1特征，在Hough森林分类器上进行分类检测。

实验结果表明，该算法在检测正确率及速率方面都得到了提高，对于复杂动态场景、遮挡现象以及目标自身形变具有较强的鲁棒性和较高的准确性，在多种行人数据集中测试取得良好的效果。

%In order to quickly detect pedestrians,we first rapidly found out the candidates of the top of the head according to the characteristics of human head tops,and according to this base point we extracted the object contour by using edge detection algorithm and took it as the area to be tested.Secondly,by using the improved colour self-similarity character and combining the region edge histogram and uniform pattern LBP26,1 characters,we conducted the classification and detection on Hough forest classifier.Experimental results showed that, the algorithm proposed in this paper gained the improvement in both the detection accuracy and speed,and had stronger robustness and higher accuracy against the cluttered dynamic background,occlusion and the deformation of the object itself.In many pedestrian datasets tests it achieved good results as well.
【期刊名称】《计算机应用与软件》
【年(卷),期】2016(033)006
【总页数】5页(P146-150)
【关键词】行人检测;像素点梯度方向;局部颜色自相似特征;区域边缘直方图;局部二值模式;Hough森林
【作者】谷灵康;周鸣争
【作者单位】安徽工程大学计算机与信息学院计算机应用技术重点实验室安徽芜湖241000;安徽工程大学计算机与信息学院计算机应用技术重点实验室安徽芜湖241000
【正文语种】中文
【中图分类】TP391.4
行人检测是智能视频监控、机器视觉、车辆辅助驾驶等应用的第一步，吸引了大批研究者，取得了一定的研究成果[1]。

但是由于行人的特殊性，场景的复杂多样性，若想取得又快又准的检测识别效果，还需要进一步的努力。

如果想快速检测行人，通常情况下是选用单一特征，这也是早期行人检测所采用的方法，但是检测效果不理想，不能有效检测行人。

为了准确检测行人，近年来很多研究者提出多特征融合的方法，这样固然能提高检测的准确性，但是需要花费大量的时间，不能满足行人检测对实时性的要求。

针对这些问题，本文根据人体特性提出一种快速且有效的行人检测方法。

因行人全身包含的信息很多，所以目前的行人检测方法大多是根据行人全身的特征来判断的，但对于复杂场景，特别是有身体遮挡的情况下，要想获得行人全身信息是不太可能的，但这种情况下，通常还能获取行人的头顶信息，本文依此头顶点为基点，利用边缘检测算子获取边缘轮廓，将其作为候选目标，然后利用改进的边缘方向直方图方法提取区域边缘直方图特征。

另外对于行人，身体颜色具有一定的自相似性，衣服颜色以及肤色的相似度很高，且头发的颜色和脸部的肤色不依赖于面部的细节特征，在表情变化、头部偏转等情况下仍能适用，具有相对的稳定性。

而且人体颜色有别于大多数背景物体的颜色，因此为了提高检测率对候选目标利用改进的颜色自相似算法进行特征提取。

为了提高检测准确性，仅提取颜色自相似特征还不够，考虑到纹理是反映目标表面色度和亮度变化模式的视觉特征，因此需要选择一种高效的纹理特征提取算法。

为了能够提高检测正确率而提取多种特征，但这样就增加了维度，从而影响检测速度。

这就要求选择学习速度快、分类能力强的分类器。

随机森林是一个包含多个决策树的分类器、优点是学习速度很快，缺点是存在过拟合[2]。

基于Hough森林的目标检测是近期提出的一种新方法，重点考察图像块与目标中心的位置关系，在叶节点处增加计算，输出成为在连续区域上的投票。

Hough森林是在随机森林框架上的一个扩展，继承了随机森林的优点并改进了其缺点[3]。

根据以上思路，本文算法流程如图1所示。

由于人的头顶是椭圆形，且经过计算发现头顶像素点的梯度方向值基本在90°左右[4]。

本文利用头顶像素点的梯度方向具有固定范围这一特性在前景中找出头顶候选点，根据该点快速确定人体轮廓域。

算法中像素点(x，y)的灰度值用H代替，G代表梯度幅值，α为梯度方向。

采用一维中心算子[-1，0，1]，可得到水平和垂直方向的梯度幅值分别为：
通过计算及实验测试，人体头顶像素点梯度的切线方向在90°左右，发型的不同对头顶的形状变化会有一定的影响，但是不大。

根据上述计算方法选取前景中梯度方向在规定范围内的像素点作为头顶候选点，然后依此点为基点，利用Prewitt检测算子提取边缘轮廓，且能去掉部分伪边缘，对噪声具有平滑作用。

边缘方向直方图(EOH)能较好体现图像的边缘和纹理特征，通过统计图像边缘像素
的方向分布来描述图像特征，其计算方法为：1) 对图像进行边缘算子运算；2) 计
算各边缘像素的梯度幅值和梯度方向，并判断梯度方向所隶属的直方图子区间；3) 统计隶属于直方图各子区间的所有边缘像素的梯度幅值和；4) 对所得的直方图各
子区间取值进行归一化得到最终的边缘方向直方图[5]。

由于传统直方图仅统计图像像素取值的频率分布，所以当两幅图像像素的频率相同时，其无法进行区分。

此时，虽然两幅图像像素取值的频率分布相同，但直方图各子区间对应区域的边缘分布是有差别的。

基于此，如果用各子区间的边缘复杂度来度量各区间构成的区域的分散程度，即可以得到一组度量灰度直方图各子区间内像素空间分布的数据。

利用该组数据对直方图的各子区间进行加权，便可得到一组新的直方图，由边缘复杂度得到的权值数据称为该直方图的空间权因子。

如图2所示。

设灰度直方图第k个子区间内所有像素构成的区域的边缘复杂度为φk。

将归一化后的数据记为(Ф1，…，Фk，…，Фn)，则其为一组体现像素空间分布复杂度的加
权直方图数据．对于其第k个子区间的数值Фk。

式(3)表明，Фk的大小只与该区间对应区域的边缘像素的总数К(Ek)有关，也即计算时只需要统计直方图各子区间对应区域的边缘像素的个数，因此该方法是一种基于区域边缘统计的图像特征描述方法。

区域边缘像素的引入反映了图像的结构信息，检测结果与EOH相比如下图所示，从另一个角度解释了区域边缘直方图具有更强的图像特征区分度的原因，能够对图像进行有效的区分。

人的身体颜色具有一定的自相似性，如:人体衣服颜色以及两臂颜色的相似度很高。

基于此，Walk等[6]提出一种颜色相似度特征CSSF(Color Self-Similarity Feature) ，用于行人检测，有效提高了检测精度，但其计算的是全局图像中每两
个块之间的相似性，计算量非常大，特征维数高，检测速度较慢。

文献[7]对CSSF
进行了改良，但该特征维度达到千万级，仍然较高，难以满足实际应用需要。

本文结合轮廓特征，提出改进的颜色自相似特征。

4.1 传统的颜色自相似特征
传统的颜色相似度特征基于矩形特征，对于矩形块R1，其内部数值和为:
CSSF特征可由相邻块R1和R2数值和的比值得到：
对于传统CSSF特征当两矩形块相距较远时，其光照情况可能相差较大，导致特征对非均匀光照敏感；而如果把矩形块之间的距离限定得太小，又会增加计算量，导致特征空间维度过高。

近些年有很多学者试图对CSSF进行改良，如文献[7-9]，
但特征维度仍然很高，势必会影响检测效率。

基于此，本文对颜色相似特征进一步改进。

4.2 改进的颜色自相似特征
为了降低特征维度又不至于导致对非均匀光照敏感，本文对矩形块的高宽比及块之间的距离进行约束。

对于分别以点(x1,y1)和(x2,y2)为左上角坐标的矩形块R1和R2，当其满足式(7)时，则计算这两个块之间的相似度。

由于有了候选区域去除了背景信息且对矩形块的高宽比及块之间的距离进行了约束，相比于文献[7]、文献[8]和文献[9]，去除了大量冗余信息，其特征空间进一步降低。

4.3 改进的旋转不变性LBP纹理特征提取
LBP特征[10]是由 Ojala等在1994年提出的一种高效的局部纹理特征提取算法。

LBP特征能够较好地反映像素点局部邻域的空间分布模式，且该特征具有计算速
度快的优点。

基本的LBP算子的计算公式为:
早期的LBP算法并不具有旋转不变性，2009年Salberg等[11]提出了一些具有旋转不变性的改进型 LBP 算法。

但由于计算的复杂度，对于实时目标检测效果并不
理想。

针对上述问题，文献[12]将形状数的概念引入到 LBP 特征描述方法中，改
进了LBP 特征提取算法。

本文在这些研究的基础上综合一致模式LBP，采用来提
取图像LBP特征,这样维度降低了,对检测速度的提高有很大帮助。

5.1 原理
Hough森林[13]，由一系列决策树h( x，θk) ，k =1，2，…组成，森林中的每
棵树都是由一系列的叶节点和非叶节点形成的，节点是由随机抽选的局部图像块来创建的。

Hough森林属于机器学习中的监督学习，通过训练，学会如何将局部的图像块特征与它们在Hough空间H⊆RH内的投票相映射：
5.2 收敛性研究
假设训练集{(x，y)}是由随机输入向量x和输出向量y分布所抽取出来的，那么对
于给定的k个分类器的集合{h1(x)，h2(x)，…，hk( x)}可以定义间隔函数为式(1)。

mg(x,y)=kavI(hk=y)-maxj≠ykavI(hk(x)=j)
用投票和概率平均(表达式如下)得到测试的预测类标签:
当森林中数目较大时，由树结构和大数定律导出随机向量趋向值如式(14):
Px,y(Pθ(h(x,θ)=y)=y-maxj≠yPθ(h(x,θ)=j)<0)
随机森林边缘函数:
决策树的分类强度s为:
设s≥0，根据Chebyshev不等式由式(15)、式(16) 得到泛化误差:
6.1 实验数据集
拍摄包含多种场所(教学楼、停车场、道路，等)、多种天气(晴天、雨天、雾天)等
复杂情况下的行人视频构成本文实验样本之一，该视频库部分场景背景如图4所示。

取部分视频制作成正样本(如图5所示)，共建正样本4600个，其中2600个
用来训练，2 000个用来验证,另外不含行人的背景图称为负样本。

为了验证本文所述算法检测效果的通用性，在目前常用的行人数据集[14]中，引入
2个国际上常用的数据集：INRIA行人数据集和NICTA行人数据集[15]。

其中INRIA行人数据集是目前使用较多的静态行人数据集，包含训练和测试两类，且每类均包含正样本和负样本。

训练集含有正样本614张(包含2416个行人)，负样本1218张；测试集含有正样本288张(包含1126个行人)，负样本453张。

NICTA行人数据集是目前规模较大的静态行人数据集，且已划分好训练集和测试集。

6.2 实验与结果分析
本文算法程序在Pentium(R) CPU 987双核1.5 GHz, 64位Windows 7系统，4 GB内存的计算机上运行。

对于行人样本图如图6所示。

按照本文算法流程(如图1所示)进行行人检测，如图7所示为实验中部分行人检测示意图。

由于目前分类算法主要还是基于SVM和AdaBoost的，基于随机森林和Hough 森林的检测是近期提出的新方法，故为了验证本文算法将其与文献[2]、文献[7]、文献[16]和文献[17]、文献[18]所述方法分别在自建数据集、INRIA、NICTA数据集上实验后比较，实验检测率如图8所示。

由图8可知，不同算法在各类行人数据集中的检测效果相差较小。

通过实验可知本文所提算法平均检测正确率(在三类数据集中正确检测出的人体占整个视频中人体的识别率)为99.07%；文献[2]所述算法HOG+LBP+LAB+Houghforest平均检测率为96.72%；文献[7]所述算法CSSF+AdaBoost平均检测率为98.16%；文献[16]所述算法HOG+Harr+SVM平均检测正确率为98.0%；文献[17]所述算法HOG+IKSVM平均检测正确率为97.65%；文献[18]所述算法Randomforest+SVM平均检测率为96.17%。

在这几类算法中，本文所述算法的检测率较高，综合这几种算法在不同数据集的检测率，进一步分析它们的误检率与漏检率，实验结果如图9所示。

在检测速率(对人体识别的平均速率)上，各算法也有较明显的差别，如表1所示。

文献[2]所述算法HOG+LBP+LAB+Houghforest平均检测速率较慢；文献[16]所述算法HOG+Harr+SVM平均检测正确率较高，误检率也较低，但是检测的速率相对较慢；文献[17]所述算法HOG+IKSVM平均检测正确率相对较低，但是速率较快；文献[7]所述算法CSSF+AdaBoost，由于特征空间仍为千万级，所以检测
速率上也较慢；文献[18]所述算法Random forest +SVM检测速率较快；而本文所述算法，花费时间相对较少。

综上所述，文献[16]由于采用HOG和Haar两种特征描述，所以有较高的识别率，不足的是加入了Haar特征的计算和分类使得耗时过长；文献[17]基于HOG特征，改进了SVM，采用的是IKSVM分类方法，分类速率大大提高，但是识别率不是
很理想；文献[18]先采取随机森林的分类算法，快速地消除图像中的背景，再通过SVM进行检测，速率得到了大幅提高，但是在识别精度上不高。

文献[7]采用的是AdaBoost方法，虽然对CSSF进行了改进，但特征空间仍为千万级，所以检测速率上较慢；文献[9]在文献[7]的基础上对颜色自相似特征进行了改进，也是采用AdaBoost进行分类，但检测的是全局图像，效率也较慢；由于是提取颜色自相似和HOG特征，然后采用SVM进行分类，所以文献[8]检测精度较高，但运行速度较慢。

本文算法由于先提取头顶点为基点，有了候选区域，快速地消除了背景信息，缩小了检测范围，然后利用改进的颜色自相似特征结合区域边缘直方图和，在Hough森林分类器上进行分类检测，在检测正确率及速率方面都得到了提高。

另外，文献[2]也是基于Hough森林的，但由于其提取的是传统的多种特征HOG、LBP和LAB，影响了检测的实时性，精度上也不太理想。

综合考量，本文算法在
行人检测中克服了遮挡带来的弊端，提高了识别精度，同时速率也得到了提高，不会出现过度拟合的问题，满足了行人检测对精度和实时性的要求，在大规模数据、高维特征、不平衡数据集和缺失数据集上也有很好的运行效果，有很好的实用价值。

本文根据人体头顶特性先提取头顶点为基点，确定候选区域，消除了背景信息，缩小了检测范围，然后利用改进的颜色自相似特征结合区域边缘直方图和，在Hough森林分类器上进行分类检测，在检测正确率及速率方面都得到了提高。

实验表明，本文方法相比于常见的行人检测算法，其检测精度明显提高，同时又提高了实时性，使得行人检测系统的总体性能有较大提升。

本文算法克服了遮挡情况下人体特征提取错误的弊端，且不会出现过度拟合的问题，在大规模数据、高维特征、不平衡数据集和缺失数据集上也有很好的运行效果，有很好的实用价值。

但由于行人场景的多样性，比如夜晚光线不好，检测效果不理想，这样就需要引入其他检测方法；诸如此类情况将作为下一步的主要研究方向，以期进一步提高行人检测的性能。