基于深度学习的行人检测算法研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于深度学习的行人检测算法研究
近些年来,随着深度学习技术的不断发展,目标检测领域受到了越来越广泛
的关注。行人检测作为目标检测中的一个经典问题,在许多实际场景,如自动驾驶、监控、娱乐、机器人等中都具有十分重要的应用。
与一般目标检测不同,行人检测问题具有两个自身的特点,即小尺寸行人和
强负样本众多。根据这个现象,本文对候选区域提议网络(Region Proposal Network,RPN)进行改进,设计了一种新的一阶行人检测器。
针对小尺寸行人,(1)本文首先对RPN进行了稠密化的设计,使其在训练阶段对小目标进行更加有效学习;(2)本文提出像素级参考框的概念,并通过其对行人进行多粒度的特征表示,缓解了因手工设定参数而导致真值框被遗漏的问题;(3)本文设计了一种多尺度检测的网络结构,该结构几乎不需要额外的计算开销,并
且能够使检测器更好的进行感受野匹配,在训练时更集中于对小目标样本的学习。针对大量和行人相似的背景(即强负样本),(4)本文提出了一种负样本挖掘方法——批焦点损失,该方法使用样本选择对焦点损失进行改进,并对正负样本进行
不同的处理,可以在不增加漏检率的情况下有效的抑制负样本的产生。
和目前流行的基于二阶方法(第一阶段提出候选区域,第二阶段对候选区域
进行再分类)的行人检测器不同,本文在一个一阶的框架内对行人进行检测。通过分析行人检测问题的特点,本文综合上述改进方案,提出了一个统一的行人检测器,其在保持高效运行速度的同时取得了具有竞争力的表现:在Caltech-USA行
人检测数据集上,本文提出的检测器取得了 10.55%的平均漏检率,并且较表现相近的方法提升了2倍的运行速度。