基于YOLOv3的人流量检测方法的研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4 实验测试
4.1 测试环境
测试环境的软硬件配置情况见表 2,所有训练测试
均在该环境下进行。
4.2 训练数据集
图 5 不同迭代次数的准确率 P
训练的数据集主要从咖啡厅、十字路口以及学校等 符合本次训练的需求。
公共场所进行采集。这些数据集都拥有不同的人流密
训练采用的初始模型参数设置如下:学习率为 0.001;
能力更强,更易于网络学习的特点,其核心思想是把空间
中的 K 个点作为几何中心,对与最接近的点进行归类,
不停地更新和迭代这 K 个点的值,直到抵达迭代次数
或 K 个值不再变化为止。COCO 数据集中的行人是全身
的“类长方形”框与本文收集的行人头部数据集多为“类
正方形”的候选框类型不同,因此需要对行人头部数据集
值。根据上述的人流量风险评估值(Prisk),用不同的颜色
- 33 -
众创空间
科技创新与应用 Technology Innovation and Application
2021 年 19 期
表 1 预警模型
预警等级
预警说明
人流量风险评估值
绿色(自由人流) 人流量较少,人均活动空间较大,行走自由
≤0.6
众创空间
科技创新与应用 Technology Innovation and Application
2021 年 19 期
基于 YOLOv3 的人流量检测方法的研究 *
徐天宇,曾丽君,魏 丽
(南京航空航天大学金城学院 信息工程学院,江苏 南京 211156)
摘 要:近几年,踩踏事故频繁发生且造成灾难性的结果,给社会带来了巨大损失,在商业、交通管制及公共安全领域等方
目标特征提取的识别效果由卷积神经网络的卷积层 数和网络结构的深浅所决定,为了对密集人流量时进行
籽=
N S
伊P,
(2)
其中,籽 为人流量密度;N 为单位面积上的行人;S 为单位
面积;P 为 YOLOv3 目标检测的准确率。
3.2 人流量风险评估和预警
人流量密度的风险值不仅和行人的行进方向、速度有
关,且被行人所处环境(如人行道、辅路等)因素影响。因
(4)
- 34 -
图 4 几种测试场景代表图像
2021 年 19 期
科技创新与应用 Technology Innovation and Application
众创空间
式(4)中,P 为准确率,Dtec 为行人头部数量的预测值,Re原
al 为当前行人的真实值。
接近,候选框的参数会根据迭代次数的增加而不断变化。 同时维持较小的计算量,改进后 YOLOv3 的网络结构见
本次改进 YOLOv3 的目的是为了实现针对密集人流量时 图 3。
进行行人头部的检测,通过深度卷积神经网络对收集的
样本来学习行人头部的特征。K-means[9]作为聚类算法的
一种,与 Faster R-CNN 相比具有主观性更弱,模型表达
对人流量密度进行分析的检测方法。
关键词:行人检测;人流量预警;计算机视觉;YOLOv3
中图分类号: TP391.4
文献标志码院A
文章编号院2095-2945渊2021冤19-0032-05
Abstract院 In recent years, stampede accidents have been frequent and disastrous, causing great damage to society, and the demand for traffic detection statistics and early warning in the areas of commerce, traffic control and public safety is increasing. At present, most methods of pedestrian volume statistics are designed to count the pedestrian volume through the gates, swiping cards and infrared sensing devices at the entrance of each place. The gate is only suitable for the statistics of the total person flow in closed places. It has the disadvantage that it is impossible to calculate the density of pedestrian volume in an open area alone. In view of this situation, this paper puts forward a detection method which uses the camera to collect the relevant data of pedestrian volume, processes the information of pedestrian volume through YOLOv3 computer vision technology at the edge, and analyzes the density of pedestrian volume.
度学习的人流量检测方法,是使用神经网络通过对行人 框的中心目标(x,y),候选框的宽度(w,h)以及目标类型
头部的数据集样本进行深度学习,实现对头部目标的实 C。通过卷积层提取特征如图 1 所示。
时追踪检测,来达到实时统计人流量的目的。
2 改进 YOLOv3
1 YOLOv3 检测原理
2.1 针对高密度检测目标重聚类
YOLOv3[3]是一种基于 DarkNet-53[4]深度学习框架的
YOLOv3 采用了 Faster R-CNN 中的先验框思想,其
由端到端的目标检测算法项目,其本质上是实现了回归 目标检测的准确度受到 anchor 的数量和宽高比影响,在
* 基金项目院江苏省高等学校大学生创新创业训练计划项目渊编号院201913655016Y冤 作者简介院徐天宇(1999-),男,本科,研究方向:软件工程,图像处理;曾丽君(1982-),女,硕士,讲师,研究方向:软件工程,软件无线电;魏丽 (1982-),女,硕士,讲师,研究方向:软件无线电,图像处理。
度、图像背景以及拍摄角度等。本次总共采集到 15120 batch为64;subdivisions 为64;max_ batches 为50000;decay
张不同的人流量密度图片作为数据集,其中训练集 15120 张图片,验证 1000 张图片。此外,将 100 张图片 作为测试数据集以便对训练结果进行测试,所有标注均 为人工标注。本次采集的数据集示例见图 4,所采集的 图片均为公共场所,路人行走姿态多样、周围环境复杂、 衣着打扮各不相同,还可能被帽子雨伞之类物品遮挡,
为 0.0005,最后通过 50000 次迭代后网络收敛。
本文在训练过程中,分别在数据集上取 5000 次、100
00 次、20000 次、30000 次、40000 次迭代训练时的结果,
其结果如图 5。
图 5 中,准确率 P 的计算公式为:
蓸 蔀 P=
1-
|Dtec-Real| Real
伊100%,
公共场所普遍装有监控摄像头,无需部署新设备;二是监 并行运算能够得到充分发挥的特点让 YOLOv3 的快速检
控面积,广角镜头可以实时监测并统计任意一片区域内的 测非常适合这种需要实时检测视频帧的项目。YOLOv3
人流量;三是可以最大程度避免干扰当前行人活动。
较之于前两代的 Yolo 有了非常大的提升,尤其是在小目
需求,且精度不高。伴随着近几年深度学习的突飞猛进, 同。首先将原始图片缩放到 416伊416 的大小并分为 S伊S
通过神经卷积网络实现多目标追踪检测,极大程度提高 个等大的单元格,每个单元格会有 3 个 anchor box[8]来预
了目标检测精度且满足视频监控的实时性需求。基于深 测 3 个 bounding box,预测框包含 3 个信息:目标在候选
面对人流量检测统计以及预警的需求日益增加。目前,大多数人流量统计的方法是通过各场所入口处的闸机、刷卡以及红外线
感应装置对人流量进行统计,闸机仅适用于封闭场所总人流量的统计,具有无法单独计算某块开放区域的人流量密度的缺点。
针对这种情况,文章提出一种使用摄像头采集人流量的相关数据,在边缘端通过 YOLOv3 计算机视觉技术处理人流量信息,并
网络层次,这样也就带来了不能提取出高层次语义特征 的问题,从而导致候选框和分类精度降低。为解决这个问
输入图像
图 1 YOLOv3 算法检测流程图
输出图像
题,本文将主干网络替换为 MobileNet[10]网络,采用 13*13、 26*26 的分辨率探测网络作为嫁接网络,使用两个不同尺
模型训练的过程中,为了让候选框与真实框的参数更加 度的 yolo 输出层,这样可以在增加网络层数保证精度的
目前,通过计算机视觉技术进行目标检测有很多种 标检测上,与 R-CNN[5]相比快 1000 倍左右,与 Faster R-
方法,比如早期传统的 HOG+SVM[1]分类器方法,再有利 CNN[6]相比快近 100 倍。使用 YOLOv3 算法进行人检测
用 KCF[2]实现多目标跟踪,这两种方法无法满足实时性的 时,与之前拥有较高准确率的 SSD[7]算法的检测有些不
- 32 -
2021 年 19 期
科技创新与应用 Technology Innovation and Application
众创空间
头部检测,需要让检测网络获得更多的小目标特征,同时
考虑到边缘端的硬件条件较为有限,本文对 YOLOv3 的
网络结构进行改进。为了提高检测速度,势必要减少主干
1.调整图像大小 2.运行卷积网络 3.NMS非极大值抑制
黄色(受约束人流) 人流量较多,人均活动空间较小,顺着人流方向行走自由,逆着人流方向行走较为困难
0.6~0.75
橙色(密集人流) 人流量多,人均活动空间受限,顺着人流方向行走速度缓慢,逆着人流方向行走很困难
0.75~2.0
红色(堵塞人流) 人流量很多,无活动空间,顺着人流方向行走困难,无法逆着人流方向行走
重新分析 K-means 聚类,得到最适合密集人流行人头部
数据集的 anchor 数量和宽高比。K-means 维度聚类方法
图 3 改进的 YOLOv3 算法流量统计原理
d(cos,centroid)=1-IOU(box,centroid) 。
(1) 3.1 人流量密度
Keywords: pedestrian detection; pedestrian volume early warning; computer vision; YOLOv3
面对错综复杂的人流量场景,近几年通过计算机视觉 的深度卷积神经网络。由于 DarkNet-53 是用 C 语言和
技术来处理和分析人流量的方法日益增多,其优势之一是 CUDA 的底层编写,所以其速度快,多核处理器以及 GPU
此,进行人流量风险评估时需要根据当前监控区域划分不
同场景,如楼梯、广场、会场等。根据不同的场景分配不同
的权重,最后获得一个人流量风险评估值,为决策层的判
断提供依据。人流量风险评估值(Prisk)用式(3)表示。
Prisk=籽伊weight,
(3)
式 (3) 中:籽 为人流量密度;weight 为不同场景下的权重
行人头部数据集聚类分析的目标函数变化曲线见图 2。
通过人流量密度能直观反映出一片区域的拥挤程
度,它是估算发生事故几率的重要指标,用式(2)表示。
图 2 目标函数变化曲线
由图 2 所示的变化曲线可知,K 值大于 7 时目标函 数趋于平缓,因此选择 K=7,即 anchor 个数为 7。 2.2 改进网络结构
≥2.0
表 2 实验平台软硬件配置
名称
相关配置
操作系统 CPU GPU
GPU 加速库 内存
深度学习框架
Windows 10 Intel(R)Core(R)i5-3470@3.20GHz
NVIDIA GTX 960 2G CUDA 9.1,CUDNN 7.1
12G Darknet
将预警级别[11]分成 4 种,见表 1。
相关文档
最新文档