基于YOLO_v3的车辆和行人检测方法
基于YOLOv3的自动驾驶中运动目标检测
3D目标检测是一种能够提供目标物体在三维空间中的位置、姿态、速度等信 息的检测技术。相比传统的2D图像目标检测,3D目标检测能够更好地适应复杂的 环境,提供更准确的目标信息。在自动驾驶中,3D目标检测通常包括以下任务: 目标检测、目标跟踪、分类识别、定位和建图等。
三、自动驾驶3D目标检测方法
1、基于激光雷达的方法:激光雷达通过发射激光束并测量反射时间,可以 获取周围环境的的三维信息。基于激光雷达的方法通常采用点云数据作为输入, 通过滤波、降采样等技术预处理数据,然后采用各种算法进行目标检测、跟踪和 分类。
(2)深度学习技术的创新:深度学习技术在自动驾驶3D目标检测中发挥着重 要作用。未来的研究将进一步探索新的深度学习技术和网络结构,以提高目标检 测的性能和效率。
(3)高精度地图和定位:高精度地图和定位是自动驾驶3D目标检测的重要支 持技术。未来的研究将进一步探索如何实现高精度地图的制作和更新,以及如何 提高定位的准确性和鲁棒性。
3、基于YOLOv3的运动目标检测
基于YOLOv3的运动目标检测通常包括以下步骤:
(1)视频预处理:首先,需要对输入的视频序列进行预处理,包括对图像 进行缩放、裁剪等操作,以便于网络进行高效的特征提取。此外,还可以采用双 线性插值等方法对视频序列进行高斯平滑处理,以减少噪声对检测结果的影响。
(2)特征提取:利用YOLOv3的主干网络(Darknet)对输入的视频帧进行特 征提取。在特征提取过程中,网络会学习到图像中的各种特征,包括颜色、形状、 纹理等。这些特征对于后续的目标检测和分类非常重要。
1、YOLOv3算法简介
YOLOv3是一种高效的实时目标检测算法,它将目标检测和分类任务合并为一 个单独的步骤,从而加快了检测速度。相比于其前身YOLOv1和YOLOv2,YOLOv3 在准确性和速度上都有了显著的提高。YOLOv3使用了一种称为Darknet的深度卷 积神经网络作为其主干网络,并采用多尺度特征融合技术来提高对不同大小目标 的检测性能。此外,YOLOv3还引入了批量归一化(Batch Normalization)和 Leaky ReLU激活函数来减轻过拟合并提高网络的学习能力。
基于YOLOv3算法的遮挡场景下行人检测
摘要随着人工智能和计算机硬件的发展,行人检测技术被应用于自动驾驶、智能视频监控、智能机器人等领域。
其中基于卷积神经网络的目标检测算法YOLOv3具有检测实时性较好、检测准确度较高等优点,被广泛应用于行人检测领域。
但是依旧存在密集场景下行人互相遮挡导致YOLOv3难以准确检测出被遮挡的行人,以及行人被物体遮挡导致YOLOv3难以准确提取行人全身特征从而出现漏检的问题。
针对行人间互相遮挡导致YOLOv3难以准确检测出被遮挡的行人的问题,本文提出基于边框排斥损失函数以及改进非极大值抑制(Non-Maximum Suppression,NMS)的YOLOv3行人检测算法。
一、在训练过程中,YOLOv3使用边框定位损失函数计算行人先验预测框与标记框之间的定位误差,在回归过程中修正误差,使得YOLOv3能够准确定位行人。
但是当行人互相遮挡时,行人先验预测框与标记框互相重叠导致算法将两个互相遮挡的行人判定为单行人,影响边框定位损失函数,从而使得网络无法准确识别出互相遮挡的行人。
为此,本文加入一组损失函数代表目标行人与邻近行人之间的误差,在训练过程中减小邻近行人对目标行人的影响,使得网络能够准确识别出互相遮挡的行人。
二、在密集场景下的行人检测中,当行人互相遮挡时,置信度得分较低的行人先验预测框会被NMS判定为虚假行人预测框,从而造成漏检现象。
基于此,本文使用线性函数改进NMS中的置信度得分函数,使用权值来衰减邻近先验预测框的置信度得分,将置信度得分相对较高的行人预测框保留在NMS的循环列表中,从而减少漏检现象。
除去行人间互相遮挡,在行人检测中存在大量的行人被物体遮挡,导致YOLOv3难以提取行人全身特征从而造成行人被漏检。
基于此,本文在YOLOv3主干网络后加入一个预测网络分支用于检测在实际场景中难以被遮挡的头肩部位,利用头肩预测结果增强行人全身预测结果的鲁棒性,提高行人被物体遮挡下的检测准确度。
同时由于YOLOv3的多尺度检测能力不足加大了行人被物体遮挡场景下的检测困难度,因此本文通过加深YOLOv3的主干网络、增加特征输出网络的层级、增加锚框尺度的多样性的方法来强化网络对不同距离下被遮挡行人的检测能力,提高算法的多尺度检测能力。
基于YOLOv3的改进行人检测算法研究
260
南京理工大学学报
第45卷第3期
to make up for the randomn^s of K-means algorithm in selecting the center point. For the feature extraction%the structure of the convolution neural network( CNN) Darknet-53 is improved so that it can extract more feature information related to pedestwan scole. The tarad location part of the loss Onction is improved i a loss function which is more consistent witli the pedeslrmn body characteOstics. The modd is trained by the 11 peson" subset in MSCOCO training set%and Uic*person + subset of MSCOCO tesS sd and a self-made pedestrian ddta sd are used as test sets So verify the model. The resuOs show that compared with the generai iarael detection algorithm of YOLOv3 % the ioproved algorithm is more convenienio extract pedestrian characteristics and provides effective feedback, and
基于YOLOv3的道路车辆检测算法研究
科技与创新┃Science and Technology&Innovation ·62·2023年第01期文章编号:2095-6835(2023)01-0062-03基于YOLOv3的道路车辆检测算法研究*张绪德,李康(凯里学院,贵州黔东南苗族侗族自治州556011)摘要:在城市道路中路况变得更加复杂情况下,进行道路目标车辆检测是进行交通信号灯规划的基础,在进行车辆检测中存在小尺寸车辆、车辆间相互遮挡的情况,经综合考虑,选用YOLOv3目标检测算法对道路目标车辆进行检测。
YOLOv3的网络架构采用Darknet-53,用UA-DETRAC数据集进行模型训练,并根据LOSS函数和mAP值进行参数优化。
通过实验结果*******为95.6%,能够有效对道路目标车辆进行检测。
关键词:YOLOv3;目标检测;LOSS函数;mAP中图分类号:TP391.4文献标志码:A DOI:10.15913/ki.kjycx.2023.01.017随着人工智能科学的不断发展,智能交通逐渐走进大众的视野中,汽车作为人们日常出行的主要交通工具,自动驾驶将陆续应用于汽车中,对车辆进行实时的目标检测是自动驾驶系统中非常重要的内容。
在研究中对道路车辆的检测可以分为基于深度学习的目标检测算法和基于人工特征的目标检测算法,其中基于人工的检测算法首先需要从图像中提取出特征,然后将提取出来的特征进行分类利用机器学习的方法进行训练[1]。
随着计算机硬件的发展和CNN网络成熟,基于深度学习的目标检测算法在实时性和准确性方面显现出优势,成为计算机视觉领域的研究热点。
根据是否预生成候选框,基于深度学习的目标检测算法分为Two-stage目标检测算法和One-stage目标检测算法[2]。
Two-stage算法精度较高,速度较慢[3-4],如Faster R-CNN[5]算法;One-stage算法速度更快,精度会有所损失,如YOLO[6]系列算法、SSD[7]算法等。
基于YOLOv3算法的交通事故检测
现代电子技术Modern Electronics Technique2022年4月1日第45卷第7期Apr.2022Vol.45No.70引言随着人们生活水平的不断提高,越来越多的人喜欢乘车出行,乘车出行给人们带来了诸多便利,但是也造成了交通拥堵,并且交通事故每天都在上演。
据统计,每年有近上百万人在交通事故中失去生命,交通事故无疑正在严重威胁着人们的生命安全。
车辆碰撞是引起交通事故的一个重要因素。
近年来,人们试图利用计算机视觉进行车辆碰撞事故检测,即在不需要人为监控的情况下及时提供急救服务。
文献[1]提出了一种利用高斯混合模型[2]检测车辆,然后利用均值漂移算法[3]对检测到的车辆进行跟踪的方法来检测交通事故。
此方法能够很好地对交通事故进行检测,而且不需要人工标注数据,具有检测速度快的优点,具有很高的实际应用价值。
但是高斯混合模型难以对车辆进行准确的检测,这样就会导致整个算法对事故的检测效果不佳。
为了克服这个缺点,本文采用经过剪枝的YOLOv3[4]算法对车辆进行检测。
为了更好地检测车辆碰撞事故,本文采用深度学习模型检测车辆,然后对检测到的车辆进行跟踪,通过跟踪能够提取车辆的有关参数,根据提取到的参数可以识别车辆碰撞事故。
基于YOLOv3算法的交通事故检测吴兰1,赵自广1,文成林2(1.河南工业大学,河南郑州450000;2.广东石油化工学院,广东茂名525000)摘要:针对深度学习算法虽然能够很好地对车辆进行检测,但网络结构复杂,存在大量冗余,导致检测速度非常缓慢的问题,提出基于缩放因子对网络结构进行剪枝。
首先,训练网络通道的稀疏性,以便更容易筛选出重要的通道。
在训练网络权值时,将L 1范数应用于缩放因子和网络偏置,具有较小参数值的结构受到惩罚;其次,对网络结构中的缩放因子进行排序,并根据比例对缩放因子较小的结构进行修剪;最后,将修剪结构的偏置转移到后续层,以保持精度。
对于车辆数据,经过训练和测试,修剪后的模型在精度几乎保持不变的情况下,每秒千兆浮点运算(GFLOPS )从33.2下降到8.1,参数量从62M 下降到6.8M 。
基于YOLO-V3的交通目标检测算法研究
基于YOLO-V3的交通目标检测算法研究基于YOLO-V3的交通目标检测算法研究摘要:随着城市化进程的加速,交通问题日益凸显。
因此,交通目标检测在城市交通管理中具有重要意义。
本文针对当前交通目标检测算法对多样化场景、不同天气条件下的准确率较低的问题,提出了一种基于YOLO-V3的交通目标检测算法。
通过对交通场景下不同目标的特点分析,从图像分辨率、滑动窗口、输入特征图数量等方面进行了优化,提高了算法的准确率和鲁棒性。
实验结果表明,在多样化场景、不同天气条件下,本文的算法准确率可达90%以上,相比当前常用的算法有明显的提高。
关键词:交通目标检测;YOLO-V3;场景多样化;鲁棒性;准确率一、引言随着城市人口数量的增加,交通问题日趋凸显。
如何科学合理地管理城市交通成为了摆在城市管理者面前的难题。
而一种有效的交通管理方法,是实现对城市交通的实时监控。
为了保证城市交通在高效有序的状态下运行,交通目标检测技术在交通监控系统中得到了广泛的应用。
目前,基于卷积神经网络(CNN)的交通目标检测算法取得了很好的效果。
但是,当前算法在多样化场景、不同天气条件下的准确率还有待提高。
因此,本文针对这一问题,提出了一种基于YOLO-V3的交通目标检测算法。
二、研究方法本文通过对交通场景下不同目标的特点分析,确定交通目标的类别,以及分析交通场景下的特征,实现对目标的快速检测。
采用YOLO-V3算法,并进行了一定的优化,提高了算法的准确率和鲁棒性。
主要优化如下:1.增加图像分辨率:对于交通目标图像,图像分辨率会影响检测算法的精度。
一般来说,图像分辨率越高,检测算法的精度越高。
因此,在本文算法中,增加图像分辨率,提高了算法的准确率。
2.滑动窗口:传统的滑动窗口方法可能会漏检甚至重复检测,降低检测算法的效率。
因此,本文采用了基于聚类的滑动窗口方法,有效地提高了算法的检测速度和准确率。
3.增加输入特征图数量:增加输入特征图数量,有效促进了算法的特征提取过程,提高了算法的准确率和稳定性。
基于yolov3的智能车辆实时行人检测
基于yolov3的智能车辆实时行人检测发布时间:2021-01-18T06:00:12.735Z 来源:《中国科技人才》2020年第23期作者:贾礼泽[导读] 智能车辆作为智能交通系统中的重要组成部分,能够提高驾驶的安全性,大幅改善公路交通效率。
智能车辆行人检测领域的技术突破势必是无人汽车发展前进一步的关键影响因素。
大连海事大学摘要:智能车辆作为智能交通系统中的重要组成部分,能够提高驾驶的安全性,大幅改善公路交通效率。
智能车辆行人检测领域的技术突破势必是无人汽车发展前进一步的关键影响因素。
本文旨在通过yolo目标检测算法对智能驾驶算法中的行人检测部分进行优化,针对行人检测算法的高精度识别以及高检测速度进行进一步的改善和创新,使得行人检测算法在现实应用中有更加良好的表现。
对于行人检测问题,首先将各种目标检测算法结合行人检测实际应用环境进行分析,说明了yolo v3算法在目标检测特别是行人检测过程中的优势,同时对于原始算法进行研究,更改原始coco类别将其设置为只显示行人这一类别的效果进行了分析;然后,为了提高网络在行人检测中的泛化能力和准确率,利用INRIA和Caltech Pedestrian Detection融合的数据集进行网络训练,使算法性能和效果得到进一步的提升;为了使预测框更加接近于真实情境,本文采用K-means的方法聚类出更符合行人体态宽高特征的anchor box,结果表明,运用处理后的anchor box得到的预测框更加的精准。
从实验结果可以看出,在行人检测中使用yolo v3算法,大大提升了检测速度,通过本文提出的方法对于yolo v3的算法流程进行的优化,在一定程度上提升了结果的精确度和泛化性。
关键词:Yolo v3;K-means;行人检测;智能车辆1.yolo v3网络模型1.1基本思想Yolo算法是一种采用一个卷积神经网络实现的端到端的目标检测。
在该算法中,输入的图像只需要经过一次卷积神经网络就可以实现目标检测。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于YOLO_v3的车辆和行人检测方法作者:洪松高定国三排才让
来源:《电脑知识与技术》2020年第08期
摘要:在新时代背景下,智慧交通的概念已经出现在人们的生活中。
检测车辆和行人已经成为目标检测领域比较热门的应用研究方向。
该文将YOLO_v3目标检测算法应用于车辆和行人的检测。
针对行人和车辆检测问题,将分类器的输出张量维度设置为21维。
实验结果表明,训练出的模型在测试集上的平均检测精度约为89%。
其中,车輛的检测精度约为95.64%.行人的检测精度约为82.55%。
关键词:智慧交通;目标检测;车辆;行人
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2020)08-0192-02
开放科学(资源服务)标识码(OSID):
1 概述
随着城市的发展,城市交通流和人流密度成为城市道路交通拥挤的重要原因。
针对这一问题,智慧交通的概念出现在人们的认知中,也因此提出了新时代智慧交通的发展应强化前沿科技应用与研发的观点[1]。
在此背景下,车辆和行人检测成为当下的研究热门。
近年来计算机视觉领域发展迅猛,基于深度学习的目标检测技术层出不穷。
当前的目标检测技术主要分为两大类,一是以Fast R-CNN和Faster R-CNN为代表的基于区域生成的两阶段检测算法;二是以
YOLO和SSD为代表的基于回归的单阶段检测算法[2]。
两阶段的检测算法通常具有较高的检测精度,但检测速度较慢,而单阶段检测算法在牺牲了一定检测精度的基础上提高了检测速度。
目前YOLO系列检测算法已经在工程中的各个领域中都有广泛的应用。
其中,在航空航天领域,钮赛赛[3]等人将YOLO智能网络算法用于红外弱小多目标的检测,将其与传统的模板匹配方法相比,在检测概率和检测精度上YOLO具有明显的优势。
在交通领域,周慧娟[4]等人提出了基于改进Tiny YOL02的地铁进站客流人脸检测方法,测试结果表明基于改进的TinyYOL02的人脸检测算法相比于原始的检测算法在召回率和检测速度上都有提升且有较好的泛化性。
在农业领域,燕红文[5]等人提出了基于改进Tiny-YOLO模型的群养生猪脸部姿态检测算法,实验表明该模型可以有效地对群养生猪不同类别脸部姿态进行检测。
在教育领域,黄伟铠[6]等人设计了一种基于YOLO算法的学生课堂关注度分析系统,该系统能有效检测课堂中学生的行为,为分析学生的课堂关注度提供了一种有利的手段。
由此可见,YOLO系列检测算法已经应用于各行各业.并取得了不错的检测效果,具有一定的实际应用价值。
单阶段检测算法YOLO_v3因其良好的检测精度和速度,已经在工程应用中成为主流检测算法。
本文在KITTI数据集的基础上,利用YOLO_v3算法对该数据集进行特征训练学习,进一步对网络模型的参数进行调整,最终得到本文的车辆和行人检测模型。
2 YOLO v3算法理论
2.1 特征提取网络Darknet-53
YOLO_v3其主干特征提取网络由连续的3x3和IXI卷积层组合而成,因为一共有53个卷积层,又被称为Darknet_53[7]。
YOLO_v3的特征提取网络Darknet-53如图1所示,在整个特征提取网络的结构里没有池化层和全连接层,张量的尺寸变换是通过改变卷积核的步长来实现的,在此结构中不考虑全局平均池化,张量维度的变化一共有5次。
2.2 基于车辆和行人检测的YOLO_v3算法分析
YOLO_v3网络将输入的行人和车辆图片进行预处理,然后将其送入CNN网络,CNN网络将输入的图片分割成SXS的网格,每个单元格被用于检测那些中心点落在该单元格内的目标。
每个单元格会预测检测物体边界框的4个偏移坐标和置信度得分。
最后YOLO_v3会在三个等级上进行预测,每个等级负责不同规模大小的物体的预测,每种规模预测三个边界框。
在本实验数据集中类别为行人和车辆,共两类。
所以得到的张量是SxSx[3x(4+1+2)],其中包含4个边界框的坐标、1个目标预测以及两种分类预测。
3 基于YOLO_v3的车辆和行人检测实验
本文是在KITTI数据集的基础上训练行人和车辆检测模型,官方提供的数据集中只有训练集图片给出了标签,一共有7481张图片。
将这7481张图片按照9:1的比例划分为训练集和测试集。
该数据集中共有八个类别,分别是Car、Van、Truck、Tram、Pedestrian等,将这八个类合并为Car、Pedestrian这两个大类。
最后通过格式转换脚本程序将KITTI数据集格式转化为YOLO网络所需要的标签格式。
3.2 实验平台
本实验平台的配置为:显卡为2080Ti,显存IIG,CPU为In-ter Core i7 9700,内存64G,操作系统为ubuntu18.04,CUDA版本为10.1,CUDNN版本为7.6.3。
3.3 实验参数设定
本实验初始学习率设置为0.001,权重衰减设置为0.0005,最大迭代次数设置为50000次,动量参数设置为0.9。
在模型训练过程中,按照设定的训练节点调整学习率的大小,减少模型训练过程中的损失,该训练节点分别为最大迭代次数的80%和90%[8]。
本实验数据集中的大部分车辆和行人在图片中所占比例较小,较难分辨,为了提高检测精度,将送入网络的图片分辨率设置为608x608。
同时为了提高模型的鲁棒性,在训练过程中随机使用不同尺寸的图片进行训练。
4 实验分析
4.1 实验过程及分析
实验过程中的loss和mAp值的变化趋势如图2所示,在前5000次迭代中loss急剧下降,mAp值逐步上升。
随着迭代次数的增加loss和mAp的变化趋于平缓,mAp的值在89%至91%范围内波动。
在40000次迭代训练后loss值趋于稳定不再下降,当迭代训练结束时,loss的值约为0.22左右。
4.2 实验评价指标
本实验采用目标检测领域公认的平均检测精度mAP以及Precision、Recall、Fl值来衡量模型的性能。
Precision、Recall、F1值、AP及mAP定義如式(1)一(5)所示。
其中TP表示正确检测到是行人或车辆;FP表示误检测为是行人或车辆;FN表示漏检测行人或车辆;P,R分别表示精确率与召回率;C表示数据集中的类别总数,本实验取2,C.表示当前第i个类别,i的取值为0和1。
实验结果表明,训练出的模型在748张图片的测试集上的平均检测精度约为89%。
其中,车辆的检测精度约为95.64%,行人的检测精度约为82.55%。
详细的实验结果如表1到3所示,在测试集上的部分检测效果如图3和4所示。
5 结束语
本文阐述了基于YOLO_v3的车辆和行人检测方法,包括修改分类器维度、模型训练及网络参数调整。
实验结果表明基于YOLO_v3的车辆和行人检测方法取得了不错的检测效果,具有一定的实用价值。
但是基于YOLO_v3的车辆和行人检测方法对于弱小车辆和行人目标检测效果不好,下一步可针对特定场景下的弱小车辆和行人目标进行网络改进以进一步提升网络检测精度。
参考文献:
[1]伍朝辉,武晓博,王亮.交通强国背景下智慧交通发展趋势展望[Jl.交通运输研究,2019,47(4):26-36.
[2]周晓彦,王珂,李凌燕.基于深度学习的目标检测算法综述[J].电子测量技术,2017,40(11):89-93.
[3]钮赛赛,周华伟,朱婧文,等.基于YOLO智能网络的红外弱小多目标检测技术[Jl.上海航天,2019,36(5):28-34.
[4]周慧娟,张强,刘羽,等.基于YOLO:的地铁进站客流人脸检测方法[J].计算机与现代化,2019(10):76-82.
[5]燕红文,刘振宇,崔清亮,等,基于改进Tiny-YOLO模型的群养生猪脸部姿态检测[Jl.农业工程学报,2019,35(18):169-179.
[6]黄伟铠,张登辉.基于YOLO算法的学生课堂关注度分析系统[J].浙江树人大学学报:自然科学版,2019,19(3):1-4,17.
[7]
Redmonj, Farhadi A.YOL09000: better, faster, stronger[C]//2017lEEE Conference on Computer Vision and Pattem Recognition(CVPR),July 21-26, 2017. Honolulu, Hl. lEEE,2017.
[8]游忍,周春燕,刘明华,等.基于TINY-YOLO的嵌入式人脸检测系统设计[Jl.工业控制计算机,2019,32(3):47-48.
【通联编辑:梁书】
收稿日期:2019-12-21
作者简介:洪松(1994-),男,硕士生,主要研究图像处理;高定国(1972-),藏族,硕士,教授,主要研究藏文信息处理、算法设计;三排才让(1994-),男,藏族,硕士生,主要研究藏文信息处理。