改进的YOLO V3算法及其在小目标检测中的运用分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 46
•
以提高小目标检测效率与准确性为前提,分析YOLO V3算法。
首先介绍该算法在小目标检测中运用、改进的YOLO V3算法,其次通过创建检测模型与实验研究,明确改进YOLO V3的优势以及两种算法在性能方面的差别,以期能够为今后小目标检测提供先进检测算法参考。
目标检测方法是广泛应用的现代化检测技术之一,小目标检测是其中重要技术,是检测行业近年来关注的焦点。
一般远距离目标具有小目标特点,小目标像素较少、特征模糊,相较于大目标的检测率较低,虚警率高。
所以,小目标检测在实践应用中具有极大的挑战。
为了能够进一步提升小目标检测召回率、检测结果准确性,基于单步目标检测算法中包含的深度卷积神经网络(YOLO V3),对该结构进行改进,并且在小目标检测中运用。
1 YOLO V3网络介绍
YOLO V3结构主要以Darknet53网络结构为主,其中涉及到53个卷积层,Darknet53包括5个残差块,其核心思想为残差神经网络。
Yolov3的残差结构输入用1×1卷积,为了减少计算量降低一半通道数,然后用3×3卷积提取特征,将通道数恢复至原始状态,最后再与输入累加,从而组建残差单元。
DBL 单元中包括卷积、批归一化、leaky ReLU 激活函数。
将残差单元引入可以增加网络深度,以免出现梯度消失的现象。
YOLO V3针对输入的图片实施反复降采样,最终3次降采样操作过程中预测目标,其中还包括3个尺度目标检测生成的特征图。
通过小特征图进行上采样,并且和大特征图结合,便可以同时完成大、小目标的检测。
2 改进的YOLO V3检测模型
2.1 数据集目标框聚类分析
YOLO V3中涉及到faster R-CNN 的anchor boxes 思想,该思想属于初始候选框,具有宽高固定的特点。
在选
择anchor boxes 时会直接影响到目标检测精准度与效率。
YOLO V3通过k -means 聚类算法实施COCO 数据集内部目标框宽高聚类操作,将平均重叠度当作目标聚类分析所需量度,最后再展开VEDAI 数据集的聚类分析,得出Avg IOU 目标函数。
选择k 值分别分析数据集内部样本,可以获得k 和Avg IOU 目标函数的关系。
如果k 值增大,那么目标函数变化也会更加平稳,拐点便是anchor boxes 最为理想的个数。
如果k 值大于3,这时曲线开始趋于稳定,确定anchor boxes 数量为3,不仅能够尽快实现损失函数收敛,还能够将候选框导致误差消除。
2.2 改进的YOLO V3检测模型
YOLO V3通过8倍降采样输出得出特征图,针对小目标实施检测。
特征图是8倍降采样目标检测层,在小目标位置信息检测方面无法获得理想的成效。
所以,为了能够
发挥YOLO V3网络结构检测优势,获得大量小目标特征信息,并且提高检测效率与准确性,在原本网络结构基础上进行改进。
由于4倍降采样特征图包含大量的小目标位置信息,所以YOLO V3输出8倍降采样特征图可以实现2倍上采样,所得特征图和Darknet53第二个残差块输出得到的4倍降采样特征图连接,构建4倍降采样特征融合目标检测层,在小目标检测中应用。
另外,为了获取大量低层小目标位置数据,基于原YOLO V3网络第二个残差块,在其中增设了2个残差单元,YOLO V3通过三3个尺度实现VOC 、COCO 数据集的预测,并且在COCO 数据集内部分别对应预测框。
在小目标检测中,为了能够提升检测效率、准确性和召回率,按照VEDAI 数据集聚类分析最终结论,将YOLO V3原本3个尺度中输出检测消除,直接通过输出4倍降采样特征融
合目标检测层的方式实施小目标检测。
YOLO V3目标检测输出层之前涉及到6个DBL 单元、1个1×1卷积,在DSSD 网络影响下,以免产生梯度消失的现象,并且提高特征复用率,将原本DBL 单元数量减少
改进的YOLO V3算法及其在小目标检测中的运用分析
南华大学 秦丹峰 尹相辉
• 47
•
为2个,另外再增加两个ResNet 单元。
经过改进的YOLO V3实现第2个残差块输出4倍降采样特征图、二倍上采样8倍降采样特征图的结合,创建4倍降采样特征融合目标检测层,在小目标检测中应用得到良好的效果。
YOLO V 3在检测中按照实际需求缩放、裁剪检测图像,通过512×512VEDAI 航拍数据集,实现检测图像的缩放与裁剪。
原本图像内部小目标分辨率降低,视场减小。
所以,改进的YOLO V3(图1)将该问题解决,检测图像不会被压缩与裁剪,保持原本分辨率,有利于提升小目标检测有效性。
3 实验结果分析与研究
在诸多尺度条件下实施YOLO V3目标检测,在当前检测领域属于代表性算法之一,具有兼顾大、小目标的特点,在小目标检测中能够充分体现出优良的检测性能,所以改进的YOLO V3和原YOLO V3检测算法展开对比。
通过VEDAI 航拍图像,将其当作数据集,实施YOLO V3与改进YOLO V3算法对比。
数据集针对原大视场卫星图像进行分割,使其划分为1024×1024图像,包括车辆、背景等内容。
此外,数据集内部还涉及到可见光图像、红外图像,图像距离与地面一致。
数据集内部还包括分辨率为1024×1024图像,针对其展开下采样获得分辨率是512×512图像,可以得到分辨率小的目标图像。
VEDAI 数据集内部每一张图像均涉及到5.5个车辆,目标在图像总像素中占比仅为0.7%,属于小目标检测数据集。
VEDAI 数据集中包括9种对象。
建议采用以下两种方式,对改进的YOLO V3在小目标检测中的性能体现进行验证:第一,运用分辨率是512×512
的图像数据集,使数
图1 改进的YOLO V3网络结构图
据集内部最小的3种目标归纳为一类,随机挑选80%图像展开训练,剩余图像则作为测试对象;第二,将分辨率是512×512的图像数据集作为数据集内9类目标的检测对象,分别展开YOLO V3和改进YOLO V3的训练。
通过旋转图像、提高对比度等方式,增强、扩张数据集内部图像。
改进YOLO V3在训练期间绘制损失值收殓曲线图、目标框、Avg IOU 目标函数图。
经过重复迭代,所有参数趋于稳定,最终损失值下降,Avg IOU 同样趋于稳定。
根据参数收殓情况分析改进的YOLO V3训练结果更满足目标要求,原始YOLO V3与改进YOLO V3算法性能对比见表1。
表1 原始与改进YOLO V3算法性能对比
原始YOLO V3算法
改进YOLO V3算法
定量对比
准确率84.5%87.5%召回率86.1%91.3%mAP值85.39%91.36%定性对比漏检与错检问题
有
无
结束语:综上所述,在深度学习技术不断创新与发展的当下,多元化的目标检测、目标跟踪算法得到应用。
其中深度卷积神经网络通过目标数据集自主学习检测目标、创建检测模型,以深度学习为基础的目标检测算法,主要有双、单步目标检测算法两种,其中单步目标检测算法效率更高。
改进的YOLO V3算法在小目标检测中应用,检测召回率与结果准确性更高,在今后检测工作中有非常可观的前景。
通讯作者:龚学余。