基于改进YOLOX的钢材表面缺陷检测研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

现代电子技术
Modern Electronics Technique
2024年5月1日第47卷第9期
May 2024Vol. 47 No. 9
0 引 言
钢材作为一种重要的工业产品正随着经济的发展扩张规模、提升产量,尽管目前生产制造水平有了巨大的进步,但在钢材的生产和加工过程中,很容易受到各种不良因素的影响,从而使钢材表面产生多种类型的缺陷[1]。

比较常见的缺陷有划痕、孔洞、裂纹,这些不同类型的缺陷会使得钢材的耐久性、使用强度急剧下降,缺陷会随着时间影响正常使用,甚至会造成不可预料的后果,所
以,迅速而精确地识别钢材表面的缺陷变得至关重要。

在AI 技术日益成熟的今天,计算机视觉逐步取代了传统的检测手段。

计算机视觉可以较好地解决传统检测方法漏检率高、成本高等缺点,它在图像分类、人脸识别和目标检测等领域得到了广泛应用[2]。

近年来,在金属表面缺陷检测领域,文献[3]提出了一种基于自适应空间特征融合结构与EIOU 损失函数的改进YOLOv4算法,提高了检测精度。

文献[4]在YOLOv4的基础上设计了一个并行的双通道注意力模块,提出了YOLO ⁃DCSAM 算法对铝带缺陷进行检测。

文献[5]基于YOLOX 模型,结合新型特征提取网络ECMNet 与数据增
基于改进YOLOX 的钢材表面缺陷检测研究
刘 毅, 蒋三新
(上海电力大学 电子与信息工程学院, 上海 201306)
摘 要: 针对目前单阶段目标检测网络YOLOX 的特征提取能力不足、特征融合不充分以及钢材表面缺陷检测精度不高等问题,提出一种改进YOLOX 的钢材表面缺陷检测算法。

首先,在Backbone 部分引入改进的SE 注意力机制,增添一条最大池化层分支,进行权重融合,强化重要的特征通道;其次,在Neck 部分引入ASFF 模块,充分利用不同尺度的特征,更好地进行特征融合;最后,针对数据集所呈现的特点,将IOU 损失函数替换为EIOU 损失函数,改善模型定位不准确的问题,提高缺陷检测精度。

实验结果表明,改进的YOLOX 算法具有良好的检测效果,在NEU⁃DET 数据集上的mAP 达到了75.66%,相比原始YOLOX 算法提高了3.74%,较YOLOv6提升了2.76%,检测精度优于其他主流算法。

关键词: YOLOX ; 单阶段目标检测网络; SE 注意力机制; ASFF 模块; 表面缺陷检测; EIOU 损失函数
中图分类号: TN911.73⁃34; TP34 文献标识码: A 文章编号: 1004⁃373X (2024)09⁃0131⁃08
Steel surface defect detection algorithm based on improved YOLOX
LIU Yi, JIANG Sanxin
(School of Electronics and Information Engineering, Shanghai University of Electric Power, Shanghai 201306, China)
Abstract : In view of the unsatisfied feature extraction capability, inadequate feature fusion, and low accuracy in steel surface defect detection in the current single⁃stage object detection network YOLOX, a steel surface defect detection algorithm based on improved YOLOX is proposed. An improved SE attention mechanism is introduced into the Backbone, adding a pooling layer branch to fuse the weight and strengthen important feature channels. An ASFF (adaptively spatial feature fusion) module is
incorporated in the Neck to fully utilize features of different scales and achieve better feature fusion. On the basis of the characteristics of this dataset, the IOU loss function is replaced by EIOU loss function, so as to eliminate inaccurate model positioning and improve the accuracy of defect detection. Experimental results demonstrate that the improved algorithm has good
detection performance, which achieves mAP (mean average precision) of 75.66% on the NEU⁃DET dataset, increasing 3.74% in comparison with that of the original YOLOX algorithm, and 2.76% over that of the YOLOv6 algorithm. Therefore, the detection accuracy of the proposed algorithm outperforms that of the other mainstream algorithms.Keywords : YOLOX; single ⁃stage object detection network; SE attention mechanism; ASFF module; surface defect
detection; EIOU loss function
DOI :10.16652/j.issn.1004⁃373x.2024.09.024
引用格式:刘毅,蒋三新.基于改进YOLOX 的钢材表面缺陷检测研究[J].现代电子技术,2024,47(9):131⁃138.
收稿日期:2023⁃12⁃18 修回日期:2024⁃01⁃10
131
现代电子技术2024年第47卷
强方法,提出了E⁃YOLOX算法。

文献[6]在YOLOv7的基础上融合了加权双向特征金字塔,并采纳了多头注意力机制MHSA和SPD卷积结构,从而增强了缺陷检测的准确性。

面对带钢表面缺陷检测中的低速率和实时性问题,文献[7]采用了多尺度检测策略并融入空间注意力策略,进而设计了一种对YOLOv4的实时检测优化方案。

本文基于YOLOX目标检测算法,采用YOLOX_S作为预训练模型,目标是在维持检测速度的基础上,进一步优化钢材表面缺陷的检测准确性。

对于引入的SE注意力机制进行改进,添加一条全局最大池化层,增强特征提取能力;添加ASFF模块,使得不同尺度的特征之间更好地融合;将损失函数替换为EIOU损失函数,计算回归框宽高的差异值取代了纵横比,加速了网络收敛的同时提高了回归精度。

改进后的检测网络在NEU⁃DET钢材表面缺陷数据集上有了较明显的提升。

1 相关工作
1.1 YOLOX算法
YOLO系列算法[8]是一种基于深度学习和卷积神经网络的目标检测方法,具有检测精度高、速度快的特点。

YOLOX算法[9]在YOLOX系列算法中处于较先进的版本,YOLOX⁃s网络于2021年提出,其主要由主干网络(Backbone)部分、特征提取网络(Neck)和用于结果预测的检测头(YOLO Head)等三部分构成。

首先,图像被送入主干网络以抽取特征,得到三种不同尺度的特征图,随后这些特征图被送入PAFPN网络进行进一步的特征强化与融合;接着,PAFPN对深层特征进行上采样,同时对浅层特征执行下采样,通过这两种方式结合形成了一个更为丰富的特征表示;最终,这一强化后的特征图被送入YOLOX⁃Head的解耦部分,输出预测结果。

YOLOX最大的改进就是采用Anchor⁃free检测算法,取消了在预测端使用多个锚框预测目标的类别以及位置,解决了数据冗余问题,这样使得检测头的参数量大大降低。

YOLOX的核心创新在于实施了Anchor⁃free的检测策略,摒弃了传统的多锚框预测方式,从而减少了数据的冗余性并显著减少了检测头的参数。

此外,YOLOX引入了SimOTA动态匹配技术。

这种技术通过评估预测框与实际框的重合度来确定每个实际框的特征点数,它根据特征点的预测精度和实际框的覆盖度构建成本矩阵,并选择成本最低的特征点作为实际框的正样本。

1.2 SENet注意力机制
SENet[10]代表了一种经典的通道注意力策略,它主要侧重于挖掘特征通道间的相互作用,从而使模型能够识别各通道特征的关键性。

简单概括就是增强重要特征,抑制不重要的特征。

SE单元结构如图1
所示。

图1 SE结构单元
SE单元的操作流程可以概括为三个核心阶段:1)“压缩”阶段。

其中输入特征图被转化为一个通道级的描述,对每个通道进行全局平均池化。

这不仅压缩了特征的空间维度,还为每个通道提供了一个全局响应的描述,从而捕获了全局上下文信息。

2)“激励”阶段。

它的目的是学习通道间的依赖关系,这是通过两个全连接层实现的,其中第一层降低了权重因子的维度,以减少计算复杂性,然后通过ReLU 激活函数增强非线性;第二层则将权重因子的维度恢复到原始大小,为每个通道生成一个权重。

3)进入“重新加权”阶段。

这里的目标是利用上一步得到的通道权重来调整原始特征图。

每个通道的特征值都乘以其相应的权重,从而强化或弱化某些特征通道。

整体而言,SENet的这种注意力机制强调了通道间的依赖性,使模型能够更加聚焦于重要的特征,从而提高了特征的区分能力。

2 改进的YOLOX算法
本研究为钢材表面缺陷特征提出了一种基于YOLOX的优化检测模型,其整体架构如图2所示。

2.1 改进的SENet注意力机制
为了融合不同类型的全局信息,进一步提高目标检测模型的特征提取能力和鲁棒性,本文提出了一种改进方法,通过在Squeeze部分添加全局最大池化分支,结合全局平均池化和全局最大池化的优点,使模型能够捕获更丰富、更具表现力的描述符。

这种组合使得网络能够更好地适应目标的尺寸、形状和纹理变化。

改进方法实际上引入了一种更丰富的特征选择策略,该策略关注整体特征的平均信息和局部最显著信息,从而提高模型的判别能力。

除此以外,输出的池化层还会分别经过1×1卷积,映射成相应的权重,这使得模型可以在训练过程中学习如何根据不同任务和场景调整全局平均池化和全局最大池化的权重。

这种自适应学习策略有助于提高模型的泛化能力,使模型在处理多样性较大的目标检测任务时具有更好的性能。

在最终步骤中,将SE单元中的标准全连接层替换为1×1的卷积操作,不仅有效地降低了模型的参数数量,还有助于避免过拟合现象,从而提升了模型的适应性。

改进后的SE单元结构如图3所示。

132
第9

图3 改进后的SE 结构单元
2.2 引入ASFF 算法
传统的目标检测算法通常采用简单的特征融合策
略,然而这些方法对于不同尺寸的目标难以有较好的检测结果。

为了解决这一问题,本文提出了ASFF (Adaptive Spatial Feature Fusion ,自适应空间特征融合)算法[11],ASFF 是一种用于目标检测任务中的特征融合方法,可以帮助模型捕捉不同尺度的缺陷目标,让模型有更好的检测精度。

ASFF 算法的关键思想是在多尺度
特征之间进行自适应权重分配,以实现更好的融合效果,ASFF 结构如图4所示。

图4中,输入通过PAFPN 输出三个特征图。

本文从上到下对它们进行编号:特征图X 1、
X 2、X 3。

不同颜色的箭头表示不同特征图中的特征传递。

X 1具有最大的感受野,stride 为32,适合检测图片中比较大的缺陷;
X 3具有最小的感受野,stride 为8,适合检测比较小的缺陷;
X 2的感受野介于两者之间,stride 为16,检测中等尺寸的缺陷。

ASFF 将PAFPN 网络的输出(X 1、X 2、X 3)作为三个特
征图融合的输入。

ASFF 的计算过程包括两部分:特征
调整和自适应融合。

特征调整包括将特征图缩放到待融合特征图的大小,以确保在融合过程中特征图的大小保持一致。

X 1→3表示将X 1缩放到X 3大小后的图像。

自适应融合是通过网络训练三个权重图α、β和γ,并将
它们与输入特征图相乘。

图2 改进后的YOLOX
网络
图4 ASFF 算法结构
刘 毅,等:基于改进YOLOX 的钢材表面缺陷检测研究133
现代电子技术
2024年第47卷
以图4中ASFF⁃3的输入为例:首先,对X 1、
X 2和X 3进行特征缩放,分别得到X 1→3、X 2→3和X 3→3;然后,使用网络训练与X 1→3、
X 2→3和X 1→3大小相同的三个权重图(α、β和γ),并逐点将每个权重图与每个输入相乘,以确定输入特征图X 中每个像素的激活和抑制,从而实现特征融合;最后,逐点相乘后将获得的三个矩阵相加,得到ASFF 中小目标的特征融合结果输出。

上述计算的公式如式(1)所示:
ASFF ⁃3=X 1→3⊗α3+X 2→3⊗β3+X 3→3⊗γ3 (1)
通过这样的计算,来检测小目标的特征图X 3中丰富的小目标特征。

同时,在特征图X 3中过滤出大目标和中等目标特征的激活值,使模型更加关注小目标的检测。

钢材表面缺陷数据集包含大量的小目标,引入ASFF 可以尽可能地融合这些小目标的特征,提高小目标的检测效果。

2.3 引入EIOU 损失函数
YOLOX 的损失函数由三个关键部分组成:类别损
失Loss clg 、置信度损失Loss obj 、边界框的位置回归损失Loss reg 。

在这三者中,类别损失和置信度损失都采用
二值交叉熵损失函数作为其计算基础,而对于位置损失,选择IOU_Loss 作为核心计算方法,如式(2)所示:
Loss =w iou Loss reg +Loss obj +Loss clg
(2)
然而,IOU_Loss 存在一些明显的缺陷:例如,当预测
的边界框与实际的目标框没有交集时,IOU 就不能准确地描述两者之间的距离关系,这会导致损失函数在某些情况下变得不可导。

此外,即使是固定的IOU 值,也不能真实地反映两个框的实际交叉情况。

为了克服这些问题,研究者提出了GIOU_LOSS 损失函数[12]。

这个新的损失函数旨在改进IOU_LOSS 中的相交问题,使其更加准确。

但是,
GIOU_LOSS 也并非没有缺点。

当预测框完全嵌套在目标框内,或者与目标框的宽和高完全对齐时,GIOU 函数会自动退化为IOU 。

如图5所示,灰色框为目标框,
白色为背景。

图5 GIOU 缺陷示意图
GIOU_Loss =1-IOU +
|
|C -(A ∪B )|
|C (3)
式中C 是预测框与目标框的最小外接矩形区域。

为了解决GIOU 存在的问题,研究者提出了
DIOU_Loss [13]。

与GIOU 不同,DIOU_Loss 并不是简单地
考虑两个边界框的重叠面积,而是采用了一种新的方法,即通过最小化两个边界框中心点之间的标准化距离来加速损失的收敛,如图6所示。

进一步地,CIOU 损失函数在DIOU 的基础上引入了一个新的概念,即边界框的纵横比。

这一改进使得CIOU 能够更准确地回归目标框。

具体来说,CIOU 的计算包括了一个额外的惩罚项αν,该惩罚项考虑了预测框与真实框之间的纵横比差异,从而更好地衡量两者之间的长宽比。

计算公式如下:
CIOU_Loss =1-IOU +ρ2()
b ,b gt
c 2
+αν(4)
式中:αν是衡量长宽比的影响因子;ρ2(b ,b gt )表示预测框与目标框中心点的欧氏距离;
c 是两框最小外接矩形的
对角线长度。

图6 DIOU 缺陷示意图
尽管CIOU _Loss 在多个方面都进行了改进,但在处理纵横比时仍有一些不足。

它主要是通过一个参数ν来描述两个框的纵横比差异,但这种方法并不能准确地捕捉到框的实际宽高差异。

为了更精确地描述这种差异,研究者们进一步改进了CIOU ,提出了EIOU_Loss [14]。

此外,为了更好地关注优质的锚框,
EIOU_Loss 还结合了Focal 机制。

EIOU 在CIOU 的基础上进一步细化,它将纵横比的
参考量分解,单独对目标框和锚框的长度与宽度进行计算和优化,该损失函数包含三个部分:重叠损失、中心距离损失、宽高损失,前两部分延续CIOU 中的方法,但是宽高损失直接使目标盒与锚盒的宽度和高度之差最小,使得收敛速度更快,计算公式如下:
EIOU_Loss =1-IOU +ρ2()b ,b gt c 2+ρ2()
w ,w gt C 2w +
ρ2(h ,h gt )
C 2h
(5)
式中:
C w 和C h 是覆盖两个Box 的最小外接框的宽度和高度。

3 实验与结果分析
实验使用的环境配置如表1所示。

134
第9期
表1 环境配置
配置名称操作系统GPU CPU 深度学习框架
版本参数Ubuntu 20.04 LTS NVIDIA GeForce RTX3090
Intel Ⓡ
Xeon Ⓡ
********************
Pytorch 1.8.0
3.1 数据集
数据集采用NET⁃DET 数据集。

NEU⁃DET 是东北大
学发布的专门针对带钢表面缺陷的数据集,它涵盖了
6种主要的缺陷类别:裂纹(crazing )、夹杂(in⁃clusion )、斑块(patches )、划痕(scratches )、麻点(pitted_surface )和氧化铁皮压入(rolled⁃in_scale )。

整体数据集包括1 800张200×200的灰度图像,每种缺陷各有300张。

为了研究,将数据按8∶2的比例分为训练集(1 440张)和测试集(360张)。

缺陷样例如图7
所示。

图7 钢材表面缺陷示意图
为了全面评估模型的性能,本文选用了两个核心指标:平均精度(AP )和均值平均精度(mAP )。

此外,还参考了每秒检测帧数(单位:f/s )、精确率(P )和召回率(R )。

通过将P 和R 作为坐标轴,可以绘制P ⁃R 曲线,其中AP 代表该曲线下的面积。

一个较大的面积意味着更高的AP 值,反映出模型的准确性。

mAP 则是各类别AP 的平均,而FPS 衡量了模型的检测速度。

3.2 实验结果分析3.2.1 消融实验分析
为了深入了解这三种改进策略对模型的贡献,实验
以YOLOX_S 作为基准,在NEU⁃DET 数据集上进行了消融实验。

所有的环境和参数配置都保持一致,具体的检测结果如表2和表3所示。

表2 改进方案消融实验对比
实验123456789
SE —√———————
SE_M ——
√——
√√—

ASFF ———
√—
√—
√√
EIOU ————
√—
√√√
mAP/%71.9272.7573.5072.2873.5874.7574.0074.1775.66
FPS 124121121116123114111117109
Params 8.94M 8.98M 8.98M
14.38M 8.94M 14.40M 8.98M 14.38M 14.42M 表3 各个缺陷类别不同改进实验对比
实验123456789
AP/%
Cr
39.7544.1445.9143.5943.7952.2447.9246.4051.71
In
82.5882.5182.1982.5682.3881.3480.3380.4683.44
Pa
87.9786.5886.9787.3188.1286.4787.1990.2787.97
PS
76.2377.4779.0976.5982.3780.0381.0876.0580.16
RS
56.6956.5058.0356.3758.0060.7360.4663.0863.11
Sc
88.3189.3188.8387.2686.8387.6787.0288.8087.57
mAP/%71.9272.7573.5072.2873.5874.7574.0074.1775.66
由表2、表3可知,裂纹类别、麻点类别、氧化铁皮类别有明显的精度提升,mAP 提高了1.58%。

实验3采用的是改进的SE 注意力机制,与初始SE 注意力机制相
比,裂纹类别和麻点类型的检测精度略有提升,总体的检测精度也有了一定提升,实验3证明了在参数量没有较大变化的条件下,改进的SE 注意力机制是有效的。

实验4所采取的改进点可以有效提高模型特征融合的能力,在原有特征的基础上进行特征的二次融合,能够获取更加丰富的特征,从而更好地进行预测。

由表3可知,检测精度也有略微提升。

实验5使用EIOU 损失函数作为模型的位置回归损失,可以一定程度上改善缺陷的识别能力。

实验6~实验8采用不同策略两两结合进行检测,结果发现两两组合进行检测,在FPS 差距不大的情况下,最终检测精度都优于采用单一策略。

实验9将三种改进策略都融入进YOLOX 网络中,取得了最好的结果。

图8是训练过程中mAP 变化图。

图9是各个缺陷类别mAP 变化图。

刘 毅,等:基于改进YOLOX 的钢材表面缺陷检测研究
135
现代电子技术
2024年第47

图8 mAP
变化曲线
图9 各个类别mAP 对比
3.2.2 不同注意力机制结果对比
为了更有力地说明选择SENet 作为改进点的理由,
在Backbone 部分输出之后、Neck 输入之前,本文引入了多种常见的注意力机制(ECANet [15]、CBAM [16]、CA [17]、FCANet [18])进行比较,从中选择检测精度最高的注意力机制作为模型的改进点,评价指标为mAP 值。

实验结果如图10
所示。

图10 不同注意力机制检测对比
通过图10可以得知,针对本文中的检测任务,SE 注意力机制的检测精度在测试中的注意力机制精度最高,可以有效提高模型对缺陷的关注程度,加强重要的特征,所以引入SE 注意力机制优化YOLOX 检测模型。

3.2.3 不同算法模型对比
为了比较本文改进算法和其他算法的检测效果,在
同一个NEU⁃DET 数据集划分基准的前提下,采用SSD [19]、Mask⁃RCNN [20]、YOLOv5以及比较新的YOLOv6[21]进行对比实验,结果见表4。

表4 不同模型对比实验效果
算法SSD
Mask⁃RCNN YOLOv5YOLOX YOLOv6Ours
mAP/%51.268.172.471.972.975.7
FPS 64.510676.2124133109
Params 24.1M 68M 20.9M 8.9M 16.9M 14.4M
3.2.4 检测相关对比
为了进一步证明算法改进的有效性,更加直观比较
改进后的YOLOX 模型与原模型的实际检测效果,随机选取了部分数据集,对部分缺陷图片进行检测,检测效果如图11
所示。

图11 改进前后对比(一)
136
第9期
对比改进前后可以看出,原始的YOLOX模型存在置信度比较低这一不足,改进后的YOLOX模型缺陷检测的置信度相比原YOLOX模型有了一定的提高,除此以外,缺陷的定位也比原始模型更加精确。

为了验证改进算法的通用性,额外选取北京大学公开的印刷电路板缺陷数据集进行验证,数据集有6个类别,分别为漏焊(Missing_hole)、缺口(Mousebite)、开路(Opencircuit)、短路(Short)、毛刺(Spur)、余铜(Spuriouscopper)。

改进方案取得的数据如表5所示。

检测效果如图12所示。

表5 北京大学PCB数据集检测结果
实验
YOLOX
Ours
AP/%
漏焊
100
100
缺口
89.0
90.6
开路
88.9
89.6
短路
100
99.8
毛刺
90.9
90.9
余铜
88.2
89.9
mAP/%
92.8
93.5
图12 改进前后对比(二)
4 结语
本文对YOLOX算法进行改进,优化钢材表面缺陷
检测问题,提出了一种改进的SE注意力机制,进一步增
强模型对特征的提取能力;添加了最大池化层分支,与
平均池化层进行权重融合,充分利用Backbone提取的
特征,取得更好的检测效果;引入ASFF算法模型捕捉不
同尺度的缺陷目标,能够更有效地进行特征融合,使得
小目标的检测精度有所提升;将IOU损失函数替换为
EIOU损失函数,改善模型定位不准确的问题,加强了模
型对缺陷目标的识别能力。

实验结果验证了所做的改
进是有效的。

后续将会对裂纹类别的缺陷进行更深层
次的研究,进一步改善此类别检测精度不高的问题,提
升模型总体的检测精度以及检测速度。

注:本文通讯作者为蒋三新。

参考文献
[1] 王浩然.基于YOLOv5的钢材表面缺陷检测研究[D].桂林:广
西师范大学,2022.
[2] 李鑫,汪诚,李彬,等.改进YOLOv5的钢材表面缺陷检测算法
[J].空军工程大学学报(自然科学版),2022,23(2):26⁃33.
[3] 叶欣.基于深度学习的热轧带钢表面缺陷检测算法研究[D].武
汉:武汉科技大学,2021.
[4] MA Z X, LI Y B, HUANG M H, et al. A lightweight detector
based on attention mechanism for aluminum strip surface de⁃
fect detection [J]. Computers in industry, 2022, 136: 103585.
[5] 曹义亲,周一纬,徐露.基于E⁃YOLOX的实时金属表面缺陷检
测算法[J].图学学报,2023,44(4):677⁃690.
[6] 齐向明,董旭.改进Yolov7⁃tiny的钢材表面缺陷检测算法[J].
计算机工程与应用,2023,59(12):176⁃183.
[7] 邹旺,吉畅.一种改进YOLOv4⁃tiny的带钢表面缺陷实时检测
方法[J].机械科学与技术,2023,42(6):883⁃889.
[8] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look
刘毅,等:基于改进YOLOX的钢材表面缺陷检测研究137
现代电子技术2024年第47卷
once: Unified, real⁃time object detection [C]// Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2016: 779⁃788.
[9] GE Z, LIU S T, WANG F, et al. YOLOX: Exceeding YOLO series in 2021 [EB/OL]. (2021⁃08⁃06) [2022⁃01⁃15]. https:/// abs/2107.08430.
[10] HU J, SHEN L, ALBANIE S, et al. Squeeze⁃and⁃excitation networks [EB/OL]. [2023⁃10⁃30]. /abs/ 1709.01507.
[11] LIU S T, HUANG D, WANG Y H. Learning spatial fusion for single⁃shot object detection [EB/OL]. [2019⁃12⁃03]. http:// /abs/1911.09516.
[12] REZATOFIGHI H, TSOI N, GWAK J Y, et al. Generalized in⁃tersection over union: A metric and a loss for bounding box re⁃gression [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2019: 658⁃666.
[13] ZHENG Z, WANG P, LIU W, et al. Distance⁃IoU loss: Faster and better learning for bounding box regression [C]// The Thirty⁃fourth AAAI Conference on Artificial Intelligence. New York: IEEE, 2020: 12993⁃13000.
[14] ZHANG Y F, REN W Q, ZHANG Z, et al. Focal and efficient IOU loss for accurate bounding box regression [J]. Neurocom⁃puting, 2022, 506: 146⁃157.[15] LIU T, LUO R, XU L, et al. Spatial channel attention for deep convolutional neural networks [J]. Mathematics, 2022, 10(10): 1750⁃1759.
[16] WOO S, PARK J, LEE J Y, et al. CBAM: Convolutional block attention module [C]// 2018 European Conference on Com⁃puter Vision (ECCV). Heidelberg, Germany: Springer, 2018: 3⁃19.
[17] HOU Q, ZHOU D, FENG J. Coordinate attention for efficient mobile network design [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2021: 13713⁃13722.
[18] QIN Z, ZHANG P, WU F, et al. FcaNet: Frequency channel attention networks [C]// Proceedings of the IEEE/CVF Interna⁃tional Conference on Computer Vision. New York: IEEE, 2021: 763⁃772.
[19] LIU W, ANGUELOV D, ERHAN D, et al. SSD: Single shot multibox detector [C]// Proceedings of 14th European Con⁃ference on Computer Vision. Heidelberg: Springer, 2016: 21⁃37.
[20] HE K, GKIOXARI G, DOLLÁR P, et al. Mask R⁃CNN [C]// Proceedings of the IEEE International Conference on Com⁃puter Vision. New York: IEEE, 2017: 2961⁃2969. [21] LI C Y, LI L L, JIANG H L, et al. YOLOv6: A single⁃stage object detection framework for industrial applications [EB/ OL]. [2024⁃03⁃19]. https:///10.48550/arXiv.2209.02976.
作者简介:刘毅(1999—),硕士研究生,主要研究方向为深度学习与图像处理、缺陷检测。

蒋三新(1975—),博士研究生,讲师,主要研究方向为机器视觉、深度增强学习等。

138。

相关文档
最新文档