引言
目标检测作为连接图像感知与高层决策的核心桥梁,其性能优劣直接决定了智能制造、自动驾驶等关键领域的智能化水平。在工业质检场景中,金属表面缺陷(如微米级裂纹、不规则夹杂)的精准检测更是保障高端装备可靠性的核心环节[1-2]。据中国机械工程学会2024年报告显示,我国每年因金属表面缺陷导致的报废率达3%~5%,对应经济损失超500亿元[3],而传统人工检测(效率20~30件/小时,漏检率随时长指数上升)与传统机器视觉(复杂工况误检率超20%)已难以满足工业4.0的“零缺陷”需求。在此背景下,基于深度学习的实时目标检测技术成为突破瓶颈的关键,其中YOLO系列算法[4]凭借“端到端”架构与高效推理特性,成为工业级部署的主流选择,但在微小缺陷捕捉、复杂纹理抗干扰、精度和速度的平衡仍需优化[5]。
在相关工作与技术瓶颈上,目标检测算法的演进始终围绕“特征表征能力”与“定位精度”两大核心展开。在单阶段检测器领域,YOLOv1开创实时检测范式但定位误差大;YOLOv3[6]通过多尺度特征融合提升小目标性能,却依赖人工设计锚框导致泛化性受限;YOLOv5[7]的自适应锚框与CSP结构优化了效率,但其特征提取对复杂背景鲁棒性不足;YOLOv7[8]的ELAN结构增强了特征学习能力,却仍难以捕捉微米级缺陷的细微特征;最新的YOLOv11[9]通过C3k2模块与动态通道剪枝实现轻量化,但其在局部上下文关联建模与极端比例目标回归上仍有提升空间。
金属缺陷检测作为高端制造领域质量控制的核心环节,其技术发展始终与工业现代化进程深度耦合。国内外研究在技术演进中形成了既同源共生又各具特色的发展路径。早期研究普遍依赖传统图像处理方法,国外学者通过阈值分割与形态学处理实现规则缺陷的初步识别[10],国内研究者则在边缘梯度分析领域进行优化,如基于Sobel算子的裂纹增强算法[11],但这类方法对低对比度缺陷和复杂背景的适应性有限。随着硬件设施与人工智能技术的发展,基于计算机视觉的检测方法逐渐成为主流,其成本低、操作简便的优势使其在钢、铝、铜板等平面材料检测中广泛应用。国内研究呈现出鲜明的应用导向特征,在数据增强与模型轻量化领域形成独特优势。WANG K等人[12]针对工业领域金属表面缺陷检测中现有算法仅面向少数缺陷类型且不同尺度(尤其小尺度)缺陷表现欠佳的问题,设计改进YOLOv5检测网络,有效损失函数解决小尺度缺陷引发的数据不平衡。张曙文等人[13]针对工业干扰环境下金属齿轮表面缺陷自动化检测易出现误检和漏检的问题,提出改进YOLOx算法,通过ASFF提高抗干扰能力,借助ECA模块增强特征提取能力。改进后网络较原版在召回率、准确率和平均精度均值均有所提升。窦智等人[14]针对钢板制造行业伤痕类型多、次品少、检测要求高导致传统算法不满足需求,且行业数据公开率低、训练样本不足使深度学习难应用的问题,提出小样本驱动的训练样本生成方法及改进YOLOv7算法,优化ELAN模块,采用ACmix注意力模块,引入WIoU优化损失函数,成功应用于小样本钢板缺陷检测。但这两种方法均未充分验证在金属表面灰度不均、微小形变和缺陷等复杂工业场景,适用性仍需进一步验证。
因此,当前领域仍面临三重核心挑战:金属表面高反射率导致的灰度不均问题,高速生产线5.12 Gb/s峰值数据率带来的实时处理压力,以及微小缺陷与随机弹性变形造成的特征混淆。针对上述瓶颈,本文以YOLOv11为基线,聚焦金属表面缺陷检测的核心需求,提出三项协同优化策略,其创新点与先进性具体体现为:
(1)针对传统C3k2模块局部上下文建模不足的问题,在残差路径中嵌入多尺度局部上下文注意力(MLCA),通过3×3/5×5并行卷积捕捉不同感受野特征,并结合通道注意力动态加权,既保留SE模块的通道级特征筛选能力,又弥补其缺乏空间关联建模的缺陷。相比Deformable DETR[15]的可变形注意力,MLCA将计算复杂度从O(N²)降至O(N),实现65 FPS的推理速度。
(2)EIoU损失函数适配:针对CIoU[16]对宽高差异约束薄弱的问题,引入EIoU损失[17],在CIoU的基础上分离宽高惩罚项,通过计算预测框与真实框的宽、高差异平方和,显式约束极端比例缺陷的回归精度。实验表明,EIoU在长宽比大于5:1的缺陷上定位误差降低42%,在金属缺陷检测模型上优于常用的损失函数SIoU[18]与ShapeIoU[19]。
(3)Detect_LADH轻量检测头:针对传统检测头特征融合冗余的问题,采用深度可分离卷积替代普通卷积,并设计动态权重生成器(基于缺陷尺度自适应分配P3/P4/P5特征权重)。相比PAN结构,其 FLOPs减少35%,推理速度提升至72 FPS,同时通过跨层特征动态融合,将复杂纹理下的误检率从25%降至8.3%,优于YOLO-World的静态融合策略(误检率12.6%)。
在本文研究贡献与结构安排上,核心价值在于为单阶段检测器在高精度实时工业场景中的应用提供了可推广的技术范式。实验验证表明在自建数据集上,改进模型较YOLOv11基线mAP@0.5提升8.9%,推理时间为1.4 ms。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000006998
作者信息:
付为刚,彭奕舜
(中国民用航空飞行学院 航空工程学院, 四川 广汉 618307)