利索能及
我要发布
收藏
专利号: 202410778039X
申请人: 盐城工学院
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-10
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种增强多尺度特征提取和目标检测的铝材表面缺陷检测方法,其特征在于,包括:构建标注有铝材表面缺陷的数据集;

构建改进的铝材表面缺陷检测模型;

将标注有铝材表面缺陷的数据集放入铝材表面缺陷检测模型进行迭代训练,在收敛后得到优化模型;

获取铝材表面图像,并输入优化模型中,检测铝材表面缺陷的类别及位置,得到识别结果;

构建标注有铝材表面缺陷的数据集,包括:

获取铝材的初始数据集;

对初始数据集中的铝材图像尺寸调整为640*640,基于数据增强方法来扩充初始数据集,得到增强数据集;

运用Label img工具对增强数据集进行缺陷标注,对基于不同的数据增强方法得到的数据生成对应的数据标签,并对得到的所有数据集按照8:2划分训练集和验证集;其中,数据增强方法包括水平翻转、竖直翻转和平移随机结合、调整对比度、裁剪处理、尺度变换处理中的至少一种;

构建改进的铝材表面缺陷检测模型,包括:

构建YOLOv8n检测模型;

将YOLOv8n检测模型中所有C2f模块均替换为mAtt‑C2f模块;

在网络的Backbone部分加入具有自适应加强特征融合能力的SPPF‑LSAtt模块;

将YOLOv8n检测模型的边界框回归CIoU损失函数替换为NWD‑MPDIoU损失函数,得到改进的铝材表面缺陷检测模型;

将标注有铝材表面缺陷的数据集放入铝材表面缺陷检测模型进行迭代训练,在收敛后得到优化模型,包括:将标注有铝材表面缺陷的数据集放入铝材表面缺陷检测模型进行迭代训练,通过多次训练,在损失值停止下降后保留该次训练的最佳模型权重,通过迁移学习,使用每次训练的最佳权重再进行若干次迭代,最终从中选取精度最高的检测模型作为优化模型。

2.如权利要求1所述的增强多尺度特征提取和目标检测的铝材表面缺陷检测方法,其特征在于,初始数据集共有十种类型的缺陷:碰伤、擦花、不导电、涂层开裂、漏底、凹陷、凸粉、起坑、桔皮和脏点。

3.如权利要求1所述的增强多尺度特征提取和目标检测的铝材表面缺陷检测方法,其特征在于,mAtt‑C2f模块为将原C2f模块中所有的Bottleneck模块均替换为Bottleneck_MLCA模块;Bottleneck_MLCA模块在原Bottleneck模块的基础上,将局部混合注意力机制MLCA嵌入到两个卷积层后,使其拥有更强的特征提取能力和特征融合能力。

4.如权利要求1所述的增强多尺度特征提取和目标检测的铝材表面缺陷检测方法,其特征在于,SPPF‑LSAtt模块通过对大核卷积操作进行分解,又将分解得到的2D卷积再次分解为级联的1D核;SPPF‑LSAtt模块添加在网络Backbone部分的最后一层。

5.如权利要求1所述的增强多尺度特征提取和目标检测的铝材表面缺陷检测方法,其特征在于,还包括:调节NWD‑MPDIoU损失函数中NWD和MPDIoU的在总损失中的相对贡献,设置损失函数表达式为:Losstotal_box=(1‑λ)LNWD+λLMPDIoU

其中,LNWD为NWD损失函数;LMPDIoU为MPDIoU损失函数;λ为调节因子,λ∈[0,1];当λ为1时,表示仅使用MPDIoU损失函数作为边界框损失函数;当λ为0时,表示仅利用NWD损失函数作为边界框损失函数;λ取值为0.5,表示NWD损失函数和MPDIoU损失函数对总损失的贡献是相等的。

6.如权利要求1所述的增强多尺度特征提取和目标检测的铝材表面缺陷检测方法,其特征在于,在运用Labelimg工具对增强数据集进行缺陷标注前,还包括:获取增强数据集中每张图像中所有像素点的RGB颜色值,RGB颜色值包括R通道取值、G通道取值及B通道取值;

根据所有像素点的RGB颜色值,计算出图像中所有像素点在R通道的平均值、G通道的平均值及B通道的平均值,计算每张图像的颜色特征系数:其中,T为图像的颜色特征系数;N为图像包括的像素点的数量; 为图像包括的所有像素点在R通道的平均值; 为图像包括的像素点在G颜色通道的平均值; 为图像包括的像素点在B颜色通道的平均值;Ri为图像包括第i个像素点的R通道取值;Gi为图像包括第i个像素点的G通道取值;Bi为图像包括第i个像素点的B通道的取值;

在增强数据集中剔除颜色特征系数大于预设颜色特征阈值的图像,得到第一修正数据集;

获取第一修正数据集中图像在垂直方向的像素梯度及在水平方向的像素梯度,计算每张图像的像素特征系数:其中,S为图像的像素特征系数;D1为图像在垂直方向的像素梯度;D2为图像在水平方向的像素梯度;Mθ为图像中角度为θ的像素点的数量; T1(x)为图像在垂直方向的x处的像素梯度;T2(x)为图像在水平方向的x处的像素梯度;|| ||0为L0范数,用于统计非零向量的数量;

在第一修正数据集中剔除像素特征系数小于等于预设像素特征阈值的图像,得到第二修正数据集,也为数据筛选后的增强数据集;

基于Label img工具对数据筛选后的增强数据集进行缺陷标注。