利索能及
我要发布
收藏
专利号: 2023104074037
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-13
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度学习的筒纱缺陷图像分类方法,其特征在于,包括以下步骤:S1、构建筒纱缺陷图像数据集;

所述步骤S1具体包括如下步骤:

S11、利用工业相机对纺织厂生产线上筒纱进行采集图像,采集过程中不要混入多个筒纱,保证样本纯度;

S12、对采集的数据图像增加白色、黑色、蓝色、绿色四种不同的背景颜色,背景颜色提供主体特征有偏数据分布,增加实用性与适用性;

S13、对上述数据图像进行裁剪、缩放、翻转、移位、旋转、亮度和增加噪声,增强图片数据,得到最终数据集;

S2、构建筒纱缺陷图像特征提取模型结构;

所述步骤S2具体包括如下步骤:

S21:构建以ResNet‑18为基础网络结构模型,对筒纱缺陷图像进行特征提取,具体包括以下步骤:

1)筒纱缺陷图像经过预处理,生成为像素256×像素256的三通道RGB图像,图像数据进入网络后经过一个卷积核为7×7,步距为2的卷积层,经过批归一化处理、激活函数、以及一个3×3的最大池化层下采样;

2)4个残差结构卷积模块进行浅层至深层的特征提取,每个卷积块包括两个残差单元,每个残差单元又包括两个卷积层,即通过堆叠3×3卷积来提取特征信息,每隔两个卷积层引入残差结构;

3)通过1×1的平均池化层下采样,得到图像特征图;

S3、融入Transformer框架,通过语义理解能力,提高模型分类的准确性;

所述步骤S3包括如下步骤:

S31:将图像特征图分成9部分,输入到Transformer编码器中进行全局信息提取;

S32:Transformer编码器内部结构通过层归一化、多头自注意力、多层感知机以及残差连接组成,精确分割提取到的空间信息和全局信息,具体包括以下步骤:

1)自注意力机制由查询矩阵Q,键矩阵K以及值矩阵V组成,自注意力机制公式为:T

QK计算出输入矩阵的注意力分数,缩放因子 提高稳定性,通过Softmax函数将注意力分数转换为概率,乘上值矩阵获得权重矩阵;

2)通过多个自注意力机制拼接成多头注意力,来提高自注意力机制的特征提取能力,公式为:0

MSA(Q,K,V)=Contact(head1,...headn)WW为权重矩阵,n为多头的数量,默认为6;

3)通过层归一化增加训练收敛速度,残差连接提高信息流;

S33、通过反复堆叠编码器不断地提取全局上下文依赖和聚合特征信息;

S4、融入稳定学习框架,通过傅里叶特征提取层与样本权重学习层,消除背景特征与本质特征的相关联系,提高模型的泛化能力;

所述步骤S4具体包括如下步骤:

S41:通过随机傅里叶特征对核函数进行替换,将输入的特征图从低维空间映射到R维空间,消除表征空间中的相关性,随机傅里叶函数公式为:随机变量ω服从标准正态分布,b在区间[0,2π]内服从均匀分布;

S42:通过计算变量A,B之间的协方差最小值得到样本权重W,随机变量A,B的协方差矩阵公式为:u和v为随机傅里叶特征映射函数,n为数据集样本数目;

*

S43:通过对样本权重W优化得到W ,优化后的权重公式为:为特征z:,i和z:,j的部分协方差矩阵;

S44:在每个训练迭代的结束融合并保存当前的样本特征与权重,在下一个训练迭代开始时重加载,作为训练数据的全局先验知识优化新一轮的样本权重,用于优化样本权重的特征公式为:ZO表示用于优化样本权重的样本特征,WO表示用于优化样本的权重,ZG1,ZG2,...,ZGK表示全局样本特征,WG1,WG2,...,WGK表示全局样本权重,在每轮迭代结束后重新进行更新,代表了筒纱缺陷数据集的全局样本信息,ZL和WL代表当前训练批次的样本特征及样本权重,代表本轮的样本信息;

S5、使用所述步骤S1中的数据集对网络模型进行训练和验证,得到目标识别模型。

2.根据权利要求1所述的基于深度学习的筒纱缺陷图像分类方法,其特征在于,所述步骤S5具体包括如下步骤:S51:使用所述数据集对网络模型进行训练和验证,得到目标识别模型;

S52:结束实验。