买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于深度学习的钢坯自动语义分割识别方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于深度学习的钢坯自动语义分割识别方法

￥30000

专利号： 2022102783960

申请人：北京科技大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-10-27

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于深度学习的钢坯自动语义分割识别方法，其特征在于，包括以下步骤：步骤S1、数据集准备，获得不同运动状态以及不同形态的钢坯图像，对获得的钢坯图像进行预处理，并对预处理后的钢坯图像进行标注，建立原始数据集；

步骤S2、构建语义分割网络模型，包括骨干网络、多尺度空间池化模块和密集上采样模块；所述步骤S2，包含如下子步骤：步骤S21、骨干网络主体采用轻量型网络，包括4个残差结构，其中前两个残差结构是标准的残差块，后两个残差结构同时应用了非对称卷积和空洞卷积，4个残差结构分别输出对应的特征图；

其中，所述的非对称卷积是将标准的二维卷积分解为两个一维的卷积，即将传统的n×n卷积分解为n×1和1×n卷积；

步骤S22、生成多尺度特征，利用步骤S21中骨干网络提取的特征图，进行多级池化，提取多尺度特征；

具体的，利用步骤S21中获取的特征图，进行多尺度空间池化，获取多尺度特征，具体是在主体网络的每个残差块后进行不同尺度的池化操作，产生不同尺度的特征图；

对第一个特征图进行3级空间池化，生成3个尺度的特征图，第二个特征图的池化等级为2，生成2个尺度的特征图,第三个特征图的池化等级为1，生成1个尺寸的特征图；

步骤S23、融合多尺度特征，将步骤S21和步骤S22中得到的特征图按相同分辨率进行聚合，使用卷积核大小为3的深度分离卷积进行特征融合；具体的，通过合并骨干网络内不同层中提取的特征信息，加强低层空间信息与高层语义信息的交互，从而提高网络的精度；

步骤S24、将步骤S23特征融合后的特征图进行密集上采样，

设输入特征图尺寸和通道为N×N×C，经卷积后将特征图通道数扩大一倍，尺寸不变，通道为2N，最后再经过像素重组到2N×2N×C/2；步骤S3、训练步骤S2中构建的语义分割网络模型；

步骤S4、测试步骤，将待测图像输入到训练所得的语义分割网络模型，得到分割结果。

2.如权利要求1所述的一种基于深度学习的钢坯自动语义分割识别方法，其特征在于，所述步骤S1中，以钢铁生产工业现场的监控视频为原始数据，通过在视频中截取关键帧，获得不同运动状态以及不同形态的钢坯图像；对获得的钢坯图像进行中心裁剪，获得图像中央预定尺寸区域，对其进行标注，建立原始数据集；将原始数据集分为训练、验证和测试数据集。

3.如权利要求2所述的一种基于深度学习的钢坯自动语义分割识别方法，其特征在于，所述步骤S22具体包括：在主体网络的每个残差块后进行不同尺度的池化操作，产生不同尺度的特征图，为扩j大感受野，提取更加丰富的特征信息，使用池化操作为步长s＝2 ，卷积核大小为k＝2s+1＝

1+j

2 +1,j∈[1,3]，j为池化等级(1)。

4.如权利要求2所述的一种基于深度学习的钢坯自动语义分割识别方法，其特征在于，所述步骤S24具体包括：设输入特征图尺寸和通道为N×N×C，经卷积后将特征图通道数扩大一倍，尺寸不变，通道为2N，最后再经过像素重组到2N×2N×C/2。

5.如权利要求1所述的一种基于深度学习的钢坯自动语义分割识别方法，其特征在于，所述步骤S3、训练步骤S2中构建的语义分割网络模型，具体包括：步骤S31、对训练集中的数据通过随机翻转、随机缩放裁剪和随机旋转的方式进行增广，所述随机翻转概率为0.5，随机缩放的范围为原图像的0.8到1.5倍之间，裁剪尺寸为512×512，缩放后尺寸不足的补0，随机旋转的角度为‑10到10度之间；

步骤S32、以交叉熵损失函数为网络训练的损失函数，使用Adam优化器进行网络参数调整，初始学习率设置为0.0001。