1.一种基于深度学习的钢坯自动语义分割识别方法,其特征在于,包括以下步骤:步骤S1、数据集准备,获得不同运动状态以及不同形态的钢坯图像,对获得的钢坯图像进行预处理,并对预处理后的钢坯图像进行标注,建立原始数据集;
步骤S2、构建语义分割网络模型,包括骨干网络、多尺度空间池化模块和密集上采样模块;所述步骤S2,包含如下子步骤:步骤S21、骨干网络主体采用轻量型网络,包括4个残差结构,其中前两个残差结构是标准的残差块,后两个残差结构同时应用了非对称卷积和空洞卷积,4个残差结构分别输出对应的特征图;
其中,所述的非对称卷积是将标准的二维卷积分解为两个一维的卷积,即将传统的n×n卷积分解为n×1和1×n卷积;
步骤S22、生成多尺度特征,利用步骤S21中骨干网络提取的特征图,进行多级池化,提取多尺度特征;
具体的,利用步骤S21中获取的特征图,进行多尺度空间池化,获取多尺度特征,具体是在主体网络的每个残差块后进行不同尺度的池化操作,产生不同尺度的特征图;
对第一个特征图进行3级空间池化,生成3个尺度的特征图,第二个特征图的池化等级为2,生成2个尺度的特征图,第三个特征图的池化等级为1,生成1个尺寸的特征图;
步骤S23、融合多尺度特征,将步骤S21和步骤S22中得到的特征图按相同分辨率进行聚合,使用卷积核大小为3的深度分离卷积进行特征融合;具体的,通过合并骨干网络内不同层中提取的特征信息,加强低层空间信息与高层语义信息的交互,从而提高网络的精度;
步骤S24、将步骤S23特征融合后的特征图进行密集上采样,
设输入特征图尺寸和通道为N×N×C,经卷积后将特征图通道数扩大一倍,尺寸不变,通道为2N,最后再经过像素重组到2N×2N×C/2;步骤S3、训练步骤S2中构建的语义分割网络模型;
步骤S4、测试步骤,将待测图像输入到训练所得的语义分割网络模型,得到分割结果。
2.如权利要求1所述的一种基于深度学习的钢坯自动语义分割识别方法,其特征在于,所述步骤S1中,以钢铁生产工业现场的监控视频为原始数据,通过在视频中截取关键帧,获得不同运动状态以及不同形态的钢坯图像;对获得的钢坯图像进行中心裁剪,获得图像中央预定尺寸区域,对其进行标注,建立原始数据集;将原始数据集分为训练、验证和测试数据集。
3.如权利要求2所述的一种基于深度学习的钢坯自动语义分割识别方法,其特征在于,所述步骤S22具体包括:在主体网络的每个残差块后进行不同尺度的池化操作,产生不同尺度的特征图,为扩j大感受野,提取更加丰富的特征信息,使用池化操作为步长s=2 ,卷积核大小为k=2s+1=
1+j
2 +1,j∈[1,3],j为池化等级(1)。
4.如权利要求2所述的一种基于深度学习的钢坯自动语义分割识别方法,其特征在于,所述步骤S24具体包括:设输入特征图尺寸和通道为N×N×C,经卷积后将特征图通道数扩大一倍,尺寸不变,通道为2N,最后再经过像素重组到2N×2N×C/2。
5.如权利要求1所述的一种基于深度学习的钢坯自动语义分割识别方法,其特征在于,所述步骤S3、训练步骤S2中构建的语义分割网络模型,具体包括:步骤S31、对训练集中的数据通过随机翻转、随机缩放裁剪和随机旋转的方式进行增广,所述随机翻转概率为0.5,随机缩放的范围为原图像的0.8到1.5倍之间,裁剪尺寸为512×512,缩放后尺寸不足的补0,随机旋转的角度为‑10到10度之间;
步骤S32、以交叉熵损失函数为网络训练的损失函数,使用Adam优化器进行网络参数调整,初始学习率设置为0.0001。