利索能及
我要发布
收藏
专利号: 2024110377633
申请人: 山东科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多任务学习的沿海养殖池语义分割方法,其特征在于,包括:S1基于海岸带高分遥感影像进行数据集制作,包含图像、掩膜、边缘和距离,将沿海养殖池矢量文件划分为训练区域和测试区域;

S2搭建基于多任务学习的沿海养殖池语义分割模型,包括基于编码器‑解码器的多任务网络架构、改进的ConvNeXt V2块以及层次化多头注意力;

S3针对任务类型构建多任务损失函数;

S4使用一种新型的训练方法对模型进行训练获取预测结果;

S5基于形态学操作对分割结果进行修复,包括破碎块清除、孔洞填充,将处理后的最终结果转换为工程所用的矢量格式;

S2包括,S2.1采用多任务网络架构建立掩膜提取、边缘检测和距离估计的多任务权重共享网络;

S2包括,S2.2在网络架构的解码器末端开发适用于多任务卷积网络的层次化多头注意力HM‑HA,对于输入特征X∈[B,C,H,W],B为批量大小,C为通道数,H和W分别为特征图的高和宽,HM‑HA计算输入特征的最大池化和平均池化结果,并沿通道维度连接得到输出特征Z:Z=cat(max(X),mean(X),dim=1);

式中,cat(·,dim=1)为沿通道维度连接所有注意力头的输出特征,max(X)为X的最大池化结果,mean(X)为X平均池化结果;

对于每个任务,计算输出Yt:

式中,σ(·)为Sigmoid激活函数,用于对卷积结果进行非线性变换;Convh,t(·)为第t个任务的第h个卷积操作,用于计算注意力;⊙为将注意力与输入特征逐元素相乘,为对任务的所有注意力头进行计算;

S2.1中多任务网络架构是以改进的ConvNeXt V2块为基本构建单元组成的单编码器‑解码器架构;

改进的ConvNeXt V2块在ConvNeXt V2块的基础上,增加一层3×3卷积、InstanceNorm归一化层以及GELU激活函数;

编码器使用5个改进的ConvNeXt V2块增加特征维度,第1个输出为A1,并进行4次下采样,每一次的输出为d1、d2、d3和d4,通道数变化为32‑64‑128‑256‑512,下采样参数为2‑2‑

2‑4;

解码器将d4输出的空间分辨率上采样到d3大小后,与d3在通道维度融合,并对融合后的特征使用改进ConvNeXt V2块进行通道压缩,重复融合与处理过程直至d2与A1,通道数变化为256‑128‑64‑32,上采样参数为4‑2‑2‑2;

由层次化多头注意力对掩膜预测、边缘检测以及距离估计任务进行特征重加权处理后,分别对掩膜预测、边缘检测以及距离估计任务进行输出处理,输出通道数分别为2‑2‑1;

S4包括:

S4.1优化器使用AdamW,并设置动量β1、β2,β1=0.9,β2=0.999;

S4.2权重衰减系数设置为0.05;

‑3

S4.3学习略调度器使用CosineAnnealing,并设置基础学习率为1e ;

‑6

S4.4基础块中设置随机深度分别为0、0、0、0、0、0.1、0.1、0.2、0.2,层缩放系数为1e ;

S4.5权重初始化;

S4.6使用自动混合精度进行训练;

S4.7使用指数移动平均进行训练并设置参数为0.9999;

S4.8使用颜色抖动、垂直翻转、对角线翻转和水平翻转对数据进行增强。

2.根据权利要求1所述的一种基于多任务学习的沿海养殖池语义分割方法,其特征在于,S1包括,S1.1获取海岸带高分遥感影像中沿海养殖池矢量文件,并划分为训练区域和测试区域;基于gdal库数据处理方法对影像和矢量文件进行处理,生成具有固定尺寸和重叠率的掩膜标签集和影像集。

3.根据权利要求2所述的一种基于多任务学习的沿海养殖池语义分割方法,其特征在于,S1包括,S1.2基于canny边缘检测和欧几里得距离生成边界标签集和距离标签集,欧几里得距离变化由每个像素到最近非零像素的距离为:式中,(x1,y1)和(x2,y2)表示空间中的两个点,d(x,y)表示两点之间的欧几里得距离。

4.根据权利要求3所述的一种基于多任务学习的沿海养殖池语义分割方法,其特征在于,S3包括,S3.1在分类任务中使用负对数似然损失函数进行损失计算,对于N个样本,负对数似然损失lnll按照像素级分类损失计算为:式中,p(yi|xi)为给定输入xi下,通过softmax激活函数计算得到的真实标签yi的预测概率,i表示第i个样本。

5.根据权利要求4所述的一种基于多任务学习的沿海养殖池语义分割方法,其特征在于,S3包括,S3.2采用均方误差获取损失,N个样本距离估计任务均方误差ldist为:式中,yi和 分别为真实距离和预测距离。

6.根据权利要求5所述的一种基于多任务学习的沿海养殖池语义分割方法,其特征在于,S3包括,S3.3对分类任务和回归任务的损失加权ltotal计算:ltotal=ω1lmask+ω2lcontour+ω3ldist;

式中,ω1、ω2和ω3分别对应掩码预测、边缘检测和距离估计任务的权重系数,比例1:

1:1;lmask为掩码预测任务均方误差,lcontour为边缘检测任务均方误差。