买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于深度学习的水下目标检测方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于深度学习的水下目标检测方法

￥12500

专利号： 2024104670260

申请人：广东工业大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-05-14

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于深度学习的水下目标检测方法，其特征在于，包括以下步骤：

S1、采集水下目标检测数据集，对数据集进行预处理，筛选合格的图像数据，平衡各个类别水下目标样本数量，并对所构建的数据集进行标注；

S2、将得到的输入特征图进行分割并拼接，得到目标尺寸的特征图，将特征图沿通道维度切分为两部分，并进行后续处理；

S3、结合CIoU和NWD，设计相应的NWD‑CIoU损失函数，用于模型训练过程中的定位回归损失；

CIoU和NWD的公式分别如式(1)、(2)所示：

式中，IoU表示预测框与真实框的交并比，b和b 分别为预测框与真实框的中心点，ρ(b,gtb )为两个中心点的欧式距离，cw和ch分别表示由预测框和真实框组成的最小包围框的宽度和高度，wgt和hgt分别表示真实框的宽度和高度，w和h分别表示预测框的宽度和高度，Z是2

数据集类别数，W2 (Na,Nb)是一个二阶Wasserstein距离定义，其中Na和Nb分别代表边界框A＝(cxa,cya,wa,ha)和边界框B＝(cxb,cyb,wb,hb)的高斯建模分布，||·||F是Frobenius范数；

将CIoU和NWD结合作为新的定位回归损失函数NWD‑CIoU，NWD‑CIoU的计算公式如式(4)所示；

LNWD‑CIoU＝α·LCIoU+(1‑α)·LNWD (4)

式中，α为CIoU的权重占比；

S4、动态调整特征图中不同尺度特征的权重，以增强模型对空间信息的感知能力，同时，调整不同位置的注意力权重；

S5、在构建的水下目标检测模型的基础上，训练并更新各层的参数，首先，初始化参数，并设置训练过程中所需的超参数；然后，将处理过的水下目标数据集划分为训练集、验证集和测试集；接着，训练模型并根据训练损失和验证损失调整模型参数，直到损失值收敛为止；

S6、使用训练好的模型对新的水下目标图像进行检测。

2.根据权利要求1所述的基于深度学习的水下目标检测方法，其特征在于：S1中采用labelme标注工具作为标注软件。

3.根据权利要求2所述的基于深度学习的水下目标检测方法，其特征在于：步骤S2中将图像数据转换为特征图F6的逻辑为：采用SCGConv对输入的特征图F1进行一次SPDConv卷积得到新的特征图F2，然后将F2沿通道维度切分为两部分，一部分为不做处理的特征图F4，另外一部分F3作为GAM_Bottleneck的输入特征图，在GAM_Bottleneck中，特征图经两层CBS层之后再经过GAM注意力机制处理，并将GAM的输出与原始GAM_Bottleneck的输入拼接之后作为GAM_Bottleneck的输出；

在SCGConv中，每一个GAM_Bottleneck的输出，都作为下一个GAM_Bottleneck的输入，依次重复n次，并将每一个GAM_Bottleneck的输出与未经过处理的特征图F3、F4拼接，得到特征图F5，F5再经一层SPDConv后得到SCGConv的最终输出特征图F6。

4.根据权利要求1所述的基于深度学习的水下目标检测方法，其特征在于：在所述S4中还包括以下步骤：同时实现尺度感知注意力πL、空间感知注意力πS和任务感知注意力πC统一的动态检测；

对于输入的水下目标特征图F，PRHead将其输入尺度感知注意力模块πL得到输出特征图F1，再将特征图F1输入空间感知注意力πS得到输出特征图F2，最后将特征图F2输入任务感知注意力πC得到PRHead的最终输出特征图F3；

L×S×C

给定的水下目标检测层三维特征张量F∈R ,其中L代表特征图的层级，S代表特征图的宽高乘积，C代表特征图的通道数，PRHead的注意力计算公式如式(5)所示；

W(F)＝πC(πS(πL(F)·F)·F)·F (5)

式中，πC(·)、πS(·)、πL(·)分别是任务感知注意力函数、空间感知注意力函数和尺度感知注意力函数，它们分别作用在维度C、S、L上。

5.根据权利要求4所述的基于深度学习的水下目标检测方法，其特征在于：尺度感知注意力通过动态调整特征图中不同尺度特征的权重，提高对不同尺度水下目标的识别能力，其计算过程如式(6)所示；

σ(x)＝max(0,min(1,(x+1)/2)) (7)

式中，f(·)表示使用1×1卷积近似的线性函数，σ(·)表示Hard‑sigmoid激活函数，对于输入的水下目标特征图F，任务感知注意力模块πL将其依次进行全局池化、1×1卷积、PReLU激活和Hard‑sigmoid激活，得到πL的输出特征图F1，特征图经过尺度感知注意力模块处理后，特征对不同尺度的水下目标变的更敏感。

6.根据权利要求5所述的基于深度学习的水下目标检测方法，其特征在于：空间感知注意力的计算过程为式(8)：式中，K表示稀疏采样位置数量，pj+Δpj表示自学习的空间偏移集中在独特区域的移动位置，用于聚焦一些判别位置，Δmj表示自学习在位置pj处的重要标量，二者都通过水下目标特征图F的中间层级学习得到；对于输入的水下目标特征图F1，空间感知注意力πS将其进行index重新排列操作后进行3×3的卷积，然后将卷积后的特征图分别进行offset偏移和sigmoid激活操作，将上述两个操作得到的输出特征图拼接得到πS的输出特征图F2。

7.根据权利要求6所述的基于深度学习的水下目标检测方法，其特征在于：任务感知注意力通过动态调整水下目标特征图中不同位置的注意力权重的计算过程为：

1 1 2 2

πC(F)·F＝max(α(F)·FC+β(F),α(F)·FC+β(F)) (9)

1 1 2 2

式中，FC是第C个通道的特征切片，α (F)、β (F)、α (F)、β (F)均为依赖于输入F的参数，它们用于学习控制激活阈值，任务感知注意力通过使用以上参数对不同的通道进行不同的激活以实现注意力操作；对于输入的水下目标特征图F2任务感知注意力πC将其依次进行全局池化、全连接、PReLU激活、全连接、正则化操作后得到πC模块的输出特征图F3，水下目标特征图F3为PRHead的最终输出特征图。

8.根据权利要求1所述的基于深度学习的水下目标检测方法，其特征在于：在步骤S5中首先初始化所有神经网络参数，并设置钢筋绑扎质量检测模型相关的超参数；然后，将训练集数据划分为多个批次，并将每个批次的数据输入水下目标检测模型进行训练，得到该批次的训练损失值loss；完成对整个训练集的所有批次数据的一轮训练后，将验证集按照批次输入至水下目标检测模型，得到相应批次的验证损失值batch_loss；在训练和验证过程中，水下目标检测模型将根据每次的loss和batch_loss情况自动学习并进行参数调整；重复进行多轮训练，直至batch_loss值趋于收敛，水下目标检测模型的训练结束。