买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于深度多尺度特征因子融合的水下目标检测方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于深度多尺度特征因子融合的水下目标检测方法

面议

专利号： 2022102538117

申请人：燕山大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于深度多尺度特征因子融合的水下目标检测方法，其特征在于：包括以下步骤：步骤1，获取水下数据集中的训练集与测试集；

步骤2，构建多尺度和差异特征融合的Faster RCNN检测模型；

具体包括以下步骤：

2.1从Faster RCNN检测模型的骨干网络ResNet‑50中获得3个卷积特征图C3，C4，C5；

2.2从Faster RCNN检测模型的特征金字塔网络中获得特征图C5上采样得到D6；

2.3构建一个由4个特征图组成的多尺度特征模块；

是将3个卷积特征图C3，C4，C5和第四个金字塔特征图D6作为多尺度特征增强模块的输入，得到4个融合多尺度增强后的金字塔特征图D3，D4，D5，D6；具体的实现方法如下：

2.3.1将第一个卷积特征图C3作为低级特征图，经过步长为1通道数为256的1×1卷积层输出得到第一个中级特征图D3；

2.3.2将第一个卷积特征图C4作为低级特征图，经过步长为1通道数为256的1×1卷积层输出得到第二个中级特征图D4；

2.3.3将第一个卷积特征图C5作为低级特征图，经过步长为1通道数为256的1×1卷积层输出得到第三个中级特征图D5；

2.3.4将多尺度变换后的第三个中级特征图D5，经过步长为2的3×3上采样层，得到多尺度金字塔特征图D6；

2.4根据数据集中正样本的数量，计算得到目标在[0,32],[32,96][96,256],[256,∞]像素中的特征因子；

2.5将3个卷积特征图C3，C4，C5和第四个金字塔特征图D6作为多尺度特征增强模块的输入，结合特征因子，得到3个融合多尺度增强后的金字塔特征图D3，D4，D5；

2.6构建一个由4个特征图组成的上下文特征模块；

具体的是将3个融合多尺度的金字塔特征图D3，D4，D5作为上下文特征增强模块的输入，得到3个融合多尺度上下文特征增强后的金字塔特征图P3，P4，P5，P6，其实现方法如下：

2.6.1将融合多尺度的第一个金字塔特征图D5与P6上采样得到的特征图M5，作为上下文特征增强模块的特征图的输入，得到差异融合上下文特征增强后的第一个金字塔特征图P5；

2.6.2将融合多尺度的第一个金字塔特征图D4与P5上采样得到的特征图M4，作为上下文特征增强模块的特征图的输入，得到差异融合上下文特征增强后的第二个金字塔特征图P4；

2.6.3将融合多尺度的第一个金字塔特征图D3与P4上采样得到的特征图M3，作为上下文特征增强模块的特征图的输入，得到差异融合上下文特征增强后的第二个金字塔特征图P3；

步骤3，将软阈值化嵌入注意力机制中，以进行冗余信息的消除；根据各个样本的情况，自适应地给各个样本设置不同的阈值；具体包括以下步骤：

3.1将现有Focal Loss函数设定为多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中目标分类任务的损失函数Lcls，其表示如下：Lcls＝FL(pi)，

式中，FL(pi)＝‑α(1‑pi) γ×log(pi)表示焦点损失函数，α表示正负样本的平衡参数，γ表示专注参数，pi表示第i个锚框为预测目标的概率；

3.2将现有Smooth L1 Loss函数设定为多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中目标位置回归任务的损失函数Lreg，其表示如下：Lreg＝SmoothL1(x)，

式中，SmoothL1(x)表示平滑L1平方损失函数，表示第i个锚框相对于预测目标边框的偏移量ti与第i个锚框相对于真实目标边框的偏移量的差值；

步骤4，优化多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中候选锚框，将NMS算法替换为Soft‑NMS；

步骤5，设定多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中目标分类与目标位置回归任务的整体损失函数L；

步骤6，训练构建的多尺度特征因子融合的Faster RCNN软阈值注意力检测模型；

步骤7，将测试样本输入到包含权重参数的多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中，预测输出测试样本中目标边界框位置，目标类别及目标的置信度分数。

2.根据权利要求1所述的一种基于深度多尺度特征因子融合的水下目标检测方法，其特征在于：步骤1中，具体包括以下步骤：

1.1采集水下的目标检测图像，对水下原始图像数据进行预处理，预处理包括图像裁剪、数据增强；

1.2标注数据集，对增强处理后的图像数据进行人工标注，再划分数据集；将水下图像数据集中的90％作为训练样本，剩余的10％作为测试样本。

3.根据权利要求1所述的一种基于深度多尺度特征因子融合的水下目标检测方法，其特征在于：步骤5中，具体包括以下步骤：

5.1将现有softmax loss函数设定为多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中目标分类任务的损失函数，用Lcls表示；

5.2将现有Smooth L1 Loss函数设定为多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中目标位置回归任务的损失函数，用Lreg表示；

5.3由目标分类任务的损失函数Lcls和目标位置回归任务的损失函数Lreg，设定多尺度特征因子融合的Faster RCNN软阈值注意力检测模型整体损失函数L为：L＝L({ci},{ti})，

式中，Ncls表示目标分类任务中正样本锚框的总数量，ci表示第i个锚框为预测目标的概率，表示第i个锚框为真实目标的概率，Lcls为多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中目标分类任务的损失函数λ表示目标分类任务与目标位置回归任务间的平衡权重参数，Nreg表示目标位置回归任务中正样本锚框的总数量，ti表示第i个锚框相对于预测目标边框的偏移量，表示第i个锚框相对于真实目标边框的偏移量，Lreg为多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中目标位置回归任务的损失函数，i表示锚框的索引，其取值范围是从1到K，K为锚框总数。

4.根据权利要求1所述的一种基于深度多尺度特征因子融合的水下目标检测方法，其特征在于：步骤6中，具体包括以下步骤：

6.1设学习率为0.0002，优化器使用Adam，训练步数设为2000，训练轮数设为15，在ImageNet数据集上使用骨干网络ResNet‑50预训练得到的分类模型参数，作为多尺度特征因子融合的Faster RCNN软阈值注意力检测模型的初始化参数；

6.2将步骤1中获得的训练样本输入到多尺度特征因子融合的Faster RCNN软阈值注意力检测模型中，使用优化器Adam优化整体损失函数，更新权重参数，当训练轮数达到15时，得到包含权重参数的多尺度特征因子融合的Faster RCNN软阈值注意力检测模型。