利索能及
我要发布
收藏
专利号: 202311681649X
申请人: 江苏海洋大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种水域无人清理船目标轻量化检测方法,其特征在于,包含一个The LRT‑DETR网络模型,该模型通过以下步骤完成水面物体检测:具体步骤如下:S1:使用一个backbone骨干网络进行输入图像的特征提取,输出四个不同维度的特征图;从低维到高维或从下到上依次是{F0、F1、F2、F3};

S2:采用一个LEHE轻量级高效混合编码器,通过EMFI高效多头特征交互模块对最高维度的特征图F3进行注意力特征提取得到输出M4;

EMFI模块具体通过以下步骤完成注意力特征提取:

S2‑1:通过映射操作从输入特征图中获得query,并将2D token变换成三维结构,以便进行更深层次的特征分析;

S2‑2:通过深度卷积操作减小特征图的尺寸,以降低计算复杂度,然后将3D token重新映射回二维结构;

S2‑3:通过进一步的映射操作,生成key和value;

S2‑4:计算自注意力,其计算公式为:

其中,IN(·)为实例规范化,Conv(·)是一个标准的1×1矩阵,dk为key的维度;

S2‑5:并将每个头的计算结果相加通过线性层linear输出,其计算为:* * *

y=x+FFN(LN(x))and x=EMSA(LN(x))  (2)其中,LN(·)为批量归一化层,FNN(·)用于特征变换和非线性处理;

S3:结合EMFFM高效多尺度特征融合模块对{F0、F1、F2、M4}进行特征融合;

EMFFM是在传统FPN结构的基础上进行的改进,用于增强特征图对图像中上下文信息和全局特征的理解,同时解决特征融合过程中的语义鸿沟问题,其具体包含以下步骤完成特征融合:S3‑1:首先通过Receptive Field Block感受野块网络引入不同大小的卷积核和池化层,扩增特征图的感受野,同时消除由于FPN结构中多次上采样和下采样导致的高层语义信息传播不足的问题;

S3‑2:EMFFM模块使用一个新提出的FUSE模块对相邻特征层进行融合,有效地整合不同尺度的特征信息;

FUSE模块解决不同尺度特征层之间的语义鸿沟问题,通过对相邻尺度的特征层进行有效融合,增强了特征图对目标的表达能力,具体步骤如下:S3‑2‑1:通过QARepBlock量化感知Rep块对网络进行参数重构,减少了网络的参数量,提高了整体的计算效率;

S3‑2‑2:结合通道注意力机制,FUSE模块自适应地学习特征通道之间的相关性,实现对不同维度特征的有效整合,提高特征融合的质量和效果;

S3‑3:S3‑2中的FUSE模块通过特殊设计,能够自适应地学习特征通道之间的相关性,实现不同维度特征的有效整合;

S3‑4:EMFFM模块对特征提取后的特征图进行拼接,并将拼接后的特征图输出到解码器层,其计算公式为:Output=EMFFM({M4,F2,F1,F0});

S4:通过Iou‑aware query selection交并比感知选择器选取固定数量的图像特征输出序列作为Decoder解码器的初始化对象查询,进一步迭代优化生成目标检测框及置信度分数,表示检测到的目标存在的概率,完成整个图像处理系统的目标检测任务。

2.根据权利要求1所述的一种水域无人清理船目标轻量化检测方法,其特征在于,所述S1中backbone用于接收输入图像并进行特征提取,生成不同尺度的特征图,其中最高维度特征图F3经过EMFI模块处理后,包含丰富的全局语义信息,适用于大目标检测,而其他维度特征图F0、F1、F2包含细节信息,其高分辨率特性使其适用于小目标检测。