利索能及
我要发布
收藏
专利号: 202311485210X
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:执行步骤A至步骤C如下,获得舰船检测模型;进而应用舰船检测模型针对待检测图像进行检测,获得待检测图像中舰船目标的检测位置、以及置信度;

步骤A.获得预设样本数量包含预设各尺寸舰船目标的样本图像,并获得各样本图像中各舰船目标的真实位置,以及获得分别对应预设大、中、小三种舰船目标尺度的舰船目标尺寸先验框,然后进入步骤B;

步骤B.构建自输入端至输出端方向依次包括主干特征提取单元Backbone、颈部单元Neck、头单元Head的改进YOLOV5网络,然后进入步骤C;

其中,主干特征提取单元Backbone的输入端构成改进YOLOV5网络的输入端,用于接收图像,主干特征提取单元Backbone的结构中,其输入端所接收图像首先经过Focus层进行切片获得特征图;然后该特征图经过第一Conv2D_BN_SiLU层(384,384,32)后,依次经过串联连接的第一特征堆叠单元、第二特征堆叠单元、第三特征堆叠单元进行处理;最后,第三特征堆叠单元的输出端对接注意力特征提取单元的输入端;

其中,第一特征堆叠单元自输入端至输出端依次包括串联连接的第二Conv2D_BN_SiLU层(192,192,64)、第一Csplayer层(192,192,64),第二特征堆叠单元自输入端至输出端依次包括串联连接的第三Conv2D_BN_SiLU层(96,96,128)、第二Csplayer层(96,96,128),第三特征堆叠单元自输入端至输出端依次包括串联连接的第四Conv2D_BN_SiLU层(48,48,

256)、第三Csplayer层(48,48,256);

注意力特征提取单元自输入端至输出端依次包括串联连接的第五Conv2D_BN_SiLU层(24,24,512)、SPPF_t层(24,24,512)、CBAM层(24,24,512)、第六Conv2D_BN_SiLU层(24,24,

512);

步骤C.基于各幅样本图像,以样本图像为输入,以样本图像中各舰船目标分别关于各舰船目标尺寸先验框的检测位置、置信度为输出,应用Adam优化器,结合CIoU损失函数,针对改进YOLOV5网络进行训练,获得舰船检测模型。

2.根据权利要求1所述一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:所述步骤A包括如下步骤:

步骤A1.收集获得预设样本数量包含预设各尺寸舰船目标的样本图像,并获得各样本图像中各舰船目标的真实位置、以及各舰船目标分别所在最小包围的真实框尺寸;

步骤A2.针对各样本图像中各舰船目标分别所在真实框尺寸,按分别对应预设大、中、小三种舰船目标尺度进行聚类,获得各聚类中心所对应真实框尺寸,即构成分别对应预设大、中、小三种舰船目标尺度的舰船目标尺寸先验框;

步骤A3.针对各幅样本图像的尺寸进行调整,统一到预设图像尺寸,更新各幅样本图像。

3.根据权利要求2所述一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:所述步骤A中在步骤A3之后,还包括步骤A4如下:

步骤A4.分别针对各幅样本图像,应用预设数据增广方式,获得各新增样本图像,进而由全部各幅样本图像、以及全部各幅新增样本图像,构成各幅样本图像。

4.根据权利要求1所述一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:第一Csplayer层(192,192,64)、第二Csplayer层(96,96,128)、第三Csplayer层(48,48,256)的结构相同,各Csplayer层的结构中,Csplayer层的输入端接收其所属特征堆叠单元中Conv2D_BN_SiLU层输出的特征,首先获得该特征的副本,由该特征、以及副本分别构成Part1和Part2,然后将Part2依次输送至预设数量个残差网络进行处理;最后将经各残差网络处理所获特征与Part1输送至Concat层进行特征堆叠处理,Concat层的输出端即构成Csplayer层的输出端。

5.根据权利要求1所述一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:所述SPPF_t层(24,24,512)包括首位Conv2D_BN_SiLU层、Concat层、末尾Conv2D_BN_SiLU层、以及十个MaxPool2d层,其中,首位Conv2D_BN_SiLU层的输入端构成SPPF_t层(24,24,512)的输入端,首位Conv2D_BN_SiLU层的输出端依次串联十个MaxPool2d层,且首位Conv2D_BN_SiLU层的输出端、第一个MaxPool2d层的输出端、第二个MaxPool2d层的输出端、第四个MaxPool2d层的输出端、第六个MaxPool2d层的输出端、第八个MaxPool2d层的输出端、第十个MaxPool2d层的输出端分别与Concat层的输入端相连,Concat层的输出端对接末尾Conv2D_BN_SiLU层的输入端,末尾Conv2D_BN_SiLU层的输出端构成SPPF_t层(24,24,512)的输出端。

6.根据权利要求1所述一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:所述CBAM层(24,24,512)自输入端至输出端依次包括串联连接的通道注意力模块、空间注意力模块,其中,通道注意力模块包括第一最大池化层、第一全局平均池化层、第一全连接层、第二全连接层、相加模块、第一Sigmoid激活函数、第一相乘模块,其中,第一最大池化层的输入端与第一全局平均池化层的输入端相连、构成通道注意力模块的输入端,即CBAM层(24,24,512)的输入端,用于接收特征图,并由第一最大池化层和第一全局平均池化层分别对特征图进行处理、获得分别所对应的特征向量;第一最大池化层的输出端、第一全局平均池化层的输出端分别依次串联第一全连接层、第二全连接层,第一最大池化层所输出特征向量、第一全局平均池化层所输出特征向量分别依次经过第一全连接层、第二全连接层获得两特征,并将该两特征输送至相加模块,由相加模块对该两特征进行相加,获得相加特征;相加模块的输出端对接第一Sigmoid激活函数的输入端,由第一Sigmoid激活函数对所接收相加特征进行归一化,获得通道注意力的权重向量;第一Sigmoid激活函数的输出端对接第一相乘模块的一输入端,同时CBAM的输入端对接第一相乘模块的另一输入端,由第一相乘模块将CBAM输入端的特征向量与通道注意力的权重向量进行相乘,获得相乘特征进行输出,第一相乘模块的输出端构成通道注意力模块的输出端;

空间注意力模块包括第二最大池化层、第二全局平均池化层、Concat层、卷积层、第二Sigmoid激活函数、第二相乘模块、Conv2D_BN_SiLU层,其中,第二最大池化层的输入端与第二全局平均池化层的输入端相连、构成空间注意力模块的输入端,空间注意力模块的输入端对接通道注意力模块的输出端,由空间注意力模块的输入端接收来自通道注意力模块输出的相乘特征,并由第二最大池化层和第二全局平均池化层分别对相乘特征进行处理、获得分别所对应的特征向量;第二最大池化层的输出端与第二全局平均池化层的输出端对接Concat层的输入端,由Concat层对第二最大池化层所输出特征向量、第二全局平均池化层所输出特征向量进行融合,获得融合特征;Concat层的输出端依次经卷积层、第二Sigmoid激活函数获得空间注意力的权重向量;第二Sigmoid激活函数的输出端对接第二相乘模块的一输入端,同时通道注意力模块的输出端对接第二相乘模块的另一输入端,由第二相乘模块将通道注意力模块所输出的相乘特征与空间注意力的权重向量进行相乘,获得相乘特征进行输出,第二相乘模块的输出端对接Conv2D_BN_SiLU层的输入端,Conv2D_BN_SiLU层的输出端构成空间注意力模块的输出端,即CBAM层(24,24,512)的输出端。

7.根据权利要求1所述一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:所述步骤B中,颈部单元Neck按数据流输送方向依次包括串联连接的第七Conv2D_BN_SiLU层、第一上采样层、第一Concat层、第八Conv2D_BN_SiLU层、第二上采样层、第二Concat层、第九Conv2D_BN_SiLU层、第一下采样层、第三Concat层、第二下采样层、第四Concat层;其中,主干特征提取单元Backbone中注意力特征提取单元的输出端对接第七Conv2D_BN_SiLU层的输入端,第一Concat层的输入端同时对接主干特征提取单元Backbone中第三特征堆叠单元的输出端,第二Concat层的输入端同时对接主干特征提取单元Backbone中第二特征堆叠单元的输出端,第三Concat层的输入端同时对接第八Conv2D_BN_SiLU层的输出端,第四Concat层的输入端同时对接第七Conv2D_BN_SiLU层的输出端。

8.根据权利要求7所述一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:所述步骤B中,头单元Head包括第十Conv2D_BN_SiLU层、第十一Conv2D_BN_SiLU层、以及分别对应预设小、中、大三种舰船目标尺度检测的检测单元P3、检测单元P4、检测单元P5,其中,颈部单元Neck中第九Conv2D_BN_SiLU层的输出端对接检测单元P3的输入端,颈部单元Neck中第三Concat层的输出端经第十Conv2D_BN_SiLU层对接检测单元P4的输入端,颈部单元Neck中第四Concat层的输出端经第十一Conv2D_BN_SiLU层对接检测单元P5的输入端,检测单元P3、检测单元P4、检测单元P5分别用于检测预设小、中、大三种舰船目标尺度的检测位置、以及置信度,并分别进行输出。

9.根据权利要求8所述一种基于改进YOLOV5网络的遥感图像多尺度舰船目标检测方法,其特征在于:第一Conv2D_BN_SiLU层(384,384,32)、第二Conv2D_BN_SiLU层(192,192,

64)、第三Conv2D_BN_SiLU层(96,96,128)、第四Conv2D_BN_SiLU层(48,48,256)、第五Conv2D_BN_SiLU层(24,24,512)、第六Conv2D_BN_SiLU层(24,24,512)、第七Conv2D_BN_SiLU层、第八Conv2D_BN_SiLU层、第九Conv2D_BN_SiLU层、第十Conv2D_BN_SiLU层、第十一Conv2D_BN_SiLU层的结构彼此相同,各Conv2D_BN_SiLU层中分别自其输入端至其输出端方向依次执行卷积、归一化、SiLU函数激活。