利索能及
我要发布
收藏
专利号: 2025100397813
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于YOLO‑LiteMax神经网络的无人机目标检测方法,其特征在于,包括如下步骤:步骤1、构建基于YOLOv8的YOLO‑LiteMax目标检测模型,输入训练集图片进行模型训练;

步骤2、输入的图片经过主干网络进行特征提取,生成不同尺度的特征图;所述主干网络包含若干个CBS模块、若干个选择卷积块、一个SPPF模块;所述选择卷积模块将C2f模块中的Bottleneck替换为FasterNet块,用于减少特征图冗余信息;

步骤3、将生成的不同尺度的特征图输入颈部网络,利用尺度序列进行特征融合;所述颈部网络对不同尺度的特征图进行差异化处理,融合多尺度特征图局部细节与全局信息,再通过增加大尺度特征图的方式突出小目标信息,并利用特征提取模块得到小目标的局部细节;

步骤4、将颈部网络特征融合后的特征图输入头部网络,进行分类和回归任务;所述头部网络中,检测头使用组归一化和共享卷积进一步提取特征,共享各尺度特征之间的信息,并通过解耦头对分类和回归任务分别进行训练,使用尺度因子对特征图进行缩放,得到训练好的YOLO‑LiteMax目标检测模型;

步骤5、将待检测的无人机图像输入至训练好的YOLO‑LiteMax目标检测模型,进行目标检测,识别图像中的密集小目标;

步骤3颈部网络中,对不同尺度的特征图进行特征融合,方法如下:

步骤301、修改主干网络与颈部网络的连接方式,将传统YOLOv8主干网络第四、六、九层连接到颈部网络,优化为主干网络第二、四、六、九层连接到颈部网络;其中,第九层SPPF模块输出的特征图P5在进入颈部网络后先经过第十层CBS模块进行卷积处理;

步骤302、将特征图P3、P4和卷积处理后的特征图P5的作为大、中、小尺寸的特征图,输入到第一个SAC模块进行特征融合,对不同尺度的特征图进行差异化处理,平衡特征图的细节保留与全局信息提取,避免小目标特征在上采样过程中丢失;

将第一个SAC模块输出的特征图再次经过一个选择卷积块进行处理,将选择卷积块输出的特征图与特征图P2、P3再次输入到第二个SAC模块,进一步充分融合特征,接着经过选择卷积块进行处理,得到P3尺度特征图,供P3检测头使用;

将第二个SAC模块输出的特征图通过由大小为3,步长为2的卷积核组成的CBS模块进行下采样操作,下采样得到的结果与第一个SAC模块融合的特征图进行Concat操作,经过选择卷积块进行处理,得到P4尺度特征图,供P4检测头使用;

将得到的特征图再次通过由大小为3,步长为2的卷积核组成的CBS模块进行下采样操作,下采样得到的结果与经过第十层CBS模块输出的特征图进行Concat操作,经过选择卷积块进行处理,得到P5尺度特征图,供P5检测头使用;

步骤303、在颈部网络中增加两个C3DSF特征提取模块,捕捉特征图跨尺度之间的关联性,将特征图P3、P4、P5输入第一个C3DSF特征提取模块,充分提取特征图信息;

步骤304、将经过第一个C3DSF特征提取模块提取的特征与经过第二个SAC模块融合后的特征图进行Add操作,增加一个上采样模块和一个Concat模块,通过上采样融合P3尺度特征图,与主干网络中第二层选择卷积块的输出进行Concat操作,经过选择卷积块再次处理后,将特征图P2、P3、P4输入到第二个C3DSF特征提取模块进行特征提取,然后与选择卷积块处理后的特征进行Add操作,得到P2尺度特征图,供P2检测头使用;

所述C3DSF特征提取模块中,将大、中、小尺寸特征图调整为同一个通道数,对中、小尺寸特征图采用插值上采样操作,将特征图大小调整为大尺寸特征图大小,拓展大、中、小尺寸特征图张量的维度并进行拼接,对拼接后的特征图使用3D卷积提取特征,接着经过归一化层、激活函数层、最大池化层后,将得到的处理结果压缩为输入时的维度;

所述C3DSF特征提取模块,特征提取表达式如下:

其中, , , 表示增加了3D维度的三个尺寸的特征图, 表示拼接操

作, 表示三维卷积, 表示批量归一化操作, 表示 激活函数,

表示最大池化操作, 表示降维操作, 表示维度。

2.根据权利要求1所述的基于YOLO‑LiteMax神经网络的无人机目标检测方法,其特征在于,步骤2中,每个所述CBS模块由一个大小为3步长为2的卷积核、批量归一化层和SiLU激活函数组成;

每个所述选择卷积块包括一个CBS模块、一个Split层、三个依次连接的FasterNet块;

每个FasterNet块仅对部分通道进行卷积,每个FasterNet块的输出作为下一个FasterNet块的输入,并存入列表,经过三个FasterNet块后,列表中的所有特征图按通道进行拼接;

所述SPPF模块由CBS和Maxpool操作组成,通过在多个尺度上池化信息,增强主干网络特征提取能力。

3.根据权利要求2所述的基于YOLO‑LiteMax神经网络的无人机目标检测方法,其特征在于,步骤2主干网络中,目标物体图片经过主干网络进行特征提取,方法如下:步骤201、输入的图片经过第零层和第一层两个CBS模块进行两次下采样,得到4倍下采样特征图,进入第二层选择卷积块进行卷积;

在第二层选择卷积块中,4倍下采样特征图先经过一个CBS模块处理,输出进入一个Split层,Split层将特征图划分为两个具有相同通道数的特征图后,依次经过3个FasterNet块进行特征提取,得到4倍下采样后的大尺寸特征图P2;

将4倍下采样后的特征图P2经过第三层CBS模块,进行8倍下采样后,输入至第四层选择卷积块中进行特征提取,得到8倍下采样后的特征图P3;

再经过第五层CBS模块,进行16倍下采样后,输入至第六层选择卷积块中进行特征提取,得到16倍下采样后的特征图P4;

再经过第七层CBS模块,进行32倍下采样后,输入至第八层选择卷积块中进行特征提取,得到32倍下采样后的特征图P5;将特征图P5通过第九层SPPF模块,提高YOLO‑LiteMax目标检测网络捕获上下文细节的能力;

步骤202、将提取特征后的8倍下采样特征图P3、16倍下采样特征图P4、32倍下采样特征图P5,以及4倍下采样后的特征图P2,共同输出到Neck网络中。

4.根据权利要求1所述的基于YOLO‑LiteMax神经网络的无人机目标检测方法,其特征在于,所述SAC模块中,对大尺寸特征图进行自适应最大池化和自适应平均池化,相加两个池化的结果,对小尺寸特征图进行插值上采样操作,再将经过处理的大、中、小尺寸特征图在通道维度上进行拼接;

所述SAC模块,特征融合表达式如下:

其中, 表示SAC模块输出的结果, 、 和 分别表示大、中、小尺寸特征图,表示最大池化操作, 表示平均池化操作, 表示插值上采样操作, 表示拼接操作。

5.根据权利要求1所述的基于YOLO‑LiteMax神经网络的无人机目标检测方法,其特征在于,步骤4头部网络中,进行分类和回归任务,方法如下:步骤401、修改颈部网络与头部网络中的连接方式,新增一个P2尺度检测头,将传统YOLOv8颈部网络P3、P4、P5三层尺度特征图连接到头部网络,修改为颈部网络P2、P3、P4、P5四层尺度特征图连接到头部网络;

步骤402、将组归一化融入至头部网络CBS模块中,将BatchNormalization替换为GroupNormalization,得到改进的CGS模块;

步骤403、P2尺度特征图先经过一个独立的CGS模块进一步特征提取,再经过两个由P2、P3、P4、P5尺度特征图共享参数的CGS模块进行处理,将CGS模块输出的特征分别输出到由P2、P3、P4、P5一起共享的1×1卷积的分类头和回归头进行解耦学习,通过Scale尺度因子将回归特征进行尺度缩放,分别计算P2尺度特征图的Bbox_loss和Cls_loss;

步骤404、P3尺度特征图先经过一个独立的CGS模块进一步特征提取,再经过两个由P2、P3、P4、P5尺度特征图共享参数的CGS模块进行处理,将CGS模块输出的特征分别输出到由P2、P3、P4、P5一起共享的1×1卷积的分类头和回归头进行解耦学习,通过Scale尺度因子将回归特征进行尺度缩放,分别计算P3尺度特征图的Bbox_loss和Cls_loss;

步骤405、P4尺度特征图先经过一个独立的CGS模块进一步特征提取,再经过两个由P2、P3、P4、P5尺度特征图共享参数的CGS模块进行处理,将CGS模块输出的特征分别输出到由P2、P3、P4、P5一起共享的1×1卷积的分类头和回归头进行解耦学习,通过Scale尺度因子将回归特征进行尺度缩放,分别计算P4尺度特征图的Bbox_loss和Cls_loss;

步骤406、P5尺度特征图先经过一个独立的CGS模块进一步特征提取,再经过两个由P2、P3、P4、P5尺度特征图共享参数的CGS模块进行处理,将CGS模块输出的特征分别输出到由P2、P3、P4、P5一起共享的1×1卷积的分类头和回归头进行解耦学习,通过Scale尺度因子将回归特征进行尺度缩放,分别计算P5尺度特征图的Bbox_loss和Cls_loss。

6.根据权利要求5所述的基于YOLO‑LiteMax神经网络的无人机目标检测方法,其特征在于,将得到的P2、P3、P4、P5尺度特征图的Bbox_loss和Cls_loss,回归损失Bbox_loss用于优化预测边界框的位置和尺寸,确保物体被准确定位;分类损失Cls_loss用于提升类别识别的准确性,确保物体类别被正确分类,通过同时最小化这两种损失,使得YOLO‑LiteMax目标检测网络在定位和分类两个方面取得平衡;

通过在头部网络中构建CGS模块并应用共享卷积,增强YOLO‑LiteMax目标检测网络在多尺度目标检测中的特征一致性与检测性能,并通过协同学习使不同尺度检测头在训练中共同优化参数,提升特征提取的鲁棒性与泛化能力。

7.一种电子设备,其特征在于,包括:

一个或多个处理器;

存储装置,其上存储有一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任一所述的基于YOLO‑LiteMax神经网络的无人机目标检测方法。

8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时,实现权利要求1至6中任一项所述的基于YOLO‑LiteMax神经网络的无人机目标检测方法中的步骤。