利索能及
我要发布
收藏
专利号: 2024100863334
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-07-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,包括具体步骤如下:S1:获取Google Earth公开的遥感军事坦克数据集,按6:2:2比例划分为训练集、验证集和测试集;

S2:在YOLOv7网络中,使用轻量级MobileNetv3替代原有Backbone,减少模型体积大小;

S3:设计更加适用于遥感目标的SD‑MP模块,减少下采样过程中坦克目标的特征损失;

S4:基于GCNet和深度可分离卷积设计GD‑ELAN模块,在轻量化的同时增强了模型的表示能力;

S5:将数据集输入网络进行迭代训练,训练完成后,使用最优模型对测试集进行检测得到最后结果。

2.根据权利要求1所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S1中遥感图像军事坦克数据集其具体为:获取来源于开源的Google Earth数据,其中包含了不同高度、方位、时间的4000张图片,划分出训练集2400张、验证集

800张和测试集800张进行实验。

3.根据权利要求1所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S2中使用轻量级MobileNetv3其具体为:使用MobileNetv3作为MSG‑YOLOv7的骨干网络,显著减少了模型的参数量和计算量,其中,MobileNetv3是一种专为图像处理任务设计的轻量级神经网络结构,它主要由Bneck结构组成,这个结构主要由扩张卷积、深度可分离卷积、SE模块和残差连接组成,在这个结构中,扩张卷积有助于增加感受野,深度可分离卷积则降低了计算成本并促进了信息流动,而SE模块则能够更好地建模特征之间的关系,而残差连接则可以融合不同特征层之间的信息,这些模块的整合能够有效提升特征学习和信息传递的效率,有助于保持模型轻量化的同时提供良好的性能表现,使得模型更适用于资源受限的场景。

4.根据权利要求3所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述深度可分离卷积是一种卷积神经网络中常用的操作,它的设计旨在减少参数数量和计算量,同时保持模型性能,主要分为两个步骤:步骤一:深度卷积,对每个输入通道进行单独的卷积操作以捕捉局部特征;

步骤二:逐点卷积,使用1×1的卷积核进行线性组合,将深度卷积的输出映射到最终的输出通道;

其中,标准卷积参数量P和计算量F公式如下:

P=DK×DK×M×N

F=DK×DK×M×N×DW×DH

其中DK代表卷积核,M代表输入通道数,N代表输出通道数,DW代表输出特征宽,DH代表输出特征高;

深度可分离卷积的参数量DP和计算量DF公式如下:

DP=DK×DK×M+M×N

DF=DK×DK×M×DW×DH+M×N×DW×DH

两者参数量和计算量对比如下:

5.根据权利要求1所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S3中SD‑MP模块主要是为了解决遥感图像中可能出现的坦克目标在下采样过程中可能面临的特征丢失问题,SD‑MP模块通过分离拼接技术,首先将输入图像分割为小块,并按通道重新组合,然后通过卷积处理以捕获更丰富的特征信息,这种操作方式有效地缓解了下采样可能导致的信息丢失,此外,引入深度可分离卷积来代替原标准卷积,以提高模块的效率和性能。

6.根据权利要求1所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S4中GD‑ELAN模块是一种为了克服在复杂背景下进行目标检测时所面临挑战而创新设计的模块,它的核心构建在两个主要组件上:全局上下文GCNet和深度可分离卷积,主要作用是提升网络对整体背景的感知和对特征的表达能力,解决在复杂背景中军事目标检测难的问题。

7.根据权利要求6所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述全局上下文GCNet是一种全局上下文模块,能够在图像处理中获取全局信息,这种全局信息对于正确区分目标和背景,以及理解目标与周围环境的关系非常重要,对于提高坦克目标检测的准确性和可靠性非常有效,其计算过程如下:Y=X×σ(Wv2Relu(LN(Wv1Y1)))

公式中,Xi表示特征图中的任意位置信息,Np表示所有位置数量,Wk表示权重参数,Softmax表示归一化操作,Y1为得到的特征矩阵,Relu为激活函数,LN为层归一化,Wv1、Wv2分别为两个卷积层v1、v2的权重参数,σ为sigmoid函数,Y为最终特征图。

8.根据权利要求1所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中模型训练其具体为:实验在Ubuntu16.04环境下进行,采用Python 

3.8和PyTorch 1.9.0作为主要开发工具,在硬件配置方面,使用了GeForce RTX 3090GPU和Core i9‑10900 CPU,配备了CUDA 11.1,系统内存容量为64GB,模型训练中设置了图片大小为640×640,并使用了SGD优化器,批量大小为16,训练迭代次数为200次。

9.根据权利要求1所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中获取模型检测结果其具体为:将改进后算法与不同算法进行对比,选取权重大小、每秒传输帧数、参数量、计算量和平均精度AP指标来评估模型性能,其AP计算公式如下:公式中,P为精度、R为召回率,TP为正确检测的数量,FP为被错检为正样本的数量,FN为被错检为负样本的数量。

10.根据权利要求9所述的一种基于MSG‑YOLOv7的轻量化遥感图像军事坦克目标检测算法,其特征在于,所述S5中将改进后算法与不同算法进行对比其具体为:为了准确地验证MSG‑YOLOv7算法在遥感坦克检测任务中的性能,将其与SSD、YOLOv3、YOLOv4、YOLOv5、YOLOv7、YOLO‑FSD和DCN‑YOLO算法进行比较,在同等条件下训练和测试以上各算法。