利索能及
我要发布
收藏
专利号: 2021112698279
申请人: 燕山大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于改进YOLOv3的遥感图像小目标检测方法,其特征在于:包括以下步骤:步骤1,数据集预处理:获取训练遥感图像组成数据集,对数据集进行格式转换,并将数据集随机划分为训练验证集和测试集,在训练时采用交叉验证的方式对YOLOv3网络模型评估;

步骤2,对YOLOv3网络进行优化:在Neck中加入空洞卷积组模块、特征强化模块和通道注意力机制模块;

步骤3,在线数据增强:在训练集中每次随机选择相同数量的图片,对其在线图像数据增强后输入优化后的YOLOv3网络;

步骤4,前向推理:优化后的YOLOv3网络中的Head负责根据融合的特征推断出物体坐标和类别,获得包围目标物体的边框坐标、物体类别和置信度;

步骤5,改进损失函数:根据函数值迭代训练并更新参数,每次迭代后在验证集上评估;

步骤6,训练结束:选择在验证集上检测精度和召回率最高的优化的YOLOv3网络模型载入网络。

2.根据权利要求1所述的一种基于改进YOLOv3的遥感图像小目标检测方法,其特征在于:步骤1中,所述数据集预处理具体是指:将数据集标注信息变换成VOC格式,将其按9:1的比例随机划分为训练验证集和测试集,各集合互不干涉,没有相同的图片,防止数据被污染;

在训练时采用交叉验证的方式对YOLOv3网络模型评估,即先将训练验证集按8:1的比例随机划分为训练集和验证集,训练集用于模型训练和权重更新,验证集用于对每轮训练结束后获得的模型评估。

3.根据权利要求1所述的一种基于改进YOLOv3的遥感图像小目标检测方法,其特征在于:步骤2中,

所述空洞卷积组模块能够适应多尺度图片输入,扩大网络感受野;

所述特征强化模块能够将物体位置信息丰富而语义信息较少的浅层特征与物体语义信息丰富而位置信息较少的深层特征融合,融合不同分辨率的特征;

所述通道注意力机制模块能够排除干扰,从复杂背景中提取对检测更为关键的物体特征信息,赋予特征各通道权值以加强全局特征。

4.根据权利要求3所述的一种基于改进YOLOv3的遥感图像小目标检测方法,其特征在于:通道注意力机制模块的计算公式为:全局平均池化:

式中,W、H表示特征图的宽、高,xi,j表示特征图每个通道上第i行第j列点的值;

通道卷积:

ω=σ(C1Dk(y))

j j

式中,因经过全局平均池化,所以此时i=1,y表示第j个通道, 表示y的k个相邻通道j

的集合,α表示第j个通道权重,σ表示sigmoid(),ωi表示第i个权重;

k的求法:

式中,c表示给定通道数,γ、b分别等于2、1,odd表示最近的奇数。

5.根据权利要求1所述的一种基于改进YOLOv3的遥感图像小目标检测方法,其特征在于:步骤3中,所用在线数据增强技术包括光度失真、几何失真、模拟遮挡、多图像融合;

所述光度失真主要改变图片的像素点,如:随机亮度变化、随机对比度变化、随机饱和度变化、随机色度变化、添加随机噪声;

所述几何失真主要改变图片的形状,如:随机裁剪、随机旋转、随机角度;

所述模拟遮挡是指随机擦除图片中的小块,即将小块像素点设置为全黑;

所述多图像融合是指随机裁剪一幅图像的一般部分,并替换另一张图片上相同位置的部分,或将两幅图片重叠在一起,像素点叠加。

6.根据权利要求1所述的一种基于改进YOLOv3的遥感图像小目标检测方法,其特征在于:步骤5中,损失函数中的位置损失使用DIOU来计算,它同时考虑检测框与真实框的重合度,重合方向和位置关系三个因素,可以直接最小化两个目标框的距离,因此收敛得会更快;

改进后的损失函数公式为:

式中,LossDIOU为一张图片上总DIOU损失,Lossconfi为一张图片上总置信度损失,Losscls为一张图片上总类别损失,N为一张图片上的目标数量。

7.根据权利要求1所述的一种基于改进YOLOv3的遥感图像小目标检测方法,其特征在于:步骤6中,选择在验证集上评估精度和召回率最高的模型载入网络,在测试集上获得该模型的检测效果。