利索能及
我要发布
收藏
专利号: 2023111505812
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种改进YOLOV8算法的遥感图像目标检测方法,其特征在于,方法包括以下步骤:接收遥感目标数据集,对遥感目标数据集进行预处理,得到遥感目标处理数据集,将遥感目标处理数据集分为训练集、验证集与测试集,其中,所述遥感目标数据集为通过遥感拍摄视频进行抽帧采样得到的采样图片;

将训练集和验证集输入至预先建立的YOLOv8原始模型内进行训练验证并进行改进,得到改进YOLOv8模型,其中所述YOLOv8原始模型在训练需设置参数;

将测试集输入至改进YOLOv8模型内进行遥感图像目标检测,得到遥感图像目标检测结果;

所述改进YOLOv8模型包括:

将残差结构与全局注意力相结合的残差注意力网络,全局注意力机制的过程表示为:T

[K1·ReLU(w2y+b2) ],

T

y=w1K1+b1,

[ConvBN(ConvBNRELU(K2))],

其中,F1为输入特征图,F2为通道注意力子模块输出特征图,sigmoid和ReLu为激活函数,w1、w2和b1、b2分别为多层感知机的初始权值和偏执项,y为多层感知机的输出,K1、K2为图像的特征值,T表示转置,ConvBN为归一化层,MC为通道注意力函数,F3为全局注意力输出特征图,MS为空间注意力函数;

将残差结构引入后,得到的残差注意力网络如下:

其中F4为残差注意力的输出特征图;

可变形卷积,可变形卷积中卷积核每个像素点的位置通过一个偏移量确定,使得采样网格不再受限于规则分布,能够适应不同形状的物体,可变形卷积对规则采样网格R增加偏移量进行扩充,对任意位置p,输出特征图Y可表示为其中,p表示输入特征图的任意位置,K表示卷积核的个数,wk和pk分别表示第k个位置的权重和偏移量,Δpk和Δmk分别表示第k个位置的可学习偏移量和调制标量,Δmk对卷积的在输入特征图上的采样点的偏移量计算权重,去除无关的上下文信息,对于无关的采样点权重直接学习成0;

由于偏移量的引入,采样的9个位置不再规则,偏移量Δpn通常为分数,所以采用双线性插值实现,可表示为G(q,p)=max(0,1‑|qx‑px|)·max(0,1‑|qy‑py|),其中,p表示任意分数位置,q枚举特征图X中的所有积分空间位置,px、py、qx、qy分别为p和q的横纵坐标,G(·,·)是双线性插值核,MAX(·,·)为取最大值函数;

可变形RoI池化,可变形RoI池化引入了偏移量来增强特征表示的表达能力,RoI池化定义经过最后一次卷积后特征图上的一个矩形框为感兴趣区域RoI,对于给定输入特征图,RoI池化层将RoI分为k×k个直方图,并输出k×k个输出特征图,定义第(i,j)个直方图为bin(i,j)(0≤i,j≤k),则对应的输出特征图y(i,j)为其中x(·)为输入特征图,p0为感兴趣的左上角坐标,p为枚举直方图bin(i,j)中的像素点,nij为直方图bin(i,j)的像素点个数;

在可变形RoI池化在RoI池化中添加偏移量Δpij,产生新的像素点位置,则对应输出特征图y(i,j)由下式表示为还包括使用改进具有动态聚焦机制的边界盒回归损失函数。

2.根据权利要求1所述的一种改进YOLOV8算法的遥感图像目标检测方法,其特征在于,所述对遥感目标数据集进行预处理为运用Mosaic数据增强算法对采样图片随机缩放、随机裁剪和随机排布。

3.根据权利要求1所述的一种改进YOLOV8算法的遥感图像目标检测方法,其特征在于,所述改进具有动态聚焦机制的边界盒回归损失函数采用非单调聚焦机制,通过构造动态的梯度增益系数,用离群度代替交并比来评价锚盒的质量,得出非单调聚焦机制与几何因素相结合边界框损失函数,公式如下:LWIoU=γRWIoULIoU,

LIoU=1‑IoU

其中,LWIoU为WIoU的边界框回归损失函数,LIoU为初始边界框回归损失函数,IoU为真实框与边界框的交并比,x,y为预测框的中心点坐标,xgt,ygt为真实框的预测框的中心点坐标,Wg和Hg是预测框与真实框构成的最小矩形框的宽高值,w,h分别为预测框的宽高值,δ,α为超参数,γ为梯度增益,β为离群度, 是具有动量m的动态平均交并比值,上标*表示为防止产生阻碍收敛的梯度,将β中的LIoU、RWIoU中的Wg和Hg从梯度计算中分离出来。

4.根据权利要求1所述的一种改进YOLOV8算法的遥感图像目标检测方法,其特征在于,所述改进YOLOv8模型性能的评价指标包括:精确率P、召回率R、平均精确率AP和检测速度FPS,其中,精确率P—定义为所有检测出的目标检测正确率,可表示为召回率R—定义为所有正样本中检测正确率,可表示为

平均精确率AP—定义为不同召回率下精确率的均值,可表示为

其中,TP为正样本预测为正类个数;FP为负样本预测为正类个数;FN为正样本预测为负类个数;TN为负样本预测为负类个数;

FPS定义为改进YOLOv8模型每秒检测图片数量。

5.一种改进YOLOV8算法的遥感图像目标检测系统,采用了权利要求1至4中任一项所述的一种改进YOLOV8算法的遥感图像目标检测方法,其特征在于,包括:数据预处理模块:用于接收遥感目标数据集,对遥感目标数据集进行预处理,得到遥感目标处理数据集,将遥感目标处理数据集分为训练集、验证集与测试集,其中,所述遥感目标数据集为通过遥感拍摄视频进行抽帧采样得到的采样图片;

模型改进模块:用于将训练集和验证集输入至预先建立的YOLOv8原始模型内进行训练验证并进行改进,得到改进YOLOv8模型,其中所述YOLOv8原始模型在训练需设置参数;

目标检测模块:用于将测试集输入至改进YOLOv8模型内进行遥感图像目标检测,得到遥感图像目标检测结果。

6.一种设备,其特征在于,包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当一个或多个所述程序被一个或多个所述处理器执行,使得一个或多个所述处理器实现如权利要求1‑4中任一所述的一种改进YOLOV8算法的遥感图像目标检测方法。