利索能及
我要发布
收藏
专利号: 2024110897089
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-01-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种面向无人机航拍图像目标检测方法,其特征在于,包括以下步骤:S1获取无人机小目标数据集并进行预处理;采用公开数据集VisDrone2019;预处理具体如下:随机裁剪为统一大小,划分训练集、验证集和测试集;将数据集转化成txt格式;

S2引入C3CBAM注意力模块,将yolov5s的Backbone特征提取网络中的C3模块全部替换为卷积块注意力模块C3CBAM模块;具体如下:C3CBAM模块包括通道注意力模块和空间注意力模块;其中,通道注意力模块对输入特征图 经过平均池化和最大池化分别输出平均池化特征图AvgPool(F)和最大池化特征图MaxPool(F),分别捕获特征图的全局平均信息和全局最大信息,再通过共享权重的多层感知器MLP输出两个具有相同维度的特征向量,用sigmoid函数对向量中的每一个元素进行归一化,形成通道注意力特征图,公式如下:;

其中,C、H、W分别是特征图通道数、高和宽, 是sigmoid激活函数,, ,r是参数减少率, 和 是多层感知器MLP的权

重, 和 分别是在空间上使用平均池化和最大池化;

空间注意力模块对通道注意力模块处理后的特征图进行通道维度的全局平均和最大池化操作;增加一个局部敏感的 卷积层帮助网络捕捉局部特征和边界细节,然后通过一个卷积层生成空间注意力特征图,公式如下:;

其中, , 和 分别表示在通道维度上对

F使用平均池化和最大池化, 为 的卷积, 为 的卷积;

S3将yolov5s的Backbone特征提取网络中第四层增加特征增强模块FEM模块;具体如下:FEM模块包括四个分支;其中,第一个分支首先特征图F经过 卷积进行降维,在经过 卷积提取局部特征得到输出M1;第二分支为卷积层,包括: 卷积、 卷积、卷积、 卷积;第三分支为卷积层,包括: 卷积、 卷积、 卷积、 卷积;第四分支为 卷积;公式如下:

其中, 表示通过第一个分支得到的输出特征图, 表示通过第二个分支得到的输出特征图, 表示通过第三个分支得到的输出特征图,A是三个分支 、 、 通过拼接后,与 卷积处理的原始输入特征图进行元素级相加后得到的最终输出特征图;

代表Conv 卷积, 代表Conv 卷积, 代表Conv 卷积,代表Conv 卷积;Cat表示的是特征图的拼接操作, 表示M1、M2、M3融合后的特征图与输入特征图 相加;

S4将yolov5s的head层中引入空间上下文感知模块SCAM模块;增加23、24、25三个特征处理层;其中,在yolov5s的head层中引入SCAM模块,具体如下:SCAM模块通过全局平均池化和全局最大池化对输入的特征图进行处理,对处理后的特征图进行线性变换,将计算得到的关联性特征图与原始特征图进行逐元素相加;公式如下:;

其中, 和 分别代表第i层特征图中第j个像素的输入和输出, 表示的是第i层特征图中第j个像素的注意力权重, 表示像素总数, 和 是用于特征映射的线性变换矩阵,exp是指数函数,用于加权计算, 和 分别执行GAP和GMP,GAP和GMP分别代表全局平均池化和全局最大池化;

增加23、24、25三个特征处理层具体如下:添加第23层用于提取高层次的特征,帮助改进模型捕获更全面的全局上下文信息,从而提高对小目标的检测能力;添加第24层,用于提取中等尺度的特征,可以增强模型对中等尺度目标的特征表示能力,同时也有助于整合来自不同尺度的全局信息;添加第25层,用于提取低层次、细粒度的特征,可以帮助模型更好地理解图像中的细节信息,并结合全局上下文信息进行小目标的检测;

S5将yolov5s的Detect检测层引入ASFF模块,ASFF模块接收Nect模块中第23层、24层、

25层特征图,经过ASFF模块处理后得到X(1)、X(2)、X(3)三个特征图,将X(1)、X(2)、X(3)分别与权重参数 、 、 相乘并求和,经过特征融合后得到 ;公式如下:;

其中, 表示通过ASFF得到的新特征图, 、 、 分别表示三个特征层的权重参数,通过Softmax函数使其满足:

其中, 、 、 分别表示第23、24、25层的特征;

S6用改进的yolov5s模型进行训练与验证,对改进的模型进行评估。