利索能及
我要发布
收藏
专利号: 2023109354994
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于YOLOv8网络的目标检测方法,其特征在于,包括:

采集待检测区域的实时监测图像,将实时监测图像输入至预先训练好的目标检测模型,获得目标检测结果;

所述目标检测模型的训练过程包括:

收集历史检测图像并进行预处理获得训练图像,构建训练数据集;所述训练图像包含目标真实标签;利用训练数据集对目标检测模型进行训练,所述目标检测模型包括特征提取网络CSPDarknet53、注意力机制模块SimAM、加强特征提取网络PAN‑FPN、EFB模块和检测层;

将训练图像输入至所述特征提取网络CSPDarknet53获得不同尺寸的特征图P1、特征图P2和特征图P3,包括:所述特征提取网络CSPDarknet53包括卷积模块CBS、第一残差模块、第二残差模块、第三残差模块、第四残差模块和SimSPPF模块;所述第一残差模块、第二残差模块、第三残差模块、第四残差模块由单个卷积模块CBS和特征融合模块C2F组成;将所述训练图像输入特征提取网络CSPDarknet53,依次经过卷积模块CBS、第一残差模块、第二残差模块、第三残差模块、第四残差模块和SimSPPF模块处理后,分别由第二残差模块、第三残差模块和SimSPPF模块输出所述特征图P1、特征图P2和特征图P3;

利用注意力机制模块SimAM对特征图P1、特征图P2和特征图P3进行处理后获得特征图、特征图 和特征图 ;将特征图 、特征图 、特征图 和特征图P3输入至加强特征提取网络PAN‑FPN输出特征图T1、特征图T2和特征图T3;将特征图T1、特征图T2和特征图T3依次经过EFB模块和检测层处理后分别输出训练检测结果;包括:将特征图T1、特征图T2和特征图T3作为EFB模块的输入特征图,通过1×1的卷积核做通道的扩展,通过归一化层和Mish激活函数层处理,利用单个3×3大小的深度卷积提取高通道的特征,然后再通过归一化层、Mish激活函数层以及1×1的卷积核输出EFB模块的中间特征图;将EFB模块的输入特征图和中间特征图进行特征叠加获得EFB模块的输出特征图,获得特征图 、特征图 和特征图 ;

将特征图 分别经过单个卷积模块CBS和Conv‑reg‑max模块、单个卷积模块CBS和Conv‑num‑class模块处理后进行特征融合输出第一级尺寸的训练检测结果;

将特征图 分别经过单个卷积模块CBS和Conv‑reg‑max模块、单个卷积模块CBS和Conv‑num‑class模块处理后进行特征融合输出第二级尺寸的训练检测结果;

将特征图 分别经过单个卷积模块CBS和Conv‑reg‑max模块、单个卷积模块CBS和Conv‑num‑class模块处理后进行特征融合输出第三级尺寸的训练检测结果;

根据训练检测结果和目标真实标签计算预测损失,并利用预测损失对目标检测模型进行优化,重复迭代直至达到设定的迭代次数输出训练好的目标检测模型。

2.根据权利要求1所述基于YOLOv8网络的目标检测方法,其特征在于,利用注意力机制模块SimAM对特征图P1、特征图P2和特征图P3进行处理,表达公式为: ;

公式中,X为注意力机制模块SimAM的输入特征图,所述输入特征图为特征图P1、特征图P2和特征图P3;E为注意力机制模块SimAM的特征图所有神经元值 的集合;

的表达式如下:

 ;

其中,为输入特征张量的其他神经元;为正则化系数,和 为中间变量。

3.根据权利要求1所述基于YOLOv8网络的目标检测方法,其特征在于,将特征图 、特征图 、特征图 和特征图P3输入至加强特征提取网络PAN‑FPN输出特征图T1、特征图T2和特征图T3的方法包括:将所述特征图P3并行上采样后与特征图 进行特征堆叠形成特征图R1;对特征图R1经过特征融合模块C2F和并行上采样后,与特征图 特征堆叠形成特征图R2;通过特征融合模块C2F对特征图R2输出特征图T1;

将特征图T1依次进过单个卷积模块CBS和特征融合模块C2F处理后输出特征图T2;通过单个卷积模块CBS对特征图T2处理后,与特征图 进行特征堆叠获得特征图R3;由单个特征融合模块C2F对特征图R3输出特征图T3。

4.根据权利要求1至3任一项所述基于YOLOv8网络的目标检测方法,其特征在于,所述卷积模块CBS包括3×3 的二维卷积、归一化层和激活函数;所述卷积模块CBS的步长设置为

2;

激活函数设置为SiLU函数,表达公式为:

 ;

其中,x表示输入SiLU函数的特征值。

5.根据权利要求1或权利要求3所述基于YOLOv8网络的目标检测方法,其特征在于,特征融合模块C2F包括Split操作单元和n个串行的Bottleneck单元;通过Split操作单元将输入特征融合模块C2F的特征图的通道维度分成两半,再使用n个串行的Bottleneck单元处理,将最后的Bottleneck单元处理的特征图与之前Bottleneck单元处理的特征图进行Concat操作,并经过单个CBS模块处理输出特征图,其作为特征融合模块C2F的输出特征图。

6.根据权利要求1至5任一项所述一种基于YOLOv8网络的目标检测方法的应用系统,其特征在于,包括:监测模块,用于采集待检测区域的实时监测图像,将实时监测图像输入至预先训练好的目标检测模型,获得目标检测结果;

训练模块,用于收集历史检测图像并进行预处理获得训练图像,构建训练数据集;所述训练图像包含目标真实标签;利用训练数据集对目标检测模型进行训练,所述目标检测模型包括特征提取网络CSPDarknet53、注意力机制模块SimAM、加强特征提取网络PAN‑FPN、EFB模块和检测层;

特征提取模块,用于将训练图像输入至所述特征提取网络CSPDarknet53获得不同尺寸的特征图P1、特征图P2和特征图P3;利用注意力机制模块SimAM对特征图P1、特征图P2和特征图P3进行处理后获得特征图 、特征图 和特征图 ;将特征图 、特征图 、特征图 和特征图P3输入至加强特征提取网络PAN‑FPN输出特征图T1、特征图T2和特征图T3;

优化迭代模块,用于将特征图T1、特征图T2和特征图T3依次经过EFB模块和检测层处理后分别输出训练检测结果;根据训练检测结果和目标真实标签计算预测损失,并利用预测损失对目标检测模型进行优化,重复迭代直至达到设定的迭代次数输出训练好的目标检测模型。

7.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至权利要求5任一项所述目标检测方法的步骤。