买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于改进YOLOv4-tiny的多尺度目标检测方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于改进YOLOv4-tiny的多尺度目标检测方法

面议

专利号： 2022110887336

申请人：南京信息工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，包括：步骤1：输入图片，利用主干特征提取网络CSPDarknet53‑tiny提取图片的特征图，所述主干特征提取网络CSPDarknet53‑tiny依次包括两个卷积模块、三个残差块和一个卷积模块；

步骤2：将主干特征提取网络的最后一个卷积模块处理后的特征图输入至快速空间金字塔池化结构中进行特征融合，得到融合后的特征图；

步骤3：将主干特征提取网络的第一个残差块和第二个残差块得到的特征图、以及步骤

2中融合后的特征图分别输入至加强特征提取网络中，加强特征提取网络对三个特征图进行处理，并进一步提取特征，其中，加强特征提取网络的激活函数使用Leaky ReLu函数；

步骤4：将经过加强特征提取网络处理后的特征图输入至超轻量级通道注意力模块ECA中进行处理；

步骤5：将经过ECA模块处理后的特征图输入至预测输出头，利用预测输出头进行结果预测；

步骤6：训练改进后的模型，获取训练结果并对模型进行评估，得到最佳模型；

步骤7：使用最佳模型对图片、视频进行检测，或者调用摄像设备进行实时检测，获取检测结果，并计算模型的推理速度。

2.根据权利要求1所述的基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，所述步骤1提取特征图的具体步骤包括：步骤1‑1：图片依次经过两个卷积模块获取特征图，所述卷积模块包括一个3x3的二维卷积模块、归一化模块和激活函数，每经过一个卷积模块，图片的宽和高各缩小一半，步长设置为2，激活函数使用Leaky ReLu函数，Leaky ReLu函数的表达式如下：其中，x表示输入，通过把x非常小的线性分量给予负输入0.01x来调整负值的零梯度问题，Leaky ReLU函数范围是负无穷到正无穷；

步骤1‑2：将经过两个卷积模块得到的特征图依次输入至三个残差块，每经过一个残差块，特征图的宽和高各缩小一半；第一残差块和第二残差块均包括两个输出，第一残差块输出第一有效特征至第二残差块和加强特征提取网络PANet，第二残差块输出第二特征图至第三残差块和加强特征提取网络PANet；所述残差块将特征图同等划分成两部分，将一部分不经过任何处理直接用作残差边，将另一部分嵌套一个小残差块，再采用连接模块对残差边与经过小残差块处理后的输出进行特征融合，最后通过最大池化层的处理，使维度降为

1/2；

步骤1‑3：将第三残差块处理后的特征图输入到卷积模块进行特征整合，并将整合后的特征图输入至快速空间金字塔池化结构。

3.根据权利要求2所述的基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，所述小残差块包括两个3x3的卷积模块、一个连接模块和一个1x1的卷积模块，输入的特征图先经过一次3x3卷积，然后等同划分成两部分，将一部分不经过任何处理直接用作残差边，将另一部分再经过一次3x3卷积，再采用连接模块对两部分的输出进行特征融合，最后进行一次1x1卷积。

4.根据权利要求1所述的基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，所述步骤2的具体步骤包括：步骤2‑1：将主干特征提取网络中最后一个卷积模块输出的特征图输入至快速空间金字塔池化结构，快速空间金字塔池化结构的统一步长为1；

步骤2‑2：通过卷积模块对特征图进行通道数减半；

步骤2‑3：将特征图串行通过三个5*5大小的最大池化层，将卷积模块直接输出的特征图命名为x，将经过一次最大池化后的特征图命名为y1，将经过两次最大池化后的特征图命名为y2，将经过三次最大池化后的特征图命名为self.m(y2)；

步骤2‑4：采用连接模块对特征图x、y1、y2、self.m(y2)进行特征融合，再输入至卷积模块进行卷积，最后输出至加强特征提取网络。

5.根据权利要求1所述的一种基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，所述步骤3的具体步骤包括：步骤3–1：将快速空间金字塔池化结构输出的特征图命名为N1，对特征图N1进行卷积、标准化和上采样，使特征图的宽和高翻倍，其中卷积核大小为1x1，步长为1，然后与主干特征提取网络的第二个残差块输出的特征图进行拼接，将拼接后的特征图命名为N2；

步骤3‑2：对特征图N2进行卷积、标准化和上采样，使特征图的宽和高翻倍，其中卷积核大小为1x1，步长为1，然后与主干特征提取网络的第一个残差块输出的特征图进行拼接，将拼接后的特征图命名为N3；

步骤3‑3：对特征图N3进行下采样，使特征图的宽和高减半，其中卷积核大小为3x3，步长为2，然后与特征图N2进行拼接，将拼接后的特征图命名为N4；

步骤3‑4：对特征图N4进行下采样，使特征图的宽和高减半，其中卷积核大小为3x3，步长为2，然后与特征图N1进行拼接，将拼接后的特征图命名为N5；

步骤3‑5：将特征图N3、N4、N5分别输出，且特征图N3、N4、N5的尺寸不同。

6.根据权利要求1所述的一种基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，所述步骤4的具体步骤包括：步骤4‑1：将经过加强特征提取网络处理后的特征图进行全局平均池化，特征图从矩阵形式变成向量形式；

步骤4‑2：利用卷积核大小为k的1维卷积实现局部跨通道交互，提取通道间的依赖关系，并经过Sigmoid激活函数得到各个通道的权重ω：ω＝σ(C1Dk(y))，C1D表示一维卷积

其中，Sigmoid激活函数表达式：

步骤4‑3：将归一化权重与经过加强特征提取网络处理后的输入特征图进行逐通道相乘，生成加权后的特征图。

7.根据权利要求1所述的一种基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，所述步骤5的具体步骤包括：步骤5‑1：经过一个3x3卷积和归一化进行特征整合，激活函数为LeakyReLU函数，步长＝1；

步骤5‑2：经过一个1x1卷积进行通道数的调整，步长为1；

步骤5‑3：每个预测输出头均获得一个特征图的预测结果，分别对应每张特征图不同尺寸的网格上的3个预测框位置；

步骤5‑4：对预测结果进行解码，得到最终的预测框在图片上的位置。

8.根据权利要求1所述的一种基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，所述步骤6的具体步骤包括：步骤6‑1：配置训练数据集信息，其中训练集、验证集、测试集按照7:1:2随机分配；

步骤6‑2：建立模型并配置模型的相关信息；

步骤6‑3：导入训练集数据并训练，轮次设为300，批大小设为16，图片尺寸设为640*

640；

步骤6‑4：获取训练结果，包括训练时间、mAP@0.5、mAP@0.5:0.95；

步骤6‑5：将精确度P、召回率R、mAP@0.5、mAP@0.5:0.95绘制成曲线图，进行评估，公式如下：式中，Ntp表示正样本预测为正样本，Nfp表示负样本预测为正样本，Nfn表示正样本预测为负样本，k代表图片数目，p(k)表示识别出k个图片是Precision的值，Δr(k)表示识别的图片由k－1增加到k时Recall值的变化情况，P代表Precision，R代表Recall，C为类别总数。

9.根据权利要求1所述的一种基于改进YOLOv4‑tiny的多尺度目标检测方法，其特征在于，所述步骤7的具体步骤包括：使用训练获取的最佳模型对图片、视频或使用摄像设备检测，输出检测结果，包括每张图片、或每一帧的检测时间、总时间、帧率FPS，其中FPS＝1/time。