利索能及
我要发布
收藏
专利号: 2024107221598
申请人: 中南民族大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种轻量化小目标检测系统,其特征在于,包括预设主干网络、预设特征融合模块以及预设检测模块,其中,所述预设主干网络包括卷积层、DCC3模块以及空间金字塔池化结构SPPF,所述DCC3模块包括第一融合分支、第二融合分支、第一融合模块以及第一卷积块,所述第一融合分支包括第二卷积块,所述第二融合分支包括依次设置的第三卷积块、卷积核、第一轻量化卷积块、第二轻量化卷积块、第四卷积块以及注意力模块,所述预设主干网络用于根据图像集合中的任一原始图像,输出第一尺寸特征图、第二尺寸特征图、第三尺寸特征图以及第四尺寸特征图;

所述预设特征融合模块用于根据所述第一尺寸特征图、所述第二尺寸特征图、所述第三尺寸特征图以及所述第四尺寸特征图,获取第一融合特征图、第二融合特征图、第三融合特征图以及第四融合特征图;

所述预设检测模块用于根据所述第一融合特征图、所述第二融合特征图、所述第三融合特征图以及第四融合特征图,获取所述原始图像的目标检测结果。

2.根据权利要求1所述的轻量化小目标检测系统,其特征在于,

所述第一卷积块为第一3 3卷积块,所述第二卷积块为第二3 3卷积块,所述第三卷积块为第三3 3卷积块,所述卷积核为第一1 1卷积块,所述第一轻量化卷积块为第一轻量化

3 3卷积块,所述第二轻量化卷积块为第二轻量化3 3卷积块,所述第四卷积块为第四3 3卷积块;

还包括图像预处理模块,所述图像预处理模块用于利用图像缩放以及预设锚框计算,将图像集合中的任一初始图像,转化为640 640 3的原始图像,并将所述图像集合中的任一原始图像输入至所述预设主干网络;

所述第一尺寸特征图的尺寸为512 20 20;

所述第二尺寸特征图的尺寸为256 40 40;

所述第三尺寸特征图的尺寸为128 80 80;

所述第四尺寸特征图的尺寸为64 160 160。

3.根据权利要求2所述的轻量化小目标检测系统,其特征在于,所述第一融合分支中的第二3 3卷积块用于处理所述原始图像,得到第一特征输出;

在所述第二融合分支中,根据第三3 3卷积块、第一1 1卷积块、第一轻量化3 3卷积块、第二轻量化3 3卷积块、第四3 3卷积块以及注意力模块处理所述原始图像,得到第二特征输出;

所述第一融合模块用于融合所述第一特征输出以及所述第二特征输出,得到拼接特征图;

所述第一3 3卷积块用于处理所述拼接特征图,得到目标尺寸特征图;

所述空间金字塔池化结构SPPF用于处理所述目标尺寸特征图,得到第一尺寸特征图、第二尺寸特征图、第三尺寸特征图以及第四尺寸特征图。

4.根据权利要求3所述的轻量化小目标检测系统,其特征在于,在所述第二融合分支中,所述原始图像在经过所述第三3 3卷积块后输入至所述第一1 1卷积块,将所述第三3

3卷积块的输出与所述第一1 1卷积块的输出进行和运算后,输入至所述第一轻量化3 3卷积块;

将所述第一轻量化3 3卷积块的输出、所述第三3 3卷积块的输出与所述第一1 1卷积块的输出进行和运算后,输入至所述第二轻量化3 3卷积块;

将所述第一轻量化3 3卷积块的输出、所述第二轻量化3 3卷积块的输出、所述第三3

3卷积块的输出与所述第一1 1卷积块的输出进行和运算后,输入至所述第四3 3卷积块;

输入所述第四3 3卷积块的输出至所述注意力模块;

将所述注意力模块的输出、所述第一轻量化3 3卷积块的输出、所述第二轻量化3 3卷积块的输出、所述第三3 3卷积块的输出与所述第一1 1卷积块的输出进行和运算后,得到所述第二特征输出。

5.根据权利要求1所述的轻量化小目标检测系统,其特征在于,所述预设特征融合模块包括第一处理分支、第二处理分支、第三处理分支以及第四处理分支,所述第一处理分支包括第一3C模块以及第一2C模块,所述第二处理分支包括第二3C模块以及第二2C模块,所述第三处理分支包括第三3C模块以及第三2C模块,所述第四处理分支包括第四2C模块,其中,每一3C模块包括3C融合模块、C3模块以及上采样层,每一2C模块包括2C融合模块以及C3模块;

所述C3模块包括第三融合分支、第四融合分支、第二融合模块以及第八3 3卷积块,所述第三融合分支包括第五3 3卷积块,所述第四融合分支包括依次设置的第六3 3卷积块、第二1 1卷积块、第七3 3卷积块。

6.根据权利要求5所述的轻量化小目标检测系统,其特征在于,对所述第一尺寸特征图、所述第二尺寸特征图、所述第三尺寸特征图以及所述第四尺寸特征图进行尺寸减半处理,得到第一尺寸输出、第二尺寸输出、第三尺寸输出、第四尺寸输出;

对于所述第一处理分支,根据所述第一3C模块中的3C融合模块以及C3模块处理所述第一尺寸输出以及所述第二尺寸输出,得到第一融合尺寸图,输入所述第一融合尺寸图至第一2C模块以及所述第一3C模块中的上采样层,所述第一2C模块根据第一融合尺寸图、所述第二3C模块的输出以及所述第二2C模块的输出,得到所述第一融合特征图;

对于所述第二处理分支,根据所述第二3C模块中的3C融合模块以及C3模块处理所述第二尺寸输出、所述第三尺寸输出以及所述第一3C模块中上采样层的输出,得到第二融合尺寸图,输入所述第二融合尺寸图至第二2C模块以及所述第二3C模块中的上采样层,所述第二2C模块根据第二融合尺寸图、所述第三3C模块的输出以及所述第三2C模块的输出,得到所述第二融合特征图;

对于所述第三处理分支,根据所述第三3C模块中的3C融合模块以及C3模块处理所述第三尺寸输出、所述第四尺寸输出以及所述第二3C模块中上采样层的输出,得到第三融合尺寸图,输入所述第三融合尺寸图至第三2C模块以及所述第三3C模块中的上采样层,所述第三2C模块根据第三融合尺寸图,得到所述第三融合特征图;

对于所述第四处理分支,根据所述第四2C模块处理所述第四尺寸输出以及所述第三3C模块中上采样层的输出,得到所述第四融合特征图。

7.根据权利要求6所述的轻量化小目标检测系统,其特征在于,所述上采样层包括内核预测模块和内容感知重组模块;

所述内核预测模块用于根据任一目标位置的内容预测每一目标位置对应的位置核,所述内容感知重组模块用于根据任一目标位置的内容以及所述位置核进行重组。

8.根据权利要求1所述的轻量化小目标检测系统,其特征在于,所述目标检测结果包括预测框的位置信息;

所述预测框的位置信息表示为:

其中, 、 分别为预测框的中心点坐标, 、 分别为预测框的宽度和高度,是sigmoid函数,预测框的置信度为 ,预测框的类别为 ,是预测框的位置信息, 是预测框目标中心点相对于所述预测框目标

中心点所在网格左上角的偏移量; 是预测框相对于锚框在宽度和高度上的缩放尺寸; 是置信度信息; 是类别信息,网格距离图片左上角的边距为,网格对应的锚框的宽和高分别为 。

9.根据权利要求1所述的轻量化小目标检测系统,其特征在于,所述预设检测模块是根据预设边界框回归损失函数调整预设权重参数,不断对初始检测模块进行优化后确定的;

所述预设边界框回归损失函数包括:

其中, 为预设边界框回归损失函数, 为预测框和真实框之间的匹配程度, 为真实框中心点与预测框中心点之间的欧几里得距离,

为预测框和真实框之间的水平方向角度或垂直方向角度的损失。

10.一种轻量化小目标检测方法,利用权利要求1‑9中任一项所述的轻量化小目标检测系统,其特征在于,包括:利用预设主干网络处理图像集合中的任一原始图像,获取第一尺寸特征图、第二尺寸特征图、第三尺寸特征图以及第四尺寸特征图;

利用预设特征融合模块处理所述第一尺寸特征图、所述第二尺寸特征图、所述第三尺寸特征图以及所述第四尺寸特征图,获取第一融合特征图、第二融合特征图、第三融合特征图以及第四融合特征图;

利用预设检测模块处理所述第一融合特征图、所述第二融合特征图、所述第三融合特征图以及第四融合特征图,获取所述原始图像的目标检测结果。