1.一种用于小目标检测的多层级感受野扩展方法,其特征在于,所述方法包括如下步骤:步骤一、对COCO数据集中的输入图像进行小目标检测适用的预处理;
步骤二、引入Swin Transformer作为主干网络,利用Swin Transformer的分层结构对所述输入图像进行特征提取,以得到多层特征,其中每层特征对应有一特征层;
步骤三、构建多层级感受野特征融合网络,通过多层级感受野特征融合网络中的感受野特征放大模块匹配Swin Transformer中各特征层的所需感受野并补充浅层预测特征,其中,进行匹配后,每个特征层对应有多个感受野特征放大模块;
步骤四、将GIOU loss与BIOU loss的线性组合作为边界框回归损失,根据对应的边界框回归损失函数以加强目标定位效果;
步骤五、将输入图像中的不同尺度目标分配在具有不同感受野的特征层上,利用检测模型中的浅层预测特征层获得对小目标进行定位与识别,以得到小目标的定位识别结果;
在所述步骤一中,所述预处理包括如下步骤:
设计数据增强策略,其中所述数据增强策略为:将输入图像的图像尺寸进行缩放,使用多尺度训练以增强样本尺度多样性;
对COCO数据集中的输入图像采用随机水平翻转作数据增广,以增强模型的泛化能力;
Swin Transformer对应有四层结构,对应提取出四个不同尺度与不同深度的提取特征,其中, ,经 卷积调整通道数后得到特征 ,其中, ;
多层级感受野特征融合网络用于输出四个不同尺度的输出特征 ,其中, ;
多层级感受野特征融合网络中四个特征层上的感受野特征放大模块表示为 ,其中, ;
对应关系如下:
其中, 分别表示第2层输出特征、第3层输出特征、第4层输出特征以及第5层输出特征, 分别表示第2层特征、第3层特征、第4层特征以及第5层特征,分别表示第2个特征层、第3个特征层、第4个特征层以及第5个特征层上的感受野特征放大模块,表示单个特征层中感受野特征放大模块的个数, 表示采用两倍的邻近取样插值法上采样;
感受野特征放大模块包括多个基础单元,在第4个特征层中,作为主干网络的Swin Transformer的第4层特征 经感受野特征放大模块的第1个基础单元 得到第一基础单元输出特征 ,再通过第2个基础单元 得到第二基础单元输出特征 ,最后经第3个基础单元 ,通过残差连接融合主干网络的第4层特征 得到第4层特征的第三基础单元输出特征 ;
对应的表达式为:
其中,第三基础单元输出特征 为第4个特征层的第一个感受野特征放大模块的输出特征;
第一基础单元输出特征 的计算公式表示为:
其中, 表示 卷积, 表示卷积核为 的空洞卷积, 表示空洞卷积的扩展率, 表示批归一化, 表示激活函数,
表示包含批归一化和激活函数的 卷积, 表示包
含批归一化和激活函数的 空洞卷积;
所述边界框回归损失函数表示为:
其中, 表示边界框回归损失函数, 表示GIOU loss损失函数, 表示BIOU loss损失函数, 表示预测边界框, 表示标注框, 表示边界框的位置,, 表示边界框中心点的坐标, 分别表示边界框的宽与高, 表示预测边界框与标注框的最小包围框面积, 表示Smooth L1损失, 表示重合度计算;
在所述步骤五中,在进行识别任务中,使用Focal loss 函数解决正负样本不平衡问题,对应的Focal loss函数表示为:其中, 表示Focal loss函数, 表示预测分数, 表示真实标签, 表示平衡正负样本数,表示调节因子;
在所述步骤五中,检测模型进行定位与识别对应的总损失函数表示为:其中, 表示检测模型进行定位与识别对应的总损失函数, 均表示超参数。
2.一种用于小目标检测的多层级感受野扩展系统,其特征在于,所述系统应用如上述权利要求1所述的一种用于小目标检测的多层级感受野扩展方法,所述系统包括:预处理模块,用于:
对COCO数据集中的输入图像进行小目标检测适用的预处理;
特征提取模块,用于:
引入Swin Transformer作为主干网络,利用Swin Transformer的分层结构对所述输入图像进行特征提取,以得到多层特征,其中每层特征对应有一特征层;
网络构建模块,用于:
构建多层级感受野特征融合网络,通过多层级感受野特征融合网络中的感受野特征放大模块匹配Swin Transformer中各特征层的所需感受野并补充浅层预测特征,其中,进行匹配后,每个特征层对应有多个感受野特征放大模块;
损失确定模块,用于:
将GIOU loss与BIOU loss的线性组合作为边界框回归损失,根据对应的边界框回归损失函数以加强目标定位效果;
结果输出模块,用于:
将输入图像中的不同尺度目标分配在具有不同感受野的特征层上,利用检测模型中的浅层预测特征层获得对小目标进行定位与识别,以得到小目标的定位识别结果。