1.一种适于目标检测的MB-SSD方法,其特征在于,所述MB-SSD方法包括以下步骤:S1,提取多小目标图像,采用生成对抗网络对提取的多小目标图像进行增强;
S2,构建MB-SSD特征提取网络,所述MB-SSD特征提取网络包括主支特征提取网络、分支特征提取网络和定位网络,将增强后数据输入MB-SSD特征提取网络,分别获取主支特征提取网络和分支特征提取网络的分类定位结果;再根据定位网络上同区域不同候选框的IoU重合度调整分类网络的输出特征;其中,所述分支特征提取网络的结构与主支特征提取网络的新增的第二个卷积层的结构相同,其输入特征为主支特征提取网络新增的第一个卷积层Conv4_3层的特征;
S3,将主支特征提取网络和分支特征提取网络的分类定位结果进行融合并降维;
S4,计算模型损失,训练模型,优化模型参数。
2.根据权利要求1所述的适于目标检测的MB-SSD方法,其特征在于,步骤S1中,所述提取多小目标图像的过程包括以下步骤:S11,将VOC数据集中所有的图片的分辨率调整至预设的标准尺寸,并更新标注中所有目标的位置信息;
S12,输入图片和与其对应的标注;
S13,统计标注中面积小于预设面积阈值的目标数量n和标注中所有目标总数N;
S14,对图片进行判断,如果n/N大于预设比例阈值则提取该图片;
S15,输入下一张图片,重复步骤S12至S14,直至遍历VOC数据集中所有图片。
3.根据权利要求2所述的适于目标检测的MB-SSD方法,其特征在于,所述预设比例阈值为2/3。
4.根据权利要求1所述的适于目标检测的MB-SSD方法,其特征在于,所述主支特征提取网络通过改进VGG16网络得到:将VGG16网络的第6,7,8全连接层去除,并增加依次连接的5个卷积层,得到11个卷积层。
5.根据权利要求4所述的适于目标检测的MB-SSD方法,其特征在于,所述根据定位网络上同区域不同候选框的IoU重合度调整分类网络的输出特征的过程包括以下步骤:S21,假设主支网络的6个特征图的分辨率分别为38×38,19×19,10×10,5×5,3×3,1×1,分支网络的2个特征图的分辨率分别为38×38,19×19;
将主支网络的6个特征图和分支网络的2个特征图输入分类定位网络,分别得到[f,f,n×(c+1)],[f,f,n×4]形状的输出;其中f代表输出特征图的尺寸,n代表该层特征所具有的先验框的数量,c代表分类的类别数;
S22,将分类定位网络的输出形状[38,38,n×(c+1)]转变为[38,38,n,1],[38,38,n×
4]转变为[38,38,n,4];
S23,求同区域不同位置之间的相对IoU值,得到形状为[38,38,n×n]的相对 IoU矩阵S24,将分类矩阵在第三个维度复制n次,并将其与相对IoU矩阵相乘得到形状为[f,f,n×n,(c+1)]的新分类矩阵;
S25,将更新的分类矩阵在第三个维度每n个元素相加,得到形状为[f,f,n,(c+1)]的分类矩阵,并最终以该分类矩阵作为最终的输出结果。
6.根据权利要求1所述的适于目标检测的MB-SSD方法,其特征在于,步骤S3中,所述将主支特征提取网络和分支特征提取网络的分类定位结果进行融合并降维的过程包括以下步骤:将主支特征提取网络前两个特征图的分类矩阵与位置矩阵分别与分支特征提取网络的分类矩阵与位置矩阵融合,随后将融合的特征进行1×1的卷积进行降维,匹配label的通道数。
7.根据权利要求1所述的适于目标检测的MB-SSD方法,其特征在于,所述MB-SSD特征提取网络的损失函数为:其中: 为权重系数; , 表示第i个正例框与j个真实框匹配, p表示p个类别; 表示第i个框第p个输出值; 表示第i个正例框与第j个真实框差值的最大值; 表示正类框的集合, 表示负类框的集合。
8.一种适于目标检测的MB-SSD特征提取网络,其特征在于,所述MB-SSD特征提取网络包括主支特征提取网络、分支特征提取网络和定位网络,将增强后数据输入MB-SSD的特征提取网络,分别获取主支特征提取网络和分支特征提取网络的分类定位结果;
所述主支特征提取网络通过改进VGG16网络得到:将VGG16网络的第6,7,8全连接层去除,并增加依次连接的5个卷积层,得到11个卷积层,用于输出6个第一特征图;
所述分支特征提取网络的结构与主支特征提取网络的新增的第二个卷积层的结构相同,其输入特征为主支特征提取网络新增的第一个卷积层Conv4_3层的特征,用于输出2个第二特征图;
所述主支特征提取网络新增的5个卷积层的输出端与定位网络连接,所述分支特征提取网络的输出端与定位网络连接,分别将输出的6个第一特征图和2个第二特征图导入定位网络,根据定位网络上同区域不同候选框的IoU重合度调整分类网络的输出特征;
所述MB-SSD特征提取网络还包括融合网络,用于将主支特征提取网络前两个特征图的分类矩阵与位置矩阵分别与分支特征提取网络的分类矩阵与位置矩阵融合,随后将融合的特征进行1×1的卷积进行降维,匹配label的通道数。