1.一种基于多目标检测模型无标签的知识蒸馏方法,其特征在于,包括以下步骤:S1、获取多类别数据集;
S2、先利用不同类别的数据集训练出不同的教师网络模型,而后将无标签的图片输入至学生网络和多个教师网络模型,从而使教师网络模型引导学生网络训练;其中,学生网络的类别为多个教师网络类别的组合;
S3、设计全局蒸馏损失以及自适应损失,平衡多个不同教师网络和学生网络之间的蒸馏损失,平衡不同教师网络之间的语言特性,优化学生网络训练过程。
2.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,数据集的类别大于等于2。
3.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,多类别数据集包括CrowdHuman数据集、WiderFace数据集、SHWD数据集。
4.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,步骤S2包括:
利用不同类别的数据集训练出不同的教师网络模型,将图片输入至学生网络和多个教师网络模型,将学生网络头部输出和不同教师网络头部输出计算蒸馏损失,采用反向传播梯度下降方法引导学生网络训练;学生网络的类别为不同教师网络类别的组合,类别通道数一一对应并分别结算分类损失,同理,相继计算出回归损失以及偏置损失。
5.根据权利要求4所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,利用不同类别的数据集训练出不同的教师网络模型具体为:通过Teacher‑i网络中backbone模块和Neck模块得到相应的头部输出,包括heatmap图,即对应的分类信息Ki和宽高的回归信息、中心点坐标的偏置信息;其中,i∈1,2,3…n,n表示总类别数。
6.根据权利要求5所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,引导学生网络训练时,在学生网络的分类头部中加入分类注意力模块。
7.根据权利要求6所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,引导学生网络训练时,先将分类预测头的输入通过卷积层转化为类别特征图C×H×W,其中C为目标类别数,H和W为特征图的高度和长度尺寸,再通过卷积层构建类内注意力图HW×1×
1,经过Softmax层归一化,并与原特征图进行矩阵乘法,获得类间特征图C×1×1,并通过Excitation操作,最后将类间注意力图C×1×1通过广播逐元素加法叠加到原特征图中,完成类别特征的提取。
8.根据权利要求7所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,步骤S3包括:
对类别预测头的输出使用Leaky ReLU进行约束,再进行教师和学生网络间的模拟,类别蒸馏损失如下:
式中,S表示学生网络,T表示教师网络,Hijc为网络的分类头部输出,k,h,w分别对应着特征图的类别通道数、高和宽,l()代表Leaky ReLU约束;
中心点偏移量蒸馏损失如下:
式中,N表示该幅图像中关键点的个数,即正样本个数,O表示目标中心点的偏置量,所有的类别共享相同的偏移量预测,Loffset采用L1损失,只对目标中心点位置 进行约束,忽略所有其他位置,并将 处的特征 作为权重叠加在对应位置;
尺度蒸馏损失如下:
式中,Si为学生或教师网络中宽高预测头输出的对应位置的预测结果,将特征 作为权重叠加;
每一个教师网络和学生网络之间分别计算蒸馏损失,最后将不同教师网络的损失进行加权求和,总的损失函数为:
其中,λt是教师和学生网络之间蒸馏权重,αt、βt和γt为不同蒸馏损失间的权重。
9.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法,其特征在于,根据每次迭代间的损失变化比例控制损失在指定的区间内,自适应性损失为:其中,损失指定区间为[α,β],r为上一个迭代与当前迭代的损失比例,包括Lcls、Loffset以及Lsize各自的损失,[rs,rl]为损失变化比例限定空间。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现权利要求1至9中任一项所述的基于多目标检测模型无标签的知识蒸馏方法。