买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于多目标检测模型无标签的知识蒸馏方法及存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于多目标检测模型无标签的知识蒸馏方法及存储介质

￥23800

专利号： 2021108389338

申请人：武汉工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-12-17

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于多目标检测模型无标签的知识蒸馏方法，其特征在于，包括以下步骤：S1、获取多类别数据集；

S2、先利用不同类别的数据集训练出不同的教师网络模型，而后将无标签的图片输入至学生网络和多个教师网络模型，从而使教师网络模型引导学生网络训练；其中，学生网络的类别为多个教师网络类别的组合；

S3、设计全局蒸馏损失以及自适应损失，平衡多个不同教师网络和学生网络之间的蒸馏损失，平衡不同教师网络之间的语言特性，优化学生网络训练过程；包括：对类别预测头的输出使用Leaky ReLU进行约束，再进行教师和学生网络间的模拟，类别蒸馏损失如下：式中，S表示学生网络，T表示教师网络，Hijc为网络的分类头部输出，k,h,w分别对应着特征图的类别通道数、高和宽，l()代表Leaky ReLU约束；

中心点偏移量蒸馏损失如下：

式中，N表示图像中关键点的个数，即正样本个数，O表示目标中心点的偏置量，所有的类别共享相同的偏移量预测，Loffset采用L1损失，只对目标中心点位置进行约束，忽略所有其他位置，并将处的特征作为权重叠加在对应位置；

尺度蒸馏损失如下：

式中，Si为学生或教师网络中宽高预测头输出的对应位置的预测结果，将特征作为权重叠加；

每一个教师网络和学生网络之间分别计算蒸馏损失，最后将不同教师网络的损失进行加权求和，总的损失函数为：其中，λt是教师和学生网络之间蒸馏权重，αt、βt和γt为不同蒸馏损失间的权重。

2.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法，其特征在于，数据集的类别大于等于2。

3.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法，其特征在于，多类别数据集包括CrowdHuman数据集、WiderFace数据集、SHWD数据集。

4.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法，其特征在于，步骤S2包括：利用不同类别的数据集训练出不同的教师网络模型，将图片输入至学生网络和多个教师网络模型，将学生网络头部输出和不同教师网络头部输出计算蒸馏损失，采用反向传播梯度下降方法引导学生网络训练；学生网络的类别为不同教师网络类别的组合，类别通道数一一对应并分别结算分类损失，同理，相继计算出回归损失以及偏置损失。

5.根据权利要求4所述的基于多目标检测模型无标签的知识蒸馏方法，其特征在于，利用不同类别的数据集训练出不同的教师网络模型具体为：通过Teacher‑i网络中backbone模块和Neck模块得到相应的头部输出，包括heatmap图，即对应的分类信息Ki和宽高的回归信息、中心点坐标的偏置信息；其中，i∈1,2,3…n，n表示总类别数。

6.根据权利要求5所述的基于多目标检测模型无标签的知识蒸馏方法，其特征在于，引导学生网络训练时，在学生网络的分类头部中加入分类注意力模块。

7.根据权利要求6所述的基于多目标检测模型无标签的知识蒸馏方法，其特征在于，引导学生网络训练时，先将分类预测头的输入通过卷积层转化为类别特征图C×H×W，其中C为目标类别数，H和W为特征图的高度和长度尺寸，再通过卷积层构建类内注意力图HW×1×

1，经过Softmax层归一化，并与原特征图进行矩阵乘法，获得类间特征图C×1×1，并通过Excitation操作，最后将类间注意力图C×1×1通过广播逐元素加法叠加到原特征图中，完成类别特征的提取。

8.根据权利要求1所述的基于多目标检测模型无标签的知识蒸馏方法，其特征在于，根据每次迭代间的损失变化比例控制损失在指定的区间内，自适应性损失为：其中，损失指定区间为[α,β]，r为上一个迭代与当前迭代的损失比例，包括Lcls、Loffset以及Lsize各自的损失，[rs,rl]为损失变化比例限定空间。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，计算机程序被处理器执行时实现权利要求1至8中任一项所述的基于多目标检测模型无标签的知识蒸馏方法。