利索能及
我要发布
收藏
专利号: 2021107190261
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-02-06
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种目标检测方法,其特征在于,包括:

获取第一目标检测模型,所述第一目标检测模型为预先利用目标对比学习损失函数和样本图像,对第二目标检测模型进行对比学习训练获得的模型;所述目标对比学习损失函数用于表示所述样本图像中对应相同对象预测类别的不同候选框区域之间图像特征的差异程度;

将待检测图像输入到所述第一目标检测模型,获得针对所述待检测图像的检测结果;

所述第一目标检测模型采用如下方式获得:

获得所述样本图像中的多个候选框区域对应的对象类别标注数据;

将所述样本图像输入到所述第二目标检测模型,获得所述多个候选框区域各自对应的图像特征,以及所述多个候选框区域各自对应的对象预测类别;

根据所述多个候选框区域各自对应的图像特征、所述多个候选框区域各自对应的对象预测类别以及所述多个候选框区域的对象类别标注数据,确定所述目标对比学习损失函数的函数值,所述目标对比学习损失函数的函数值具体为各个所述候选框区域与对应相同对象预测类别的不同候选框区域之间图像特征的差异程度的加权平均值;

根据所述目标对比学习损失函数的函数值,调整所述第二目标检测模型的模型参数,以对第二目标检测模型进行训练;

在达到预定的训练结束条件的情况下,得到所述第一目标检测模型。

2.根据权利要求1所述的方法,其特征在于,所述获取第一目标检测模型,包括:利用对所述第二目标检测模型进行分类训练的分类损失函数,对所述第二目标检测模型进行定位训练的定位损失函数,以及所述目标对比学习损失函数,对所述第二目标检测模型进行训练;

在达到预定的训练结束条件的情况下,得到所述第一目标检测模型。

3.根据权利要求2所述的方法,其特征在于,所述根据所述多个候选框区域各自对应的图像特征、所述多个候选框区域各自对应的对象预测类别以及所述多个候选框区域的对象类别标注数据,确定所述目标对比学习损失函数的函数值,包括:采用如下公式获得所述目标对比学习损失函数的函数值: ;

其中,所述 用于表示所述目标对比学习损失函数的函数值,所述 用于表示所述多个候选框区域的数目,所述 用于表示所述多个候选框区域中的第 个候选框区域,所述用于表示所述第 个候选框与对应相同对象预测类别的不同候选框区域之间图像特征的差异程度,所述 用于表示所述 的权重。

4.根据权利要求1所述的方法,其特征在于,所述 采用如下公式的一种获得:;

其中, 用于表示所述第 个候选框区域对应的对象预测类别与所述第 个对象对应的对象类别标注数据之间的交并比。

5.根据权利要求4所述的方法,其特征在于,所述 采用如下公式获得:;

其中,所述 用于表示所述第 个候选框区域对应的对象预测类别,所述 用于表示在不同对象中所述对象预测类别与所述第 个候选框区域对应的对象预测类别相同的候选框的数目,所述 用于表示所述第 个候选框区域对应的图像特征的归一化图像特征,所述 用于表示所述多个候选框区域中除所述第 个候选框区域之外的第 个候选框区域,所述 用于表示所述第 个候选框区域对应的图像特征的归一化图像特征,所述 为预先设定的超参数,所述 用于表示所述 与所述 之间的特征相似性,所述用于表示所述不同对象中除所述第 个候选框区域之外的第 个候选框区域,所述用于表示所述第 个候选框区域对应的图像特征的归一化图像特征,所述用于表示所述 与所述 之间的特征相似性。

6.根据权利要求1所述的方法,其特征在于,所述将待检测图像输入到所述第一目标检测模型,获得针对所述待检测图像的检测结果,包括:将所述待检测图像输入到所述第一目标检测模型,获得针对所述待检测图像中的目标对象的分类结果,和/或获得针对所述待检测图像中的目标对象的定位结果;

将所述分类结果和/或所述定位结果作为所述针对所述待检测图像的检测结果。

7.一种目标检测装置,其特征在于,包括:

模型获得模块,用于获取第一目标检测模型,所述第一目标检测模型为预先利用目标对比学习损失函数和样本图像,对第二目标检测模型进行对比学习训练获得的模型;所述目标对比学习损失函数用于表示所述样本图像中对应相同对象预测类别的不同候选框区域之间图像特征的差异程度;

检测结果获得模块,用于将待检测图像输入到所述第一目标检测模型,获得针对所述待检测图像的检测结果;

所述模型获得模块,包括:

标注数据获得子模块,用于获得所述样本图像中的多个候选框区域对应的对象类别标注数据;

图像特征获得子模块,用于将所述样本图像输入到所述第二目标检测模型,获得所述多个候选框区域各自对应的图像特征,以及所述多个候选框区域各自对应的对象预测类别;

函数值确定子模块,用于根据所述多个候选框区域各自对应的图像特征、所述多个候选框区域各自对应的对象预测类别以及所述多个候选框区域的对象类别标注数据,确定所述目标对比学习损失函数的函数值,所述目标对比学习损失函数的函数值具体为各个所述候选框区域与对应相同对象预测类别的不同候选框区域之间图像特征的差异程度的加权平均值;

第一模型训练子模块,用于根据所述目标对比学习损失函数的函数值,调整所述第二目标检测模型的模型参数,以对第二目标检测模型进行训练;

第一目标检测模型获得子模块,用于在达到预定的训练结束条件的情况下,得到所述第一目标检测模型。

8.根据权利要求7所述的装置,其特征在于,所述模型获得模块,包括:第一模型训练子模块,用于利用对所述第二目标检测模型进行分类训练的分类损失函数,对所述第二目标检测模型进行定位训练的定位损失函数,以及所述目标对比学习损失函数,对所述第二目标检测模型进行训练;

第一目标检测模型获得子模块,用于在达到预定的训练结束条件的情况下,得到所述第一目标检测模型。

9.根据权利要求7所述的装置,其特征在于,所述函数值确定子模块具体用于采用如下公式获得所述目标对比学习损失函数的函数值:;

其中,所述 用于表示所述目标对比学习损失函数的函数值,所述 用于表示所述多个候选框区域的数目,所述 用于表示所述多个候选框区域中的第 个候选框区域,所述用于表示所述第 个候选框与对应相同对象预测类别的不同候选框区域之间图像特征的差异程度,所述 用于表示所述 的权重。

10.根据权利要求9所述的装置,其特征在于,所述 采用如下公式的一种获得:;

其中, 用于表示所述第 个候选框区域对应的对象预测类别与所述第 个对象对应的对象类别标注数据之间的交并比。

11.根据权利要求10所述的装置,其特征在于,所述 采用如下公式获得:;

其中,所述 用于表示所述第 个候选框区域对应的对象预测类别,所述 用于表示在不同对象中所述对象预测类别与所述第 个候选框区域对应的对象预测类别相同的候选框的数目,所述 用于表示所述第 个候选框区域对应的图像特征的归一化图像特征,所述 用于表示所述多个候选框区域中除所述第 个候选框区域之外的第 个候选框区域,所述 用于表示所述第 个候选框区域对应的图像特征的归一化图像特征,所述 为预先设定的超参数,所述 用于表示所述 与所述 之间的特征相似性,所述用于表示所述不同对象中除所述第 个候选框区域之外的第 个候选框区域,所述用于表示所述第 个候选框区域对应的图像特征的归一化图像特征,所述用于表示所述 与所述 之间的特征相似性。

12.根据权利要求7所述的装置,其特征在于,所述检测结果获得模块具体用于:将所述待检测图像输入到所述第一目标检测模型,获得针对所述待检测图像中的目标对象的分类结果,和/或获得针对所述待检测图像中的目标对象的定位结果;将所述分类结果和/或所述定位结果作为所述针对所述待检测图像的检测结果。

13.一种电子设备,其特征在于,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6中任意一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行权利要求1至6中任意一项所述的方法。