利索能及
我要发布
收藏
专利号: 2021111564864
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2025-02-06
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种检测模型的训练方法,包括:将第一样本图像和第二样本图像输入第一预设模型,得到与所述第一样本图像对应的第一特征图和与所述第二样本图像对应的第二特征图;

将第三样本图像和第四样本图像输入第二预设模型,得到与所述第三样本图像对应的第三特征图和与所述第四样本图像对应的第四特征图,其中,所述第一样本图像和所述第三样本图像是正样本图像对,所述第二样本图像和所述第四样本图像是负样本图像对;

基于第一对比损失函数,利用所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图,调整所述第一预设模型的模型参数,直至满足预设条件,其中,所述第二预设模型的模型参数的数值与所述第一预设模型的模型参数的数值相同;以及将在满足所述预设条件的情况下得到的第一预设模型确定为所述检测模型。

2.根据权利要求1所述的方法,其中,所述基于第一对比损失函数,利用所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图,调整所述第一预设模型的模型参数,直至满足预设条件,包括:

基于所述第一对比损失函数,利用所述第一特征和所述第三特征,得到第一输出值;

基于所述第一对比损失函数,利用所述第二特征和所述第四特征,得到第二输出值;

根据输出值调整所述第一预设模型的模型参数,直至输出值所述输出值收敛,其中,所述输出值包括所述第一输出值和所述第二输出值;以及将在所述输出值收敛情况下得到的第一预设模型确定为检测模型。

3.根据权利要求2所述的方法,其中,所述输出值还包括第三输出值和第四输出值;

所述方法还包括:

将所述第一特征图和所述第二特征图分别输入所述第一预设模型,得到所述第一样本图像包括的每个对象的第一实例向量和所述第二样本图像包括的每个对象的第二实例向量;

将所述第三特征图和所述第四特征图分别输入所述第二预设模型,得到所述第三样本图像包括的每个对象的第三实例向量和所述第四样本图像包括的每个对象的第四实例向量;

基于第二对比损失函数,利用所述第一实例向量和所述第三实例向量,得到所述第三输出值;以及

基于所述第二对比损失函数,利用所述第二实例向量和所述第四实例向量,得到所述第四输出值。

4.根据权利要求1~3中任一项所述的方法,其中,所述将第一样本图像和第二样本图像输入第一预设模型,得到与所述第一样本图像对应的第一特征图和与所述第二样本图像对应的第二特征图,包括:

将所述第一样本图像和所述第二样本图像分别输入所述第一预设模型的骨干网络,得到与所述第一样本图像对应的第一特征图和与所述第二样本图像对应的第二特征图;

所述将第三样本图像和第四样本图像输入第二预设模型,得到与所述第三样本图像对应的第三特征图和与所述第四样本图像对应的第四特征图,包括:将所述第三样本图像和所述第四样本图像输入所述第二预设模型的骨干网络,得到与所述第三样本图像对应的第三特征和与所述第四样本图像对应的第四特征。

5.根据权利要求3所述的方法,其中,所述将所述第一特征图和所述第二特征图分别输入所述第一预设模型,得到所述第一样本图像包括的每个对象的第一实例向量和所述第二样本图像包括的每个对象的第二实例向量,包括:将所述第一特征和所述第二特征分别输入所述第一预设模型的检测头,得到所述第一样本图像包括的每个对象的第一实例向量和所述第二样本图像包括的每个对象的第二实例向量;

所述将所述第三特征图和所述第四特征图分别输入所述第二预设模型,得到所述第三样本图像包括的每个对象的第三实例向量和所述第四样本图像包括的每个对象的第四实例向量,包括:

将所述第三特征和所述第四特征分别输入所述第二预设模型的检测头,得到所述第三样本图像包括的每个对象的第三实例向量和所述第四样本图像包括的每个对象的第四实例向量。

6.根据权利要求1~5中任一项所述的方法,其中,所述第二样本图像是利用数据增强方法处理所述第一样本图像得到的。

7.一种目标检测方法,包括:

将待处理图像输入检测模型,得到所述待处理图像包括的每个对象的类别和位置,其中,所述检测模型是利用根据权利要求1~6中任一项所述的方法训练的。

8.一种检测模型的训练装置,包括:第一获得模块,用于将第一样本图像和第二样本图像输入第一预设模型,得到与所述第一样本图像对应的第一特征图和与所述第二样本图像对应的第二特征图;

第二获得模块,用于将第三样本图像和第四样本图像输入第二预设模型,得到与所述第三样本图像对应的第三特征图和与所述第四样本图像对应的第四特征图,其中,所述第一样本图像和所述第三样本图像是正样本图像对,所述第二样本图像和所述第四样本图像是负样本图像对;

调整模块,用于基于第一对比损失函数,利用所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图,调整所述第一预设模型的模型参数,直至满足预设条件,其中,所述第二预设模型的模型参数的数值与所述第一预设模型的模型参数的数值相同;以及

确定模块,用于将在满足所述预设条件的情况下得到的第一预设模型确定为所述检测模型。

9.根据权利要求8所述的装置,其中,所述调整模块,包括:第一获得单元,用于基于所述第一对比损失函数,利用所述第一特征图和所述第三特征图,得到第一输出值;

第二获得单元,用于基于所述第一对比损失函数,利用所述第二特征图和所述第四特征图,得到第二输出值;

调整单元,用于根据输出值调整所述第一预设模型的模型参数,直至输出值所述输出值收敛,其中,所述输出值包括所述第一输出值和所述第二输出值;以及确定单元,用于将在所述输出值收敛情况下得到的第一预设模型确定为检测模型。

10.根据权利要求9所述的装置,其中,所述输出值还包括第三输出值和第四输出值;

所述装置还包括:

第三获得模块,用于将所述第一特征图和所述第二特征图分别输入所述第一预设模型,得到所述第一样本图像包括的每个对象的第一实例向量和所述第二样本图像包括的每个对象的第二实例向量;

第四获得模块,用于将所述第三特征图和所述第四特征图分别输入所述第二预设模型,得到所述第三样本图像包括的每个对象的第三实例向量和所述第四样本图像包括的每个对象的第四实例向量;

第五获得模块,用于基于第二对比损失函数,利用所述第一实例向量和所述第三实例向量,得到所述第三输出值;以及第六获得模块,用于基于所述第二对比损失函数,利用所述第二实例向量和所述第四实例向量,得到所述第四输出值。

11.根据权利要求8~10中任一项所述的装置,其中,所述第一获得模块,包括:第三获得单元,用于将所述第一样本图像和所述第二样本图像分别输入所述第一预设模型的骨干网络,得到与所述第一样本图像对应的第一特征图和与所述第二样本图像对应的第二特征图;

所述第二获得模块,包括:

第四获得单元,用于将所述第三样本图像和所述第四样本图像输入所述第二预设模型的骨干网络,得到与所述第三样本图像对应的第三特征图和与所述第四样本图像对应的第四特征图。

12.根据权利要求10所述的装置,其中,所述第三获得模块,包括:第五获得单元,用于将所述第一特征图和所述第二特征图分别输入所述第一预设模型的检测头,得到所述第一样本图像包括的每个对象的第一实例向量和所述第二样本图像包括的每个对象的第二实例向量;

所述第四获得模块,包括:

第六获得单元,用于将所述第三特征图和所述第四特征图分别输入所述第二预设模型的检测头,得到所述第三样本图像包括的每个对象的第三实例向量和所述第四样本图像包括的每个对象的第四实例向量。

13.根据权利要求8~12中任一项所述的装置,其中,所述第二样本图像是利用数据增强方法处理所述第一样本图像得到的。

14.一种目标检测装置,包括:第七获得模块,用于将待处理图像输入检测模型,得到所述待处理图像包括的每个对象的类别和位置,

其中,所述检测模型是利用根据权利要求8~13中任一项所述的装置训练的。

15.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~6中任一项或权利要求7所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~6中任一项或权利要求7所述的方法。

17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1~6中任一项或权利要求7所述的方法。