利索能及
我要发布
收藏
专利号: 2021104391019
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种分类模型的训练方法,包括:获取图像样本,所述图像样本具有指示类别的标签且所述图像样本中的至少部分样本为包括目标物体的图像;

将所述图像样本输入所述分类模型中不包括翻转层的第一处理支路,获得所述图像样本的第一分类信息;

将所述图像样本输入所述分类模型中包括翻转层的第二处理支路,获得所述图像样本的第二分类信息;以及

基于所述第一分类信息、所述第二分类信息和所述标签,对所述分类模型进行训练,其中,所述翻转层用于对所述图像样本进行镜像翻转,其中,对所述分类模型进行训练包括:基于所述第一分类信息和所述第二分类信息,确定所述图像样本的预测类别;以及根据所述预测类别和所述标签指示的类别,对所述分类模型进行训练。

2.根据权利要求1所述的方法,其中,所述第二处理支路还包括特征提取层和全连接层;获得所述图像样本的第二分类信息包括:以所述图像样本作为所述特征提取层的输入,获得所述图像样本的特征信息;

以所述特征信息作为所述翻转层的输入,获得翻转后的翻转特征信息;以及以所述翻转特征信息作为所述全连接层的输入,获得所述图像样本的第二分类信息。

3.根据权利要求1所述的方法,其中,所述标签指示的类别包括指示第一物体的第一类别、指示第二物体的第二类别和指示背景的第三类别;所述第一分类信息和所述第二分类信息均包括针对所述第一类别的第一预测概率和针对所述第三类别的第二预测概率;确定所述图像样本的预测类别包括:确定所述第一分类信息和所述第二分类信息中包括的最大概率,作为第一概率;以及根据所述第一概率所针对的类别和所述第一概率所属的分类信息,确定所述预测类别。

4.根据权利要求3所述的方法,其中,所述确定所述预测类别包括:在所针对的类别为所述第一类别且所属的分类信息为所述第一分类信息的情况下,确定所述预测类别为所述第一类别;

在所针对的类别为所述第一类别且所属的分类信息为所述第二分类信息的情况下,确定所述预测类别为所述第二类别;以及在所针对的类别为所述第三类别的情况下,确定所述预测类别为所述第三类别,其中,所述第一物体和所述第二物体彼此镜像对称,所述目标物体包括所述第一物体和所述第二物体。

5.根据权利要求4所述的方法,其中:所述翻转层用于关于第一轴对所述图像样本进行镜像翻转;以及所述第一物体为呈镜像对称的两个物体中的其中一个物体,所述第二物体为呈镜像对称的两个物体中的其中另一个物体。

6.根据权利要求4所述的方法,其中:所述翻转层用于关于第二轴对所述图像样本进行镜像翻转;以及所述第一物体为第一视角下的物体,所述第二物体为与第一视角相对的第二视角下的物体。

7.根据权利要求3所述的方法,其中:所述第二处理支路包括具有第一翻转层的第一子支路、具有第二翻转层的第二子支路和具有依次连接的所述第一翻转层和所述第二翻转层的第三子支路;

所述第一翻转层用于关于第一轴对所述图像样本进行镜像翻转,所述第二翻转层用于关于第二轴对所述图像样本进行镜像翻转;

获得所述图像样本的第二分类信息包括:基于所述第一子支路,获得所述图像样本的第一子分类信息;基于所述第二子支路,获得所述图像样本的第二子分类信息;以及基于所述第三子支路,获得所述图像样本的第三子分类信息。

8.根据权利要求6所述的方法,其中:所述第一类别包括:指示第一视角的第一子类别及指示第二视角的第二子类别;所述第二类别包括:指示所述第一视角的第三子类别及指示所述第二视角的第四子类别;所述第二视角与所述第一视角相对;

所述第一预测概率为针对所述第一子类别的预测概率;所述第一子分类信息、所述第二子分类信息和所述第三子分类信息均包括所述第一预测概率和所述第二预测概率;

其中,所述确定所述图像样本的预测类别包括:在所针对的类别为所述第一类别且所属的分类信息为所述第一分类信息的情况下,确定所述预测类别为所述第一子类别;

在所针对的类别为所述第一类别且所属的分类信息为所述第一子分类信息的情况下,确定所述预测类别为所述第二子类别;

在所针对的类别为所述第一类别且所属的分类信息为所述第二子分类信息的情况下,确定所述预测类别为所述第三子类别;

在所针对的类别为所述第一类别且所属的分类信息为所述第三子分类信息的情况下,确定所述预测类别为所述第四子类别;以及在所针对的类别为所述第二类别的情况下,确定所述预测类别为所述第三类别,其中,所述第一物体为呈镜像对称的两个物体中的其中一个物体,所述第二物体为呈镜像对称的两个物体中的其中另一个物体。

9.一种对图像进行分类的方法,包括:获取待分类图像;

基于分类模型中不包括翻转层的第一处理支路,获得所述待分类图像的第三分类信息;

基于所述分类模型中包括所述翻转层的第二处理支路,获得所述待分类图像的第四分类信息;以及

基于所述第三分类信息和所述第四分类信息,确定所述待分类图像的类别,其中,所述翻转层用于对所述待分类图像进行镜像翻转;所述分类模型是采用权利要求1~8中任一项所述的方法训练得到的。

10.根据权利要求9所述的方法,其中,所述待分类图像的类别为至少两个预定类别中的一个;所述预定类别包括:指示第一物体的第一类别、指示第二物体的第二类别和指示背景的第三类别;所述第三分类信息和所述第四分类信息均包括针对所述第一类别的第三预测概率和针对所述第三类别的第四预测概率;确定所述待分类图像的类别包括:确定所述第三分类信息和所述第四分类信息中包括的最大概率,作为第二概率;以及根据所述第二概率所针对的类别和所述第二概率所属的分类信息,确定所述待分类图像的类别。

11.一种分类模型的训练装置,包括:样本获取模块,用于获取图像样本,所述图像样本具有指示类别的标签且所述图像样本中的至少部分样本为包括目标物体的图像;

第一信息获得模块,用于将所述图像样本输入所述分类模型中不包括翻转层的第一处理支路,获得所述图像样本的第一分类信息;

第二信息获得模块,用于将所述图像样本输入所述分类模型中包括翻转层的第二处理支路,获得所述图像样本的第二分类信息;以及模型训练模块,用于基于所述第一分类信息、所述第二分类信息和所述标签,对所述分类模型进行训练,

其中,所述翻转层用于对所述图像样本进行镜像翻转;

其中,所述模型训练模块包括:预测类别确定子模块,用于基于所述第一分类信息和所述第二分类信息,确定所述图像样本的预测类别;以及

训练子模块,用于根据所述预测类别和所述标签指示的类别,对所述分类模型进行训练。

12.一种对图像进行分类的装置,包括:图像获取模块,用于获取待分类图像;

第三信息获得模块,用于基于分类模型中不包括翻转层的第一处理支路,获得所述待分类图像的第三分类信息;

第四信息获得模块,用于基于所述分类模型中包括所述翻转层的第二处理支路,获得所述待分类图像的第四分类信息;以及类别确定模块,用于基于所述第三分类信息和所述第四分类信息,确定所述待分类图像的类别,

其中,所述翻转层用于对所述待分类图像进行镜像翻转;所述分类模型是采用权利要求11所述的装置训练得到的。

13.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~10中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~10中任一项所述的方法。