利索能及
我要发布
收藏
专利号: 2020800067679
申请人: 商汤国际私人有限公司
专利类型:其他
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种目标对象识别方法,其特征在于,所述方法包括:

对目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别;

根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确;

响应于所述预测类别不正确,输出提示信息;

根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确,包括:将所述待识别目标对象的隐层特征输入与所述预测类别对应的真伪识别模型,以使所述真伪识别模型输出概率值;其中,所述目标对象的隐层特征是指在利用分类网络对目标对象进行分类时,输入至所述分类网络中的分类器之前的特征;所述预测类别对应的真伪识别模型为与该预测类别的目标对象的多个隐层特征相关的高斯概率分布模型,所述概率值表征所述待识别目标对象的最终类别为所述预测类别的概率;

在所述概率值小于概率阈值时,确定所述预测类别不正确;

在所述概率值大于或等于所述概率阈值时,确定所述预测类别正确。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于所述预测类别正确,将所述预测类别确定为所述待识别目标对象的最终类别,并输出所述待识别目标对象的所述最终类别。

3.根据权利要求1或2所述的方法,其特征在于,所述目标图像中包括叠放着的多个待识别目标对象,对所述目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别,包括:将所述目标图像的高度通过缩放调整至预设高度,其中,所述目标图像是根据采集到的图像中叠放着的多个待识别目标对象的检测框从所述采集到的图像中裁剪得到的,且所述目标图像的高度方向为所述叠放着的多个待识别目标对象的叠放的方向;

对调整后的目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别。

4.根据权利要求3所述的方法,其特征在于,将所述目标图像的高度调整至所述预设高度,包括:将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到预设宽度;

在缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像的高度大于所述预设高度的情况下,将所述缩放后的目标图像的高度和宽度等比例缩小,直至缩小后的目标图像的高度等于所述预设高度。

5.根据权利要求3所述的方法,其特征在于,将所述目标图像的高度调整至所述预设高度,包括:将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到所述预设宽度;

在所述缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像的高度小于所述预设高度的情况下,利用第一像素对所述缩放后的目标图像进行填充,使得填充后的目标图像的高度为所述预设高度。

6.根据权利要求3所述的方法,其特征在于,所述预设高度根据所述待识别目标对象的最大数量设置;

对所述调整后的目标图像中的所述待识别目标对象进行分类,确定所述待识别目标对象的预测类别,包括:对所述调整后的目标图像进行特征提取,得到特征图,所述特征图的高度维度与所述目标图像的高度方向对应;

沿着所述特征图的宽度维度对所述特征图进行平均池化,得到池化后的特征图;

根据所述最大数量,将所述池化后的特征图沿着高度维度分段,得到预设数量的特征,其中,所述预设数量的特征与所述叠放着的多个待识别目标对象具有一一对应关系;

根据各个特征确定所述叠放着的多个待识别目标对象中各个待识别目标对象的预测类别。

7.根据权利要求6所述的方法,其特征在于,对所述调整后的目标图像中的所述待识别目标对象进行分类确定所述待识别目标对象的预测类别是由神经网络执行的,所述神经网络包括分类网络;其中,所述分类网络中包括K个分类器,K为进行分类时已知类别的数量,k为正整数;

根据所述各个特征确定所述叠放着的多个待识别目标对象中所述各个待识别目标对象的预测类别,包括:分别计算所述各个特征与各个分类器的权重向量之间的余弦相似度;

根据所述计算的余弦相似度确定所述叠放着的多个待识别目标对象中所述各个待识别目标对象的预测类别。

8.根据权利要求6所述的方法,其特征在于,对所述调整后的目标图像中的所述待识别目标对象进行分类确定所述待识别目标对象的预测类别是由神经网络执行的,所述神经网络包括特征提取网络,所述特征提取网络包括多个卷积层,所述特征提取网络的所述多个卷积层中的最后N个卷积层在所述特征图的高度维度上的步长为1,N为正整数。

9.根据权利要求1所述的方法,其特征在于,对所述目标图像中的所述待识别目标对象进行分类是利用神经网络进行分类的,所述预测类别对应的所述真伪识别模型采用该预测类别的认证目标对象的隐层特征建立,所述认证目标对象在所述神经网络训练阶段和/或测试阶段正确预测。

10.一种目标对象的识别装置,其特征在于,所述装置包括:分类单元,用于对目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别;

确定单元,用于根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确;

提示单元,用于响应于所述预测类别不正确,输出提示信息;

所述确定单元用于:

将所述待识别目标对象的隐层特征输入与所述预测类别对应的真伪识别模型,以使所述真伪识别模型输出概率值;其中,所述目标对象的隐层特征是指在利用分类网络对目标对象进行分类时,输入至所述分类网络中的分类器之前的特征;所述预测类别对应的真伪识别模型反映该预测类别的、与目标对象的多个隐层特征相关的高斯概率分布模型,所述概率值表征所述待识别目标对象的最终类别为所述预测类别的概率;

在所述概率值小于概率阈值时,确定所述预测类别不正确;

在所述概率值大于或等于所述概率阈值时,确定所述预测类别正确。

11.根据权利要求10所述的装置,其特征在于,所述装置还包括输出单元,用于响应于所述预测类别正确,将所述预测类别确定为所述待识别目标对象的最终类别,并输出所述待识别目标对象的所述最终类别。

12.根据权利要求10或11所述的装置,其特征在于,所述目标图像中包括叠放着的多个待识别目标对象,所述分类单元用于:

将所述目标图像的高度通过缩放调整至预设高度,其中,所述目标图像是根据采集到的图像中叠放着的多个待识别目标对象的检测框从所述采集到的图像中裁剪得到的,且所述目标图像的高度方向为所述叠放着的多个待识别目标对象的叠放的方向;

对调整后的目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别。

13.根据权利要求12所述的装置,其特征在于,所述分类单元用于:将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到预设宽度;

在缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像的高度大于所述预设高度的情况下,将所述缩放后的目标图像的高度和宽度等比例缩小,直至缩小后的目标图像的高度等于所述预设高度。

14.根据权利要求12所述的装置,其特征在于,所述分类单元用于:将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到所述预设宽度;

在所述缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像的高度小于所述预设高度的情况下,利用第一像素对所述缩放后的目标图像进行填充,使得填充后的目标图像的高度为所述预设高度。

15.根据权利要求12所述的装置,其特征在于,所述预设高度根据所述待识别目标对象的最大数量设置;

所述分类单元用于:

对所述调整后的目标图像进行特征提取,得到特征图,所述特征图的高度维度与所述目标图像的高度方向对应;

沿着所述特征图的宽度维度对所述特征图进行平均池化,得到池化后的特征图;

根据所述最大数量,将所述池化后的特征图沿着高度维度分段,得到预设数量的特征,其中所述预设数量的特征与所述叠放着的多个待识别目标对象具有一一对应关系;

根据各个特征确定所述叠放着的多个待识别目标对象中各个待识别目标对象的预测类别。

16.根据权利要求15所述的装置,其特征在于,对所述调整后的目标图像中的所述待识别目标对象进行分类确定所述待识别目标对象的所述预测类别是由神经网络执行的,所述神经网络包括分类网络;其中,所述分类网络中包括K个分类器,K为进行分类时已知类别的数量,k为正整数;

根据所述各个特征确定所述叠放着的多个待识别目标对象中所述各个待识别目标对象的预测类别,包括:分别计算所述各个特征与各个分类器的权重向量之间的余弦相似度;

根据所述计算的余弦相似度确定所述叠放着的多个待识别目标对象中所述各个待识别目标对象的预测类别。

17.一种电子设备,其特征在于,所述设备包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为调用所述存储器存储的所述处理器可执行指令,以执行权利要求1至9任一项所述的方法。

18.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至9任一项所述的方法。