利索能及
我要发布
收藏
专利号: 2019110186029
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-07
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图像识别方法,其特征在于,包括:

对包括目标对象的待处理图像进行面部识别,得到所述目标对象的第一识别结果,所述第一识别结果包括所述目标对象的多个类别标签及各个类别标签的第一概率;

在所述第一识别结果不满足识别条件的情况下,根据信任集的多个第一图像中对象的参考类别,对所述第一识别结果中的全部或部分类别标签的第一概率进行校正,确定所述目标对象的第二识别结果;

根据所述第二识别结果,确定所述待处理图像中的目标对象的类别。

2.根据权利要求1所述的方法,其特征在于,所述第二识别结果包括所述全部或部分类别标签的第二概率,其中,所述根据信任集的多个第一图像中对象的参考类别,对所述第一识别结果进行校正,确定所述目标对象的第二识别结果,包括:根据所述信任集的多个参考类别以及预设的第一人物关系矩阵,确定第二人物关系矩阵;

根据所述多个参考类别以及所述第二人物关系矩阵,对所述第一识别结果中的全部或部分类别标签的第一概率进行校正,得到所述全部或部分类别标签的第二概率。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述第一识别结果满足所述识别条件的情况下,根据所述第一识别结果,确定所述待处理图像中的目标对象的类别。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在所述第一识别结果满足所述识别条件的情况下,将所述待处理图像及所述待处理图像中的目标对象的类别添加到所述信任集中。

5.根据权利要求2至4中任意一项所述的方法,其特征在于,所述方法还包括:对采集的第一数据集中的多个第一数据的第二图像进行识别,从所述多个第一数据的第二图像中确定出第三图像,其中,所述第一数据集中的每个第一数据包括文本以及与所述文本对应的第二图像,所述第三图像标注有对象的类别标签;

对所述多个第一数据的文本分别进行标注,得到所述多个第一数据的文本标注信息;

根据所述多个第一数据的文本标注信息以及所述第三图像中对象的类别标签,确定出第二数据集;

其中,所述第二数据集中的全部或部分所述第三图像以及所述第三图像中对象的类别标签用于训练第一识别网络,所述第一识别网络用于对所述待处理图像进行面部识别。

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据所述多个第一数据的文本标注信息以及所述第三图像中对象的类别标签,确定出所述第一人物关系矩阵。

7.根据权利要求5或6所述的方法,其特征在于,所述对采集的第一数据集中的多个第一数据的第二图像进行识别,从所述多个第一数据的第二图像中确定出第三图像,包括:对所述多个第一数据的第二图像分别进行人脸检测,从多个第二图像中确定出多个包括人脸的第四图像;

利用第二识别网络对所述多个包括人脸的第四图像进行识别,从所述多个包括人脸的第四图像中确定出所述第三图像。

8.一种图像识别装置,其特征在于,包括:

第一识别模块,用于对包括目标对象的待处理图像进行面部识别,得到所述目标对象的第一识别结果,所述第一识别结果包括所述目标对象的多个类别标签及各个类别标签的第一概率;

结果校正模块,用于在所述第一识别结果不满足识别条件的情况下,根据信任集的多个第一图像中对象的参考类别,对所述第一识别结果中的全部或部分类别标签的第一概率进行校正,确定所述目标对象的第二识别结果;

第一类别确定模块,用于根据所述第二识别结果,确定所述待处理图像中的目标对象的类别。

9.一种电子设备,其特征在于,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:执行权利要求1至7中任意一项所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。