利索能及
我要发布
收藏
专利号: 2020105547388
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于识别图像类别的方法,包括:

将待识别图像导入预先训练的图像识别模型,得到对应所述待识别图像的识别结果信息,所述图像识别模型用于对所述待识别图像进行识别,得到识别结果信息,所述识别结果信息包括所述待识别图像属于至少一个图像类别中每个图像类别的概率;

查询所述识别结果信息对应的至少一个图像类别中每个图像类别的阈值和权值,根据所述阈值和权值对所述识别结果信息进行分析,得到所述待识别图像对应每个图像类别的最终识别结果,所述阈值用于表征所述待识别图像属于对应图像类别的概率,所述权值用于表征对应的图像类别在全部图像类别中的权重比例,所述权值和权重比例为反比关系;

根据所述最终识别结果确定所述待识别图像的图像类别;

其中,所述根据所述阈值和权值对所述识别结果信息进行分析,得到所述待识别图像对应每个图像类别的最终识别结果,包括:获取所述识别结果信息中对应图像类别的初始概率;

响应于所述初始概率小于所述阈值,确定所述待识别图像不属于对应图像类别,否则,将所述初始概率与所述权值的乘积设置为对应图像类别的最终识别结果的取值。

2.根据权利要求1所述的方法,其中,所述根据所述阈值和权值对所述识别结果信息进行分析,得到所述待识别图像对应每个图像类别的最终识别结果,包括:响应于所述初始概率小于所述阈值,标记所述最终识别结果为0。

3.根据权利要求2所述的方法,其中,所述根据所述最终识别结果确定所述待识别图像的图像类别,包括:响应于对应图像类别的、取值最大的最终识别结果为0,标记所述待识别图像的图像类别为空,否则,将取值最大的最终识别结果对应的图像类别标记为所述待识别图像的图像类别。

4.根据权利要求1所述的方法,其中,所述方法还包括:设置图像类别的阈值和权值的步骤,所述设置图像类别的阈值和权值,包括:获取多个样本图像及对应所述多个样本图像中每个样本图像的样本图像类别;

将所述多个样本图像中的每个样本图像作为输入,将所述多个样本图像中的每个样本图像所对应的所述样本图像类别作为输出,设置对应图像类别的阈值和权值。

5.根据权利要求4所述的方法,其中,所述将所述多个样本图像中的每个样本图像作为输入,将所述多个样本图像中的每个样本图像所对应的所述样本图像类别作为输出,设置对应图像类别的阈值和权值,包括:执行以下训练步骤:将所述多个样本图像中的每个样本图像依次输入至深度学习模型,得到所述多个样本图像中的每个样本图像所对应的预测图像类别,将所述多个样本图像中的每个样本图像所对应的预测图像类别与该样本图像所对应的样本图像类别进行比较,得到对应图像类别的初始准确率,确定所述初始准确率是否大于对应图像类别的预设准确率阈值,若对应图像类别的初始准确率都大于对应的预设准确率阈值,则将对应的初始准确率设置为对应图像类别的基准阈值,并根据对应图像类别的基准阈值设置对应图像类别的基准权值。

6.根据权利要求5所述的方法,其中,所述将所述多个样本图像中的每个样本图像作为输入,将所述多个样本图像中的每个样本图像所对应的所述样本图像类别作为输出,设置对应图像类别的阈值和权值,包括:响应于不大于所述预设准确率阈值,调整所述深度学习模型的参数和对应图像类别的预设准确率阈值,并继续执行所述训练步骤。

7.一种用于识别图像类别的装置,包括:

识别结果信息获取单元,被配置成将待识别图像导入预先训练的图像识别模型,得到对应所述待识别图像的识别结果信息,所述图像识别模型用于对所述待识别图像进行识别,得到识别结果信息,所述识别结果信息包括所述待识别图像属于至少一个图像类别中每个图像类别的概率;

最终识别结果获取单元,被配置成查询所述识别结果信息对应的至少一个图像类别中每个图像类别的阈值和权值,根据所述阈值和权值对所述识别结果信息进行分析,得到所述待识别图像对应每个图像类别的最终识别结果,所述阈值用于表征所述待识别图像属于对应图像类别的概率,所述权值用于表征对应的图像类别在全部图像类别中的权重比例,所述权值和权重比例为反比关系;

图像类别识别单元,被配置成根据所述最终识别结果确定所述待识别图像的图像类别;

其中,所述最终识别结果获取单元包括:

初始概率获取子单元,被配置成获取所述识别结果信息中对应图像类别的初始概率;

最终识别结果获取子单元,响应于所述初始概率小于所述阈值,被配置成确定所述待识别图像不属于对应图像类别,否则,将所述初始概率与所述权值的乘积设置为对应图像类别的最终识别结果的取值。

8.根据权利要求7所述的装置,其中,所述最终识别结果获取单元包括:

最终识别结果获取子单元,响应于所述初始概率小于所述阈值,被配置成标记所述最终识别结果为0。

9.根据权利要求8所述的装置,其中,所述图像类别识别单元包括:

图像类别识别子单元,响应于对应图像类别的、取值最大的最终识别结果为0,被配置成标记所述待识别图像的图像类别为空,否则,将取值最大的最终识别结果对应的图像类别标记为所述待识别图像的图像类别。

10.根据权利要求7所述的装置,其中,所述装置还包括:参数设置单元,被配置成设置图像类别的阈值和权值,所述参数设置单元包括:样本获取子单元,被配置成获取多个样本图像及对应所述多个样本图像中每个样本图像的样本图像类别;

参数设置子单元,被配置成将所述多个样本图像中的每个样本图像作为输入,将所述多个样本图像中的每个样本图像所对应的所述样本图像类别作为输出,设置对应图像类别的阈值和权值。

11.根据权利要求10所述的装置,其中,所述参数设置子单元包括:

参数设置模块,被配置成将所述多个样本图像中的每个样本图像依次输入至深度学习模型,得到所述多个样本图像中的每个样本图像所对应的预测图像类别,将所述多个样本图像中的每个样本图像所对应的预测图像类别与该样本图像所对应的样本图像类别进行比较,得到对应图像类别的初始准确率,确定所述初始准确率是否大于对应图像类别的预设准确率阈值,若对应图像类别的初始准确率都大于对应的预设准确率阈值,则将对应的初始准确率设置为对应图像类别的基准阈值,并根据对应图像类别的基准阈值设置对应图像类别的基准权值。

12.根据权利要求11所述的装置,其中,所述参数设置子单元包括:

参数调整模块,响应于不大于所述预设准确率阈值,被配置成调整所述深度学习模型的参数和对应图像类别的预设准确率阈值,并返回所述参数设置模块。

13.一种电子设备,包括:

一个或多个处理器;

存储器,其上存储有一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行权利要求1至6中任一所述的方法。

14.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一所述的方法。