利索能及
我要发布
收藏
专利号: 2019102888759
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图像标注方法,其特征在于,包括:在应用使用过程中,采集所述应用的元数据,其中,所述元数据中包括图像、及图像对应的识别结果和第一置信度;

对所述元数据中每个图像进行内容检测,确定每个图像对应的各视觉属性及各视觉属性的各第二置信度;

根据每个图像对应的各视觉属性和各第二置信度、及所述元数据中的识别结果和第一置信度,确定每个图像对应的待标注方式;

根据每个图像对应的待标注方式,将所述每个图像进行标注处理。

2.如权利要求1所述的方法,其特征在于,所述对所述元数据中每个图像进行内容检测,确定每个图像对应的各视觉属性及各视觉属性的各第二置信度之前,还包括:根据所述元数据中每个图像对应的识别结果的第一置信度,对所述元数据进行过滤处理,获取第一置信度在预设范围内的第一图像集;

所述对所述元数据中每个图像进行内容检测,包括:对所述第一图像集中的每个图像进行内容检测。

3.如权利要求2所述的方法,其特征在于,所述根据所述元数据中每个图像对应的识别结果的第一置信度,对所述元数据进行过滤处理,包括:根据所述应用对应的业务类型,确定置信度阈值;

根据所述置信度阈值及每个图像对应的识别结果的第一置信度,对所述元数据进行过滤处理。

4.如权利要求1所述的方法,其特征在于,所述根据每个图像对应的各视觉属性和各第二置信度、及所述元数据中的识别结果和第一置信度,确定每个图像对应的待标注方式,包括:

根据所述应用对应的业务类型,确定所述各视觉属性分别对应的各第一权重、及所述元数据中的识别结果对应的第二权重;

根据所述各视觉属性分别对应的各第一权重、元数据中的识别结果对应的第二权重、每个图像对应的各视觉属性的各第二置信度、及所述元数据中的识别结果的第一置信度,确定每个图像对应的融合后的总置信度;

根据每个图像对应的融合后的总置信度,确定每个图像对应的待标注方式。

5.如权利要求4所述的方法,其特征在于,所述根据每个图像对应的融合后的总置信度,确定每个图像对应的待标注方式,包括:若第一图像对应的融合后的总置信度大于或等于第一阈值,则确定所述第一图像为优选标注图像;

若第二图像对应的融合后的总置信度小于第一阈值、且大于或等于第二阈值,则确定所述第二图像为人工标注图像;

若第三图像对应的融合后的总置信度小于第二阈值,则确定所述第三图像为待清理图像。

6.如权利要求1‑5任一所述的方法,其特征在于,所述将所述每个图像进行标注处理之后,还包括:

利用标注处理后的图像对所述应用中的图像识别模型进行更新训练,生成更新后的识别模型。

7.一种图像标注装置,其特征在于,包括:采集模块,用于在应用使用过程中,采集所述应用的元数据,其中,所述元数据中包括图像、及图像对应的识别结果和第一置信度;

第一确定模块,用于对所述元数据中每个图像进行内容检测,确定每个图像对应的各视觉属性及各视觉属性的各第二置信度;

第二确定模块,用于根据每个图像对应的各视觉属性和各第二置信度、及所述元数据中的识别结果和第一置信度,确定每个图像对应的待标注方式;

标注模块,用于根据每个图像对应的待标注方式,将所述每个图像进行标注处理。

8.如权利要求7所述的装置,其特征在于,还包括:过滤模块,用于根据所述元数据中每个图像对应的识别结果的第一置信度,对所述元数据进行过滤处理,获取第一置信度在预设范围内的第一图像集;

所述第一确定模块,包括:

检测单元,用于对所述第一图像集中的每个图像进行内容检测。

9.如权利要求8所述的装置,其特征在于,所述过滤模块,包括:第一确定单元,用于根据所述应用对应的业务类型,确定置信度阈值;

过滤单元,用于根据所述置信度阈值及每个图像对应的识别结果的第一置信度,对所述元数据进行过滤处理。

10.如权利要求7所述的装置,其特征在于,所述第二确定模块,包括:第二确定单元,用于根据所述应用对应的业务类型,确定所述各视觉属性分别对应的各第一权重、及所述元数据中的识别结果对应的第二权重;

第三确定单元,用于根据所述各视觉属性分别对应的各第一权重、元数据中的识别结果对应的第二权重、每个图像对应的各视觉属性的各第二置信度、及所述元数据中的识别结果的第一置信度,确定每个图像对应的融合后的总置信度;

第四确定单元,用于根据每个图像对应的融合后的总置信度,确定每个图像对应的待标注方式。

11.如权利要求10所述的装置,其特征在于,所述第四确定单元,具体用于:若第一图像对应的融合后的总置信度大于或等于第一阈值,则确定所述第一图像为优选标注图像;

若第二图像对应的融合后的总置信度小于第一阈值、且大于或等于第二阈值,则确定所述第二图像为人工标注图像;

若第三图像对应的融合后的总置信度小于第二阈值,则确定所述第三图像为待清理图像。

12.如权利要求7‑11任一所述的装置,其特征在于,还包括:更新模块,用于利用标注处理后的图像对所述应用中的图像识别模型进行更新训练,生成更新后的识别模型。

13.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑6中任一所述的图像标注方法。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1‑6中任一所述的图像标注方法。