利索能及
我要发布
收藏
专利号: 2021109868861
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种数据集的确定方法,其特征在于,包括:获取包含多个语义信息的语义数据库;

基于所述语义数据库创建多个标签数据;每个标签数据对应一个语义类别,每个标签数据包含所属于对应语义类别的物体标签;所述多个标签数据对应的语义类别为能够对待测试模型进行全方位表示测试的类别;

基于预设数据集合,为各个所述标签数据的物体标签确定相匹配数据,并基于所述相匹配数据确定每个所述标签数据对应的测试数据集合,得到多个测试数据集合。

2.根据权利要求1所述的方法,其特征在于,所述语义数据库为多个,所述基于所述语义数据库创建多个标签数据,包括:将多个语义数据库中的语义信息进行融合,得到融合语义数据库;其中,所述融合语义数据库中包含多个融合语义信息和多个融合语义信息之间的层次信息;

确定待划分的多个语义类别,并按照所述多个语义类别对所述融合语义数据库划分为所述多个标签数据。

3.根据权利要求2所述的方法,其特征在于,所述将多个语义数据库中的语义信息进行融合,得到融合语义数据库,包括:在所述多个语义数据库的第一语义数据库中确定待融合语义信息;所述待融合语义信息在所述第一语义数据库中不包含下一层级的语义信息;

基于所述第一语义数据库中语义信息间的层次信息,确定所述待融合语义信息所在的语义路径,所述语义路径包含至少一个语义信息;

基于所述语义路径中位于所述待融合语义信息之前的高层次语义信息,将所述待融合语义信息和第二语义数据库中的语义信息进行融合,得到所述融合语义数据库,所述第二语义数据库为所述多个语义数据库中除所述第一语义数据库之外的数据库。

4.根据权利要求3所述的方法,其特征在于,所述基于所述语义路径中位于所述待融合语义信息之前的高层次语义信息,将所述待融合语义信息和第二语义数据库中的语义信息进行融合,得到所述融合语义数据库,包括:按照由高到低的层次顺序,在所述高层次语义信息中确定目标语义信息;所述目标语义信息在所述第二语义数据库中包含相对应的语义信息;

将所述待融合语义信息和所述第二语义数据库中与所述目标语义信息相对应的语义信息的下一层次的语义信息进行融合,得到所述融合语义数据库。

5.根据权利要求2所述的方法,其特征在于,所述融合语义数据库为树形结构的数据库;所述按照所述多个语义类别对所述融合语义数据库划分为所述多个标签数据,包括:在所述树形结构的数据库中确定与每个语义类别相对应的节点,得到多个目标节点;

将每个所述目标节点作为根节点,对所述树形结构的数据库进行划分,划分得到多个子树形结构的数据库,其中,每个子树形结构的数据库对应一个目标节点;

基于所述多个子树形结构的数据库确定所述多个标签数据,其中,每个标签数据中的物体标签为对应子树形结构的数据库中的语义信息。

6.根据权利要求1至5中任一项所述的方法,其特征在于,所述预设数据集合中包含多个数据和多个数据的数据标签;

所述基于预设数据集合,为各个所述标签数据的物体标签确定相匹配数据,包括:确定每个标签数据中所包含的物体标签;

将所述预设数据集合中的数据标签与所述物体标签进行匹配,确定至少一组匹配标签;

在所述预设数据集合中确定与每组匹配标签中的数据标签相对应的至少一个数据,并将所述相对应的至少一个数据确定为与该组匹配标签中的物体标签相匹配的数据。

7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:通过每个测试数据集合对所述待测试模型进行测试处理,得到多个测试结果;

计算所述多个测试结果的平均值,并将所述平均值确定为对所述待测试模型进行全方位表示测试的测试结果。

8.根据权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:在所述预设数据集合中未确定出与目标标签数据中的目标物体标签相匹配数据的情况下,确定所述目标标签数据所对应目标语义类别;

在备选数据库中查找与所述目标语义类别相匹配的匹配数据库,并在所述匹配数据库中查找与所述目标物体标签相匹配数据。

9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:在所述预设数据集合中确定出目标数据标签的情况下,基于所述预设数据集合中数据标签之间的层次信息,确定所述目标数据标签的上一层次标签;所述目标数据标签为在多个标签数据的物体标签中不包含对应物体标签的数据标签;

确定所述上一层次标签所对应的语义信息,并在所述多个标签数据中确定与所述上一层次标签所对应的语义信息相匹配的语义信息;

将所述目标数据标签所对应的语义信息作为新语义信息,添加至所述相匹配的语义信息的下一层次的语义信息中,并基于所述预设数据集合为所述新语义信息确定相匹配数据。

10.一种数据集的确定装置,其特征在于,包括:获取单元,用于获取包含多个语义信息的语义数据库;

创建单元,用于基于所述语义数据库创建多个标签数据;每个标签数据对应一个语义类别,每个标签数据包含所属于对应语义类别的物体标签;所述多个标签数据对应的语义类别为能够对待测试模型进行全方位表示测试的类别;

确定单元,用于基于预设数据集合,为各个所述标签数据的物体标签确定相匹配数据,并基于所述相匹配数据确定每个所述标签数据对应的测试数据集合,得到多个测试数据集合。

11.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至9任一所述的数据集的确定方法的步骤。

12.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任意一项所述的数据集的确定方法的步骤。