利索能及
我要发布
收藏
专利号: 2020109858390
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种视觉定位方法,包括:

获取待定位位置的目标图片;

对所述目标图片进行特征提取,获得所述目标图片的第一全局特征;其中,所述第一全局特征中包括第一布局特征和第一纹理特征,所述第一布局特征用于表征所述目标图片中各物体的空间结构信息;

从数据库中获取多张候选图片;其中,每张候选图片的第二全局特征与所述第一全局特征之间的差异值小于所述数据库中其他图片的第二全局特征与所述第一全局特征之间的差异值;

基于所述多张候选图片对所述待定位位置进行定位;

所述对所述目标图片进行特征提取,获得所述目标图片的第一全局特征包括:基于第一网络对所述目标图片进行第一特征提取,获得所述第一布局特征;

基于第二网络对所述目标图片进行第二特征提取,获得所述第一纹理特征;

基于第三网络将所述第一布局特征和所述第一纹理特征进行融合,获得所述第一全局特征;

所述基于第一网络对所述目标图片进行第一特征提取,获得所述第一布局特征包括:基于第一网络对所述目标图片进行第一特征提取,获得所述目标图片中各物体的空间结构信息;其中,所述空间结构信息中包括物体的语义信息和属性信息,所述属性信息表征该物体与所述目标图片中其他物体之间的约束关系;

基于所述目标图片中各物体的语义信息和属性信息,构造所述目标图片的第一布局特征。

2.根据权利要求1所述的方法,其中,所述属性信息包括物体的结构尺寸,所述基于所述目标图片中各物体的语义信息和属性信息,构造所述目标图片的第一布局特征包括:以所述目标图片中目标物体的结构尺寸为单位,对所述目标图片中其他物体的结构尺寸进行归一化;其中,所述目标物体为所述目标图片中结构尺寸最大的物体;

基于所述目标图片中各物体的语义信息和目标属性信息,构造所述目标图片的第一布局特征;其中,所述目标属性信息包括归一化后的结构尺寸。

3.根据权利要求1所述的方法,其中,所述从数据库中获取多张候选图片包括:分别获取所述第一全局特征和所述数据库中每张图片的第二全局特征之间的欧式距离;

从获取的欧式距离中筛选出多个目标欧式距离;其中,每个目标欧式距离小于所述获取的欧式距离中其他欧式距离;

从所述数据库中筛选出所述多个目标欧式距离对应的图片,以筛选出所述多张候选图片。

4.一种视觉定位装置,包括:

第一获取模块,用于获取待定位位置的目标图片;

特征提取模块,用于对所述目标图片进行特征提取,获得所述目标图片的第一全局特征;其中,所述第一全局特征中包括第一布局特征和第一纹理特征,所述第一布局特征用于表征所述目标图片中各物体的空间结构信息;

第二获取模块,用于从数据库中获取多张候选图片;其中,每张候选图片的第二全局特征与所述第一全局特征之间的差异值小于所述数据库中其他图片的第二全局特征与所述第一全局特征之间的差异值;

定位模块,用于基于所述多张候选图片对所述待定位位置进行定位;

所述特征提取模块包括:

第一特征提取单元,用于基于第一网络对所述目标图片进行第一特征提取,获得所述第一布局特征;

第二特征提取单元,用于基于第二网络对所述目标图片进行第二特征提取,获得所述第一纹理特征;

第三特征提取单元,用于基于第三网络将所述第一布局特征和所述第一纹理特征进行融合,获得所述第一全局特征;

所述第一特征提取单元,具体用于基于第一网络对所述目标图片进行第一特征提取,获得所述目标图片中各物体的空间结构信息;其中,所述空间结构信息中包括物体的语义信息和属性信息,所述属性信息表征该物体与所述目标图片中其他物体之间的约束关系;

基于所述目标图片中各物体的语义信息和属性信息,构造所述目标图片的第一布局特征。

5.根据权利要求4所述的装置,其中,所述属性信息包括物体的结构尺寸,所述第一特征提取单元,具体用于以所述目标图片中目标物体的结构尺寸为单位,对所述目标图片中其他物体的结构尺寸进行归一化;其中,所述目标物体为所述目标图片中结构尺寸最大的物体;基于所述目标图片中各物体的语义信息和目标属性信息,构造所述目标图片的第一布局特征;其中,所述目标属性信息包括归一化后的结构尺寸。

6.根据权利要求4所述的装置,其中,所述第二获取模块包括:第一获取单元,用于分别获取所述第一全局特征和所述数据库中每张图片的第二全局特征之间的欧式距离;

第一筛选单元,用于从获取的欧式距离中筛选出多个目标欧式距离;其中,每个目标欧式距离小于所述获取的欧式距离中其他欧式距离;

第二筛选单元,用于从所述数据库中筛选出所述多个目标欧式距离对应的图片,以筛选出所述多张候选图片。

7.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑3中任一项所述的方法。

8.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1‑3中任一项所述的方法。