1.一种视觉词典生成方法,所述方法包括:
获取目标定位区域内环境图像所对应的至少一个特征信息;其中,所述特征信息包括所述环境图像中局部元素的相关信息;
基于所述环境图像所对应的至少一个特征信息,构建与所述目标定位区域对应的目标视觉词典;所述目标视觉词典中至少包括所述目标定位区域内多个物体图像的局部元素的相关信息;所述目标视觉词典用于对目标定位区域中待定位图像进行语义表示。
2.根据权利要求1所述的方法,其特征在于,所述基于所述环境图像所对应的至少一个特征信息,构建与所述目标定位区域对应的目标视觉词典,包括:若所述目标定位区域中不存在初始视觉词典,则对所述环境图像对应的至少一个特征信息进行聚类处理,得到K类特征信息集合;其中,K为大于1且小于N的整数;N为所述环境图像中至少一个特征信息的总数;
将所述K类特征信息集合作为所述目标定位区域对应的目标视觉词典。
3.根据权利要求1所述的方法,其特征在于,所述基于所述环境图像所对应的至少一个特征信息,构建与所述目标定位区域对应的目标视觉词典,包括:若所述目标定位区域对应的初始视觉词典中包含M个预设特征信息,将所述至少一个特征信息保存至所述预设视觉词典中,得到所述目标定位区域对应的目标视觉词典;其中,M为大于等于1的整数。
4.根据权利要求3所述的方法,其特征在于,所述将所述至少一个特征信息保存至所述预设视觉词典中,得到所述目标定位区域对应的目标视觉词典,包括:当所述至少一个特征信息中第i个特征信息与初始视觉词典中第j个预设特征信息匹配,将所述第i个特征信息和第j个预设特征信息进行合并处理,得到更新后的第j个预设特征信息;其中,i为大于零且小于等于N的整数,N为所述环境图像中至少一个特征信息的总数;j为大于零且小于等于M整数;
将所述更新后的第j个预设特征信息存入所述初始视觉词典中,得到与所述目标定位区域对应的目标视觉词典。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当初始视觉词典中没有预设特征信息与所述至少一个特征信息中第i个特征信息匹配,从初始视觉词典中获取与所述第i个特征信息相似度大于第一预设阈值的目标特征信息集合;
将所述第i个特征信息添加至所述目标特征信息集合中,得到所述目标视觉词典。
6.根据权利要求2所述的方法,其特征在于,所述对所述环境图像对应的至少一个特征信息进行聚类处理,得到K类特征信息集合之后,还包括:若第k类特征信息集合中的特征信息个数大于预设个数,对所述第k类特征信息集合中的特征信息进行聚类处理,得到所述第k类特征信息集合对应的至少一个第k子类特征信息集合;k为大于等于1且小于等于K的整数;
若第m个第k子类特征信息集合中的特征信息个数大于预设个数,对所述第m个第k子类特征信息集合中的特征信息进行聚类处理,直至特征信息集合中的特征信息个数小于预设个数,形成所述环境图像对应的至少一个特征信息的树形结构数据库;m为正整数;
对应地,所述将所述K类特征信息集合作为所述目标定位区域对应的目标视觉词典,包括:将所述环境图像对应的至少一个特征信息的树形结构数据库作为所述目标视觉词典。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应用户终端的定位请求;所述定位请求中包括用户终端所处区域和用户终端在所处区域采集的待定位图像;
获取与用户终端所处区域的距离小于预设距离的至少一个目标定位区域所对应的目标视觉词典;
从所述至少一个目标定位区域所对应的目标视觉词典中获取,与所述待定位图像匹配的最优视觉词典;
基于所述最优视觉词典,对所述待定位图像进行语义表示,得到待定位图像特征向量;
将所述特征向量,与用户终端所处区域对应的历史图像数据库中历史图像的特征向量进行特征匹配,得到所述用户终端的目标位置。
8.一种视觉词典的生成装置,包括:
获取单元,用于获取目标定位区域内环境图像所对应的至少一个特征信息;其中,所述特征信息包括所述环境图像中局部元素的相关信息;
处理单元,用于基于所述环境图像所对应的至少一个特征信息,构建与所述目标定位区域对应的目标视觉词典;所述目标视觉词典中至少包括所述目标定位区域内多个物体图像的局部元素的相关信息;所述目标视觉词典用于对目标定位区域中待定位图像进行语义表示。
9.一种电子设备,包括:处理器和配置为存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器配置为运行所述计算机程序时,执行权利要求1至7任一项所述视觉词典生成方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行实现权利要求1至7任一项所述视觉词典生成方法的步骤。