利索能及
我要发布
收藏
专利号: 2021108504143
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种数据搜索方法,其特征在于,所述方法包括:获取数据查询方提交的需要查询的目标数据;

计算所述目标数据与各样本数据的相似度,确定多个相似度区间,并按照各所述样本数据与所述目标数据的相似度,将各所述样本数据分配到对应的相似度区间中;

按照预设区间选取规则,选取指定相似度区间中的样本数据,并按照相似度对选取的样本数据进行排序,得到第一排序结果;

将所述第一排序结果发送给所述数据查询方。

2.根据权利要求1所述的方法,其特征在于,所述计算所述目标数据与各样本数据的相似度,确定多个相似度区间,并按照各所述样本数据与所述目标数据的相似度,将各所述样本数据分配到对应的相似度区间中,包括:按照预设顺序计算所述目标数据与各样本数据的相似度,并根据当前已经得到的各相似度的上下边界,调整各相似度区间对应的相似度范围;

按照各所述样本数据与所述目标数据的相似度,将各所述样本数据分配到对应的相似度区间中。

3.根据权利要求2所述的方法,其特征在于,所述按照各所述样本数据与所述目标数据的相似度,将各所述样本数据分配到对应的相似度区间中之后,所述方法还包括:针对任一相似度区间,当该相似度区间中样本数据的数量超过预设数量阈值时,将该相似度区间重新划分为多个相似度区间,并相应调整重新划分的各相似度区间中的样本数据。

4.根据权利要求1所述的方法,其特征在于,所述按照预设区间选取规则,选取指定相似度区间中的样本数据,按照相似度对选取的样本数据进行排序,得到第一排序结果,包括:

获取所述数据查询方单页最多能够显示的样本数据的数量得到第一数值;

按照相似度由高到低的顺序,选取前第二数值个相似度区间作为指定相似度区间,其中,前第二数值个相似度区间中样本数据的总数量不小于所述第一数值,且前第三数值个相似度区间中样本数据的总数量小于所述第一数值,所述第三数值等于所述第二数值减1;

将所述指定相似度区间中的样本数据按照相似度由高到低的顺序进行排序得到第一序列,选取第一序列中的前第一数值个样本数据作为第一排序结果。

5.根据权利要求4所述的方法,其特征在于,在所述将所述第一排序结果发送给所述数据查询方之后,所述方法还包括:

在接收到所述数据查询方的表示请求更多查询结果的查询消息时,确定所述指定相似度区间中除所述第一排序结果外的其他样本数据的数量得到第四数值;

根据所述第四数值及所述第一数值,计算得到还需要选取的样本数据的数量得到第五数值;

按照相似度由高到低的顺序,在除所述指定相似度区间外的其他相似度区间中选取前第六数值个相似度区间作为当前指定相似度区间,其中,前第六数值个相似度区间中样本数据的总数量不小于所述第五数值,且前第七数值个相似度区间中样本数据的总数量小于所述第五数值,所述第七数值等于所述第六数值减1;

将当前指定相似度区间中的样本数据按照相似度由高到低的顺序进行排序得到第二序列,选取所述第一序列中最后第四数值个及所述第二序列中的前第五数值个样本数据作为第二排序结果;

将所述第二排序结果发送给所述数据查询方。

6.根据权利要求1所述的方法,其特征在于,在所述将所述第一排序结果发送给所述数据查询方之后,所述方法还包括:

针对未进行样本数据排序的各相似度区间,按照相似度由高到低的顺序,选取前第八数值个相似度区间中的样本数据进行排序,得到第三排序结果,其中,所述第八数值为预设区间数量或所述第八数值满足在未进行样本数据排序的各相似度区间中前第八数值个相似度区间中样本数据的总数量不小于预设样本数值,且前第九数值个相似度区间中样本数据的总数量小于所述预设样本数值,所述第九数值等于所述第八数值减1;

将所述第三排序结果发送给所述数据查询方。

7.根据权利要求1所述的方法,其特征在于,在所述将所述第一排序结果发送给所述数据查询方之后,所述方法还包括:

在接收到所述数据查询方的表示显示第第十数值页查询结果的查询消息时,根据所述数据查询方单页最多能够显示的样本数据的第一数值及各样本区间中样本数据的数量,按照相似度由高到低的顺序,选取第第十一数值个样本区间至第第十二数值个样本区间作为目标样本区间,其中,前第十一数值减1个样本区间中样本数据的总数不大于第十三数值,所述第十三数值等于所述第一数值与所述第十数值的乘积减去所述第一数据,前第十一数值个样本区间中样本数据的总数大于所述第十三数值,前第十二数值减1个样本区间中样本数据的总数小于第十四数值,所述第十四数值等于所述第一数值与所述第十数值的乘积,前第十二数值个样本区间中样本数据的总数不小于所述第十四数值;

按照相似度由高到低的顺序,将所述目标样本区间中的各样本数据进行排序,得到第三序列;

在所述第三序列中选取第第十五数值个至第第十六数值个样本数据作为第四排序结果,其中,所述第十五数值等于所述第十三数值减去第十七数值再加1,所述第十六数值等于所述第十四数值减去所述第十七数值,所述第十七数值为前第十一数值减1个样本区间中样本数据的总数;

将所述第四排序结果发送给所述数据查询方。

8.一种数据搜索装置,其特征在于,所述装置包括:目标数据获取模块,用于获取数据查询方提交的需要查询的目标数据;

样本数据分配模块,用于计算所述目标数据与各样本数据的相似度,确定多个相似度区间,并按照各所述样本数据与所述目标数据的相似度,将各所述样本数据分配到对应的相似度区间中;

样本数据排序模块,用于按照预设区间选取规则,选取指定相似度区间中的样本数据,按照相似度对选取的样本数据进行排序,得到第一排序结果;

排序结果发送模块,用于将所述第一排序结果发送给所述数据查询方。

9.根据权利要求8所述的装置,其特征在于,所述样本数据分配模块,具体用于:按照预设顺序计算所述目标数据与各样本数据的相似度,并根据当前已经得到的各相似度的上下边界,调整各相似度区间对应的相似度范围;按照各所述样本数据与所述目标数据的相似度,将各所述样本数据分配到对应的相似度区间中。

10.根据权利要求9所述的装置,其特征在于,所述样本数据分配模块,还用于:针对任一相似度区间,当该相似度区间中样本数据的数量超过预设数量阈值时,将该相似度区间重新划分为多个相似度区间,并相应调整重新划分的各相似度区间中的样本数据。

11.一种电子设备,其特征在于,包括处理器及存储器;

所述存储器,用于存放计算机程序;

所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1‑7任一所述的数据搜索方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1‑7任一所述的数据搜索方法。