欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 202110871873X
申请人: 深圳市思特克电子技术开发有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种语音搜索方法,其特征在于,所述方法包括:获取用户输入的目标语音;

将所述目标语音转化为目标文本;

对所述目标文本进行特征提取,得到第一关键词集;

获取所述用户的预设时间段的目标浏览记录;

对所述目标浏览记录进行特征提取,得到第二关键词集;

根据所述第一关键词集和所述第二关键词集确定第三关键词集;

根据所述第三关键词集进行搜索,得到目标搜索结果集;

其中,所述根据所述第三关键词集进行搜索,得到目标搜索结果集,包括:根据所述第三关键词集进行搜索,得到初始搜索结果集;

从所述初始搜索结果集中选取排序靠前的P个搜索结果,所述P为大于1的整数;

获取所述用户的年龄,得到目标年龄;

根据所述目标年龄对所述P个搜索结果进行筛选和排序,得到所述目标搜索结果集;

其中,所述根据所述目标年龄对所述P个搜索结果进行筛选和排序,得到所述目标搜索结果集,包括:

获取所述P个搜索结果中每一搜索结果的浏览记录,得到P个浏览记录,每一浏览记录均对应用户年龄信息;

根据所述P个浏览记录确定所述P个搜索结果中每一搜索结果对应的浏览分布直方图,得到P个浏览分布直方图,所述浏览分布直方图的横轴为年龄、纵轴为用户数量;

根据所述P个浏览分布直方图确定所述P个搜索结果中每一搜索结果与所述目标年龄之间的关联度,得到P个关联度,具体为:针对任一浏览分布直方图获取所述目标年龄对应的用户数量,确定该用户数量与总的用户数量之间的比值,将该比值作为所述关联度;

从所述P个关联度中筛选出处于预设范围的关联度,得到Q个关联度,所述Q为小于或等于所述P的正整数;

根据所述Q个关联度以及该Q个关联度对应的Q个搜索结果每一搜索结果的序号值确定所述Q个搜索结果的排序值,得到Q个排序值;

根据所述Q个排序值对所述Q个搜索结果进行排序,得到所述目标搜索结果集。

2.根据权利要求1所述的方法,其特征在于,所述根据所述第一关键词集和所述第二关键词集确定第三关键词集,包括:从所述第二关键词集中选取与所述第一关键词集中的关键词相关的关键词,得到至少一个关键词;

将所述第二关键词集以及所述至少一个关键词进行合并,得到第四关键词集;

从所述第四关键词集中选取预设数量的关键词作为所述第三关键词集。

3.根据权利要求1所述的方法,其特征在于,所述根据所述Q个关联度以及该Q个关联度对应的Q个搜索结果每一搜索结果的序号值确定所述Q个搜索结果的排序值,得到Q个排序值,包括:

按照预设的关联度与调节因子之间的映射关系,确定关联度i对应的目标调节因子,所述关联度i为所述Q个关联度中的任一关联度;

按照预设的序号与序号值之间的映射关系,确定所述关联度i的序号对应的目标序号值,其中,序号越靠前,则序号值越大;

根据所述目标调节因子对所述目标序号值进行调节,得到所述关联度i对应的排序值。

4.根据权利要求1或2所述的方法,其特征在于,所述将所述目标语音转化为目标文本,包括:

对所述目标语音进行识别,得到目标语言类型;

按照预设的语言类型与语音识别模型之间的映射关系,确定所述目标语音类型对应的目标语音识别模型;

通过所述目标语音识别模型将所述目标语音转化为目标文本。

5.一种语音搜索装置,其特征在于,所述装置包括:第一获取单元、转化单元、第一提取单元、第二获取单元、第二提取单元、确定单元和搜索单元,其中,所述第一获取单元,用于获取用户输入的目标语音;

所述转化单元,用于将所述目标语音转化为目标文本;

所述第一提取单元,用于对所述目标文本进行特征提取,得到第一关键词集;

所述第二获取单元,用于获取所述用户的预设时间段的目标浏览记录;

所述第二提取单元,用于对所述目标浏览记录进行特征提取,得到第二关键词集;

所述确定单元,用于根据所述第一关键词集和所述第二关键词集确定第三关键词集;

所述搜索单元,用于根据所述第三关键词集进行搜索,得到目标搜索结果集;

其中,所述根据所述第三关键词集进行搜索,得到目标搜索结果集,包括:根据所述第三关键词集进行搜索,得到初始搜索结果集;

从所述初始搜索结果集中选取排序靠前的P个搜索结果,所述P为大于1的整数;

获取所述用户的年龄,得到目标年龄;

根据所述目标年龄对所述P个搜索结果进行筛选和排序,得到所述目标搜索结果集;

其中,所述根据所述目标年龄对所述P个搜索结果进行筛选和排序,得到所述目标搜索结果集,包括:

获取所述P个搜索结果中每一搜索结果的浏览记录,得到P个浏览记录,每一浏览记录均对应用户年龄信息;

根据所述P个浏览记录确定所述P个搜索结果中每一搜索结果对应的浏览分布直方图,得到P个浏览分布直方图,所述浏览分布直方图的横轴为年龄、纵轴为用户数量;

根据所述P个浏览分布直方图确定所述P个搜索结果中每一搜索结果与所述目标年龄之间的关联度,得到P个关联度,具体为:针对任一浏览分布直方图获取所述目标年龄对应的用户数量,确定该用户数量与总的用户数量之间的比值,将该比值作为所述关联度;

从所述P个关联度中筛选出处于预设范围的关联度,得到Q个关联度,所述Q为小于或等于所述P的正整数;

根据所述Q个关联度以及该Q个关联度对应的Q个搜索结果每一搜索结果的序号值确定所述Q个搜索结果的排序值,得到Q个排序值;

根据所述Q个排序值对所述Q个搜索结果进行排序,得到所述目标搜索结果集。

6.根据权利要求5所述的装置,其特征在于,在所述根据所述第一关键词集和所述第二关键词集确定第三关键词集方面,所述确定单元具体用于:从所述第二关键词集中选取与所述第一关键词集中的关键词相关的关键词,得到至少一个关键词;

将所述第二关键词集以及所述至少一个关键词进行合并,得到第四关键词集;

从所述第四关键词集中选取预设数量的关键词作为所述第三关键词集。

7.一种服务器,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1‑4任一项所述的方法中的步骤的指令。

8.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1‑4任一项所述的方法。