利索能及
我要发布
收藏
专利号: 201810434066X
申请人: 和美(深圳)信息技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-06-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种数据处理方法,所述方法包括:

获取提问信息;

当所述提问信息与知识库中的候选待推荐问题的词向量相似度评分大于第一预设阈值时,获取所述提问信息对应的目标待推荐问题和所述目标待推荐问题对应的答案;

获取与所述目标待推荐问题相邻同类问题集合,计算所述同类问题集合中各个同类问题与所述目标待推荐问题的总相似度,所述总相似度是根据各个所述同类问题与所述目标待推荐问题的问题相似度、第一词向量相似度、第二词向量相似度和语句相似度中至少两种相似度确定的,所述第二词向量相似度为不同类型语言的词向量相似度;

将所述总相似度满足预设相似度阈值的所述同类问题添加至所述知识库,所述同类问题对应的答案为所述目标推荐问题对应的答案。

2.根据权利要求1所述的方法,其特征在于,所述计算所述同类问题集合中各个同类问题与所述目标待推荐问题的总相似度,包括:计算各个所述同类问题与所述目标待推荐问题的所述问题相似度,所述问题相似度是通过提取各个所述同类问题和所述目标待推荐问题的关键词,根据各个所述同类问题所述关键词与所述目标待推荐问题的关键词的相似度,确定所述问题相似度;

分别提取各个所述同类问题和所述目标待推荐问题的词向量,计算各个所述同类问题的词向量和所述目标待推荐问题的词向量的相似度,得到所述第一词向量相似度;

将各个所述同类问题转换为第二语言同类问题,将所述目标待推荐问题转换成对应的第二语言目标待推荐问题,分别提取各个所述第二语言同类问题和所述第二语言目标待推荐问题词向量,根据各个所述第二语言同类问题所述关键词与所述第二语言目标待推荐问题的关键词的相似度,确定所述第二词向量相似度;

获取自定义规则模板,根据所述自定义规则模板计算各个所述同类问题与所述目标待推荐问题的语句相似度;

根据所述问题相似度、所述第一词向量相似度、所述第二词向量相似度和所述语句相似度进行加权得到所述总相似度。

3.根据权利要求1所述的方法,其特征在于,所述获取与所述目标待推荐问题相邻同类问题集合之前,还包括:获取当前会话对应的当前目标待推荐问题和所述当前提问信息之前至当前会话上一次返回答案后的全部问题,组成问题集合;

当所述问题集合的问题数目满足第一预设数目时,直接返回所述目标待推荐问题对应的答案;

当所述问题集合的问题数目满足第二预设数目时,进入所述获取与目标待推荐问题相邻同类问题集合的步骤。

4.根据权利要求1所述的方法,其特征在于,所述计算所述同类问题集合中各个同类问题与所述目标待推荐问题的相似度之后,还包括:获取当前会话对应的当前目标待推荐问题和所述当前目标待推荐问题之前至当前会话上一次返回答案后的全部问题,组成问题集合;

当所述总相似度未满足所述预设相似度阈值时,从所述问题集合中获取有效提问信息;

对所述有效提问信息进行聚类,得到对应的聚类问题集合;

对所述聚类问题集合进行去重,得到有效聚类问题集合和对应的有效问题数目;

通过网络对所述有效问题数目大于预设聚类数目阈值的所述有效聚类问题集合中各个聚类问题进行爬取,得到对应的网络问题和网络答案;

计算各个所述聚类问题和对应的网络问题的第三词向量相似度;

将所述聚类问题、对应的所述网络问题和所述网络答案和对应的所述第三词向量相似度,发送至第一终端;

接收所述第一终端发送的反馈信息,根据所述反馈信息确定所述聚类问题的处理状态。

5.根据权利要求1所述的方法,其特征在于,所述接收所述第一终端发送的反馈信息之后,包括:当所述反馈消息为通过时,将所述聚类问题和对应的网络答案添加至所述知识库;

当所述反馈消息为丢弃时,将所述聚类问题录入词典中,所述词典用于记录无效问题。

6.根据权利要求4所述的方法,其特征在于,所述方法还包括:

当所述词向量相似度评分未满足所述第一预设阈值时,将所述提问信息录入日志模块;

当所述日志模块中包含的所述提问信息数目大于第一预设数目时,将所述日志模块中的全部提问信息作为问题集合,进入从所述问题集合中获取有效提问信息的步骤;或获取预先配置的问题分析时间,当当前时刻满足所述预先配置的问题分析时间时,将所述日志模块中的全部提问信息作为问题集合,进入从所述问题集合中获取有效提问信息的步骤。

7.根据权利要求1所述的方法,其特征在于,所述当所述提问信息与知识库中的候选待推荐问题的词向量相似度评分大于第一预设阈值时之后,还包括:当未获取所述目标待推荐问题对应的答案时,重复执行所述获取提问信息的步骤。

8.一种数据处理装置,其特征在于,所述装置包括:

提问信息获取模块,用于获取提问信息;

问题推荐模块,用于当所述提问信息与知识库中的候选待推荐问题的词向量相似度评分大于第一预设阈值时,获取所述提问信息对应的目标待推荐问题和所述目标待推荐问题对应的答案;

相似度计算模块,用于获取与所述目标待推荐问题相邻对应的同类问题集合,计算所述同类问题集合中各个同类问题与所述目标待推荐问题的相似度,所述相似度是根据各个所述同类问题与所述目标待推荐问题的问题总相似度、第一词向量相似度、第二词向量相似度和语句相似度中至少两种相似度确定的,所述第二词向量相似度为不同类型语言的词向量相似度;

知识库更新模块,用于将所述总相似度满足预设相似度阈值的所述同类问题和所述目标待推荐问题对应的答案添加至所述知识库。

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。