利索能及
我要发布
收藏
专利号: 2020113053680
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种问题解析方法,其特征在于,所述方法包括:

获取原始问题集,利用所述原始问题集以及预先设定的语句分类模板训练预构建的第一语言模型,得到问题分发模型,及利用所述原始问题集训练预构建的第二语言模型,得到语义抽取模型;

利用所述问题分发模型对待解析问题进行分类,得到分类结果,及利用所述语义抽取模型对所述待解析问题进行语义解析,得到语义解析结果;

根据所述分类结果以及所述语义解析结果查找相匹配的查询语句模板,根据所述查询语句模板得到问题查询语句;

利用所述问题查询语句查询数据库内容,得到问答解析结果并反馈给查询终端;

其中,所述利用所述原始问题集训练预构建的第二语言模型,得到语义抽取模型,包括:利用所述第二语言模型提取所述原始问题集中的实体信息,并根据所述实体信息预测与所述实体信息对应的实体和实体关系;计算所述实体信息预测的准确率;当所述预测的准确率高于预设的阈值时,生成所述训练完成的语义抽取模型;

所述提取所述原始问题集中的实体信息,并根据所述实体信息预测与所述实体信息对应的实体和实体关系,包括:将所述原始问题集转化为原始序列,并利用所述第二语言模型的编码器对所述原始序列进行编码,得到编码序列;利用预设的二分类器预测所述编码序列中的实体信息;从所述编码序列中抽取出所述实体信息首尾对应的编码向量;以所述编码向量作为条件对所述编码序列做层标准化,对所述层标准化后的序列预测与所述实体信息对应的实体和实体关系;

所述利用所述问题分发模型对待解析问题进行分类,得到分类结果,包括:利用所述问题分发模型中的第一训练层识别所述待解析问题中的问题文本的缺失信息,得到预测问题;利用所述问题分发模型中的第二训练层识别所述预测问题中的问题文本中句子之间的依赖关系,得到初始问题;利用所述问题分发模型中的分类函数,对所述初始问题中的问题文本按照所述语句分类模板进行分类,得到所述分类结果。

2.如权利要求1所述的问题解析方法,其特征在于,所述计算所述实体信息预测的准确率,包括:采用下述公式计算所述准确率L:r,s r,c

e 为真正有关系的实体,e 为预测的有关系的实体,R为所有实体个数,r为第r个实体。

3.如权利要求1所述的问题解析方法,其特征在于,所述利用所述问题分发模型中的第一训练层识别所述待解析问题中的问题文本的缺失信息,得到预测问题,包括:遍历所述待解析问题中的问题文本,随机替换所述问题文本内的一个或多个词,得到原始替换问题;遍历所述原始替换问题中的文本,预测所述文本中被替换的词,得到所述预测问题。

4.如权利要求1所述的问题解析方法,其特征在于,所述利用所述问题分发模型中的第二训练层识别所述预测问题中的问题文本中句子之间的依赖关系,得到初始问题,包括:将所述预测问题中的语句排列顺序打乱,得到乱序预测问题;

从所述预测问题中选取第一数量的未打乱排序的语句对,及从所述乱序预测问题中选取第二数量的打乱排序的语句对,汇总所有语序对,得到语句对集;

遍历所述语句对集中的语句对,判断所述语句对中第二句话在文本中是否紧跟在第一句话之后,以得到排序正确的语句,其中,当语句对中第二句话在文本中紧跟在第一句话之后,则这两句话为排序正确的语句;

汇总所有排序正确的语句,得到所述初始问题。

5.一种问题解析装置,用于实现如权利要求1至4中任意一项所述的问题解析方法,其特征在于,所述装置包括:模型训练模块,用于获取原始问题集,利用所述原始问题集以及预先设定的语句分类模板训练预构建的第一语言模型,得到问题分发模型;及利用所述原始问题集训练预构建的第二语言模型,得到语义抽取模型;

问题解析模块,用于利用所述问题分发模型对待解析问题进行分类,得到分类结果;及利用所述语义抽取模型对所述待解析问题进行语义解析,得到语义解析结果;

问题查询模块,用于根据所述分类结果以及所述语义解析结果查找相匹配的查询语句模板,根据所述查询语句模板得到问题查询语句;

结果反馈模块,用于利用所述问题查询语句查询数据库内容,得到问答解析结果并反馈给查询终端。

6.一种电子设备,其特征在于,所述电子设备包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至4中任意一项所述的问题解析方法。

7.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任意一项所述的问题解析方法。