利索能及
我要发布
收藏
专利号: 2021104857818
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于自然语言处理的语句补全方法,其特征在于,包括:获取待处理的目标语句和所述目标语句对应的会话语句,所述会话语句包括上文语句和/或下文语句;

利用自然语言处理模型将所述目标语句转换为第一词向量,以及将所述会话语句转换为第二词向量;

提取所述第一词向量对应的第一语境信息、所述第二词向量对应的第二语境信息,以及提取所述第一词向量和所述第二词向量之间的第三语境信息,并根据所述第一语境信息和所述第三语境信息生成第一隐藏状态,以及根据所述第二语境信息和所述第三语境信息生成第二隐藏状态;

根据所述第一隐藏状态和所述第二隐藏状态,生成与所述目标语句和所述会话语句相关的特征向量;

基于所述特征向量获取全局信息,以将所述特征向量转换为与所述目标语句和所述会话语句相关的字向量矩阵;

利用连通域标记算法查询所述字向量矩阵中的连通区域;

根据所述会话语句中与所述连通区域关联的字向量,对所述目标语句进行语句补全处理,得到语句补全结果。

2.如权利要求1所述的基于自然语言处理的语句补全方法,其特征在于,所述根据所述第一隐藏状态和所述第二隐藏状态,生成与所述目标语句和所述会话语句相关的特征向量的步骤包括:

根据所述第一隐藏状态和所述第二隐藏状态,确定所述第一词向量和所述第二词向量之间的字级相似性,以及确定所述第一词向量和所述第二词向量之间的余弦相似性,以及确定所述第一词向量和所述第二词向量之间的双线性相似性;

根据所述字级相似性、所述余弦相似性和所述双线性相似性,生成特征向量。

3.如权利要求1所述的基于自然语言处理的语句补全方法,其特征在于,所述基于所述特征向量获取全局信息,以将所述特征向量转换为与所述目标语句和所述会话语句相关的字向量矩阵的步骤包括:

利用所述自然语言处理模型的切分层提取所述特征向量对应的全局信息,并基于所述全局信息,将所述特征向量转换为与所述目标语句和所述会话语句相关的字向量矩阵;

其中,所述切分层包括自所述切分层的输入端开始依次连接的两个下采样模块、两个上采样模块和全连接模块;所述下采样模块包括依次连接的两个卷积单元,以及全局池化单元;所述上采样模块包括依次连接的两个卷积单元,以及反卷积单元;所述全连接模块包括依次连接的两个卷积单元,以及前馈神经网络单元。

4.如权利要求1所述的基于自然语言处理的语句补全方法,其特征在于,所述根据所述会话语句中与所述连通区域关联的字向量,对所述目标语句进行语句补全处理,得到语句补全结果的步骤包括:

根据所述会话语句中与每个所述连通区域关联的字向量,以及所述目标语句中与每个所述连通区域关联的字向量,确定每个所述连通区域对应的编辑操作,其中,所述编辑操作的类型包括替换操作和插入操作;

根据所述会话语句中与每个所述连通区域关联的字向量,以及每个所述连通区域对应的所述编辑操作,对所述目标语句进行语句补全处理,得到语句补全结果。

5.如权利要求1‑4中任一项所述的基于自然语言处理的语句补全方法,其特征在于,所述根据所述会话语句中与所述连通区域关联的字向量,对所述目标语句进行语句补全处理,得到语句补全结果的步骤之后,还包括:确定所述语句补全结果对应的响应操作;

根据所述响应操作对所述目标语句对应的会话任务进行响应处理。

6.如权利要求5所述的基于自然语言处理的语句补全方法,其特征在于,所述根据所述响应操作对所述目标语句对应的会话任务进行响应处理的步骤之后,还包括:接收到所述响应处理对应的确定响应时,根据所述语句补全结果、所述目标语句和所述会话语句生成训练样本;

利用所述训练样本更新所述自然语言处理模型。

7.如权利要求1所述的基于自然语言处理的语句补全方法,其特征在于,所述根据所述会话语句中与所述连通区域关联的字向量,对所述目标语句进行语句补全处理,得到语句补全结果的步骤之后,还包括:

将所述目标语句对应的会话记录中的所述目标语句,替换为所述语句补全结果,并更新所述会话记录;

将更新后的所述会话记录发送至存储服务端以块链式的账本进行存储。

8.一种基于自然语言处理的语句补全装置,其特征在于,包括:获取模块,用于获取待处理的目标语句和所述目标语句对应的会话语句,所述会话语句包括上文语句和/或下文语句;

切分模块,用于利用自然语言处理模型将所述目标语句转换为第一词向量,以及将所述会话语句转换为第二词向量;

提取模块,用于提取所述第一词向量对应的第一语境信息、所述第二词向量对应的第二语境信息,以及提取所述第一词向量和所述第二词向量之间的第三语境信息,并根据所述第一语境信息和所述第三语境信息生成第一隐藏状态,以及根据所述第二语境信息和所述第三语境信息生成第二隐藏状态;

生成模块,用于根据所述第一隐藏状态和所述第二隐藏状态,生成与所述目标语句和所述会话语句相关的特征向量;

转换模块,用于基于所述特征向量获取全局信息,以将所述特征向量转换为与所述目标语句和所述会话语句相关的字向量矩阵;

查询模块,用于利用连通域标记算法查询所述字向量矩阵中的连通区域;

处理模块,用于根据所述会话语句中与所述连通区域关联的字向量,对所述目标语句进行语句补全处理,得到语句补全结果。

9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于自然语言处理的语句补全方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于自然语言处理的语句补全方法的步骤。