利索能及
我要发布
收藏
专利号: 2020111153453
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种医疗文本翻译方法,其特征在于,包括:

获取待翻译医疗文本;

将所述待翻译医疗文本进行语义特征提取,得到第一特征向量;

获取与所述待翻译医疗文本对应的目标特征向量,具体包括:对医疗领域中的所有医学知识图谱进行向量化,得到每个医学知识图谱对应的第三特征向量,并根据每个医学知识图谱中的第一实体词,为每个医学知识图谱对应的第三特征向量添加第一实体标签;根据所述待翻译医疗文本中的第二实体词,确定与所述待翻译医疗文本对应的第二实体标签;确定与所述第二实体标签匹配的第一实体标签,并将所述匹配的第一实体标签对应的第三特征向量作为与所述待翻译医疗文本对应的目标特征向量,所述目标特征向量用于表征与所述待翻译医疗文本对应的医学知识图谱;

将所述第一特征向量与所述目标特征向量进行拼接,得到第二特征向量;

根据所述第二特征向量,对所述待翻译医疗文本进行翻译。

2.一种医疗文本翻译方法,其特征在于,包括:

获取待翻译医疗文本;

将所述待翻译医疗文本进行语义特征提取,得到第一特征向量;

获取与所述待翻译医疗文本对应的目标特征向量,具体包括:根据每个医学知识图谱中的第一实体词,对医疗领域中的所有医学知识图谱添加第一实体标签;根据所述待翻译医疗文本中的第二实体词,确定与所述待翻译医疗文本对应的第二实体标签;确定与所述第二实体标签匹配的第一实体标签,并将与所述匹配的第一实体标签对应的医学知识图谱作为目标医学知识图谱;对所述目标医学知识图谱进行向量化,得到与所述待翻译医疗文本对应的目标特征向量,所述目标特征向量用于表征与所述待翻译医疗文本对应的医学知识图谱;

将所述第一特征向量与所述目标特征向量进行拼接,得到第二特征向量;

根据所述第二特征向量,对所述待翻译医疗文本进行翻译。

3.根据权利要求1或2所述的方法,其特征在于,所述将所述待翻译医疗文本进行语义特征提取,得到第一特征向量,包括:对所述待翻译医疗文本中的每个单词进行词嵌入处理,得到与每个单词对应的词向量;

根据每个单词对应的词向量进行语义特征提取,得到所述第一特征向量。

4.根据权利要求3所述的方法,其特征在于,在根据每个单词对应的词向量进行语义特征提取,得到所述第一特征向量之前,所述方法还包括:根据自注意力机制以及每个单词对应的词向量,确定每个单词对应的目标词向量;

所述根据每个单词对应的词向量进行语义特征提取,得到所述第一特征向量,包括:根据每个单词对应的目标词向量进行语义特征提取,得到所述第一特征向量。

5.根据权利要求4所述的方法,其特征在于,所述根据自注意力机制以及每个单词对应的词向量,确定每个单词对应的目标特征向量,包括:对单词A对应的词向量进行编码,得到与所述单词A对应的关键值向量、查询向量以及价值向量,所述单词A为所述待翻译医疗文本中的任意一个单词;

确定所述单词A对应的查询向量与每个单词对应的关键值向量之间的相似度,并将所述相似度作为所述单词A与每个单词之间的权重;

根据所述单词A与每个单词之间的权重,对每个单词对应的价值向量进行加权处理,得到所述单词A对应的目标词向量。

6.根据权利要求1或2所述的方法,其特征在于,

所述待翻译医疗文本包括中文医疗文本或英文医疗文本,且在所述待翻译医疗文本为中文医疗文本的情况下,所述医学知识图谱为中文医学知识图谱,在所述待翻译医疗文本为英文医疗文本的情况下,所述医学知识图谱为英文医学知识图谱。

7.一种医疗文本翻译装置,其特征在于,包括:

获取单元,用于获取待翻译医疗文本;

处理单元,用于将所述待翻译医疗文本进行语义特征提取,得到第一特征向量;

所述获取单元,还用于获取与所述待翻译医疗文本对应的目标特征向量,具体用于:对医疗领域中的所有医学知识图谱进行向量化,得到每个医学知识图谱对应的第三特征向量,并根据每个医学知识图谱中的第一实体词,为每个医学知识图谱对应的第三特征向量添加第一实体标签;根据所述待翻译医疗文本中的第二实体词,确定与所述待翻译医疗文本对应的第二实体标签;确定与所述第二实体标签匹配的第一实体标签,并将所述匹配的第一实体标签对应的第三特征向量作为与所述待翻译医疗文本对应的目标特征向量,所述目标特征向量用于表征与所述待翻译医疗文本对应的医学知识图谱;

所述处理单元,还用于将所述第一特征向量与所述目标特征向量进行拼接,得到第二特征向量;

所述处理单元,还用于根据所述第二特征向量,对所述待翻译医疗文本进行翻译。

8.一种医疗文本翻译装置,其特征在于,包括:

获取单元,用于获取待翻译医疗文本;

处理单元,用于将所述待翻译医疗文本进行语义特征提取,得到第一特征向量;

所述获取单元,还用于获取与所述待翻译医疗文本对应的目标特征向量,具体用于:根据每个医学知识图谱中的第一实体词,对医疗领域中的所有医学知识图谱添加第一实体标签;根据所述待翻译医疗文本中的第二实体词,确定与所述待翻译医疗文本对应的第二实体标签;确定与所述第二实体标签匹配的第一实体标签,并将与所述匹配的第一实体标签对应的医学知识图谱作为目标医学知识图谱;对所述目标医学知识图谱进行向量化,得到与所述待翻译医疗文本对应的目标特征向量,所述目标特征向量用于表征与所述待翻译医疗文本对应的医学知识图谱;

所述处理单元,还用于将所述第一特征向量与所述目标特征向量进行拼接,得到第二特征向量;

所述处理单元,还用于根据所述第二特征向量,对所述待翻译医疗文本进行翻译。

9.一种医疗文本翻译装置,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行权利要求1-6任一项方法中的步骤的指令。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-6任一项所述的方法。