利索能及
我要发布
收藏
专利号: 2020111218960
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种癌症分期信息处理方法,其特征在于,包括:

获取文本信息;

确定所述文本信息中与癌症分期相关的第一关键词;

根据所述文本信息以及所述第一关键词,确定所述第一关键词的有效性;

在确定所述第一关键词有效的情况下,对所述第一关键词进行标准化,得到第二关键词;

根据所述第二关键词,获取与所述第二关键词对应的癌症分期信息;和/或,将所述文本信息确定为与所述第二关键词对应的癌症分期信息。

2.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息以及所述第一关键词,确定所述第一关键词的有效性,包括:对所述文本信息进行编码,得到第一特征向量;

对所述第一关键词进行编码,得到第二特征向量;

将所述第一特征向量与所述第二特征向量进行拼接,得到第三特征向量;

根据所述第三特征向量,确定所述第一关键词的有效性。

3.根据权利要求2所述的方法,其特征在于,所述对所述第一关键词进行编码,得到第二特征向量,包括:分别确定第一单词和第二单词在所述文本信息中的位置,其中,所述第一单词为所述第一关键词中的第一个单词,所述第二单词为所述第一关键词中的最后一个单词;

根据所述第一单词和所述第二单词在所述文本信息中的位置,对所述第一关键词进行编码,得到所述第二特征向量。

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一关键词中的第一单词和第二单词在所述文本信息中的位置,对所述第一关键词进行编码,得到所述第二特征向量,包括:获取预设向量维度;

根据所述第一单词在所述文本信息中的位置,确定所述第一单词在所述第二特征向量中的第一维度;

根据所述第二单词在所述文本信息中的位置,确定所述第二单词在所述第二特征向量中的第二维度;

根据所述第一维度以及所述第二维度,得到所述第二特征向量,其中,所述第二特征向量的维度为所述预设向量维度,且所述第二特征向量的第一维度、第二维度、以及所述第一维度和所述第二维度之间的维度对应的取值均为第一预设值,其余维度对应的取值均为第二预设值。

5.根据权利要求4所述的方法,其特征在于,在确定所述文本信息中与癌症分期相关的第一关键词之前,所述方法还包括:确定所述文本信息包含的单词的数量;

在所述文本信息包含的单词的数量大于所述预设向量维度的情况下,将所述文本信息分割为多个子文本信息,并将每个子文本信息作为所述文本信息,其中,每个子文本信息的包含的单词的数量小于或等于所述预设向量维度。

6.根据权利要求1-5中任一项所述的方法,其特征在于,所述第一关键词包括至少一个字符,所述对所述第一关键词进行标准化,得到第二关键词,包括:对每个字符进行词嵌入,得到与每个字符对应的字符向量;

对每个字符对应的字符向量进行编码,得到与每个字符对应的关键值向量、查询向量以及价值向量;

根据自注意力机制以及每个字符对应的查询向量、关键值向量以及价值向量,得到与每个字符对应的第四特征向量;

根据每个字符对应的第四特征向量对所述第一关键词进行标准化,得到所述第二关键词。

7.根据权利要求6所述的方法,其特征在于,所述根据自注意力机制以及每个字符对应的查询向量、关键值向量以及价值向量,得到与每个字符对应的第四特征向量,包括:确定字符A对应的查询向量与每个字符对应的关键值向量之间的相似度,并将所述相似度作为所述字符A与每个字符之间的权重,其中,所述字符A为所述至少一个字符中的任意一个字符;

根据所述字符A与每个字符之间的权重,对每个字符对应的价值向量进行加权处理,得到所述字符A对应的第四特征向量。

8.一种癌症分期信息处理装置,其特征在于,包括:

获取单元,用于获取文本信息;

确定单元,用于确定所述文本信息中与癌症分期相关的第一关键词;

所述确定单元,还用于根据所述文本信息以及所述第一关键词,确定所述第一关键词的有效性;

标准化单元,用于在确定所述第一关键词有效的情况下,对所述第一关键词进行标准化,得到第二关键词;

所述获取单元,还用于根据所述第二关键词,获取与所述第二关键词对应的癌症分期信息;和/或,将所述文本信息确定为与所述第二关键词对应的癌症分期信息。

9.一种癌症分期信息处理装置,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行权利要求1-7任一项方法中的步骤的指令。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7任一项所述的方法。