利索能及
我要发布
收藏
专利号: 2023116179557
申请人: 南通康盛医疗器械有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2024-12-17
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种医疗器械智能化检索系统,其特征在于:包括:

知识图谱构建模块,用于对来自不同数据源的医疗器械信息进行分析,进而构建关于医疗器械的知识图谱,并存入数据库中;

检索词解析模块,用于对用户端输入的检索词进行解析,根据自然语言处理技术对获取的检索词进行实体的识别和抽取,获取一个或多个检索三元组,将获取的检索三元组存入检索三元组集合;若无法提取检索三元组,则提取检索词的关键词存入检索关键词集合;

将获取的检索三元组集合或检索关键词集合打上时间戳和用户ID标签发送至关联匹配模块;

关联匹配模块,用于对获取的带有时间戳和用户ID标签的检索三元组集合或检索关键词集合进行分析,获取匹配索引词集合发送至知识推荐模块;当获取的是检索三元组集合,则针对检索三元组集合中的一个或多个检索三元组,根据同义词词典获取各个检索三元组对应实体或关系词的索引词集,根据获取的各个索引词链接的知识图谱相关知识是否包含对应三元组的主体实体、关系词以及客体实体,从而获取对应三元组的第一匹配索引词、第二匹配索引词以及第三匹配索引词,进而获取只包含一个检索三元组的检索三元组集合的匹配索引词集合,以及在同一匹配等级下,将索引词按照频次从大到小的顺序进行排列,从而获取包含多个检索三元组的检索三元组集合的匹配索引词集合;当获取的是检索关键词集合,则经过分析获取检索关键词集合的匹配索引词集合;关联匹配模块将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;

当获取的是带有时间戳和用户ID标签的检索三元组集合时,关联匹配模块的分析过程如下:

统计检索三元组集合所包含的检索三元组的数量;

若检索三元组的数量等于1,则有:

将检索三元组集合中唯一的检索三元组标记为目标三元组,将其包含的主体实体词、关系词以及客体主体词分别标记为第一目标实体、目标关系词以及第二目标实体;

根据同义词词典,分别将第一目标实体、目标关系词以及第二目标实体在数据库所包含的索引词中进行遍历,分别获取属于第一目标实体、目标关系词以及第二目标实体的主体实体索引词集、关系词索引词集以及客体实体索引词集;

对各个索引词集包含的索引词所链接的知识图谱实体、与该实体链接的其他实体以及该实体与其他实体之间的关系词进行遍历;

根据同义词词典判断知识图谱对应的实体、与该实体链接的其他实体以及该实体与其他实体之间的关系词是否与第一目标实体、第二目标实体以及目标关系词语义相似;若三项语义均相似,则将该索引词标记为第一匹配索引词;若存在两项语义相似,则将该索引词标记为第二匹配索引词,若存在一项语义相似,则将该索引词标记为第三匹配索引词;

从各个索引词集中筛选出第一匹配索引词、第二匹配索引词以及第三匹配索引词,对重复的索引词进行删除,对删除重复后的各个索引词按照匹配等级依次排列,从而获取目标三元组的匹配索引词集合,并将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;

若检索三元组的数量大于1,则有:

按照上述检索三元组的数量等于1的方式对检索三元组集合中每个检索三元组进行处理,获取各个检索三元组的匹配索引词集合,并合并成一个匹配索引词集合;

统计各个索引词的频次,将合并后的匹配索引词集合中的每个匹配等级所包含的各个索引词按照频次从大到小的顺序依次排列,将重复的索引词删除,将处理完毕的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;

知识推荐模块,用于根据获取的带有时间戳和用户ID标签的匹配索引词集合,将数据库所存储的知识图谱相关知识信息推送至用户端;

知识图谱构建模块的构建过程如下:

获取来自不同数据源的医疗器械信息;

对获取的医疗器械信息所包含的噪声、重复数据、缺失数据或错误数据进行处理,并将不同数据结构的数据转化成统一的数据结构和数据格式;

通过自然语言处理技术对统一数据结构和数据格式的医疗器械的文本数据进行实体识别和抽取,将主体实体、客体实体以及关系词表示为三元组;

在组成多个三元组之后,通过同义词典对其中相同的主体实体或客体实体进行链接,从而构建关于医疗器械的知识图谱,并存入数据库中,数据库采用图算法对知识图谱建立索引;其中,同义词典是前期将不同的词语或术语进行归并,使得同义词能够关联;

当获取的是带有时间戳和用户ID标签的检索关键词集合时,关联匹配模块的分析过程如下:

若检索关键词的数量等于1,则将检索关键词集合中唯一的检索关键词标记为目标关键词,根据同义词词典,将目标关键词在数据库所包含的索引词中进行遍历获取属于目标关键词的匹配索引词集合,并将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;

若检索关键词的数量大于1,则根据上述检索关键词的数量等于1的方式获取各个检索关键词的匹配索引词集合,并合并成一个匹配索引词集合;

统计各个索引词的频次,将合并后的匹配索引词集合中的各个索引词按照频次从大到小的顺序依次排列,将重复的索引词删除,打上时间戳和用户ID标签发送至知识推荐模块;

所述知识推荐模块根据索引词集合,提取索引词集合所包含的各个索引词;按照索引词在索引词集合中的顺序,依次将链接对应的知识图谱的知识信息发送至用户端,供用户端进行查看。

2.根据权利要求1所述的一种医疗器械智能化检索系统,其特征在于:医疗器械信息包括医疗器械的名称、规格、功能、性能、品牌、生产厂家、使用说明、用途、适应症以及病症描述,其中,医疗器械的名称、品牌以及生产厂家为主体实体信息,医疗器械的规格、功能、性能、使用说明、用途、适应症以及病症描述为客体实体信息。

3.根据权利要求1所述的一种医疗器械智能化检索系统,其特征在于:所述检索词解析模块获取检索三元组后存入检索三元组集合的过程如下:统计检索三元组的数量;若通过检索词获取多个检索三元组,则将提取出的三元组按照在检索词中出现的顺序进行排列;并统计各个检索三元组的频次,若存在频次大于1的检索三元组,则将频次大于1的检索三元组删减至频次等于1;将经过处理后的检索三元组存入检索三元组集合,并打上时间戳和用户ID标签发送至关联匹配模块。