利索能及
我要发布
收藏
专利号: 2020113524689
申请人: 湖南师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种脑卒中医疗知识图谱的构建方法,其特征在于,所述方法包括以下步骤:

S1、基于国际标准医学术语集并通过人工参与的方式构建脑卒中疾病词典,具体实现方式包括:

S11、通过人工参与的方式调用国际标准医学术语集并初步建立概念分类体系;

S12、同时利用人工对所调用的国际标准医学术语集进行标注分析以建立关系分类体系;

S13、对所建立的概念分类体系和关系分类体系进行对比评估,从而构建脑卒中疾病词典;

S2、根据脑卒中疾病词典构建脑卒中本体库和脑卒中本体库的模式层,并生成脑卒中本体库模式层的规则;

S3、从信息库中获取脑卒中疾病及其相关的医学知识,对获取的医学知识进行实体对齐和相似度计算,然后基于本体库模式层的规则将与脑卒中本体库中实体匹配的医学知识添加到脑卒中本体库中,具体实现方式包括:S31、采用分布式爬虫从垂直医学网站和众包性质的百科网站中爬取脑卒中疾病及其相关的医学知识,并将所爬取的医学知识以三元组形式储存在Neo4J图数据库中;

S32、将从公开知识库中获取的通用知识图谱医学知识直接进行整合,并将所整合的医学知识以三元组形式储存在Neo4J图数据库中;

S33、将Neo4J图数据库中储存的从步骤S31和步骤S32获取的医学知识映射到连续的低维向量空间中并以实体向量表示以进行实体对齐,然后计算出实体之间的语义结构信息的相似度,具体为:S331、利用TransD模型将Neo4J图数据库中储存的从步骤S31和步骤S32获取的医学知识映射到连续的低维向量空间中以实体向量表示,其中TransD模型表示为:式(1)中,h表示头实体节点,t表示尾实体节点,r表示头实体节点与尾实体节点之间的关系,L1/L2表示计算时使用L1的距离或使用L2的距离,L1表示r向量到h向量的平移距离,L2表示r向量到t向量的平移距离,其中,Mh=rphp+I,Mt=rptp+I,I表示单位矩阵,p表示投影,hp、rp、tp分别为三元组的投影向量;

S332、将同类实体的相同属性的不同表达方式进行属性对齐得到异构数据源,然后根据本体库模式层的规则对异构数据源的属性值进行规范化处理,其中,异构数据源的属性值进行规范化处理具体包括:对数值型属性值的度量单位进行统一;对字符串类型属性值中带有的空格符和换行符进行删除;将区间型属性值的上限和下限储存于列表中;将实体对象型属性值储存于列表中且不进行属性对齐操作;

S333、计算属性对齐和规范化处理后实体的语义结构信息的相似度,从而确定该医学知识中实体与脑卒中本体库中实体之间的关系,其计算公式表示为:式(2)中,W1,W2表示两个实体,k表示权重参数,N表示可调节参数,i,j表示实体的属性名称,lcs(i,j)表示实体属性名称i和j的最大公共子序列的长度,li表示实体W1中词的长度,lj表示实体W2中词的长度;

S34、基于本体库模式层的规则将所计算的相似度高的医学知识添加到脑卒中本体库中;

S4、不断重复步骤S3,以对脑卒中本体库进行更新和完善,进而可获得脑卒中医疗知识图谱。

2.如权利要求1所述的脑卒中医疗知识图谱的构建方法,其特征在于,所述脑卒中本体库中的实体包括基于医学主题词表和ICD‑10编码。

3.如权利要求2所述的脑卒中医疗知识图谱的构建方法,其特征在于,所述步骤S3中的医学知识包括脑卒中疾病数据,以及治疗手段、症状、检查方法和药品。

4.如权利要求3所述的脑卒中医疗知识图谱的构建方法,其特征在于,所述步骤S4中通过人工干预的方式对所获得的脑卒中医疗知识图谱边界进行限定以保证脑卒中医疗知识图谱不会在广度上无限延伸。

5.如权利要求4所述的脑卒中医疗知识图谱的构建方法,其特征在于,所述步骤S4的具体实现方式包括:不断从信息库中获取脑卒中疾病及其相关的医学知识,并进行实体对齐和相似度计算,然后根据当前脑卒中本体库的模式层的关系类型对获取的医学知识进行判定,当获取的医学知识的关系类型存在当前脑卒中本体库的模式层中且其头实体节点和尾节点节点类型已知时,则将所获取的医学知识链接到脑卒中本体库已有的实体关系上,若脑卒中本体库中没有对应的实体关系,则在当前脑卒中本体库的模式层中添加新的实体关系;当获取的医学知识所连接的头实体节点和尾实体节点只有一个能在当前脑卒中本体库的模式层中找到对应的关系类型时,则将该未知关系类型的实体进行抽取并计算其出现的次数,然后对其熵值做均一化处理,并将熵值较大的关系类型与实体类型作为候选模式添加到模式层,进而不断更新脑卒中医疗知识图谱。

6.如权利要求5所述的脑卒中医疗知识图谱的构建方法,其特征在于,还包括步骤S5、计算脑卒中医疗知识图谱中医学知识的置信度,并舍弃置信度低的医学知识以保证所获得的脑卒中医疗知识图谱的质量。