1.一种多模态药物知识图谱的知识表征与推理方法,其特征是,包括以下步骤:S1.构建多模态药物知识图谱:分析整合药物主成分的化学结构,并将这些信息融入药物知识图谱中,为模型提供药物的分子式结构特征和统一表征;
S2.对多模态药物知识图谱上的药物显性特征进行提取并表示:提取多模态药物知识图谱中的药物特征,包括药物主成分的化学分子式结构图特征,然后通过图神经网络技术提取分子结构式的拓扑结构特征对药物特征进行表示;
步骤S2包括数据预处理、药物主成分的分子表示和分子结构式图卷积表示三部分,具体步骤如下:S2.1.数据预处理:在提取药物特征之前,通过对多模态数据进行彻底的清洗和预处理来确保数据质量和一致性;
S2.2.药物主成分的分子表示:通过在相同化学键表下保持原空间中的特性在药物成分化学分子式图表示过程中引入镜像投影机制,来捕捉沿不同化学键的信息特征,计算公式为:,
其中, 表示镜像投影机制中变换矩阵, 表示分子结构式图中原子表示向量,表示单位矩阵,表示转置;
S2.3.分子结构式图卷积表示:采用Attentive FP框架,在单层图注意力神经网络GAT中对分子结构式卷积图进行表示,其中邻接节点信息的聚合过程公式为:,
其中, 表示线性整流函数,表示分子式中不同的化学键,表示分子式中的原子,表示 聚合过程中的注意力,表示变换矩阵,表示图卷积层,表示关系集, 表示节点对应特征向量,表示节点以 化学键链接的节点,表示分子式中的节点, 表示节点以 化学键链接的邻居集, 表示 图卷积层的节点对应待更新表示向量,每层原子表示通过门控循环单元GRU进行更新,更新过程的公式为:,
其中, 表示门控循环单元的操作, 表示 图卷积层的 节点特征向量, 表示图卷积层节点更新后的特征向量;
S3.对待推理药物‑药物的关系路径规则进行表示:通过路径的图卷积算法筛选出待推理药物‑药物之间的路径,然后以查询药物为中心广度遍历生成的 的子图对待推理药物‑药物的关系路径规则进行表示;
S4.预测推理结果得分:将获得关系路径规则表示向量喂给全连接层,预测在候选答案上的得分,以确定药物‑药物间的潜在互作用。
2.根据权利要求1所述的一种多模态药物知识图谱的知识表征与推理方法,其特征是:步骤S1中,在构建多模态药物知识图谱的过程中,通过图神经网络技术对药物的分子式结构特征进行处理,分析药物化合物的分子结构,并提取其特征,然后将提取到的特征进行融合来构建药物知识图谱中。
3.根据权利要求2所述的一种多模态药物知识图谱的知识表征与推理方法,其特征是:步骤S3包括设计融合全局信息的门控制循环神经元和 层门图注意力神经网络,具体步骤如下:设计融合全局信息的门控制循环神经元:通过建模药物知识图谱的关系规则特点设计融合全局信息的门控制循环神经元,关系规则特点包含沿路径的关系组合的顺序性和来自全局的关系特征,融合全局信息的门控制循环神经元结构被定义的公式为:,
其中, 表示更新后的路径特征, 表示 源节点的特征向量, 表示 关系的全局表征向量, 表示 关系的特征向量,GMGU对关系的全局信息和局部特征之间添加一个门,表示控制关系全局与局部特征融合时信息分配,GMGU的计算公式为:,
,
,
,
其中,表示遗忘门, 表示候选隐藏状态,表示可学习分配权重,表示 激活函数, 表示拼接操作, 表示点积操作, 、 分别表示可训练的变换矩阵和偏移量, 表示双曲正切函数。
4.根据权利要求3所述的一种多模态药物知识图谱的知识表征与推理方法,其特征是:层门图注意力神经网络:在 层门图注意力神经网络中,第 层门图注意力神经网络聚合以查询实体 为中心的 子图关系传播信息,在层中,通过 捕获沿边的关系规则特征表示 ,计算公式为:,
其中, 表示在 层 源节点的特征向量, 表示在 层 关系的特征向量,表示 关系的全局表征向量, 、 、 , 表示维度为 的实数向量;
然后通过查询特征 和获得关系规则特征表示 计算中心节点每条邻接边的注意力 ,计算公式为:,
,
其中, 和 分别表示注意力 的可训练的变换矩阵和向量, 表示注意力 的可训练的偏移量, 表示在 层 处的邻接边集, 在网络中分别表示信息传播机制中的源节点、关系、中心节点、问题对,其中问题对 通过三元组 表示,将缺少目标实体的问题对 记作 ; 分别表示其他源节点、其他关系,表示注意力权重, 表示在 层 的注意力权重,聚合过程的公式为:,
最后通过最小门控循环神经网络 更新实体的表示,计算公式为:,
其中, 表示 层的实体表示, 表示 层更新后的实体表示。
5.根据权利要求4所述的一种多模态药物知识图谱的知识表征与推理方法,其特征是:步骤S4中,将最终表示向量喂给全连接层,预测在候选答案上的得分并确定药物间的潜在互作用,求问题对 中的中心节点 ,缺少目标实体的问题对 的答案 在候选答案实体集 上, 上得分的公式为:,
其中, 表示候选答案是中心节点 的得分, 表示变换矩阵, 表示偏移量, 分别表示子图步数和延迟层。