1.一种融合有序关系路径和实体描述信息的知识表示学习方法,其特征在于,包括以下步骤:对数据库中知识图谱三元组中的每个路径关系信息以及实体描述信息进行提取并预处理;
对提取的每个路径关系的头尾实体投影到不同空间中,并使用池化策略融合不同的路径信息,得到有序关系路径信息的表示;
对提取的实体描述信息利用Transformer结合关系注意力机制进行嵌入,得到实体描述的向量表示;
将有序关系路径信息的表示以及实体描述的向量表示进行融合,在相同的连续低维的向量空间中,对实体和关系融合的向量表示进行学习;
其中,所述对提取的每个路径关系的头尾实体投影到不同空间中,并使用池化策略融合不同的路径信息,得到有序关系路径信息的表示,包括:设计一个两层池化策略融合不同路径的信息,首先,第一层策略为利用最小池化方法从i步路径中提取特征信息,并定义一个能量函数 如下所示:其中, 表示与从头实体h到尾实体t的关系r相关的所有i步路径的集合;
第二层池化策略为利用最小池化方法来融合来自不同长度路径的信息,并定义如下能量函数:s=1 s=2 s=n
Efinal(h,r,t)=Min[E(h,r,t),E(h,p ,t),E(h,p ,t),…,E(h,p ,t)]其中,E(h,r,t)表示直接关系r的能量值;
所述对提取的实体描述信息利用Transformer结合关系注意力机制进行嵌入,得到实体描述的向量表示,包括:利用DKRL模型对实体描述信息进行关键词提取,然后使用Transformer编码器和关系注意机制来提取实体描述中所包含的关键语义特征。
2.如权利要求1所述的一种融合有序关系路径和实体描述信息的知识表示学习方法,其特征在于,对于知识图谱中的每个三元组(h,r,t),使用向量来表示实体对和关系;在每个三元组向量中,包括头部实体h、关系r以及尾部实体t。
3.如权利要求1所述的一种融合有序关系路径和实体描述信息的知识表示学习方法,其特征在于,为测量两个实体之间的直接关系的指示性以及保证路径中关系的顺序,则定s=n s=n义一个能量函数E(h,p ,t),p 表示从h到t的n步路径之一,即所述能量函数如下所示:
其中,
hp=f(p,h),tp=g(p,t)
hp和tp分别表示头实体h和尾实体t在有序关系路径p中的表示, 表示给定路径p中关于第i个关系的序列矩阵。
4.如权利要求1所述的一种融合有序关系路径和实体描述信息的知识表示学习方法,其特征在于,实体描述信息的表示模型由三层组成,分别为输入层、Transformer Encoder层和关系注意层;在输入层,将实体描述的词嵌入和位置嵌入连接起来形成句子嵌入,作为模型输入信息;采用一个具有多头自注意机制的Transformer Encoder在实体描述中获取更多的语义特征,并学习描述中单词之间的依赖关系;采用关系注意力机制来计算实体描述中每个词的权重,获得实体描述的全局矢量表示。
5.一种融合有序关系路径和实体描述信息的知识表示学习系统,具体执行如权利要求
1‑4任一项所述的一种融合有序关系路径和实体描述信息的知识表示学习方法,其特征在于,包括:数据提取模块,用于对数据库中知识图谱三元组中的每个路径关系信息以及实体描述信息进行提取并预处理;
数据处理模块,用于对提取的每个路径关系的头尾实体投影到不同空间中,并使用池化策略融合不同的路径信息,得到有序关系路径信息的表示;
以及对提取的实体描述信息利用Transformer结合关系注意力机制进行嵌入,得到实体描述的向量表示;
数据融合模块,用于将有序关系路径信息的表示以及实体描述的向量表示进行融合,在相同的连续低维的向量空间中,对实体和关系融合的向量表示进行学习。
6.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述如权利要求1‑4所述的任一项方法的步骤。
7.一种计算机可读存储介质,其特征在于,存储有计算机程序,该程序被处理器执行时执行上述如权利要求1‑4所述的任一项方法的步骤。