利索能及
我要发布
收藏
专利号: 2020110348878
申请人: 和美(深圳)信息技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-07-25
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种知识图谱表示学习方法,其特征在于,包括:

根据知识图谱中的三元组的首实体以及尾实体在知识图谱中的关系实体,对应确定所述首实体以及尾实体的语境信息;所述首实体以及尾实体的语境信息包括所述知识图谱中的三元组的首实体以及尾实体在知识图谱中的一度关系实体以及二度关系实体;

根据所述三元组以及所包含的首实体以及尾实体的语境信息,构建三元组树,并将所述三元组树输入到嵌入层编码,得到嵌入向量;所述嵌入向量作为正样本的实体向量与关系向量的表示;所述三元组树包括所述首实体、尾实体、所述首实体的一度关系实体、所述首实体的二度关系实体、所述尾实体的一度关系实体、以及所述尾实体的二度关系实体的信息;

根据实体向量和关系向量之间的转化模型,得到所述三元组数对应嵌入向量的一个评价函数,通过最小化所述评价函数,学习得到所述三元组的向量表示。

2.根据权利要求1所述的知识图谱表示学习方法,其特征在于,所述嵌入层包括字符嵌入层、位置嵌入层以及分割嵌入层;所述将所述三元组树输入到嵌入层编码,得到嵌入向量的步骤包括:将所述三元组树输入到字符嵌入层编码、位置嵌入层以及分割嵌入层中的一种,得到所述嵌入向量。

3.根据权利要求2所述的知识图谱表示学习方法,其特征在于,将所述三元组树输入到位置嵌入层时,得到所述嵌入向量表示为:a, b, c, d, e, f, g, h, i, g, k, l, m;

其中,a表示所述三元组中首实体的位置编码, b表示所述三元组中关系的位置编码, c, d表示所述三元组中尾实体的位置编码, e表示所述首实体的一度关系的位置编码, f表示所述首实体的一度关系对应实体的位置编码, g表示所述首实体的二度关系的位置编码, h表示所述首实体的二度关系对应实体的位置编码, i表示所述尾实体的一度关系的位置编码, g表示所述尾实体的一度关系对应实体的位置编码, k表示所述尾实体的二度关系的位置编码, l表示所述尾实体的二度关系对应实体的位置编码。

4.根据权利要求3所述的知识图谱表示学习方法,其特征在于,所述实体向量和关系向量之间的转化模型通过伯努利分布分布抽样技术,替换所述三元组的首实体或者尾实体得到负样本。

5.一种知识图谱表示学习系统,其特征在于,包括:

语境信息获取模块,用于根据知识图谱中的三元组的首实体以及尾实体在知识图谱中的关系实体,对应确定所述首实体以及尾实体的语境信息;所述首实体以及尾实体的语境信息包括所述知识图谱中的三元组的首实体以及尾实体在知识图谱中的一度关系实体以及二度关系实体;

嵌入向量获取模块,用于根据所述三元组以及所包含的首实体以及尾实体的语境信息,构建三元组树,并将所述三元组树输入到嵌入层编码,得到嵌入向量;所述嵌入向量作为正样本的实体向量与关系向量的表示;所述三元组树包括所述首实体、尾实体、所述首实体的一度关系实体、所述首实体的二度关系实体、所述尾实体的一度关系实体、以及所述尾实体的二度关系实体的信息;

向量表示学习模块,用于根据实体向量和关系向量之间的转化模型,得到所述三元组数对应嵌入向量的一个评价函数,通过最小化所述评价函数,学习得到所述三元组的向量表示。

6.根据权利要求5所述的知识图谱表示学习系统,其特征在于,所述嵌入层包括字符嵌入层、位置嵌入层以及分割嵌入层;

所述嵌入向量获取模块具体用于:将所述三元组树输入到字符嵌入层编码、位置嵌入层以及分割嵌入层中的一种,得到所述嵌入向量。

7.根据权利要求6所述的知识图谱表示学习系统,其特征在于,所述嵌入向量获取模块具体用于:将所述三元组树输入到位置嵌入层时,得到所述嵌入向量表示为:a, b, c, d, e, f, g, h, i, g, k, l, m;

其中,a表示所述三元组中首实体的位置编码, b表示所述三元组中关系的位置编码, c, d表示所述三元组中尾实体的位置编码, e表示所述首实体的一度关系的位置编码, f表示所述首实体的一度关系对应实体的位置编码, g表示所述首实体的二度关系的位置编码, h表示所述首实体的二度关系对应实体的位置编码, i表示所述尾实体的一度关系的位置编码, g表示所述尾实体的一度关系对应实体的位置编码, k表示所述尾实体的二度关系的位置编码, l表示所述尾实体的二度关系对应实体的位置编码。

8.根据权利要求7所述的知识图谱表示学习系统,其特征在于,所述实体向量和关系向量之间的转化模型通过伯努利分布分布抽样技术,替换所述三元组的首实体或者尾实体得到负样本。