利索能及
我要发布
收藏
专利号: 2022109105145
申请人: 燕山大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于邻域关系表征向量的知识图谱嵌入表示方法,其特征在于,其包括以下子步骤:S1、生成实体的邻域关系表征向量,得到实体的邻域关系表征向量集合Ω;

S2、生成同类型实体集,具体包括如下子步骤:

S21、定义维度为2*m的向量max和min;

S22、对max和min向量进行赋值;

S23、对集合Ω中的任意实体邻域关系表征向量vi进行归一化处理,得到归一化处理后的邻域关系表征向量集合Ω';

S24、采用聚类方法将邻域关系表征向量集合Ω'中的实体邻域关系表征向量聚为K个簇,则按同簇的邻域关系表征向量从实体集合E中挑选相对应的实体ei,从而完成同类型实体集Ck(k∈[1,K])的划分;

S3、进行同类型实体特征的提取与融合,具体包括如下子步骤:

S31、根据步骤S2生成的同类型实体集,确定实体ei所属的同类型实体集Ck;

S32、根据同类型实体集Ck从基准知识图谱嵌入模型的实体嵌入矩阵中挑取相应的实体嵌入向量,并将各个实体嵌入向量按式(2)拼接为同类型实体嵌入矩阵Ek;

其中,||表示拼接操作,hi为同类型实体集Ck中实体ei的嵌入向量;

S33、在基准知识图谱嵌入模型的训练过程中,采用式(3)所示的线性降维方式实现从同类型实体嵌入矩阵Ek中提取蕴含的实体类型特征tk;

tk=σ(WkEk)              (3)

其中,σ(·)为mish激活函数,Wk为线性变换矩阵,模型训练结束后,最终得到的tk即为同类型实体集Ck中所有实体的类型特征;

S34、将实体类型特征tk与实体ei的嵌入向量hi进行串联拼接后,按式(4)所示将拼接后的特征向量输入至全连接层,从而得到融合实体类型特征tk后的实体嵌入向量e'i;

e′i=concat(hi,tk)W+b                 (4)其中,concat为将两个特征向量串行拼接的操作,hi为通过知识图谱嵌入模型得到的实(dim1+dim2)×dim1体ei的嵌入向量,tk为实体ei所属类别的实体类型的特征向量表示,W∈R 为权重矩阵,dim1为实体ei嵌入向量hi的维度,dim2为实体类型特征向量tk的维度,e'i为实体ei的嵌入向量hi融合实体类型特征向量tk后的嵌入向量表示,b为偏置参数;

S35、按式(5)更新实体嵌入矩阵中实体ei的嵌入向量hi;

hi=e′i                          (5)S36、在以基准知识图谱嵌入模型的评分函数和损失函数为约束的训练过程中,通过反向传播实现模型参数的不断更新,待模型训练结束时输出结果从而获得最终的实体类型特征tk以及融合实体类型特征后的实体嵌入向量hi。

2.根据权利要求1所述的基于邻域关系表征向量的知识图谱嵌入表示方法,其特征在于,步骤S1具体包括以下步骤:S11、将某知识图谱表示为G=(E,R),E为实体集合,R为关系集合,E={e0,...,ei,...,en‑1},其中i∈[0,n‑1],n为实体数量;R={r0,...,rj,...,rm‑1},其中j∈[0,m‑1],m为关系数量;

S12、根据知识图谱G中的关系数量m定义长度为m*2的实体ei的邻域关系表征向量vi=[d0,...,dj,...,dm+j,...,d2m‑1],并将其各元素初始化为0;其中,前m维用于存放实体ei作为头实体时与其直接关联的各类关系的数量,后m维用于存放实体ei作为尾实体时与其直接关联的各类关系的数量;

S13、统计实体ei作为头实体时与其直接关联的各类关系的数量,若关系rj出现pj次,则将邻域关系表征向量vi的dj维更新为pj;

S14、统计实体ei作为尾实体时与其直接关联的各类关系的数量,若关系rj出现pj'次,则将邻域关系表征向量vi的dm+j维更新为pj';

S15、对实体集合E中的任意实体执行S12至S14的操作,得到实体的邻域关系表征向量集合Ω={v0,...,vi,...,vn‑1}。

3.根据权利要求1所述的基于邻域关系表征向量的知识图谱嵌入表示方法,其特征在于:步骤S22的具体方法为将步骤S1生成的实体的邻域关系表征向量集合Ω中所有实体邻域关系表征向量dj维中的最大值赋值给向量max中的dj维;将集合Ω中所有实体邻域关系表征向量dj维中的最小值赋值给向量min中的dj维,其中j∈[0,2*m‑1]。

4.根据权利要求1所述的基于邻域关系表征向量的知识图谱嵌入表示方法,其特征在于:步骤S23中归一化处理的具体方法如下:对集合Ω中的任意实体邻域关系表征向量vi按式(1)进行归一化处理,从而使得归一化处理后邻域关系表征向量集合Ω'中所有邻域关系表征向量的各维度数值均介于[0,1]区间内,*

其中,vi为实体ei邻域关系表征向量vi经过归一化处理后的向量。

5.一种用于权利要求1所述的基于邻域关系表征向量的知识图谱嵌入表示方法的系统,其特征在于:其包括实体的邻域关系表征向量生成模块、同类型实体集生成模块以及同类型实体特征的提取与融合模块,所述实体的邻域关系表征向量生成模块用于得到实体的邻域关系表征向量集合Ω,所述同类型实体集生成模块用于生成同类型实体集,从而完成同类型实体集Ck(k∈[1,K])的划分,所述同类型实体特征的提取与融合模块用于进行同类型实体特征的提取和融合,从而完成知识图谱的嵌入表示。