利索能及
我要发布
收藏
专利号: 2024101566068
申请人: 南京师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种SubGNN注入空间特征的地理知识图谱表示学习方法,其特征在于,所述方法包括如下步骤:S1:抓取地理空间知识图谱中地理实体的矢量数据,作为获得地理实体的空间特征向量表示的基础数据;

S2:设计一种在统一的空间中将点、线和面实体一致表达且保持实体空间特征完整的映射方法,将点、线和面实体统一表达为子图的形式;

S3:提出基于子图神经网络的地理空间特征编码器,结合地理实体的位置、邻居与结构特征,获得地理实体基于空间特征的向量表示;

S4:基于平移模型,设计融合地理实体空间特征向量的能量函数,将基于地理实体的空间特征和基于图谱本身结构特征的两种向量表示学习到同一个连续向量空间;

所述步骤S1中,获取地理空间知识图谱中地理实体的矢量数据,具体是指通过地理实体唯一标识符从OpenStreetMap中链接地理实体的几何坐标信息,所述步骤S2中,设计一种在统一的空间中将点、线和面实体一致表达且保持实体空间特征完整的映射方法,将点、线和面实体统一表达为子图的形式,具体是指通过将原本矢量的数据,转化为节点与边的图结构形式,其中点实体通过无向图结构化后将为单个节点组成的子图,线实体通过图结构化后将为多个节点与边相连形成的子图,面实体通过图结构化后将为首尾相连的多个节点所包围的所有节点和边组合而成的子图;

所述步骤S3中子图神经网络空间特征编码器具体是指,挖掘图结构上子图内部与子图间的位置、邻居和结构3种空间特征,通过空间特征消息传递框架,在每个空间特征通道中设置采样点,捕获的空间特性从采样点出发,并由特定的相似性函数加权,传播到子图,最终训练得到子图的向量表示,即获得地理实体基于空间特征的向量表示,每一种空间特征的传递函数与相似性函数定义如下:γNE(S,ANE)=1

其中下标X代表的空间特征通道,包括位置通道PO、邻居通道NE和结构通道ST;S代表子图集合,Ax是X空间特征通道的采样点,ax是X空间特征通道采样点通过编码生成的向量,代表X空间特征通道的传递函数;γx代表X空间特征通道的传递函数,其中位置通道特性通过子图到采样点的最短路径反映,dsp代表子图到采样点的平均的最短距离;邻居通道相似度设定为1;结构通道特性通过子图与采样点有序度序列反映,dS和 分别代表子图和采样点的有序度序列,DTW代表动态时间规整函数,将空间特征的消息转换为顺序不变的隐藏表示和属性感知的向量表示,如下:

zx=σ(Mx·yx)

其中gx是聚合X空间特征通道中所有采样点的空间特性消息的隐藏表示,AGGM是对消息进行操作的聚合函数,NA代表X空间特征通道中采样点的数量,i为空间特性的传递函数序号,yx表示关于X空间特征通道的子图表示,其携带了空间特性消息的隐藏表示gx和前一层的表示 的特性,l代表网络层,Wx是X空间特征通道的逐层可学习的权重矩阵,σ是非线性激活函数,zx为属性感知的向量表示,Mx是采样点的消息矩阵,由消息传递函数MSGx生成,最终聚合不同空间特征通道和不同网络层的子图表示,转化为最终的子图表示:(0) (l) (L)

esp=ys=AGGL({z ,...,z ,...,z })

(l)

其中z 代表第l层的属性感知向量,AGGC表示通道聚合函数,AGGL表示网络层聚合函数,yS表示子图的最终表示,也即地理实体基于空间特征的向量表示esp;

所述步骤S4中,平移模型中,三元组内部实体与关系向量之间具有h+r≈t的关系,其中的h是头实体的向量表示,r是关系的向量表示,t是尾实体的向量表示,用e(h,t)统一表示实体的向量表示,能量函数E为:E(h,r,t)=||hst+r‑tst||

其中hst,tst是仅基于图谱本身的结构信息的头实体和尾实体向量表示,融合地理实体基于空间特征的向量表示,设计的能量函数为:E(h,r,t)=α1||hst+r‑tst||+α2||hst+r‑tsp||+α3||hsp+r‑tst||+α4||hsp+r‑tsp||其中α1,α2,α3,α4是控制各项权值的超参数,hsp,tsp是基于空间特征的头实体和尾实体的向量表示,||hst+r‑tst||部分实际上与平移模型中的能量函数一致,||hst+r‑tsp||,||hsp+r‑tst||和||hsp+r‑tsp||是加入了基于空间特征的实体向量影响的混合项,通过混合项的限制,将实体的两种向量映射到同一语义空间,共享相同的关系向量,最终将获得实体的向量表示e(h,t),关系的向量表示r。