1.一种基于关系聚合超图的节点分类方法,其特征在于:包括以下步骤:S1、根据高阶关系图数据的结构及节点特征定义显式和隐式关系;
S2、根据显式关系,构建显式超边;
所述S2的具体操作如下:
传统超图:传统超图用G=(V,E)表示,其中V={v1,…,vn}表示n个节点集合,E={e1,…,em}表示超图中m条超边的集合,其中每条超边为一个无序节点集合当超边连接节点个数为2时,超图退化成普通图;
不同于一条边只能连接两个顶点的传统图,超图结构中不限制顶点的度,即每条超边可以连接任意多个顶点,因此称之为图的高阶表示,将由显式关系构建的传统超图定义为显式超图,称E为显式超边;
S3、根据隐式关系,构建隐式超边;
所述S3中,采用KNN和K‑means两种方法,从局部和全局两个角度提取节点间高阶关系,构建隐式超边,为了捕捉特征空间中的全局信息,避免噪声数据及离群点以及参数选取欠佳带来的影响,采用K‑MEANS方法对KNN产生的超边进行修正,基于隐式关系的超边集为其中p条超边由KNN生成,q条超边由k‑means生成;
S4、定义隐式特征相关性系数,采用全局注意力机制,计算隐式超边中目标节点与邻居节点间的重要性,并与显式超边聚合生成关系聚合的超图结构;
所述S4的具体操作为:
隐式特征相关性系数αij:隐式超边集中,节点与其共享隐式超边的邻居节点之间的重要性系数 eij为节点间相似性系数,Zi为节点的邻居节点集合,exp为以e为底的指数函数;
l
关系聚合的超图RAH:设有节点集V={v1,v2,…,vn},在显式超边E和隐式超边E 中,存在l节点vi∈E,vj∈E 且 若αij≥β,即存在与目标节点的隐式特征相似性系数大于阈值A A Aβ,则将vj补充至E中,生成新的超边E,构成关系聚合的超图结构G=(V,E ,W),其中W为代l表顶点属于不同超边的权重矩阵,当E={Φ}时,RAH退化为传统超图;
S5、采用超图神经网络对生成的关系聚合超图结构进行嵌入表示;
S6、将训练后的节点嵌入表示送入softmax分类器,根据固有标签进行节点分类。
2.根据权利要求1所述的一种基于关系聚合超图的节点分类方法,其特征在于:所述S1的具体操作如下:显式关系定义:在传统超图G中,设有节点集V={v1,v2,…,vn},用A(V)={A1,A2,…,Am}表示节点的属性集合,则Ai(vj)就表示节点vj的第i个属性的值,如果Ai(vj)={vk|vk∈Aj(vj)},任取vj∈V,vk∈Ai(vj),则节点vj与vk的关系称为显示关系,记为Re;
隐式关系定义:在传统超图G中,设有节点集V={v1,v2,…,vn},用A(V)={A1,A2,…,Am}表示节点的属性集合,则Ai(vj)就表示节点vj的第i个属性的值,任取vj∈V,vk∈V,定义f(Ai(vj),Ai(vk))表示节点vj与vk的关系称为隐式关系,记为Ri,故节点间所有关系可表示为R={Ri}∪{Re}。
3.根据权利要求1所述的一种基于关系聚合超图的节点分类方法,其特征在于:所述S5A的具体步骤如下:关系聚合的超图结构用加权的关联矩阵H表示,神经网络的输入为关联A矩阵H和节点特征X节点的嵌入表示更新公式为:
模型的训练过程可以分为顶点卷积和超边卷积两步:
顶点卷积,节点关系聚合到超边上,
超边卷积,由超边的特征得到节点的嵌入表示,
(l) F
其中,X ∈R 是节点在第l层的特征,σ为非线性激活函数,Dv表示顶点度的对角矩阵,顶点的度即与顶点相关联的超边个数,De表示超边度的对角矩阵,超边度即超边中顶点的A(l)个数,E 为超边在l层的特征。
4.根据权利要求1所述的一种基于关系聚合超图的节点分类方法,其特征在于:所述S6具体包括以下步骤:将节点的嵌入表示送入softmax分类器,模型的最终输出是一个N×M的矩阵,即对应每个节点所属类别的概率,模型的损失函数选取负对数似然损失NLLLoss函数:其中N为样本数量,M为样本类别,pmn为模型输出的第n个样本属于第m个类别的概率;
其中
当第m个样本的标签为n时yn=1否则yn=0。