1.一种基于组织相似度的联邦学习方法,其特征在于,包括以下步骤:
获取机构的本地子图,计算本地子图中各个节点的嵌入值;根据节点的嵌入值组成该机构本地子图的嵌入列表;
中央服务器获取多个客户端的嵌入列表,分别将每个客户端的嵌入列表与中央服务器的嵌入列表进行对齐排序处理;根据嵌入列表和度量公式分别获取各个客户端与中央服务器的相似度,筛选出相似度高于设定值的客户端为预选客户端,中央服务器与预选客户端共同参与联邦学习;
所述度量公式如下:
其中, 表示机构i的嵌入列表, 表示机构j的嵌入列表, 表示机构i的嵌入列表中第x个节点嵌入值; 表示机构j的嵌入列表中第x个节点嵌入值;
节点的嵌入值的计算过程具体为:识别本地子图中的连通分量,获取连通分量的嵌入系数,根据嵌入系数和嵌入公式计算该连通分量中每个节点的嵌入值;嵌入公式如下:其中,c表示节点,ec表示节点c的嵌入值,Nc表示节点c的邻节点集合,p表示节点c的一个邻节点;Wc,p表示节点c与节点p的边权重,coef表示连通分量f的嵌入系数,Wf表示整个连通分量f的边权重;
获取连通分量的嵌入系数过程如下:根据路径公式获取连通分量的平均最短路径长度,通过转换公式将平均最短路径长度转换为该连通分量的嵌入系数;
转换公式如下:
coef=(af‑1)×(n/2)
其中,coef表示连通分量的嵌入系数,af表示连通分量的平均最短路径长度,n表示连通分量中的节点数;
路径公式如下:
其中,f表示连通分量,q表示连通分量中的任意一个节点,m表示连通分量中节点q能够到达的节点;d(q,m)表示从节点q至节点m的最短路径长度。
2.根据权利要求1所述的一种基于组织相似度的联邦学习方法,其特征在于,分别将每个客户端的嵌入列表与中央服务器的嵌入列表进行对齐排序处理的步骤具体为:若客户端嵌入列表的嵌入值个数与中央服务器嵌入列表的嵌入值个数不相同,则对嵌入值个数较少的嵌入列表进行补全,使两个嵌入列表的嵌入值个数相同,再对客户端嵌入列表的嵌入值进行排序,对中央服务器嵌入值列表的嵌入值进行排序;补全嵌入值个数较少的嵌入列表时使用的是该嵌入列表的所有嵌入值的平均值。
3.根据权利要求1所述的一种基于组织相似度的联邦学习方法,其特征在于,中央服务器与预选客户端共同参与联邦学习的步骤具体为:中央服务器向预选客户端发送训练模型,预选客户端根据本地数据集对训练模型进行训练,获得模型梯度参数;将模型梯度参数依次进行剪裁处理、加噪处理后发送至中央服务器;
中央服务器将所有预选客户端的模型梯度参数进行聚合获得全局模型参数,将全局模型参数进行加噪处理后分别发送给各个预选客户端进行新一轮的训练,直至训练模型收敛。
4.根据权利要求3所述的一种基于组织相似度的联邦学习方法,其特征在于,训练模型为消息传递神经网络模型;训练模型的训练过程包括消息传递阶段和读出阶段;
消息传递阶段具体为:获取本地子图中每个节点的当前特征及该节点的邻节点特征,根据第一聚合函数生成节点的聚合特征,根据聚合特征和更新公式更新节点的隐藏特征;
读出阶段具体为:通过多层消息传递后,从最后一层的节点隐藏特征中计算特征向量并进行链接预测,完成一轮训练模型的训练。
5.根据权利要求4所述的一种基于组织相似度的联邦学习方法,其特征在于,节点的隐藏特征的更新过程如下:其中,k表示客户端,c表示节点,l是层索引, 表示客户端k第l+1层索引中节点c的隐藏特征,Uφ(·)为更新公式, 表示客户端k第l层索引中节点c的特征, 表示客户端k第l+1层索引中节点c的聚合特征;
聚合特征的生成公式如下:
其中,AGG(·)表示第一聚合函数,Mθ(·)表示获得隐藏特征的消息生成函数, 表示客户端k第l层索引中节点c的特征,p表示节点c的邻节点, 表示客户端k第l层索引中邻节点p的特征,zc,p表示节点c和邻节点p的边特征,Nc表示节点c的邻节点集合。
6.根据权利要求4或5所述的一种基于组织相似度的联邦学习方法,其特征在于,特征向量的计算公式如下:其中,k表示客户端k,D是节点对D,节点对D包括两个节点c, 表示客户端k节点对D的隐藏特征之间的特征向量,Rδ为级联函数或池化函数中的一种;l表示层数, 表示客户端k第l层节点c的隐藏特征, 表示客户端k的节点对集合。
7.根据权利要求3所述的一种基于组织相似度的联邦学习方法,其特征在于,剪裁处理的步骤具体为:其中,t表示第t轮训练,k表示第k个客户端, 表示模型梯度参数, 表示剪裁后的模型梯度参数,C表示剪裁阈值。