利索能及
我要发布
收藏
专利号: 2023116713402
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度图神经网络的区块链地址身份推断方法,其特征在于,包括:基于采集到的区块链交易数据集生成有向交易网络图,并基于联合子图采样策略得到所述有向交易网络图中每个节点的节点子图;所述有向交易网络图中节点代表区块链上的交易地址,边表示一个交易地址与另一个交易地址之间的交易;

将每个节点的节点子图分别输入至预先训练好的多任务身份识别图模型中,输出节点的嵌入表示;

将各节点的嵌入表示输入至预先训练好的分类器,利用分类器输出各个身份类别的概率分布,取概率最高的身份类别作为各节点最终的身份标签,完成身份推断;

所述多任务身份识别图模型包括:N个串行的MGPI块,第一个MGPI块的输入端用于接入节点子图,其余MGPI块的输入端与前一个MGPI块的输出端相连,第N个MGPI块的输出端输出节点的嵌入表示;

各MGPI块的结构相同,均包含输入层和N个并联的MGPI层,以及并联的第一信息处理单元和第二信息处理单元,所述第一信息处理单元和第二信息处理单元结构相同,均包括顺次设置的全连接层、第一归一化层、前馈层和第二归一化层,所述前馈层和第二归一化层之间设置第二残差连接;各MGPI块的输入层与第一信息处理单元和第二信息处理单元中的第一归一化层之间均设置第一残差连接;

将节点子图中的节点信息与拉普拉斯向量结合后的信息和边信息一起送入N个并行的MGPI层进行处理,每个MGPI层都得到中间结果 和  ,其中, 为节点信息处理的中间结果, 为边信息处理的中间结果,i代表中心节点的序号,j代表邻居节点的序号,l代表了当前MGPI块的块数,k代表了MGPI层的层数;将N个MGPI层的中间结果在最后一维进行连结后依次输入至第一信息处理单元中的全连接层、第一归一化层、前馈层和第二归一化层,得到当前MGPI块的输出 ;

将N个MGPI层的中间结果 在最后一维进行连结后输入至第二信息处理单元中的中的全连接层、第一归一化层、前馈层和第二归一化层,得到当前MGPI块的输出 ;

第N个MGPI块的输出为 和 , 为节点的嵌入表示, 为边的嵌入表示。

2.根据权利要求1所述的一种基于深度图神经网络的区块链地址身份推断方法,其特征在于:所述MGPI层包括顺次设置的 全连接层、 全连接层、 全连接层、 全连接层、缩放层、归一化层以及最后的 全连接层、 全连接层、n代表节点;其中,全连接层将节点特征转换为键表示,用于评估其他节点的查询与中心节点的匹配程度;

全连接层将节点特征转换为查询表示,用于确定节点应该如何与其邻居节点交互,以及权重大小; 全连接层将节点特征转换为值表示,当查询与键匹配时,相应的值被用来更新节点的表示; 全连接层将边的特征转换为边的表示,用于在注意力机制中提供额外的上下文信息;

将中心节点信息 输入 全连接层,得到查询嵌入数据 ,公式如下:;

其中, 代表 全连接层中的权重矩阵, 代表 全连接层中的偏置项;

将邻居节点信息 输入 全连接层、 全连接层,得到键嵌入数据 和值嵌入数据 ,公式如下:

其中, 、 分别代表 全连接层、 全连接层中的权重矩阵, 、分别代表 全连接层、 全连接层中的偏置项;

输入中心节点与邻居结点间的边信息 至 全连接层,得到边嵌入数据 ,公式如下:;

其中, 分别代表 全连接层中的权重矩阵, 分别代表 全连接层中的偏置项;

对于查询嵌入数据 与键嵌入数据 ,经过 函数转换,得到 与 ;

函数转换公式如下:

其中, 为定义的映射函数,将输入x映射到一个新输出;

,用于提取输入x的特性;

是一个归一化因子,用于保证映射的输出有合适的规模;

为三角函数; 为确定性向量;

与 的计算公式如下:

令 与 的转置相乘的结果输入至缩放层后,得到中间结果1;

将所述中间结果1与边嵌入数据 相乘后,得到中间结果2;

将所述中间结果2输入至 全连接层,输出结果再与所述边信息 相加,得到当前层的一个关于边信息的中间结果输出 ;

将所述中间结果1再输入至归一化层,所得结果与所述值嵌入数据 相乘后送入全连接层 ,得到中间结果3;

将所述中间结果3与所述中心节点信息 相加,得到当前层的另一个关于节点信息的中间结果输出 ;

将N个MGPI层的结果 在最后一维进行连结后依次输入至第一信息处理单元中的全连接层、第一归一化层、前馈层和第二归一化层,得到当前MGPI块的输出 ;

将N个MGPI层的结果 在最后一维进行连结后输入至第二信息处理单元中的中的全连接层、第一归一化层、前馈层和第二归一化层,得到当前MGPI块的输出 。

3.根据权利要求1所述的一种基于深度图神经网络的区块链地址身份推断方法,其特征在于:所述多任务身份识别图模型的训练方法包括:基于历史采集到的区块链交易数据集生成有向交易网络图,并基于联合子图采样策略得到有向交易网络图中每个节点的节点子图;

将每个节点的节点子图分别输入至预先训练好的多任务身份识别图模型中,输出各节点的嵌入表示;

将各节点的嵌入表示分别输入节点填空网络、子图划分网络以及线性分类器,得到对应的训练预测值;

将各训练预测值分别输入预先设置的损失函数中,计算出相应的训练损失,并基于训练损失通过求加权和得到总损失函数;

以所述总损失函数最小为目标,利用随机梯度下降算法迭代优化损失,反馈更新多任务身份识别图模型的模型参数,完成多任务身份识别图模型的训练。

4.根据权利要求3所述的一种基于深度图神经网络的区块链地址身份推断方法,其特征在于:每个节点的节点子图的获取方法包括:将采集到的区块链交易数据集抽象为有向交易网络图;所述区块链交易数据集包括标签地址和交易数据;

基于所述有向交易网络图,利用联合子图采样策略得到联合采样概率,并将所述联合采样概率运用至邻居采样中,得到有向交易网络图中每个节点的节点子图。

5.根据权利要求3所述的一种基于深度图神经网络的区块链地址身份推断方法,其特征在于:联合采样概率的表达式为:;

其中, ; ; ;

式中, 表示边 e的时间戳信息, 表示所有邻居边的时间戳之和,为考虑时间戳信息时边 e的采样概率, 为邻居节点集合, ; 表示边 e的交易金额信息, 表示所有邻居边的交易金额之和, 为考虑交易金额信息时边 e的采样概率, 表示边 e的交易总数信息, 表示所有邻居边的交易总数之和, 为考虑交易总数时边e的采样概率; 表示对应的 在联合采样概率中的权重;

在利用邻居采样方法生成子图的过程中,对于每个节点,根据联合采样概率选择邻居规划至子图中,从而生成每个节点的节点子图。

6.根据权利要求3所述的一种基于深度图神经网络的区块链地址身份推断方法,其特征在于:所述节点填空网络接收节点嵌入表示,随机地选择一些节点进行屏蔽,利用多任务身份识别图模型预测这些被屏蔽节点的特征;所述子图划分网络接收节点嵌入表示,并将一个子图中所有节点的嵌入表示聚合成一个单一的嵌入表示,所述单一的嵌入表示在一定程度上反映子图的整体特性,并由此判断两个子图的关系为无关系、包含关系还是重叠关系。

7.根据权利要求3所述的一种基于深度图神经网络的区块链地址身份推断方法,其特征在于:所述线性分类器顺次包含全连接层和激活层;节点嵌入表示输入至全连接层中,再经过激活层,输出每个类别的概率,公示如下:;

其中, 是节点 属于类别t的预测概率, 是权重矩阵,是偏置项, 是输入节点经过模型处理后输出的节点嵌入表示。

8.根据权利要求3所述的一种基于深度图神经网络的区块链地址身份推断方法,其特征在于:所述总损失函数的获得方法包括:设定总损失函数Ltotal包含Focal Loss损失函数Lclassify、交叉熵损失函数Ldivide、均方差损失函数Lfill、其中Lclassify用于线性分类器,Ldivide用于子图划分网络、Lfill用于节点填空网络,如下式所示:Ltotal= Lclassify+ Ldivide+ Lfill;

其中, 表示权重参数;

计算Focal Loss损失函数Lclassify的值,如下式所示:;

其中,n是子图中标记地址的总数, 是处理级别不平衡问题的加权项, 是节点 属于类别t的预测概率,是平衡简单和困难样本的调节参数;

计算交叉熵损失函数Ldivide的值,如下式所示:;

其中,n是子图的总数,M表示子图类别的数量, 是子图i属于类别c的预测概率,为符号函数,如果样本i的真实类别等于c取1,否则取0;

计算均方差损失函数Lfill的值,如下式所示:;

其中,n是子图中标记地址的总数, 是节点 属于类别t的预测概率; 为符号函数,如果样本i的真实类别等于t取1,否则取0。

9.一种基于深度图神经网络的区块链地址身份推断系统,其特征在于,包括存储介质和处理器;

所述存储介质用于存储指令;

所述处理器用于根据所述指令进行操作以执行根据权利要求1‑8中任一项所述的方法。