1.一种基于互信息的联邦学习版权保护方法,其特征在于,包括以下步骤:从潜在空间对噪声进行采样,并输入生成器,生成真实样本数据集 ;
基于所述真实样本数据集 ,使用触发器生成网络 ,生成水印触发样本集 ;
通过最大化全局模型 在真实数据样本集 与水印触发样本集 梯度之间的互信息,来完成休眠水印的嵌入;
先后使用真实样本数据集 和水印触发样本集 对全局模型 进行微调,提取出标签;并将所提取的标签与目标标签进行比对;若二者一致,则证明该模型的所有权归属;
生成水印触发样本集 的过程为:
S21,定义触发器生成网络,初始化触发特征 ,训练触发器生成网络 ,旨在优化触发特征 ,挖掘目标标签的特征,目标标签是由服务器预先定义和选择的标签;
S22,将真实样本数据集 输入触发器生成网络 ,输出结果与超参数 相乘,得到优化的触发特征 和水印触发样本集为 ;其中 是输入的真实样本数据集中的一项数据样本, 是目标标签;
所述全局模型 是服务器对各个客户端上传的本地模型进行聚合操作得到:其中, 是客户端 的模型, 是客户端 的数据, 是所有客户端数据的集合;N为客户端总数;
所述休眠水印嵌入步骤为:
S31,使用带有正确标签的真实样本数据集 对全局模型 实施微调处理;
S32,基于微调后的全局模型 ,对当前的嵌入参数进行联合更新操作,旨在最大化全局模型 在真实数据样本集 与水印触发样本集 梯度之间的互信息;
S33,利用水印触发样本集 对全局模型 进行微调。
2.根据权利要求1所述的一种基于互信息的联邦学习版权保护方法,其特征在于,生成真实样本数据集 的过程为:S11,从服从正态分布的潜在空间对噪声进行采样,得到输入向量;
S12,生成器将输入向量映射输出至特定空间,最终生成真实样本数据集 ;
S13,通过反向传播更新生成器 。
3.根据权利要求1所述的一种基于互信息的联邦学习版权保护方法,其特征在于,所述生成器由三层全连接神经网络构成。
4.一种基于互信息的联邦学习版权保护系统,其特征在于,包括:真实样本数据生成模块:从潜在空间对噪声进行采样,并输入生成器,生成真实样本数据集 ;
水印触发样本生成模块:基于所述真实样本数据集 ,使用触发器生成网络 ,生成水印触发样本集 ;
水印嵌入模块:通过最大化全局模型 在真实数据样本集 与水印触发样本集 梯度之间的互信息,来完成休眠水印的嵌入;
以及,验证模块:先后使用真实样本数据集 和水印触发样本集 对全局模型 进行微调,提取出标签;并将所提取的标签与目标标签进行比对;若二者一致,则证明该模型的所有权归属;
生成水印触发样本集 的过程为:
S21,定义触发器生成网络,初始化触发特征 ,训练触发器生成网络 ,旨在优化触发特征 ,挖掘目标标签的特征,目标标签是由服务器预先定义和选择的标签;
S22,将真实样本数据集 输入触发器生成网络 ,输出结果与超参数 相乘,得到优化的触发特征 和水印触发样本集为 ;其中 是输入的真实样本数据集中的一项数据样本, 是目标标签;
所述全局模型 是服务器对各个客户端上传的本地模型进行聚合操作得到:其中, 是客户端 的模型, 是客户端 的数据, 是所有客户端数据的集合;N为客户端总数;
所述休眠水印嵌入步骤为:
S31,使用带有正确标签的真实样本数据集 对全局模型 实施微调处理;
S32,基于微调后的全局模型 ,对当前的嵌入参数进行联合更新操作,旨在最大化全局模型 在真实数据样本集 与水印触发样本集 梯度之间的互信息;
S33,利用水印触发样本集 对全局模型 进行微调。
5.一种计算机存储介质,存储有可读程序,其特征在于,当程序被处理器运行时,能够执行权利要求1‑3任一项所述的一种基于互信息的联邦学习版权保护方法。
6.一种电子设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一条可执行指令,所述可执行指令使所述处理器执行如权利要求1‑3中任一项所述的一种基于互信息的联邦学习版权保护方法对应的操作。
7.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令指示计算设备执行如权利要求1‑3中任一所述的一种基于互信息的联邦学习版权保护方法对应的操作。