1.一种基于多视图协同训练和激励机制的个性化联邦学习方法,其特征在于,包括以下步骤:S1、数据预处理:将原始数据与真实标签进行虚拟化处理得到虚拟数据与虚拟标签,通过设定原始数据与虚拟数据之间距离的上限、将真实标签的最小值作为虚拟标签的最小值、设定原始梯度与虚拟梯度之间的距离约束,对虚拟数据及虚拟标签进行优化;
S2、确定最优训练策略:将服务器设置为领导者,客户端设置为跟随者,基于客户端开销、对客户端的奖励预算,构建服务器的训练策略,选择使消耗 CPU 的周期数最少的训练策略下发给客户端,客户端基于接收到的训练策略、客户端开销,进行客户端训练策略的优化,选择使消耗CPU的周期数最少的训练策略作为最优训练策略,其中基于客户端开销、对客户端的奖励预算,构建服务器的训练策略,具体为:
,
其中, 是服务器的训练策略, 是计算客户端开销的硬件参数, 是计算客户端开销的性能参数,是计算开销折算的成本因子, 是对客户端的奖励预算;
基于接收到的训练策略、客户端开销,进行客户端训练策略的优化,具体为:
,
其中, 是客户端训练策略, 是服务器下发的训练策略;是计算开销折算的成本因子, 是计算客户端开销的硬件参数;
S3、训练客户端模型:基于S1中得到的优化后的虚拟数据和S2中得到的最优训练策略,对客户端的模型进行训练,得到客户端模型,客户端模型包括生成器模型和鉴别器模型;S1中得到的优化后的虚拟数据和S2中得到的最优训练策略,经过生成器模型处理后,得到生成数据,所有的生成数据构建得到生成数据集,将生成数据集上传至服务器;
S4、确定客户端模型权重:使用测试集对客户端模型进行准确率的测试,得到客户端模型准确率,上传至服务器;
基于客户端模型准确率和客户端数据量占参与联邦学习的所有客户端的全部数据量的比例,确定当前客户端的客户端模型权重,输出客户端生成器模型参数和客户端鉴别器模型参数;
S5、优化客户端模型:服务器将从所有客户端接收的生成数据集进行汇总后,得到代理数据集,根据客户端模型权重,从代理数据集中选择样本下发至客户端,客户端将S1中得到的优化后的虚拟数据及自服务器接收到的样本构建合成数据集,使用合成数据集对客户端模型进行训练,除本客户端外的其他客户端对本客户端未训练的数据进行标记,本客户端模型针对标记数据进行训练,直至训练完成合成数据集中的所有数据;客户端模型收敛后将生成器模型参数和鉴别器模型参数上传至服务器;
S6、聚合服务器全局模型:所有客户端模型权重与生成器模型参数进行加权求和,与所有客户端模型权重之和的比值,作为服务器全局模型的生成器模型参数;所有客户端模型权重与鉴别器模型参数进行加权求和,与所有客户端模型权重之和的比值,作为服务器全局模型的鉴别器模型参数。
2.根据权利要求1所述的基于多视图协同训练和激励机制的个性化联邦学习方法,其特征在于,所述S1中通过设定原始数据与虚拟数据之间距离的上限、将真实标签的最小值作为虚拟标签的最小值、设定原始梯度与虚拟梯度之间的距离约束,对虚拟数据及虚拟标签进行优化,用公式表示为:,
其中,X是原始数据,x是原始标签,X'是虚拟数据,x'是虚拟标签,h原始数据和虚拟数据之间距离的上限制,x'min为虚拟标签最小值;
所述S1中对虚拟数据及虚拟标签进行优化,公式为:
,
其中,X是原始数据,x是原始标签,X'是虚拟数据,x'是虚拟标签,gradient(X',x' )和gradient(X,x)分别代表“虚拟”梯度和原始梯度,ε则代表“虚拟”梯度和原始梯度之间的距离约束。
3.根据权利要求1所述的基于多视图协同训练和激励机制的个性化联邦学习方法,其特征在于,所述S3还包括基于服务器生成器的模型参数、生成器学习率和客户端样本数量、客户端生成器模型梯度、客户端生成器权重变化量,进行客户端生成器模型参数的更新,公式为:,
其中,m为客户端样本数量, 为客户端生成器权重变化量, 为模型梯度, 为服务器生成器模型参数,n为第n个客户端, 为生成器学习率, 为第i个客户端的生成器模型参数。
4.根据权利要求1所述的基于多视图协同训练和激励机制的个性化联邦学习方法,其特征在于,所述S3还包括基于服务器鉴别器的模型参数、鉴别器学习率和当前轮次生成器模型对应的客户端鉴别器模型、客户端鉴别器权重变化量,进行客户端鉴别器模型参数的更新,公式为:,
其中m为客户端样本数量, 为客户端鉴别器权重变化量, 为在当前轮次生成器模型下的客户端鉴别器模型,为服务器模型参数, 为鉴别器学习率, 为第i个客户端的鉴别器模型参数。
5.根据权利要求1所述的基于多视图协同训练和激励机制的个性化联邦学习方法,其特征在于,所述S4中输出客户端生成器模型参数和客户端鉴别器模型参数,公式为:,
其中, 是第i个联邦学习客户端数据量大小,是联邦学习客户端数量, 是客户端模型准确率, 是第i个客户端的客户端生成器模型参数, 是第i个客户端的客户端鉴别器模型参数, n是参与联邦学习用户的全部数据量的大小, 是输出的客户端生成器模型参数, 是输出的客户端鉴别器模型参数。
6.根据权利要求1所述的基于多视图协同训练和激励机制的个性化联邦学习方法,其特征在于,所述S6中服务器全局模型的生成器模型参数、服务器全局模型的鉴别器模型参数,用公式分别表示为:,
其中, 是聚合本地生成器模型参数后的服务器生成器模型参数, 是第i个客户端的权重, 是第i个客户端的本地生成器模型参数; 是聚合本地鉴别器模型参数后的服务器鉴别器模型参数, 是第i个客户端的本地鉴别器模型参数。
7.根据权利要求1所述的基于多视图协同训练和激励机制的个性化联邦学习方法,其特征在于,所述S6还包括当客户端模型参数出现变化,取服务器全局模型参数和客户端模型参数之间差距和的平均值,再与服务器全局模型参数进行对比相减,来更新服务器全局模型参数,用公式表示为:,
其中, 是优化后的服务器模型, 是在第t轮采样时客户端i的客户端模型, 是在第t轮采样时的服务器模型,N为一组客户端数量。
8.一种计算机可读存储介质,其特征在于,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1‑7中任一项所述的基于多视图协同训练和激励机制的个性化联邦学习方法。