1.一种自适应等待时长的异步加权联邦学习方法,其特征在于,具体包括以下步骤:
101、服务器向客户端发起学习任务,并广播初始化全局模型参数;
102、客户端开始本地训练,并上传训练好的模型参数及参数生成轮数k;
103、服务器采用DDQN算法依据当前联邦学习任务进程以及能耗决策出本轮训练等待时长;
104、服务器收到客户端用户上传的数据后,根据等待时长进行等待,若在等待时长时间内再次收到用户数据,则重新根据等待时长进行等待;若在等待时长时间内没有收到任何用户数据,则结束收集用户数据;
105、服务器执行异步加权聚合联邦学习算法将收集到的客户端上传的模型参数进行聚合,得到全局模型参数;
106、将聚合得到的全局模型参数广播给本轮参与聚合的用户;
107、重复步骤102~106直到全局模型参数达到目标精度。
2.根据权利要求1所述的一种自适应等待时长的异步加权联邦学习方法,其特征在于,服务器采用DDQN算法决策出本轮训练等待时长的过程包括:设置状态空间S∈{S=s|θr,Tr,Nr},动作空间A∈{A=a|±τ,±2τ,±3τ,±4τ,±5τ},以及奖励G∈{G=g|‑(αTr+βNr)·f(θr)+γ·Δθr};
服务器将上一轮的全局模型测试精度,耗时以及参与聚合的用户数量输入到DQN算法中的Q网络,得到本轮的等待时间τ;
本轮聚合结束后,服务器记录第r轮总耗时Ttotal,及第r轮参与全局聚合的用户的数量Nr,测试第r轮聚合后全局模型的精度θr,及第r轮精度增长幅度Δθr,最后服务器获得奖励{‑(αTr+βNr)·f(θr)+γ·Δθr};
其中,s表示一个状态,(θr,Tr,Nr)表示一个状态的状态参数;Tr为第r轮的耗时;a表示一个动作,τ为动作空间一最小时间单位;g表示一个奖励值;α、β、γ为奖励函数系数;f(θr)为一随测试精度不断增加而衰减的函数。
3.根据权利要求1所述的一种自适应等待时长的异步加权联邦学习方法,其特征在于,步骤105服务器执行异步加权聚合联邦学习算法将收集到的客户端上传的模型参数进行聚合,聚合公式为:其中,Wr为全局模型参数;N为客户端数量;Dn为第n个用户的数据量大小;D为全体用户总数据量大小; 为第n个用户在第r轮上传的模型参数; 为模型参数新鲜度与贡献度权值。
4.根据权利要求3所述的一种自适应等待时长的异步加权联邦学习方法,其特征在于,模型参数新鲜度与贡献度权值 表示为:其中,r为当前训练轮次;k为用户端的全局模型参数所属的训练轮次; 为第n个用户第k轮训练前的原始参数;e为自然常数; 为统一权重数量级的系数。