1.一种图片分类模型训练方法,其特征在于,包括:采用强化学习动态调整每个客户端的本地分类模型的个性化参数与共享参数的比例,获取调整后的本地分类模型;
将标记有真实标签的本地图片数据集输入至对应的调整后的本地分类模型中,获取预测的图片分类结果;
根据所输入的本地图片数据、真实标签及预测的图片分类结果计算交叉熵损失;
基于交叉熵损失更新本地分类模型中的个性化参数和共享参数,获取各客户端更新后的个性化参数和共享参数;
将每个客户端更新后的个性化参数、共享参数输入至预构建的目标函数中,并以目标函数最小为目标,分配各客户端的参数聚合权重;
根据各客户端所分配的参数聚合权重计算全局共享参数,并将每个客户端的本地分类模型的共享参数更新为全局共享参数;
重复上述步骤直至各客户端的本地分类模型收敛,获取训练好的图片分类模型;
采用强化学习动态调整每个客户端的本地分类模型的个性化参数与共享参数的比例,获取调整后的本地分类模型,包括:根据本地分类模型中每一层的个性化参数和共享参数的方差,以及当前每一层的解耦比例,获得每一层的状态空间;
基于每一层的状态空间,最大化期望奖励函数,获得最优的动作;
根据最优的动作,获得调整后的本地分类模型;
所述每一层的状态空间表示为:
,
式中, 表示客户端 在第 层的状态,的范围是从1到 , 表示客户端数量;的范围是从1到N,N表示客户端的本地分类模型的总层数; 和 分别表示客户端 的本地分类模型在第 层个性化参数的方差和共享参数的方差, 为解耦比例,表示客户端 的本地分类模型在第 层的个性化参数比例;
所述最大化期望奖励函数表示为:
,
式中, 表示期望奖励函数, 为折扣因子,用于对未来的奖励进行折扣,表示对轨迹 的期望值,其中 服从分布 ,轨迹 表示在强化学习中,从初始状态出发,到最终状态所经历的状态‑动作序列, 表示对轨迹中的每一个时间步 从0到H求和,H是轨迹的最大时间步数;表示客户端的序号, 表示客户端数量,表示客户端的本地分类模型的层级序号,的范围是从1到N,N表示客户端的本地分类模型的总层数; 和分别表示客户端 的本地分类模型在第 层的个性化参数的方差和共享参数的方差。
2.根据权利要求1所述的方法,其特征在于,所述目标函数最小时的表达式为:,
式中, 表示客户端 的参数聚合权重,的范围是从1到 , 表示客户端数量;
表示全部客户端的个性化参数, 表示全部客户端的共享参数, 表示客户端 的个性化参数, 表示客户端 的共享参数, 表示客户端 的损失函数,F表示损失函数。
3.根据权利要求1所述的方法,其特征在于,基于交叉熵损失更新本地分类模型中的个性化参数和共享参数,获取各客户端更新后的个性化参数和共享参数表示为:,
,
式中, 表示客户端 更新后的个性化参数, 表示客户端 更新后的共享参数,表示客户端 的个性化参数, 表示客户端 的共享参数;表示学习率,为一个超参数,用于决定一次梯度下降更新的步长; 表示一次梯度下降 的变化值, 表示一次梯度下降 的变化值;
为交叉熵损失, , 表示交叉熵损失函数, 表示客户端i输入的图片数据样本, 表示对图片数据的分类预测值, 表示图片数据的真实标签,表示对所有客户端的损失值进行求和,其中 表示在样本 中,每个数据点 和对应的真实标签 成对出现。
4.根据权利要求1所述的方法,其特征在于,分配各客户端的参数聚合权重为:,
式中, 为分配给每个客户端的参数聚合权重; 表示客户端 的本地图片数据集的数据量,表示客户端的序号, 表示客户端数量, 是一个防止被除数为零的小常数,表示本地子网和共享子网预测之间的差异;
,
式中, 表示本地子网预测值, 表示共享子网预测值, 表示 散度。
5.根据权利要求1所述的方法,其特征在于,根据各客户端所分配的参数聚合权重计算全局共享参数的表达式为:,
表示聚合后的全局共享参数, 表示客户端 上传的共享参数, 表示客户端上传的共享参数对应的聚合权重,的范围是从1到 , 表示客户端数量。
6.一种图片分类方法,其特征在于,将待分类图片输入至权利要求1至5任一项所述方法训练获取的图片分类模型中,获取图片分类结果。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1‑6中任一所述的方法。