利索能及
我要发布
收藏
专利号: 2022116977143
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于差分隐私机制的分布式在线优化方法,其特征在于;包括以下步骤:S1、利用多智能体系统搭建分布式在线优化问题数学模型;

S2、根据所有节点当前决策所产生的代价与事后最优固定决策所产生的代价之间的差异构建在线优化方法性能评估指标;

S3、引入差分隐私机制和强盗反馈机制来设计分布式在线优化算法,并根据所设计的分布式在线算法迭代求解所述分布式优化模型。

2.根据权利要求1所述的一种基于差分隐私机制的分布式在线优化方法,其特征在于:所述S1中,所述多智能体系统包括多个智能体,根据每个智能体之间的通信关系建立由节点和边组成的通信拓扑图G=(V,E),每个所述智能体被视为通信拓扑图中的一个节点,其中,V={1,2,...,N}=, 分别表示图G的节点集和边集,搭建分布式在线优化问题数学模型,所述分布式在线优化问题数学模型的表达式为:i

其中, 为节点i在时刻t的状态信息,ft 为节点i在时刻t的成本函数,N为多智能体网络中节点的个数,T为总迭代时间,Ω为节点状态所形成的定义域。

3.根据权利要求2所述的一种基于差分隐私机制的分布式在线优化方法,其特征在于:所述S2中,所述在线优化方法性能评估指标包括个体遗憾 用于反映节点j所做出的决策的总成本与最佳决策的总成本之间的差值,在形式上,个体遗憾被定义为:其中, 为迭代结束后最优节点状态,当一个在线优化方法的个体遗憾作为T的函数是次线性的,则该算法能够有效解决分布式在线优化问题。

4.根据权利要求3所述的一种基于差分隐私机制的分布式在线优化方法,其特征在于:所述S3中,基于差分隐私机制对每个节点的状态进行摄动,根据不同的隐私水平ε生成相应的随机噪声,并利用该噪声对节点的状态进行摄动,其表达式为:其中, 是符合拉普拉斯分布的随机噪声, 节点摄动后的状态,节点之间利用摄动后的状态 进行通信。

5.根据权利要求4所述的一种基于差分隐私机制的分布式在线优化方法,其特征在于:所述S3中,根据强盗反馈机制构建梯度估计器,定义如下:其中,d表示维度,δ是勘探参数, 是一个均值为零的单位随机变量。

6.根据权利要求5所述的一种基于差分隐私机制的分布式在线优化方法,其特征在于:所述S3中,根据差分隐私机制和强盗反馈机制设计的分布式在线优化算法迭代公式如下:其中, 为更新后的节点状态;PΩ(x)表示x在集合Ω上的投影;ò是一个小的正数,对算法的收敛起着关键作用;αt表示步长,满足 为节点i在时刻t的辅助变量,其迭代规则如下:

[Ar]ij和[Ac]ij为行随机邻接矩阵Ar和列随机邻接矩阵Ac中的元素,构造规则如下:in

其中,|Ni |是节点i内邻的个数, 是节点j外邻的个数,随着迭代次数的增加,当时,最终能够得到准确的优化结果。