利索能及
我要发布
收藏
专利号: 2022107820580
申请人: 合肥工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种多无人机协同博弈决策方法,所述博弈决策方法由计算机执行,其特征在于,包括以下步骤:生成多无人机的零和矩阵博弈模型,所述零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;所述博弈双方信息包括攻击方编队的信息和防御方编队的信息,所述博弈策略集合包括所述攻击方编队的第一策略集合和所述防御方编队的第二策略集合;

基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵;

基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略;

根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡;

基于所述目标混合策略纳什均衡和所述收益矩阵获取所述攻击方编队的最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略;

所述攻击方编队的信息包括无人机信息;所述防御方编队的信息包括防御目标信息和拦截导弹信息;

所述收益矩阵包括:

其中,

为攻击方编队在策略对 下的收益值; 为第一策略集合中的第t个策略, 为第二策略集合中的第l个策略;T为攻击方编队,L为防御方编队;ST为第一策略集合,SL为第二策略集合;

其中,

表示拦截导弹n对无人机m的拦截概率、Pmk表示无人机m对防御目标k的毁伤概率、vk表示防御目标k的价值;

表示无人机m未被拦截的概率;

表示无人机m对防御目标k的有效毁伤概率;

表示防御目标k未被无人机m毁伤的概率;

表示防御目标k实际未被毁伤的概率;

表示防御目标k实际被毁伤的概率;

表示攻击方编队对防御目标的总期望毁伤值。

2.根据权利要求1所述的博弈决策方法,其特征在于,所述基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵,包括:在所述第一策略集合中选取p个策略,以及在所述第二策略集合中选取q个策略;其中,p和q为正整数,且p≥2,q≥2;

根据所述p个策略和所述q个策略生成严格博弈矩阵,所述严格博弈矩阵中包括p×q个策略对。

3.根据权利要求2所述的博弈决策方法,其特征在于,所述基于所述严格博弈矩阵获取初始混合策略纳什均衡,包括:基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡,所述初始混合策略纳什均衡中包括所述p个策略的第一概率分布和所述q个策略的第二概率分布;

所述根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略,包括:遍历所述初始混合策略纳什均衡,根据所述第一概率分布获取概率最大的第一策略,并确定为初始第一策略;根据所述第二概率分布获取概率最大的第二策略,并确定为初始第二策略。

4.根据权利要求3所述的博弈决策方法,其特征在于,所述根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断的步骤,包括:获取所述初始第一策略的第一邻居策略集合,所述第一邻居策略集合中包括多个第一邻居策略;

基于所述收益矩阵获取所述多个第一邻居策略中,使所述攻击方编队的收益值最大的第一目标邻居策略,并判断所述第一目标邻居策略是否为所述初始第一策略;

若否,则将所述第一目标邻居策略添加到所述严格博弈矩阵中,并重新执行基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡的步骤;

若是,则获取所述初始第二策略的第二邻居策略集合,所述第二邻居策略集合中包括多个第二邻居策略;基于所述收益矩阵获取所述多个第二邻居策略中,使所述防御方编队的收益值最大的第二目标邻居策略,并判断所述第二目标邻居策略是否为所述初始第二策略;

若否,则将所述第二目标邻居策略添加到所述严格博弈矩阵中,并重新执行基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡。

5.根据权利要求4所述的博弈决策方法,其特征在于,所述获取所述初始第一策略的第一邻居策略集合,包括:确定所述初始第一策略中的多个对应关系,所述对应关系指的是所述攻击方编队中的无人机和所述防御方编队中的防御目标的攻防对应关系;

将所述初始第一策略中,任意一个对应关系中的所述防御目标变更为所述防御目标的邻居防御目标,得到第一调节策略,并将所述第一调节策略确定为第一邻居策略;

分别将所述初始第一策略和每个所述第一调节策略中,任意两个对应关系中的所述防御目标进行调换,得到第二调节策略,并将所述第二调节策略确定为第一邻居策略;

将所述初始第一策略和所有的第一邻居策略确定为第一邻居策略集合。

6.根据权利要求5所述的博弈决策方法,其特征在于,所述基于所述目标混合策略纳什均衡获取最佳第一策略,包括:获取所述目标混合策略纳什均衡中概率最大的第一策略,并确定为最佳第一策略。

7.一种多无人机协同博弈决策系统,其特征在于,所述系统包括:生成模块,被配置为生成多无人机的零和矩阵博弈模型,所述零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;所述博弈双方信息包括攻击方编队的信息和防御方编队的信息,所述博弈策略集合包括所述攻击方编队的第一策略集合和所述防御方编队的第二策略集合;

严格博弈矩阵获取模块,被配置为基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵;

初始策略获取模块,被配置为基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略;

目标混合策略纳什均衡获取模块,被配置为根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡;

最佳策略模块,被配置为基于所述目标混合策略纳什均衡和所述收益矩阵获取所述攻击方编队的最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略;

所述攻击方编队的信息包括无人机信息;所述防御方编队的信息包括防御目标信息和拦截导弹信息;

所述收益矩阵包括:

其中,

为攻击方编队在策略对 下的收益值; 为第一策略集合中的第t个策略, 为第二策略集合中的第l个策略;T为攻击方编队,L为防御方编队;ST为第一策略集合,SL为第二策略集合;

其中,

表示拦截导弹n对无人机m的拦截概率、Pmk表示无人机m对防御目标k的毁伤概率、vk表示防御目标k的价值;

表示无人机m未被拦截的概率;

表示无人机m对防御目标k的有效毁伤概率;

表示防御目标k未被无人机m毁伤的概率;

表示防御目标k实际未被毁伤的概率;

表示防御目标k实际被毁伤的概率;

表示攻击方编队对防御目标的总期望毁伤值。

8.一种计算机可读存储介质,其特征在于,其存储用于多无人机协同博弈决策生成的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~6任一项所述的多无人机协同博弈决策方法。

9.一种电子设备,其特征在于,包括:

一个或多个处理器;

存储器;以及

一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要求1~6任一项所述的多无人机协同博弈决策方法。