利索能及
我要发布
收藏
专利号: 2019106616236
申请人: 合肥工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种无人机编队协同目标分配的矩阵博弈方法,其特征在于,包括:

基于第一无人机编队中无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;

基于第二无人机编队中无人机的数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;

基于第一无人机编队的第一占位策略、第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;

将第一无人机编队作为矩阵博弈的第一参与人,将第二无人机编队作为矩阵博弈的第二参与人;

确定矩阵博弈中第一无人机编队的第一博弈策略集、第二无人机编队的第二博弈策略集,其中,第一博弈策略集包括所有的第一博弈策略,第二博弈策略集包括所有的第二博弈策略;第一博弈策略与第一占位策略一一对应,第二博弈策略与第二占位策略一一对应;

基于多个第一博弈策略和多个第二博弈策略,确定多个博弈策略对;其中,每个博弈策略对包括一个第一博弈策略和一个第二博弈策略;

针对每个博弈策略对,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈的博弈策略对对应的第一无人机编队的支付值;

基于所有博弈策略对对应的第一无人机编队的支付值,生成矩阵博弈的博弈矩阵;

从算法库中选择一种纳什均衡求解算法并计算得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行每个第二博弈策略的概率;

基于所述矩阵博弈的第一均衡混合策略和第二均衡混合策略,按照第一无人机编队执行每个第一博弈策略的概率,从多个第一博弈策略中选取第一无人机编队执行的博弈策略,按照第二无人机编队执行每个第二博弈策略的概率,从多个第二博弈策略中选取第二无人机编队执行的博弈策略;

基于第一无人机编队执行的博弈策略、第二无人机编队执行的博弈策略,确定第一无人机编队的最优目标分配策略。

2.根据权利要求1所述的方法,其特征在于,基于第一无人机编队中无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略,基于第二无人机编队中无人机的数量和第二无人机编队的占位区域,确定第二无人机队的多个第二占位策略,包括:获取第一无人机编队中的无人机的数量和第一无人机编队的占位区域;

将所述第一无人机编队的占位区域分割为多个第一子区域;

基于第一无人机编队中无人机的数量和所述多个第一子区域,确定第一无人机编队的多个第一占位策略;其中所述第一占位策略包括第一无人机编队中的每个无人机所占据的第一子区域;

获取第二无人机编队中无人机的数量和第二无人机编队的占位区域;

将所述第二无人机编队的占位区域分割为多个第二子区域;

基于第二无人机编队中无人机的数量和所述多个第二子区域,确定第二无人机编队的多个第二占位策略;其中所述第二占位策略包括第二无人机编队中的每个无人机所占据的第二子区域。

3.根据权利要求1所述的方法,其特征在于,基于第一无人机编队的第一占位策略、第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略,包括:获取第一无人机编队中的无人机数量和第一无人机编队的第一占位策略、获取第二无人机编队中的无人机数量和第二无人机编队的第二占位策略;

基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第一无人机编队的多个目标分配策略;其中所述第一无人机编队的目标分配策略包括第一无人机编队中的每个无人机所对抗的第二无人机编队中的无人机;

基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第二无人机编队的多个目标分配策略;其中所述第二无人机编队的目标分配策略包括第二无人机编队中的每个无人机所对抗的第一无人机编队中的无人机。

4.根据权利要求1所述的方法,其特征在于,基于矩阵博弈中博弈策略对下第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该博弈策略对对应的第一无人机编队的支付值,包括:在博弈策略对(sR,sB)下,第一无人机编队的支付值由公式(1)计算可得:

其中, 为第一无人机编队的最大期望优势值, 为第二无人机编队的

最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为-u(sR,sB)。

5.根据权利要求4所述的方法,其特征在于,基于博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最大期望优势值,包括:建立第一无人机编队的目标分配模型,如公式(2)-(6):

∑j∈Nai,j=1,

∑i∈Mai,j≤Cj,

若 满足 则对于r≠i,ar,j=0     (5)

ai,j∈{0,1},

其中,(sR,sB)表示博弈策略对,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机; 表示无人机i相对于无人机j的优势值;

公式(2)表示第一无人机编队目标分配模型的目标函数;公式(3)表示第一无人机编队中的每个无人机i只能对抗第二无人机编队中的一个无人机;公式(4)表示对抗无人机j的第一无人机编队的无人机数量不能大于第一预定数量Cj;公式(5)表示当无人机i相对于无人机j的优势值大于第一预定优势值SFR时,不再增加分配对抗无人机j的第一无人机编队的无人机;ai,j为二元决策变量,无人机i对抗无人机j时,ai,j取值为1,否则取值为0;

对第一无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第一无人机编队在博弈策略对(sR,sB)下的最大期望优势值

6.根据权利要求4所述的方法,其特征在于,基于博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第二无人机编队的最大期望优势值,包括:建立第二无人机编队的目标分配模型,如公式(7)-(11):

∑i∈Mbj,i=1,

∑j∈Nbj,i≤Ci,

若 满足 则对于r≠j , br,i=0         (10)

bj,i∈{0,1},

其中,(sR,sB)表示博弈策略对,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机; 表示无人机j相对于无人机i的优势值;

公式(7)表示第二无人机编队目标分配模型的目标函数;公式(8)表示第二无人机编队中的每个无人机j只能对抗第一无人机编队中的一个无人机;公式(9)表示对抗i的第二无人机编队的无人机数量不能大于第二预定数量Ci;公式(10)表示当无人机j相对于无人机i的优势值大于第二预定优势值时,不再增加分配对抗无人机i的第二无人机编队的无人机;

bj,i为二元决策变量,无人机j对抗无人机i时,bj,i取值为1,否则取值为0;

对第二无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第二无人机编队在博弈策略对(sR,sB)下的最大期望优势值

7.根据权利要求4所述的方法,其特征在于,生成矩阵博弈的博弈矩阵,包括:

遍历所有的博弈策略对,并计算第一无人机编队在每个博弈策略对下的支付值,生成矩阵博弈的博弈矩阵,如公式(12)所示:其中,U为博弈矩阵, 为第一无人机编队的第i个博弈策略, 为第二无人机编队的第j个博弈策略,τR为第一无人机编队的博弈策略数量,τB为第二无人机编队的博弈策略数量。

8.一种无人机编队协同目标分配的矩阵博弈系统,其特征在于,包括:

占位策略确定模块,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;

目标分配策略确定模块,用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;

博弈策略确定模块,用于将第一无人机编队作为矩阵博弈的第一参与人,将第二无人机编队作为矩阵博弈的第二参与人;确定矩阵博弈中第一无人机编队的第一博弈策略集、第二无人机编队的第二博弈策略集,其中,第一博弈策略集包括所有的第一博弈策略,第二博弈策略集包括所有的第二博弈策略;第一博弈策略与第一占位策略一一对应,第二博弈策略与第二占位策略一一对应;

矩阵生成模块,用于基于多个第一博弈策略和多个第二博弈策略,确定多个博弈策略对;针对每个博弈策略对,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈的博弈策略对对应的第一无人机编队的支付值;并基于所有博弈策略对对应的第一无人机编队的支付值,生成矩阵博弈的博弈矩阵;其中,每个博弈策略对包括一个第一博弈策略和一个第二博弈策略;

纳什均衡求解模块,用于从算法库中选择一种纳什均衡求解算法并计算得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行每个第二博弈策略的概率;

策略筛选模块,用于基于所述矩阵博弈的第一均衡混合策略和第二均衡混合策略,按照第一无人机编队执行每个第一博弈策略的概率,从多个第一博弈策略中选取第一无人机编队执行的博弈策略,按照第二无人机编队执行每个第二博弈策略的概率,从多个第二博弈策略中选取第二无人机编队执行的博弈策略,并基于第一无人机编队执行的博弈策略、第二无人机编队执行的博弈策略,确定第一无人机编队的最优目标分配策略。

9.根据权利要求8所述的系统,其特征在于,所述矩阵生成模块在基于矩阵博弈中博弈策略对下第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该博弈策略对对应的第一无人机编队的支付值时,包括:在博弈策略对(sR,sB)下,第一无人机编队的支付值由公式(1)计算可得:

其中, 为第一无人机编队的最大期望优势值, 为第二无人机编队的

最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为-u(sR,sB)。

10.根据权利要求9所述的系统,其特征在于,所述矩阵生成模块在生成矩阵博弈的博弈矩阵时,具体包括:遍历所有的博弈策略对,并计算第一无人机编队在每个博弈策略对下的支付值,生成矩阵博弈的博弈矩阵,如公式(12)所示:其中,U为博弈矩阵, 为第一无人机编队的第i个博弈策略, 为第二无人机编队的第j个博弈策略,τR为第一无人机编队的博弈策略数量,τB为第二无人机编队的博弈策略数量。