1.一种用于无人机编队智能决策的控制方法,其特征在于,所述控制方法包括:分析第一无人机群中的每架第一无人机的第一状态信息和第二无人机群中的每架第二无人机的第二状态信息,计算每架所述第一无人机的行动组合相对于每架所述第二无人机的行动组合的第一优势值,构建第一无人机矩阵,每个所述行动组合包括俯冲、拉升、转向、发射炮弹中的至少一者;
分析每个所述第二状态信息和每个所述第一状态信息,计算每架所述第二无人机的行动组合相对于每架所述第一无人机的行动组合的第二优势值,构建第二无人机矩阵;
根据所述第一无人机矩阵和所述第二无人机矩阵构建所述第一无人机群和所述第二无人机群的博弈双矩阵,具体包括:将所述第一无人机矩阵中的每个元素与所述第二无人机矩阵中的元素一一匹配,以使得构建的所述博弈双矩阵包括所述第一无人机群的每个策略项和所述第二无人机群的每个策略项的混合项;
采用粒子群算法计算所述博弈双矩阵的纳什均衡;
根据计算出的纳什均衡调控所述第一无人机群和第二无人机群进行模拟对抗;
其中,所述第一无人机矩阵和所述第二无人机矩阵均包括策略项和与所述策略项对应的概率分布;
所述采用粒子群算法计算所述博弈双矩阵的纳什均衡包括:输入所述博弈双矩阵并初始化所述粒子群算法的各个变量;
根据所述博弈双矩阵的维度生成初始的种群以作为初始的解;
根据所述博弈双矩阵的维度确定适应度函数;
分别计算所述解中的每个粒子的适应度;
确定每个粒子的个体极值和所述种群的全体极值;
计算所述粒子群算法的惯性权重;
根据所述惯性权重更新每个粒子的速度和位置;
分别对所述解中的每个粒子进行处理以使得每个粒子的满足归一化条件;
根据处理后的所述解更新个体极值和全体极值;
判断所述全体极值是否在预设的求解精度范围内;
在判断所述全体极值在所述求解精度范围内的情况下,输出所述解;
在判断所述全体极值不在所述求解精度范围内的情况下,再次计算所述粒子群算法的惯性权重并执行所述控制方法的相应步骤,直到判断所述全体极值在所述求解精度范围内;
所述计算所述粒子群算法的惯性权重包括:
根据公式(2)确定所述惯性权重,
其中,ωk为第k次迭代时的所述惯性权重,ωmax为迭代过程中最大的惯性权重,ωmin为迭代过程中最小的惯性权重,k为迭代次数,kmax为最大迭代次数;
所述根据所述惯性权重更新每个粒子的速度和位置包括:根据公式(3)和公式(4)更新每个粒子的速度,
其中, 为第k+1次迭代时第t个粒子中的一个策略项xm的速度,ωk为所述惯性权重, 为第k次迭代时第t个粒子中的一个策略项xm的速度, 为所述粒子群算法的学习因子,λ1、λ2为服从(0,1)均匀分布的随机数,Pbest(t(m))为第t个粒子迭代到k代为止所能搜索到策略项xm的最优解, 为第k次迭代时第t个粒子中的一个策略项xm的的位置矢量,Gbest(t(m))为第t个粒子迭代到k代为止所述种群所能搜索到策略项xm的最优解;
其中, 为第k+1次迭代时第t个粒子中的一个策略项yn的速度,ωk为所述惯性权重, 为第k次迭代时第t个粒子中的一个策略项yn的速度, 为所述粒子群算法的学习因子,λ1、λ2为服从(0,1)均匀分布的随机数,Pbest(t(n))为第t个粒子迭代到k代为止所能搜索到策略项yn的最优解, 为第k次迭代时第t个粒子中的一个策略项yn的的位置矢量,Gbest(t(n))为第t个粒子迭代到k代为止所述种群所能搜索到策略项yn的最优解;
根据公式(5)和公式(6)更新每个粒子的位置,
其中, 为第k+1次迭代时第t个粒子中的一个策略项xm的位置矢量, 为第k次迭代时第t个粒子中的一个策略项的位置矢量xm的位置矢量, 为第k+1次迭代时第t个粒子中的一个策略项xm的速度;
其中, 为第k+1次迭代时第t个粒子中的一个策略项yn的位置矢量, 为第k次迭代时第t个粒子中的一个策略项的位置矢量yn的位置矢量, 为第k+1次迭代时第t个粒子中的一个策略项yn的速度。
2.根据权利要求1所述的控制方法,其特征在于,所述采用粒子群算法计算所述博弈双矩阵的纳什均衡包括:输入所述博弈双矩阵并初始化所述粒子群算法的各个变量;
初始化迭代次数;
根据所述博弈双矩阵的维度生成初始的种群以作为初始的解;
根据所述博弈双矩阵的维度确定适应度函数;
分别计算所述解中的每个粒子的适应度;
确定每个粒子的个体极值和所述种群的全体极值;
计算所述粒子群算法的惯性权重;
根据所述惯性权重更新每个粒子的速度和位置;
分别对所述解中的每个粒子进行处理以使得每个粒子满足归一化条件;
根据处理后的所述解更新个体极值和全体极值;
判断迭代次数是否大于或等于预设的阈值;
在判断所述迭代次数大于或等于预设的阈值的情况下,输出所述解;
在判断所述迭代次数小于预设的阈值的情况下,再次计算所述粒子群算法的惯性权重并执行所述控制方法的相应步骤,直到判断所述迭代次数大于或等于预设的阈值。
3.根据权利要求1或2所述的控制方法,其特征在于,所述分别对所述解中的每个粒子进行处理以使得每个粒子的满足归一化条件进一步包括:从所述解中随机选取一个未被选取的粒子;
判断选取的粒子是否处于可行空间;
在判断选取的粒子处于可行空间的情况下,再次从所述解中随机选取一个未被选取的粒子直到所述解中不存在未被选取的粒子;
在判断所述选取的粒子并非处于可行空间的情况下,对所述粒子进行归一化操作,并再次从所述解中随机选取一个未被选取的粒子直到所述解中不存在未被选取的粒子。
4.根据权利要求1或2所述的控制方法,其特征在于,所述根据所述博弈双矩阵的维度生成初始的种群以作为初始的解包括:针对所述第一无人机群和所述第二无人机群的每个策略项,分别从区间(0,1)中随机选取一个随机数以作为每个策略项对应的概率值。
5.根据权利要求1或2所述的控制方法,其特征在于,所述根据所述博弈双矩阵的维度确定适应度函数包括:根据公式(1)生成所述适应度函数,
其中,p为粒子的适应度;x[i]为所述第一无人机群的第i个策略项;y[j]为所述第二无人机群的第j个策略项;A[i][j]为在所述第一无人机群选择第i个策略项,所述第二无人机群选择第j个策略项的情况下,所述第一无人机群的第一优势值;B[i][j]为在所述第一无人机群选择第i个策略项,所述第二无人机群选择第j个策略项的情况下,所述第二无人机群的第二优势值。
6.一种用于无人机编队智能决策的控制系统,其特征在于,所述控制系统包括处理器,所述处理器用于执行如权利要求1至5任一所述的控制方法。
7.一种存储介质,其特征在于,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行如权利要求1至5任一所述的控制方法。