利索能及
我要发布
收藏
专利号: 2020113562962
申请人: 合肥工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种多平台智能决策的多目标博弈方法,其特征在于,该方法包括:S1、获取对抗双方的总策略空间;

S2、基于战术偏好,设置至少一个优化目标;

S3、将所述优化目标转化为至少一个子优化目标,并基于每个所述子优化目标设置对应的支付函数;

S4、基于支付函数,分别构建对抗双方的用于评估总策略空间的高维矩阵;

S5、基于对抗双方的高维矩阵,利用多目标混合策略纳什均衡求解算法,输出混合策略纳什均衡解,且具体包括如下步骤:S501、输入对抗双方的高维矩阵;

S502、利用PROMETHEEII方法构建聚合矩阵;

S503、采用Lemke‑Howson算法求解,输出所有混合策略纳什均衡解;

S504、选择概率输出时,直接输出混合策略纳什均衡解;选择离散战术策略输出时,采用轮盘赌转法选择一个混合策略纳什均衡解;

其中,所述S502具体包括如下步骤:

S5021、定义多准则函数模型,包括:设定一种 的多准则函数

对于任意策略对组合(ork,or′,k′),计算:则得到:

其中,

Ni表示优化目标的数量,j表示第j个优化目标,i表示对抗双方Pi,i=1或2;w表示对应的权重,(ork,or′,k′),ork,or′,k′∈O表示对抗双方的策略对组合,O为对抗双方的总策略空间;

i i

表示ork优于or′k′的偏序水平;π(ork,or′k′)∈[0,1],π(ork,or′k′)的值越大,则ork就越优于or′k′;

S5022、定义正流、负流和净流矩阵;包括:从ork的正流、负流和净流的角度定义:代表ork优于O\{ork}的策略集合的程度, 越大则ork越优;

代表O\{ork}的策略集合优于ork的程度, 越小则ork越优;

(i)

φ (ork)是一个正流和负流的聚合,|O|是O集合的基数;

S5023、采用净流值构造聚合矩阵。

2.如权利要求1所述的一种多平台智能决策的多目标博弈方法,其特征在于,所述S1、获取对抗双方的总策略空间,具体包括如下步骤:S101、获取对抗双方的可选策略,并基于双方的平台数量,获取可选目标分配方案;

S102、计算对抗双方各自所有的可选策略‑可选目标分配方案组合,每个可选策略‑可选目标分配方案组合作为一个策略,得到对抗双方各自的策略空间X和Y;

S103、基于对抗双方各自的策略空间,获取对抗双方所有策略的组合,构建总策略空间O=X×Y。

3.如权利要求1所述的一种多平台智能决策的多目标博弈方法,其特征在于,所述战术偏好包括平台性能偏好和/或态势偏好;每个战术偏好对应设置一个优化目标;

所述平台性能PP的计算公式如下:

PP=ln(A+1)+K

K=[lnB+lnC]ε1ε2ε3ε4其中:K为常数项,C表示雷达探测能力参数,B表示机动性参数,A表示武器参数,ε1表示操纵效能系数,ε2表示生存力系数,ε3表示航程系数,ε4表示电子对抗能力系数;

所述S3、将所述优化目标转化为至少一个子优化目标,并基于每个所述子优化目标设置对应的支付函数,包括:S301a、设置武器参数A的可选值和对应的权重;

S302a、构建与武器参数A的可选值数量对应的子优化目标;

S303a、分别构建每个子优化目标对应的对抗双方的平台性能优势矩阵EpG,l,G∈{R,B},包括我方平台性能优势矩阵EpR,l和敌方平台性能优势矩阵EpB,l;

S304a、基于所述平台性能优势矩阵,构建每个子优化目标的支付函数;

所述态势包括高度和距离,则所述态势Sit的计算公式为:Sit=w1ud+w2uh

其中,uh(hi,hj)指的是高度优势,hibest表示我方i平台的最佳飞行高度,hi表示我方i平台的飞行高度,hj表示敌方j平台的飞行高度;

m

ud(ri,j)指的是距离优势,ri,j指我方i平台与敌方j平台的距离,ri 指我方i平台与敌方j平台火力范围最大值与最小值的平均值,w1,w2分别表示对应权重,w1+w2=1;

所述S3、所述将所述优化目标转化为多个子优化目标,并基于每个所述子优化目标设置对应的支付函数,包括:S301b、设置高度优势和距离优势的权重;

S302b、分别构建对应高度优势和距离优势的子优化目标;

S303b、分别构建每个子优化目标对应的对抗双方的态势优势矩阵EsG,l,G∈{R,B};包括我方平台态势优势矩阵EsR,l和敌方平台态势优势矩阵EsB,l;

S304b、基于所述态势优势矩阵,构建每个子优化目标的支付函数。

4.如权利要求1所述的一种多平台智能决策的多目标博弈方法,其特征在于,所述对抗双方的高维矩阵为:其中,(xi,yj)表示对抗双方的策略对,xi表示我方策略,yj表示敌方策略,表示第n个优化目标的支付函数, 表示第n个优化目标的第ln个子优化目标对应的支付函数;G表示对抗双方,R表示我方,B表示敌方。

5.如权利要求1所述的一种多平台智能决策的多目标博弈方法,其特征在于,所述S503、采用Lemke‑Howson算法求解,输出所有混合策略纳什均衡解;具体包括如下步骤:S5031、对博弈双矩阵进行线性不等式转化,包括:构建对抗双方的线性不等式,并对所述线性不等式按照每个策略的编号添加标签;

S5032、构建对抗双方的最优反应多面体:通过坐标系将对抗双方的线性不等式转化为对抗双方的最优反应多面体;其中,所述最优反应多面体的顶点即为各个线性不等式的交点,所述交点则标记相应的线性不等式的标签;

S5033、利用Lemke‑Howson算法从最优反应多面体中寻找纳什均衡点,并在每次找到纳什均衡点后,变换起始搜索点,直至获得所有的纳什均衡。

6.如权利要求5所述的一种多平台智能决策的多目标博弈方法,其特征在于,所述S5033、利用Lemke‑Howson算法从最优反应多面体中寻找纳什均衡点包括:任意选择最优反应多面体的人工均衡顶点对上其中一方的标签,作为遗失标签;

以人工均衡顶点作为起始搜索点,在该方所在最优反应多面体的顶点处丢弃标签;

在标签所在边的另一端,捡起一个新标签,作为重复标签;

在另一方的最优反应多面体上,将重复标签丢弃,重新捡起新标签作为重复标签,直到捡起的新标签为初始时遗失的标签,算法终止,对应的顶点对作为纳什均衡。

7.一种多平台智能决策的多目标博弈装置,其特征在于,包括:一个或多个处理器;

存储器;以及

一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要求1‑6任一项所述的多平台智能决策的多目标博弈方法。