1.一种对抗环境下无人机智能决策的纳什均衡博弈方法,所述智能决策包括行为决策,其特征在于,所述纳什均衡博弈方法包括:分别获取第一无人机和第二无人机行为决策时的状态信息,生成所述第一无人机和所述第二无人机行为决策时的状态向量XR、XB;
分析所述第一无人机和所述第二无人机在行为决策时不同类型的典型行为,建立所述第一无人机和所述第二无人机的行为决策策略集合SR、SB;
基于证据理论融合方法,将所述第一无人机和所述第二无人机执行不同类型行为决策策略时的攻击有效性影响因素进行融合,设计所述第一无人机和所述第二无人机不同行为决策策略的支付函数;
基于所述第一无人机和所述第二无人机行为决策时的状态向量XR、XB,根据设计的所述第一无人机和所述第二无人机行为决策策略的支付函数计算行为决策策略集合SR与行为决策策略集合SB中任意一对行为决策策略对应的所述第一无人机的支付值和所述第二无人机的支付值,从而生成所述第一无人机和所述第二无人机博弈的双矩阵F;
基于所述第一无人机和所述第二无人机博弈的双矩阵F,计算无人机双方行为决策的最优方案;
基于所述第一无人机行为决策的最优方案,选择所述第一无人机的行为决策策略。
2.根据权利要求1所述的纳什均衡博弈方法,其特征在于,所述纳什均衡博弈方法进一步包括:所述第一无人机与所述第二无人机在行为决策时的状态向量XR、XB采用下式表示:XR=(xR,yR,zR,vR,θR,ψR),XB=(xB,yB,zB,vB,θB,ψB);
其中,xR,yR,zR、xB,yB,zB分别为第一无人机与第二无人机行为决策时相对于地面坐标系的位置坐标,vR、vB分别表示第一无人机与第二无人机行为决策时的速度标量,θR、θB分别为第一无人机与第二无人机行为决策时相对于地面坐标系的俯仰角;ψR、ψB分别表示第一无人机与第二无人机行为决策时相对于地面坐标系的航迹偏转角。
3.根据权利要求1所述的纳什均衡博弈方法,其特征在于,所述纳什均衡博弈方法进一步包括:分析无人机在行为决策时不同类型的典型行为,将无人机的行为决策策略划分为三类七种,分别为机动行为决策策略、攻击行为决策策略和防御行为决策策略;其中,所述机动行为决策策略包括保持飞行状态不变、左转、右转、爬升、俯冲;所述攻击行为决策策略为发射导弹;所述防御行为决策策略为发射干扰弹;进而生成所述第一无人机与所述第二无人机的行为决策策略集合SR、SB,SR、SB采用下式表示:其中, 表示所述第一无人机和所述第二无人机飞行状态不变行为决策策略,表示所述第一无人机和所述第二无人机左转行为决策策略, 表示所述第一无人机和所述第二无人机右转行为决策策略, 表示所述第一无人机和所述第二无人机爬升行为决策策略, 表示所述第一无人机和所述第二无人机俯冲行为决策策略,表示所述第一无人机和所述第二无人机发射导弹行为决策策略, 表示所述第一无人机和所述第二无人机发射干扰弹行为决策策略,所述第一无人机的第i个行为策略由 表示,所述第二无人机的第j个行为策略由 表示。
4.根据权利要求1所述的纳什均衡博弈方法,其特征在于,所述纳什均衡博弈方法进一步包括:基于证据理论融合方法,在所述第一无人机执行机动行为决策策略,所述第二无人机执行行为决策策略时,所述第一无人机的支付值 由公式(1)所示的支付函数计算可得:
其中, 为由预设的态势优势函数计算所述第一无人机执行机动行为决策策略 所述第二无人机执行行为决策策略 后,所述第一无人机对所述第二无人机的态势优势值;
为预设的证据理论融合算子;pB为由预设的方法计算的所述第二无人机执行攻击行为决策策略时的导弹攻击命中概率;
在所述第二无人机执行机动行为决策策略,所述第一无人机执行行为决策策略时,所述第二无人机的支付值 由公式(2)所示的支付函数计算可得:
其中 为由预设的态势优势函数计算所述第二无人机执行机动行为决策策略 所述第一无人机执行行为决策策略 后,所述第二无人机对所述第一无人机的态势优势值;
为预设的证据理论融合算子;pR为由预设的方法计算的所述第一无人机执行攻击行为决策策略时的导弹攻击命中概率。
5.根据权利要求1所述的纳什均衡博弈方法,其特征在于,所述纳什均衡博弈方法进一步包括:在所述第一无人机执行攻击行为决策策略,所述第二无人机执行行为决策策略时,所述第一无人机的支付值 由公式(3)所示的支付函数计算可得:其中, 为由预设的态势优势函数计算所述第一无人机执行攻击行为决策策略 所述第二无人机执行行为决策策略 后,所述第一无人机对所述第二无人机的态势优势值;
为预设的证据理论融合算子;pR为由预设的方法计算的所述第一无人机执行攻击行为决策策略时的导弹攻击命中概率,pB为由预设的方法计算的所述第二无人机执行攻击行为决策策略的导弹攻击命中概率;εB为预设的所述第二无人机执行防御行为决策策略时的干扰弹干扰成功概率;
在所述第二无人机执行攻击行为决策策略,所述第一无人机执行行为决策策略,所述第二无人机的支付值 由公式(4)所示的支付函数计算可得:其中, 为由预设的态势优势函数计算所述第二无人机执行攻击行为决策策略 所述第一无人机执行行为决策策略 后,所述第二无人机对所述第一无人机的态势优势值;
为预设的证据理论融合算子;pR为由预设方法计算的所述第一无人机执行攻击行为决策策略时的导弹攻击命中概率,pB为由预设方法计算的所述第二无人机执行攻击行为决策策略时的导弹攻击命中概率;εR为预设的所述第一无人机执行防御行为决策策略时的干扰弹干扰成功概率。
6.根据权利要求1所述的纳什均衡博弈方法,其特征在于,所述纳什均衡博弈方法进一步包括:在所述第一无人机执行的防御行为决策策略,所述第二无人机执行行为决策策略时,所述第一无人机的支付值 由公式(5)所示的支付函数计算可得:
其中, 为由预设的态势优势函数计算所述第一无人机执行防御行为决策策略 所述第二无人机执行行为决策策略 后,所述第一无人机对所述第二无人机的态势优势值;
为预设的证据理论融合算子;pB为由预设的方法计算的所述第二无人机执行攻击行为决策策略时的导弹攻击命中概率;,εR为预设的所述第一无人机执行防御行为决策策略时的干扰弹干扰成功概率;
在所述第二无人机执行防御行为决策策略,所述第一无人机执行行为决策策略,所述第二无人机的支付值 由公式(6)所示的支付函数计算可得:其中, 为由预设的态势优势函数计算所述第二无人机执行防御行为决策策略 所述第一无人机执行行为决策策略 后,所述第二无人机对所述第一无人机的态势优势值;
为预设的证据理论融合算子;pR为由预设的方法计算的所述第一无人机执行攻击行为决策策略时的导弹攻击命中概率;εB为预设的所述第二无人机执行防御行为决策策略时的干扰弹干扰成功概率。
7.根据权利要求1所述的纳什均衡博弈方法,其特征在于,生成所述第一无人机和所述第二无人机博弈的双矩阵F采用公式(7)表示:其中, 为所述第一无人机和所述第二无人机分别执行行为决策策略
后所述第一无人机的支付值、所述第二无人机的支付值。
8.一种对抗环境下无人机智能决策的纳什均衡博弈系统,其特征在于,所述纳什均衡矩阵博弈系统包括处理器,所述处理器用于执行如权利要求1至7任一所述的纳什均衡博弈方法。