1.一种基于信息素启发的群无人机多运动目标搜索方法,其特征在于,包括以下步骤:
步骤一:建立群无人机多动态目标搜索模型;
所述步骤一中,建立的群无人机多动态目标搜索模型包括:
任务环境:任务区域考虑为无人机高度不变的二维区域;在长×宽为Lv×Lh的栅格区域内,单个栅格用G(lo,la)表示,其中1≤lo≤Lv,1≤la≤Lh,栅格边长为ΔL0,用栅格中心(lo,la)表示栅格的位置,记为G(lo,la);
任务对象:对象表示为全集A=UAV∪T∪B;其中集合UAV={uavi|i=1,2,...,nV;10≤nV≤100}表示无人机,nV表示无人机的总数量;集合T={tarj|j=1,2,...,nT;nT≥1}表示目标,nT表示目标的总数量;集合B={obsm|m=1,2,...,nB;nB≥1}表示障碍物,nB表示障碍物的总数量;t时刻,无人机uavi、目标tarj、障碍物obsm的位置分别为uavi|t、tarj|t、obsm|t;无人机uavi1与无人机uavi2之间的欧式距离表示为Dvi1,i2|t=||uavi1|t‑uavi2|t||,i1=1,
2,...,nV,i2=1,2,...,nV,且i1≠i2;无人机uavi与目标tarj之间的欧式距离表示为Dvti,j|t=||uavi|t‑tarj|t||;无人机uavi与障碍物obsm之间的欧式距离为Dvbi,m|t=||uavi|t‑obsm|t||;目标tarj与障碍物obsm之间的欧式距离表示为Dtbj,m|t=||tarj|t‑obsm|t||;
任务:在搜索范围内,无人机通过相互协作搜索目标;在避免碰撞的前提下,依靠探测到的目标信号、信息交互、自身的运动,无人机搜索目标位置;当所有待搜索的目标附近d0范围内均有无人机到达,即为完成目标搜索任务;
无人机:无人机uavi在时刻t的速度表示为Vvi|t,其大小满足0≤||Vvi|t||≤Vvm,Vvm表示无人机速度的最大值,为标量;且无人机所在位置均为栅格中心;考虑最大通信半径rcom,最大障碍物感知半径robs,最大目标探测半径rtar,无人机可实现功能为:Dvi1,i2|t≤rcom时,无人机之间通信;Dvti,j|t≤rtar时,探测目标信号;Dvbi,m|t≤robs时,获取障碍物方位;
目标:目标tarj在时刻t的速度表示为Vtj|t,其大小满足0<||Vtj|t||≤Vtm,Vtm表示目标速度的最大值,为标量;且目标所在位置任意;在群无人机搜索目标时,无人机通过传感器探测周围的目标信号,目标信号与距离满足一个受到环境干扰的函数,描述为目标信号探测函数,且用式(1)表示:其中Ii,|t表示t时刻无人机uavi探测到的目标信号;η为环境干扰;G(Dvti,j|t)表示在无干扰的环境中目标信号与距离的关系;Dvti,j|t客观存在但无人机无法得知,当无人机目标探测范围内有多个目标时,较弱目标信号将被较强目标信号覆盖,且无人机无法区分不同目标的信号;
假设1:各参数大小关系满足:Vtm
假设2:所有参与目标搜索的无人机是同构的,被搜索的所有目标为同类型目标;
步骤二:对无人机进行基于距离的动态任务分工,得到无人机对动态目标的搜索状态;
步骤三:判断无人机对动态目标的搜索状态,若无人机处于漫游状态,则进入步骤四,若处于协同搜索状态,则进入步骤五;若无人机处于搜索任务完成状态,则搜索任务已完成,结束所有操作;
步骤四:进行基于置信区域信息素的漫游搜索;
所述步骤四具体过程为:
(4‑1)假设函数δ(D)函数表达式如下:
其中nr为矩阵D的列数,nl为矩阵D的行数,bζ,ξ为D中第ζ行第ξ列的数值;
函数 的表达式如下:
其中:
(4‑2)定义动态目标搜索的置信区域及其信息素:
定义1:确定不存在目标的区域称为置信区域,记为Cz,非置信区域用 表示;
无人机uavi在时刻t0到达栅格区域内的P1位置,未探测到目标信号,无人机探测范围内为置信区域,在时刻t0+Δt无人机离开P1,Δt为时间增加量;由于目标速度有限,因此P1周围仍旧保持一定圆形区域的置信区域,置信区域边缘向P1移动的距离ΔU满足下式:uavi在时刻(t0+Δt)到达P′1,若Δt足够小,此时P1与P′1对应的置信区域将形成连续的置信区域;
推论1:将无人机探测目标分为三种情况:Case1:无人机附近距离小于等于rtar的范围内存在障碍物或任务环境的边界;Case2:无人机附近距离小于等于2rtar的范围内存在其他无人机;Case3:无人机附近距离小于等于rtar的范围内不存在障碍物或任务环境的边界,且距离小于等于2rtar的范围内无其他无人机;Case1和Case2相加的最大置信区域大于Case3的最大置信区域,Case3无人机探测得到的置信区域记为Cz,1,Case1和Case2相加比Case3多的置信区域记为Cz,2;
在任务环境内,置信区域用信息素表示;无人机存储不同位置的信息素强度, 表示uavi在t时刻存储的位置P0信息素,置信区域内信息素取值范围为[0,τm],τm为置信区域内信息素的最大值,即置信区域Cz,2的信息素取值;置信区域信息素在无人机所在栅格取最小值 置信区域Cz,2信息素取最大值 而非置信区域的信息素强度记为
t0时刻无人机uavi到达P1,该点信息素 以P1为圆心,rtar为半径的圆内为
Cz,1;搜索区域内任意一点P0与P1的距离为dp≥0,P0的信息素为:
由式(7)和式(8)可知在满足置信区域性质与信息素取值范围的前提下,Cz,1边缘运动的距离与时间Δt、P0点信息素强度与距离dp均呈线性相关,因此当无人机远离P1,信息素变化量与时间Δt亦满足线性关系:式中,ρ为信息素增强参数;当经过时间 P1变为置信区域Cz,2,该点信息素变为最大值 由此可得信息素增强参数ρ=τmVtm/rtar;当置信区域Cz,1的栅格信息素增加到τm时,变为置信区域Cz,2;
P0的信息素变化满足下式:
在搜索区域内,为节约无人机存储空间,无人机仅存储每个栅格内一个点的信息素;用PHi|t表示uavi在时刻t存储的所有栅格的信息素强度,PHi|t表示为式(11):式中矩阵的任意元素 表示uavi存储的在时刻t栅格G(lo,la)的信息素;
目标可在搜索区域内的任意位置,因此仅当整个栅格在无人机探测区域内且无人机未探测到目标信号时方可判断该栅格无目标,属于置信区域;在此对可探测的栅格下定义:定义2:当某个栅格G(lo,la)最远点与无人机uavi距离||(G(lo,la)+0.5ΔL·δ(G(lo,la)‑uavi))‑uavi||≤rtar,该栅格称为可探测栅格,记为DG,uavi的所有可探测栅格所成集合记为DGi;与之相反,||(G(lo,la)+0.5ΔL·δ(G(lo,la)‑uavi))‑uavi||>rtar,G(lo,la)则被称为不可探测栅格,记为UG;若目标不可探测栅格存在相接的可探测栅格,则称之为最近不可探测栅格,记为NUG;
对于uavi,任意可探测栅格 的信息素满足下式:
ΔE为中间变量;在时间上采取了离散的迭代方式,由式(10)可知任意栅格G(lo,la)信息素的迭代关系满足下式:对于区域Cz,2,当存在栅格 使得G(lo,la)符合下式时,G(lo,la)将变为非置信区域:ΔH为中间变量;
当栅格
对于任意无人机uavi所存储的栅格信息素每次迭代更新5次,每次迭代中信息素的更新流程如下:Step1:依式(13)计算并更新所有栅格信息素;
Step2:依式(12)计算并更新所有可探测栅格的信息素;
Step3:CUAVi={uavI1,uavI2,...,uavIn}表示可与uavi通信的无人机所成集合;uavi获取CUAVi中所有无人机存储的信息素,并将其存储的所有栅格信息素依下式更新:Step4:若uavi处于协同搜索状态,为子联盟 中任意无人
机,T UJ 中 ty p e _I 无 人机 为 ty pe _ Ⅱ 无人 机 为集合 中所有栅格变为非置信区
域,信息素依下式更新:
Step5:搜索范围内所有栅格的信息素依下式更新:
(4‑3)设定漫游搜索速度:
定义3:当某个栅格G(lo,la)与无人机uavi距离||G(lo,la)‑uavi||≤Vvm,该栅格称为可达栅格,记为RG,uavi的所有可达栅格所成集合记为RGi;在以uavi为中心连续的[‑π,π)角度方向上,若某个可达栅格在某段角度方向上为距离无人机最远的可达栅格,则称该可达栅格为最远可达栅格;
最远可达栅格与最近不可探测栅格存在着对应关系,假设某个最远可达栅格为角度区间(θ1,θ2)方向上的最远可到达栅格,若无人机指向某个最近不可探测栅格最远点所成向量的角度在区间(θ1,θ2)范围内,则该最近不可探测栅格与该最远可达栅格对应;
漫游状态下,为快速探测到更多区域,无人机在根据信息素得到速度方向后,以该方向最大速度运动,选择速度方向上最远可达栅格作为下一步所在位置;在更新完信息素之后,漫游状态下任意无人机uavi周围目标可探测栅格内的信息素将满足式(12),与uavi距离相同的栅格信息素相等;而不可探测栅格的信息素即使与无人机距离相同也将出现差异,uavi依据最近不可探测栅格的信息素强度决定下一步飞行方向;
uavi的最远可达栅格记为FGi,k,其中1≤k≤ki,re,k表示从x正半轴开始顺时针第k个最远可达栅格,ki,re为最远可达栅格数量;FGi,k对应的最近不可探测栅格的信息素记为Fphi,k,n,其中0≤n≤ni,gr,n表示顺时针第n个最近不可探测栅格,ni,gr为FGi,k对应的最近不可 探 测栅 格 的 数 量 ,u a v i 第 k 个 最远 可 达 栅 格 对 应 的 最 大 信 息素uavi获取FGi,k和Fphi,k,max后,按照轮盘赌法更新速度,轮盘赌法用式(18)表示;随机数ra~U(0,1),当Q(K‑1)
步骤五:进行基于概率限制粒子群算法的协同搜索;
所述步骤五中:
将协同状态下的全局最优为子联盟中的最优的,称为半全局最优,记作sgbJ|t;而个体历史最优则为无人机个体加入子联盟后的历史最优,记为pbi|t;
在动态目标搜索中,随时间的变化同一位置的适应度函数值是变化的,个体历史最优和全局最优对系统寻优的可靠性随着迭代而逐渐降低,因此,半全局最优和个体历史最优的更新分别引入概率值,以概率值限制粒子群优化PSO中最优的继承,同时改进个体历史最优的计算方式,提出概率限制的粒子群优化PFPSO;
假设时刻t无人机uavi所在位置的适应度函数表示为f(uavi|t),PFPSO的全局最优与个体历史最优的更新方式如下:半全局最优引入全局最优概率值σj,其初始值为σ0,其中0<σ0<1;对于任意子联盟TUJ|t,其中目标信号最强的I类无人机为uavJ,TUJ|t对应的半全局最优更新过程如下:Step1:判断时刻(t‑1)是否存在一个子联盟 其中目标信号最强的I类无人机
若存在,则赋值[0,1]之间均匀分布随机数rσ,并执行Step2;否则sgbJ|t=uavJ|t,σJ=σ0,更新结束;
Step2:若条件 成立,f()为公式
(21)表示的适应度函数,sgbJ|t=uavJ|t,σJ=σ0,更新结束;否则执行Step3;
Step3: 结束更新;其中 为 的半
全局最优;
个体历史最优引入个体历史最优概率值μi,其初始值为μ0,其中0<μ0<1;对于任意一个在协同搜索状态下的无人机uavi,其个体历史最优pbi|t更新流程如下:Step11:判断无人机何时加入子联盟,若在时刻t加入子联盟,按照式(20)更新pbi|t,并赋值μi=μ0,更新结束;否则赋值[0,1]之间均匀分布随机数rμ,并执行Step12;
Step12:若条件(f(uavi|t)≥f(pbi|(t‑1)))||(f(uavi|t)
Step13:pbi|t=pbi|(t‑1),μi=μi·μ0,更新结束;
在协同搜索状态的无人机分为两类:type_I和type_II;对于某子联盟中任意I类无人机,个体历史最优仍选择该个体历史上的最优位置;而对于某子联盟中任意II类无人机uavi,若uavi的目标信息是通过通信从无人机 取,无人机个体历史最优为二者中点;无人机uavi的个体历史最优按照式(20)更新:不同类型的协同搜索状态下的无人机,适应度函数计算方式不同;在任意子联盟中,若无人机uavi为type_I,适应度函数值即为传感器探测到的目标信号;若无人机uavi为type_II, 为其最近type_I通信无人机,适应度函数值取uavi与 距离的相反数,即:综上所述概率限制的PSO期望速度计算由式(22)所示:
其中c1、c2分别为认知系数、社会系数,r1、r2是服从U(0,1)的随机数,ω为惯性权重,α是考虑运动学的惯性环节,pbi|t为无人机uavi在时刻t的个体历史最优,sgbJ|t为无人机uavi所属子联盟TUJ|t的半全局最优;Vvpi|(t+1)为中间变量。
2.根据权利要求1所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,所述步骤二中,群无人机在搜索目标时,任务是搜索到任务区域内所有目标,而搜索某局部区域内的目标作为子任务,子任务数至多为nT,完成相同子任务的无人机组成子联盟,t时刻子联盟记为TUJ|t,其中0≤J≤nT,序号J按照子联盟中探测到的最强目标信号从大到小排列,组成子联盟的无人机所处状态称为协同搜索状态,无人机按照以下方式组成子联盟:无人机通过两种途径获取目标信号,由此将可获取目标信号的无人机分为两类:由自身传感器探测到目标信号的I类无人机和由无人机之间的通信获取目标信号的II类无人机,I类无人机记为type_I,II类无人机记为type_II;首先,I类无人机分组,甄选出局部区域内目标信号最强的无人机uavi0,当附近其他I类无人机uavi与uavi0满足式(2),则与uavi0组成子联盟TU1|t;剩余不满足式(2)的I类无人机则继续甄选出目标信号最强的无人机再在附近剩余的无人机中寻找与 关系符合式(2)的无人机组成子联盟,以此往复直至所有I类无人机均组成子联盟;然后,II类无人机加入最近的可通信I类无人机所在子联盟;
3.根据权利要求2所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,所述步骤二中,在子任务分配后,为了避免相同子联盟中无人机过多造成无人机资源浪费,进一步引入闭环调节,评估各个子联盟的资源分配:当某个子联盟的无人机数NJ>Nmax,该子联盟择优选取Nmax个无人机作为该子联盟个体,其中Nmax为子联盟无人机最大允许个数;择优原则为:优先选择I类无人机,I类无人机中优先选择目标信号强者,II类无人机中优先选择距离通信无人机近者;
将无人机对动态目标的搜索分为三种状态:快速覆盖搜索区域的漫游状态、组成子联盟的协同状态和搜索任务完成状态。
4.根据权利要求3所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,步骤四或步骤五中,无论无人机是处于协同状态还是漫游状态,都在计算出期望速度Vvei|(t+1)后考虑避障;以边界扫描避障策略为基础,将其改进为适应于栅格环境中的改进的边界扫描避障IBSOA,无人机避障时,将感知到的障碍物分为连续障碍物与不连续障碍物两种情形,避障方向分为逆时针避障与顺时针避障,无人机综合考虑感知到的障碍物情形与历史避障方向计算下一步速度;
由于地图的栅格化,将存在障碍物栅格称为障碍栅格;IBSOA忽略障碍物情形,综合考虑避障方向与障碍栅格进行避障;若无人机在漫游状态,且在其附近距离小于min(rtar,tobs)的范围内存在障碍物,开始考虑避障;若无人机在协同状态,且在其附近距离小于Vvm的范围内存在障碍物,开始考虑避障;IBSOA的避障过程表示为下述两点:
1、无人机uavi在漫游状态,且在其附近距离小于min(rtar,robs)的范围内,
当λi=0,表示上一步未避障,从栅格集合FOGi|t中选取与Vvei|(t+1)角度差最小的栅格Gni作为无人机uavi下一步将到达的栅格;
当λi=1,从栅格集合FOGi|t中选取在逆时针方向上与Vvei|(t+1)角度差栅格Gni作为无人机uavi下一步将到达的栅格;
当λi=‑1,从栅格集合FOGi|t中选取在顺时针方向上与Vvei|(t+1)角度差最小的栅格Gni作为无人机uavi下一步将到达的栅格;
再根据栅格Gni及式(23),求解下一步速度Vvi|(t+1),式中Gni为Gni位置;得到速度后依据式(24)更新λi,计算避障速度结束:λi=sgn(F(
2、无人机uavi在协同状态,且在其附近距离小于Vvm范围内,
当λi=0,表示上一步未避障,从栅格集合OGi|t中选取与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
当λi=1,从栅格集合OGi|t中选取在逆时针方向上与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
当λi=‑1,从栅格集合OGi|t中选取在顺时针方向上与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
再根据栅格grdni及式(25),求解下一步速度Vvi|(t+1),式中grdni为grdni位置,得到速度后依据式(26)更新λi,计算避障速度结束;
λi=sgn(F(