1.一种基于批处理先验知识树的无人机路径规划方法,其特征在于,包括以下步骤:(1)初始化集合,集合包括树边集合、树节点集合、采样点集合、树节点优先队列 和待扩展边优先队列 ;将起始点置入树节点集合和树节点优先队列中,目标点置入采样点集合;
(2)引入采样点范围控制函数和合势力绝对值的阈值,结合人工势场法生成采样点,更新采样点集合;
(3)根据当前 和 的最小估计成本,确定最优待扩展边,得到初始路径,并将目标点进入树节点集合;
(4)以初始路径的起始点和目标点作为焦点,根据最优路径长度和起始点和目标点的直线路径长度确定长轴和短轴,构建椭圆,对步骤(3)得到的初始路径进行剪枝优化,并在椭圆中进行批次采样,更新采样点集合;
(5)引入障碍物密集程度因子,采用多臂赌博算法EXP3从步骤(4)更新采样点集合中确定信标点;
(6)将目标点从树节点集合中拿出再次放入采样点集合中,置空 和 ,将起始点放入 ,根据起始点到信标点对应的 和 的最小估计成本,确定最优待扩展边,直到最优待扩展边不能降低从起始点到信标点的路径代价后,以起始点和信标点为焦点,起始点到信标点的路径代价值为长轴构建第一子椭圆;以目标点和信标点为焦点,当前最优路径代价减去起始点到信标点的路径代价值为长轴构建第二子椭圆;
(7)再次置空 和 ,并将起始点放入 ,再根据第一子椭圆和第二子椭圆内对应的 和 的最小估计成本,确定最优待扩展边,直到到达预定时间;
(8)判断目标点是否进入树节点集合中,若是则进入下一步,若否则返回步骤(4)的椭圆批次采样中;
(9)对第一子椭圆和第二子椭圆中进行剪枝优化,并在两个子椭圆中批次采样;置空和 将路径上的采样点放入 ,根据 和 的最小估计成本,确定最优待扩展边,再次更新优化路径,直到最优待扩展边不能降低当前的路径成本;
(10)判断是否完成迭代,若完成则输出路径,未完成则返回步骤(9)的批次采样中;
(11)对步骤(10)的输出路径,进行三阶B样条平滑处理,得到最终路径。
2.根据权利要求1所述基于批处理先验知识树的无人机路径规划方法,其特征在于,步骤(2)中,合势力绝对值 为;
;
;
;
其中, 为采样点范围控制函数, ; 为引力势场函数, 为斥力势场函数; 表示地图的面积, 表示第 个障碍物的面积, 为障碍物的总量; 、和 为阈值常量, 为采样点 到目标点 的欧式距离, 和 为引力增益系数; 为斥力系数; 为距离因子调节系数,其值为大于零的常数,计算当前所有有效采样点的平均合势力,阈值 为;
其中, 为阈值自适应系数, ; 为有效采样点的个数, 为有效采样点的合势力;当 小于 时,则保留该采样点,反之则剔除该采样点。
3.根据权利要求1所述基于批处理先验知识树的无人机路径规划方法,其特征在于,步骤(3)具体如下:(31)若当前树节点优先队列 的最小估计成本小于或等于待扩展边优先队列 的最小估计成本,则进行树节点扩展操作,直到 大于 ;反之,则从待扩展边优先队列中,选取估计成本最低的待扩展边作为最优待扩展边;
(32)若最优待扩展边的估计成本小于当前路径成本,进入步骤(33);反之,则清空队列结束此次迭代;
(33)若最优待扩展边无碰撞且能降低成本,则进入步骤(34);反之,则清空队列结束此次迭代;
(34)若最优待扩展边的终端节点在当前树节点列表中,则进行节点重布线,进入步骤(35);反之,则将终端节点从采样节点列表中移入树节点集合,进入步骤(35);
(35)将最优待扩展边加入树边集合并清理无用边,返回步骤(31),直至最优待扩展边不能降低当前路径成本,确定初始路径。
4.根据权利要求1所述基于批处理先验知识树的无人机路径规划方法,其特征在于,步骤(4)中,椭圆的长轴为当前最优的路径长度 ,短轴为 , 为起始点和目标点的直线路径长度。
5.根据权利要求1所述基于批处理先验知识树的无人机路径规划方法,其特征在于,步骤(5)中,引入障碍物密集程度因子,采用EXP3算法从步骤(4)得到的更新后采样点集合中确定信标点,具体如下:(51)步骤(4)得到的更新后采样点集合 ,对节点集合中的每个节点初始化权重为1;
(52)计算 时刻第 个节点作为信标的选择概率 ;
(53)基于EXP3算法选择信标的选择概率,根据该信标的选择概率选择一个节点作为信标 ,并引入障碍物密集程度因子计算信标 的奖励 ,接着进行归一化处理,得到归一化奖励 ;
(54)更新信标权重,得到更新后的信标权重 ;
(55)重复步骤(52)至步骤(54),达到预定时间,生成最终信标 。
6.根据权利要求5所述基于批处理先验知识树的无人机路径规划方法,其特征在于,时刻第 个节点作为信标的选择概率 为;
其中, 为当前信标权重, 为采样点个数。
7.根据权利要求6所述基于批处理先验知识树的无人机路径规划方法,其特征在于,信标 的奖励 为;
;
;
其中, 和 为权重参数, 为从信标 到目标点 的潜在路径代价,为障碍物密集程度;A是以信标 和目标点 的中点为中心、半径r为的圆形区域面积; 为指示函数;
归一化奖励 为
;
其中, 为奖励的绝对值。
8.根据权利要求7所述基于批处理先验知识树的无人机路径规划方法,其特征在于,更新后的信标权重 为;
其中,为学习率, 。
9.根据权利要求1所述基于批处理先验知识树的无人机路径规划方法,其特征在于,椭圆内进行批次采样,采样点 的计算方程如下:;
其中, 为缩放因子, , 为 上均匀分布的随机数;
将采样点 依次进行逆旋转和逆平移操作,得到采样点在原始坐标系下的坐标。
10.根据权利要求1所述基于批处理先验知识树的无人机路径规划方法,其特征在于,步骤(11)中,三阶B样条曲线为;
其中, 时间的集合, 为四阶矩阵, 为控制点集合。