利索能及
我要发布
收藏
专利号: 2023117777100
申请人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种多无人机基站航迹规划方法,其特征在于,所述一种多无人机基站航迹规划方法包括:获取目标地区用户终端的移动轨迹数据集,根据所述移动轨迹数据集训练多层感知器网络、第一图注意力网络和第二图注意力网络,得到目标多层感知器网络、目标第一图注意力网络和目标第二图注意力网络;

实时获取所述无人机实时观测到的目标用户终端的位置和无人机群中每个无人机的第一位置,根据所述目标用户终端的位置构建用户终端节点,根据每个无人机的第一位置构建无人机节点;

根据所述无人机节点,通过所述目标第一图注意力网络生成无人机群中每个无人机的无人机节点特征,根据所述用户终端节点,通过所述目标第二图注意力网络生成所述目标地区中每个用户终端的用户终端节点特征;

根据所述无人机节点特征和所述用户终端节点特征,通过所述目标多层感知器网络生成无人机群中每个无人机的运动轨迹;

根据每个无人机的运动轨迹获取每个无人机的第二位置,根据所述目标用户终端的位置和所述第二位置,采用有限比例公平调度算法给每个目标用户终端分配无人机子信道;

所述根据每个无人机的运动轨迹获取每个无人机的第二位置,根据所述目标用户终端的位置和所述第二位置,采用有限比例公平调度算法给每个目标用户终端分配无人机子信道的步骤包括:获取目标用户终端的数据速率,根据目标用户终端的数据速率对目标用户终端进行排序;

对目标用户终端中的数据速率最小的用户终端,按照预设规则分配无人机子信道;

当分配完成后,将已分配的用户终端从排序中去除,重新选取排序中目标用户终端中的数据速率最小的用户终端,并为当前目标用户终端的数据速率最小的用户终端分配无人机子信道;

持续更新排序,直到排序中所有的用户终端都完成无人机子信道分配。

2.根据权利要求1所述的多无人机基站航迹规划方法,其特征在于,所述获取目标地区用户终端的移动轨迹数据集,根据所述移动轨迹数据集训练多层感知器网络、第一图注意力网络和第二图注意力网络,得到目标多层感知器网络、目标第一图注意力网络和目标第二图注意力网络,具体包括:获取所述目标地区中第一预设数量个所述用户终端的移动轨迹数据集和所述无人机群中每个无人机的第三位置,根据所述用户终端的移动轨迹数据集和所述第三位置生成样本数据,并将所述样本数据存储到数据库中;

从所述数据库中获取第二预设数量个样本数据,依次采用预设模型计算所述第二预设数量个样本数据中每个样本数据的Q总值,在每次获取到样本数据的Q总值后,根据Q总值计算时序差分损失函数,根据所述时序差分损失函数对所述多层感知器网络、所述第一图注意力网络和所述第二图注意力网络进行一次训练,并根据当前训练得到的多层感知器网络、第一图注意力网络和第二图注意力网络进行下一次训练;

重新多次获取用户终端的移动轨迹数据集和无人机群中每个无人机的位置,生成新的样本数据,并根据所述新的样本数据对所述多层感知器网络、所述第一图注意力网络和所述第二图注意力网络进行多次训练;

当对所述多层感知器网络、所述第一图注意力网络和所述第二图注意力网络的训练次数达到预设次数时,结束训练,并得到目标多层感知器网络、目标第一图注意力网络和目标第二图注意力网络。

3.根据权利要求2所述的多无人机基站航迹规划方法,其特征在于,所述获取所述目标地区中第一预设数量个所述用户终端的移动轨迹数据集和所述无人机群中每个无人机的第三位置,根据所述用户终端的移动轨迹数据集和所述第三位置生成样本数据,并将所述样本数据存储到数据库中的步骤包括:获取所述目标地区中第一预设数量个所述用户终端的移动轨迹数据集和所述无人机群的第三位置;

对所述目标地区中第一预设数量个所述用户终端的移动轨迹数据集中的每个移动轨迹数据集和每个无人机群的第三位置,采用当前多层感知器网络、第一图注意力网络和第二图注意力网络迭代更新无人机的当前运动轨迹;

当迭代次数达到第三预设数量时,停止迭代,获取第一预设数量次迭代过程中无人机运动轨迹对应的全部动作和对应的状态以及奖励值;

根据第一预设数量的迭代过程中无人机运动轨迹对应的全部动作和对应的状态以及奖励值生成第一预设数量个样本数据,并将第一预设数量个样本数据存储到所述数据库中。

4.根据权利要求2所述的多无人机基站航迹规划方法,其特征在于,所述从所述数据库中获取第二预设数量个样本数据,依次采用预设模型计算所述第二预设数量个样本数据中每个样本数据的Q总值,在每次获取到样本数据的Q总值后,根据Q总值计算时序差分损失函数,根据所述时序差分损失函数对所述多层感知器网络、所述第一图注意力网络和所述第二图注意力网络进行一次训练,并根据当前训练得到的多层感知器网络、第一图注意力网络和第二图注意力网络进行下一次训练的步骤包括:从所述数据库中获取第二预设数量个样本数据;

对从数据库中获取的样本数据依次采用所述预设模型计算Q总值,并根据所述Q总值计算时序差分损失函数,根据时序差分损失函数反向传播训练多层感知器网络、第一图注意力网络、第二图注意力网络和预设模型,当反向传播完成后,完成一次训练,其中,所述预设模型包括双工竞争架构,转移网络和混合网络;

根据训练后的多层感知器网络、第一图注意力网络、第二图注意力网络和预设模型进行下一次训练。

5.根据权利要求1所述的多无人机基站航迹规划方法,其特征在于,所述实时获取所述无人机实时观测到的目标用户终端的位置和无人机群中每个无人机的第一位置,根据所述目标用户终端的位置构建用户终端节点,根据每个无人机的第一位置构建无人机节点的步骤包括:实时获取所述无人机实时观测到的目标用户终端的位置和无人机群中每个无人机的第一位置;

基于图生成网络,根据所述目标用户终端的位置构建用户终端节点,根据所述第一位置构建无人机节点。

6.根据权利要求1所述的多无人机基站航迹规划方法,其特征在于,所述根据所述无人机节点特征和所述用户终端节点特征,通过所述目标多层感知器网络生成无人机群中每个无人机的运动轨迹的步骤包括:根据所述无人机节点特征和所述用户终端节点特征,通过所述目标多层感知器网络生成无人机群中无人机的Q值,根据贪婪算法以预设概率阈值选取Q值最大的动作,并将所述动作发送给对应无人机;

根据每个无人机的动作生成每个无人机的运动轨迹。

7.一种多无人机基站航迹规划系统,其特征在于,所述一种多无人机基站航迹规划系统包括:训练模块,用于获取目标地区用户终端的移动轨迹数据集,根据所述移动轨迹数据集训练多层感知器网络、第一图注意力网络和第二图注意力网络,得到目标多层感知器网络、目标第一图注意力网络和目标第二图注意力网络;

节点构建模块,用于实时获取所述无人机实时观测到的目标用户终端的位置和无人机群中每个无人机的第一位置,根据所述目标用户终端的位置构建用户终端节点,根据每个无人机的第一位置构建无人机节点;

节点特征获取模块,用于根据所述无人机节点,通过所述目标第一图注意力网络生成无人机群中每个无人机的无人机节点特征,根据所述用户终端节点,通过所述目标第二图注意力网络生成所述目标地区中每个用户终端的用户终端节点特征;

轨迹生成模块,用于根据所述无人机节点特征和所述用户终端节点特征,通过所述目标多层感知器网络生成无人机群中每个无人机的运动轨迹;

信道分配模块,用于根据每个无人机的运动轨迹获取每个无人机的第二位置,根据所述目标用户终端的位置和所述第二位置,采用有限比例公平调度算法给每个目标用户终端分配无人机子信道;

所述根据每个无人机的运动轨迹获取每个无人机的第二位置,根据所述目标用户终端的位置和所述第二位置,采用有限比例公平调度算法给每个目标用户终端分配无人机子信道的步骤包括:获取目标用户终端的数据速率,根据目标用户终端的数据速率对目标用户终端进行排序;

对目标用户终端中的数据速率最小的用户终端,按照预设规则分配无人机子信道;

当分配完成后,将已分配的用户终端从排序中去除,重新选取排序中目标用户终端中的数据速率最小的用户终端,并为当前目标用户终端的数据速率最小的用户终端分配无人机子信道;

持续更新排序,直到排序中所有的用户终端都完成无人机子信道分配。

8.一种终端,其特征在于,所述终端包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的一种多无人机基站航迹规划程序,所述一种多无人机基站航迹规划程序被所述处理器执行时实现如权利要求1‑6任意一项所述一种多无人机基站航迹规划方法的步骤。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有一种多无人机基站航迹规划程序,所述一种多无人机基站航迹规划程序被处理器执行时实现如权利要求1‑6任意一项所述一种多无人机基站航迹规划方法的步骤。