利索能及
我要发布
收藏
专利号: 2023115267495
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种无人机辅助的通感算网络融合方法,应用于无人机通感一体化传输与感知系统的环境中,其特征在于,所述环境中至少包括 个用户、 个边缘基站以及飞行在用户的上空的 架无人机,所述无人机辅助的通感算网络融合方法包括:无人机通过周期性的发出通感一体化信号对环境状态进行感知,以获得回波信号;

根据所述回波信号中的信息进行提取,获得当前的环境状态;

所述无人机在每个决策时刻t时,获取各无人机当前的坐标、各用户当前的坐标、各边缘基站当前的坐标、无人机当前的剩余能量、无人机的处理速率、卸载速率和当前的环境状态,输入至采用基于SAC算法训练好的策略优化网络模型,通过所述策略优化网络模型对所述无人机下一时刻的轨迹规划、无人机和用户关联决策、目标感知选择、发射波束形成策略和资源分配策略进行分析,确定无人机下一时刻最优的轨迹规划、无人机和用户关联决策、目标感知选择、发射波束形成策略和资源分配策略;

在下一时刻时,所述无人机根据所述最优的无人机的轨迹规划进行移动,所述无人机根据所述最优的无人机和用户关联决策与所述环境中的用户进行通信连接,所述无人机根据最优的目标感知选择确定感知的目标,所述无人机根据所述最优的发射波束形成策略调整发出通感一体化信号的通信功率加权系数和感知功率加权系数,所述无人机根据所述最优的资源分配策略对任务计算资源进行分配。

2.根据权利要求1所述的无人机辅助的通感算网络融合方法,其特征在于,所述通感一体化信号的表达式为:;

其中,F为无人机发出的通感一体化信号, 表示感知分量, 表示通信分量, 为通信功率加权系数, 为感知功率加权系数。

3.根据权利要求2所述的无人机辅助的通感算网络融合方法,其特征在于,所述回波信号的表达式为:;

其中, 为回波信号, 为雷达路径损耗, 为自然常数,fs为目标移动造成的频偏, 为虚数单位,用于表示复数, 为噪声干扰。

4.根据权利要求1所述的无人机辅助的通感算网络融合方法,其特征在于,所述策略优化网络模型包括Critic网络和Actor网络,所述Critic网络对上一时刻输出最优的轨迹规划、无人机和用户关联决策、目标感知选择、发射波束形成策略和资源分配策略进行评价,输出评价结果至所述Actor网络,所述Actor网络根据所述Critic网络的评价结果和各无人机当前的坐标、各用户当前的坐标、各边缘基站当前的坐标、无人机当前的剩余能量、无人机的处理速率、卸载速率和当前的环境状态,输出无人机下一时刻最优的轨迹规划、无人机和用户关联决策、目标感知选择、发射波束形成策略和资源分配策略。

5.根据权利要求1所述的无人机辅助的通感算网络融合方法,其特征在于,所述采用基于SAC算法训练策略优化网络模型的步骤包括:模拟无人机通感一体化传输与感知系统的环境中进行信息传递与波束感知,获得每个时刻的各无人机的坐标样本、各用户的坐标样本、各边缘基站的坐标样本、无人机的剩余能量样本、无人机的处理速率样本、卸载速率样本和当前的环境状态样本,作为样本数据;

基于SAC算法,将样本数据作为待训练的策略优化网络模型的当前状态 ,输入待训练的策略优化网络模型的Critic网络,所述Critic网络根据上一时刻的状态 、获得的回报 和熵,对输入的当前状态的样本数据进行分析,以最大限度的提升无人机的加权频谱效率为所述待训练的策略优化网络模型的优化目标进行优化,由所述的Actor网络输出包括无人机的轨迹规划、无人机和用户关联决策、目标感知选择、发射波束形成策略和资源分配策略的动作 ,Critic网络从环境中获得回报 ,其中,熵根据公式 进行自适应优化, 表示求偏导, 为熵参数, 为熵函数,用于熵参数的更新;

将每个时刻的当前状态 、动作 、回报 以及下一状态 作为经验元组存入经验池中,随着基于SAC算法的迭代,经验池中的经验元组的数量逐渐增加,在达到预设数量时,使用当前收集的经验元组多个epoch执行小批量训练,优化Actor网络的网络参数,以及对Critic网络中的主Critic网络和目标Critic网络进行更新;

其中,通过  对Actor网络的网络参数进行优化,主Critic网络更新方法为 ,目标Critic网络更新方法为

,其中, 为Actor网络的网络参数, 为Actor网络

参数的更新函数, 为软更新参数, 为主Critic网络的网络参数, 为目标Critic网络的网络参数, 为主Critic网络参数的更新函数。

6.根据权利要求5所述的无人机辅助的通感算网络融合方法,其特征在于,所述待训练的策略优化网络模型的优化目标的表达式为:,

s.t. ,

其中, 为 时刻无人机 的加权频谱效率, 为无人机 在 时刻的水平位置,为无人机 在 时刻的水平位置, 为无人机 在一个时隙T内的最大行驶距离, 为无人机集合, 为用户集合, 为其他无人机 在 时刻的水平位置, 为在同一时刻 无人机 与其他无人机 之间的最小间隔距离, 为无人机 在 时刻的海拔高度, 为用户m在 时刻的海拔高度, 为用户m在 时刻的水平位置, 为无人机 到第m个用户的最大关联距离, 为无人机允许飞行的最小高度,  为无人机允许飞行的最大高度。

7.根据权利要求6所述的无人机辅助的通感算网络融合方法,其特征在于,所述 时刻无人机 的加权频谱效率的表达式为:,

其中, 为通信功率加权系数, 为感知功率加权系数, 为 时刻无人机 实现的通信频谱效率, 为 时刻无人机 的感知频谱效率, 为 时刻无人机与用户m之间的关联情况, 为 时刻无人机 与用户m之间信道功率增益, 为时刻无人机 的信号发射功率, 为 时刻其他无人机 与用户m之间信道功率增益,为 时刻其他无人机 的信号发射功率, 为接收信号处的高斯白噪声功率, 为发射增益, 为接收增益, 为用户m的雷达截面平均值, 为载波收发机的波长, 为时刻无人机 与用户m的距离, 为 时刻无人机 对用户m的通道功率增益,为 时刻其他无人机 对用户m的通道功率增益, 为相距距离1米时的信道功率。