利索能及
我要发布
收藏
专利号: 2025112782915
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种边界层气象观测飞行器动态信道传输特性优化方法,其特征在于:在预先构建的基于DRL的边界层气象观测飞行器信道模型中分析传输路径在空域、时域和频域的非平稳特性;

在预先构建的基于DRL的边界层气象观测飞行器信道模型中,结合传输路径在空域、时域和频域的非平稳特性,考虑气象观测飞行器的飞行能耗和信道中的可达速率,构建气象观测飞行器在信道中的能效优化目标和约束条件,定义气象观测飞行器奖励函数;

在约束条件下对能效优化目标进行求解,求解结果根据气象观测飞行器奖励函数规划最优飞行路径,得到适应非平稳信道的气象观测飞行器最优动作参数;

其中,所述基于DRL的边界层气象观测飞行器信道模型的构建方法包括:考虑散射簇是移动的,当发射端发出的信号经散射簇反射路径到达接收端时,构建发射端和接收端与散射簇之间的传输距离的函数表达式;构建信号经散射簇反射到达接收端的传输路径的信道复冲激响应函数表达式;

当发射端发出的信号直射路径到达接收端时,构建发射端与接收端之间的传输距离的函数表达式;构建信号直射到达接收端的传输路径的信道复冲激响应函数表达式;

构建基于DRL的边界层气象观测飞行器信道模型的方法为:在三维空间建立 直角坐标系,定义发射端天线阵列投影中点和接收端天线阵列中点的连线为 轴;定义经过发射端天线阵列投影中点且垂直于 轴的线为 轴;定义经过发射端天线阵列投影中点且垂直于 平面的线为 轴;当发射机发出的信号经过多次反射到达接收机时,我们将散射体建模为发射机发出信号后的第一次反射,以及信号到达接收机之前的最后一次反射,分别由 和 个散射体构成,而对于第一次反射和最后一次反射之间存在的复杂多径,我们通过虚拟链路来表征;气象观测飞行器在边界层内的区域内飞行,水平面的限制为到 和 到 ,高度限制为 到 ; 和 分别为 轴的最小坐标和最大坐标; 和 分别为 轴的最小坐标和最大坐标; 和 分别为 轴的最小坐标和最大坐标;由于DRL算法基于离散时间步运行,因此我们将总运行时间划分为 个离散段,其中离散时间间隔需要足够小以满足连续时间信道状态;

当发射端发出的信号经散射簇反射路径到达接收端时,构建发射端和接收端与散射簇之间的传输距离的函数表达式的方法为:计算发射端第 根天线到第一个散射簇中第 个散射体的时变传输距离  ;

其中, , ,是一个足够小的离散时间间隙,用于准确捕捉信道时变特性, 表示从原点到第一个散射簇的距离向量, 表示从第一个散射簇的中点到第个散射体的偏移向量, 表示由DRL算法计算出来的飞行器坐标, 表示从发射端天线的中点到第 根天线的距离向量,表达式为:;

从飞行器到第一个散射簇的单位距离向量表示为 ,

其中, 和 分别表示发射端和第一个散射体的连线与水平面和竖直平面上的夹角; 表示发射端的线型天线上任意两天线的间距; 和 分别表示发射端天线阵列的方向角和仰角;

计算接收端第 根天线与最后一个散射簇中第 个散射体之间的时变传输距离 ;

其中, 表示从最后一个散射簇的中点到第 个散射体的偏移向量, 表示从发射端天线的中点到第 根天线的距离向量,表达式为:;

从最后一个散射簇到接收端的单位距离向量表示为 ,

其中, , , 和 分别表示发射端和最后一个散射簇中第一个散射体的连线与水平面和竖直平面上的夹角; 表示发射端的线型天线上任意两天线的间距; 表示发射端天线阵列的方向角。

2.根据权利要求1所述的边界层气象观测飞行器动态信道传输特性优化方法,其特征在于:经散射簇反射到达接收端的传输路径的信道复冲激响应函数表达式为: ;

其中, 表示莱斯因子; 表示复数; 表示独立且均匀分布的随机相位, 表示波长,表示载波频率,表示光的传输速率; 表示两个散射簇之间虚拟链路的传播延迟。

3.根据权利要求2所述的边界层气象观测飞行器动态信道传输特性优化方法,其特征在于:当发射端发出的信号直射路径到达接收端时,构建发射端与接收端之间的传输距离的函数表达式的方法为:计算发射端第 根天线与接收端第 根天线之间的传输距离 ,  ;

发射端到接收端的单位距离向量 。

4.根据权利要求3所述的边界层气象观测飞行器动态信道传输特性优化方法,其特征在于:信号直射到达接收端的传输路径的信道复冲激响应函数表达式包括:信号直射到达接收端的传输路径的信道复冲激响应函数表达式为: ;

其中, 和 分别表示发射端和接收端的连线与水平面和竖直平面上的夹角;

总信道复冲激响应函数表达式为:

其中,表示路径延迟,是冲激函数。

5.根据权利要求4所述的边界层气象观测飞行器动态信道传输特性优化方法,其特征在于:在预先构建的DRL的边界层气象观测飞行器信道模型中分析传输路径在空域、时域和频域的非平稳特性的方法包括:当发射端发出的信号经散射簇反射和直射到达接收端时,计算发射端第 根天线与接收端第 根天线之间传输路径在空域的互相关函数为:;

其中,表示离散时间下标, 表示信道时变特性的时间间隔, 表示期望函数, 和表示发射端和接收端归一化后的天线间距;

令上述空域表达式中的 得到时域的自相关函数表达式为: ;

当发射端发出的信号经散射体反射和直射到达接收端时,发射端第 根天线与接收端第 根天线之间传输路径的频域相关函数表达式为: ;

其中, 表示频率间隔。

6.根据权利要求5所述的边界层气象观测飞行器动态信道传输特性优化方法,其特征在于:考虑气象观测飞行器的飞行能耗和信道中的可达速率,构建气象观测飞行器在信道中的能效优化目标和约束条件的方法包括:考虑气象观测飞行器的飞行能耗 和信道中的可达速率 表达式为:;

其中, 和 分别代表气象观测飞行器在悬停状态下的恒定叶片轮廓功率和诱导功率,而 则代表爬升或下降所需的恒定功率;此外, 表示转子叶尖速度, 指的是悬停期间的平均转子诱导速度;参数 表示机身阻力比,代表转子实度, 和 则分别是空气密度和转子盘面积; 是气象观测飞行器的速度;

气象观测飞行器的能效优化目标函数为: ;

对应于状态和动作空间的条件约束表示为:

其中, 是气象观测飞行器的初始位置, 是指定的气象观测飞行器可飞行区域,和 分别是气象飞行器由DRL更新的速度和位置向量, 是气象观测飞行器的电池能耗最大值, 表示气象飞行器机体坐标系的加速度向量范围, 表示气象飞行器的角速度来更新三维旋转角。

7.根据权利要求6所述的边界层气象观测飞行器动态信道传输特性优化方法,其特征在于,奖励函数定义为:;

其中, 是奖励符号, 是气象观测飞行器飞出指定区域的惩罚, 、 和 分别是三个不同的权重值, 是信道可达速率的最大值。

8.根据权利要求7所述的边界层气象观测飞行器动态信道传输特性优化方法,其特征在于,在约束条件下对能效优化目标进行求解的方法包括:用双延迟深度确定性策略梯度算法求解气象观测飞行器的能效优化目标;

初始化行动者和双评价者网络,随机抽取包含 个样本的小批次对网络进行更新,最小化损失的更新方法表示为:;

其中, 是损失函数, 表示第一个评价者网络的参数, 表示第二个评价者网络的参数, 表示样本总数量, 表示智能体观测到的环境状态, 表示智能体在状态 下选择的动作, 和 分别是评价者网络中输出状态‑动作的价值估计;

软更新目标网络,表达式为:

其中, 表示目标评论者网络的值, 表示智能体执行动作 后从环境获得的反馈,引导智能体学习更好的动作,表示折扣因子,控制未来奖励的权重, 表示取双评价者网络的最小价值估计, 表示下一个环境状态, 表示生成下一状态的目标策略,表示给动作加入的探索噪声,让智能体在训练时主动探索环境,避免陷入局部最优, 表示两个评价者网络中的参数,通过延迟更新让目标更稳定;

行动者网络根据延迟策略梯度算法,更新公式为:

其中, 表示梯度计算, 表示对行动者策略网络参数的梯度,表示策略目标, 是期望函数,通过对环境状态和智能体动作的分布取期望,避免单一样本噪声;表示动作,表示状态, 表示评论者网络对动作的梯度, 表示策略网络对自身参数的梯度, 表示两个评价者网络参数,而 表示行动者策略网络的参数。