利索能及
我要发布
收藏
专利号: 2022111441322
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:授权未缴费
更新日期:2024-10-29
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种无人机数据收集方法,其特征在于:包括以下步骤:S1:建模UAV模型;

S2:建模SN模型;

S3:建模信道模型;

S4:基于亲和力传播算法确定SN聚类策略;

S5:建模网络效用函数;

S6:建模资源调度、带宽分配限制条件,具体包括:

T表示时隙总数,t表示当前时隙,M为SN数量,m表示第m个SN的序号,m0表示时隙t内,最多可支持m0个SN同时上传数据至UAV;αm,t∈{0,1},若αm,t=1,表示SNm在时隙t上传数据至UAV,反之,αm,t=0;Bm,t为SNm在时隙t分配的带宽;B0表示UAV的可用带宽;

S7:建模系统状态、动作和输出奖励,具体包括:建模系统在时隙t的状态 其中 表示UAV在时隙t的位置,ht={h1,t,h2,t,…,hM,t}表示UAV与SN之间信道增益的集合;建模时隙t,动作at=<θt,vt,Bt,Ct>,其中θt∈(0,2π]为UAV的飞行方向,vt表示UAV在时隙t的飞行速度,Bt={B1,t,B2,t,…,BM,t},Ct={α1,t,α2,t,…,αM,t};建模时隙t,UAV的输出奖励其中 表示UAV在时隙t的能量消耗, 为SN在时隙t的传输能耗,ζ和ω分别为SN传输能耗和UAV推进能耗的权重系数;

S8:建模并训练双时延深度确定性策略梯度网络,具体包括:初始化折扣因子γ,更新率υ;演员网络和两个评论网络的在线策略网络参数为 θ1和θ2,将在线策略网络参数复制给目标网络,参数为 θ1′和θ′2;初始化经验回放缓冲区 初始化小样本集 并对系统状态st进行初始化;对于U,根据策略at=μ(st)+nt, 将动作at施加于系统环境,得到奖励值rt(st,at)和下一时刻的状态st+1,并将(st,at,rt,st+1)存入经验回放缓冲区从 中抽取一批样本 通过 计算出st+1状态下对应的动作的值 目标值为 基于损失函数最小化

更新评论网络;利用策

略梯度更新公式 更新其演员

网络;通过软更新算法更新在线策略网络和目标网络的参数,具体为:θi′←υθi,t+(1‑υ)θ′i,t,i=1,2;

S9:基于双时延深度确定性策略梯度算法确定UAV数据收集策略。

2.根据权利要求1所述的无人机数据收集方法,其特征在于:步骤S1中所述建模UAV模型具体包括:将系统时间划分为大小相等的时隙,令T表示时隙总数,τ表示时隙长度,并假设在一个时隙内UAV的位置固定不变;UAV从初始位置出发对所有SN进行数据收集后返回初始位置,令H为UAV的飞行高度,UAV在时隙t的位置为 UAV的最大速度为vmax;vt∈[0,vmax]表示UAV在时隙t的飞行速度;令B0表示UAV的可用带宽。

3.根据权利要求1所述的无人机数据收集方法,其特征在于:步骤S2中所述建模SN模型具体包括:SNm表示第m个SN,χm表示SNm的数据包大小,SNm的位置为 1≤m≤M,M为SN数量,SNs从环境中采集数据并通过正交频分多址技术传输至UAV,时隙t内,最多可支持m0个SN同时上传数据至UAV。

4.根据权利要求1所述的无人机数据收集方法,其特征在于:步骤S3中所述建模信道模型具体包括:建模时隙t,SNm与UAV之间信道模型,具体为: 其中a为路径损耗系数,ρ0为距离为1m时的参考信道增益, 表示时隙t,UAV与SNm之间的距离; 建模为高斯随机变量,e∈{LoS,NLoS}为传播参数。

5.根据权利要求1所述的无人机数据收集方法,其特征在于:步骤S4中所述基于亲和力传播算法确定SN聚类策略,具体包括:利用SN之间的相似性将其划分为K个簇;令二元指标矩阵ρ=[ρm,k]M×M,其中ρm,k∈{0,1},若ρm,k=1,表示SNk为SNm的聚类中心,反之,ρm,k=0;

基于优化问题 对聚类中心进行优化,其中 κ

是非负常数,表示节点作为聚类中心的能力;

建模SNs成簇限制条件为:

① 表示一个SN只能与一个聚类中心关联;

② 表示一个簇最多包含m0个SN;

令S=(sm,k)M×M为相似度矩阵,其中sm,k表示SNm和SNk之间的相似性,建模为:令Ψ=(ψm,k)M×M为吸引度矩阵,其中ψm,k表示SNk成为覆盖SNm的聚类中心的适合度;令为归属度矩阵,其中 为SNm选择SNk作为其聚类中心的适合度;给定SNk,初始化ψm,k=0, 假设n是当前迭代次数, 分别为ψm,k, 的第n次迭代值,则ψm,k及 的更新公式如下:

重复执行更新步骤直至算法收敛,得到聚类中心,集合 进而确定SN的聚类策略为:

6.根据权利要求1所述的无人机数据收集方法,其特征在于:在步骤S5中所述建模网络效用函数为:其中ζ和ω分别为SN传输能耗和UAV推进能耗的权重系数; 为SN在时隙t的传输能耗,Em,t表示SNm在时隙t的能耗,计算公式为:Em,t=αm,tpm,tDm,t,其中αm,t∈{0,1},若αm,t=1,表示SNm在时隙t上传数据至UAV,反之,αm,t=0;pm,t表示SNm在时隙t的传输功率,Dm,t表示上传数据的时延,建模为: Rm,t表示SNm在时隙t内的传输速率,建2

模为 其中Bm,t为SNm在时隙t分配的带宽,σ为噪声功率;

表示UAV在时隙t的能量消耗,建模为 其中l0为给定h

门限值, 为UAV的悬停能耗,建模为 其中P 为悬停能耗; 表示UAV在时隙t飞行时的能耗,计算公式为:

其中P0和Pi为常数,分别表示叶片剖面功率和悬停状态下的感应功率,Utip为转子叶片的叶尖速度,v0为UAV悬停时平均转子诱导速度,d0和s分别为机身阻力比和转子可靠性,ρ和Λ分别为空气密度和转子盘面积。

7.根据权利要求1所述的无人机数据收集方法,其特征在于:在步骤S9中所述基于双时延深度确定性策略梯度算法确定UAV数据收集策略,具体包括:将环境观测值输入网络,根据在线策略网络的输出确定UAV飞行轨迹、SN的带宽分配及资源调度策略。