买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种多UAV-RIS辅助移动边缘计算的任务卸载方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种多UAV-RIS辅助移动边缘计算的任务卸载方法

￥26000

专利号： 2024101664037

申请人：南京信息工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-12-30

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种多UAV‑RIS辅助移动边缘计算的任务卸载方法，其特征在于，所述任务卸载方法包括以下步骤：S1，根据第三方收集的数据，构建多UAV‑RIS辅助的大规模移动边缘计算卸载场景；

S2，分别建立用户卸载决策、卸载比例、UAV轨迹、RIS相位偏移、用户和UAV计算资源分配的通信模型、计算模型、时延模型和能耗模型，基于通信模型、计算模型、时延模型和能耗模型构建优化模型；通信模型用于计算网络平均吞吐量，计算模型用于计算任务的表示、任务量以及计算所需的CPU数量，时延模型用于UAV服务器计算时延、用户计算时延和卸载时延，能耗模型用于UAV飞行能耗计算、双向传输能耗计算、UAV和用户本地能耗计算；

S3，设定相关优化变量的初始值；

S4，依据当前最优RIS相位偏移和UAV轨迹，求解用户卸载决策、卸载比例、用户和UAV计算资源分配；

S5，依据当前最优用户卸载决策、卸载比例、用户和UAV计算资源分配以及UAV轨迹，采用解析法求解RIS相位偏移矩阵；

S6，依据当前最优用户卸载决策、卸载比例、用户和UAV计算资源分配以及RIS相位偏移，应用深度强化学习算法求解UAV轨迹；

S7，使用交替优化算法，循环执行步骤S4、步骤S5和步骤S6，直到相邻两次迭代间整个网络消耗的能量或时延绝对值小于预设阈值，或达到最大预设迭代次数时，迭代结束，获得用户设备和UAV的计算资源最优分配策略，获得用户设备的计算任务最优卸载决策和卸载比例，获得RIS相位偏移和最优UAV的轨迹；

S8，基于整个移动边缘计算网络的当前状态，应用UAV轨迹、计算任务最优卸载决策和卸载比例、RIS相位偏移、以及计算资源最优分配策略，以最大化整个网络平均吞吐量为目标，对大规模目标区域内各用户设备计算任务进行卸载和计算；

步骤S1中，根据第三方收集的数据，构建多UAV‑RIS辅助的大规模移动边缘计算卸载场景的过程包括以下步骤：period

设定在连续周期G 内有T个时隙执行计算任务，每个时隙编号为t；利用第三方收集的数据得到环境信息，其中，K个单天线用户随机分布在长度为l、宽度为w的区域内，用户三维坐标表示为 UAV数量为M，第m个UAV的编号为每架UAV均允许作为空中基站，为地面用户提供卸载服务，其坐标为RIS数量为N，每架UAV都配有至少一个RIS，第n个RIS编号为n, RIS采用均匀线性阵列，将用户的信号反射卸载给地面基站；基站的3D坐标固定为(xB,yB,hB)；

设定计算任务卸载约束条件，包括：

定义一个新的集合表示用户设备允许卸载的位置；针对用户可能卸载到UAV边缘服务器或地面基站的特点，定义卸载决策变量ak,m(t)：当ak,m(t)＝1,m≠M+1时表示t时隙用户k决定将其部分计算任务卸载到第m个UAV；ak,m(t)＝1,m＝M+1表示t时隙用户k决定将其部分计算任务反射卸载到基站；当ak,m(t)＝0时表示t时隙用户k并未进行卸载服务，选择全部计算任务进行本地计算；每个时隙只有一个用户设备能够卸载，且只能卸载到一个位置，有设定飞行约束，包括：

令第m个UAV在时隙t的3D坐标设为qm(t)＝(xm(t),ym(t),hm(t))；规定UAV的起始和结束init final init final位置，有qm(0)＝q ，qm(T)＝q ， q 代表UAV起始飞行位置，q 代表UAV结束max停止位置；UAV在一个时隙内的最大移动距离限制为：‖qm(t+1)‑qm(t)‖≤V t，t＝1,...T‑max

1，V 表示UAV在单位时间内能够达到的最大位移；UAV之间保持最小安全距离以防止UAV在飞行期间相撞，||qm(t)‑qj(t)||≥dmin， j≠m，dmin是最小安全距离；

步骤S2中，构建用户卸载决策、卸载比例、UAV轨迹、RIS相位偏移、用户和UAV计算资源分配的通信模型过程如下：根据欧几里得公式，计算时隙t内不同设备之间的距离：

式中，dk,m(t)为第m个UAV和第k个用户设备之间的距离；dk,n(t)为第n个RIS和第k个用户设备之间的距离；dn,B(t)为第n个RIS和基站之间的距离；

在时隙t从第k个用户设备到第m个UAV为视距链路，其信道增益gk,m(t)为：其中，α0是参考距离为1m时的信道功率增益；

在时隙t内，从第k个用户设备到第n个RIS的信道增益gk,n(t)和从第n个RIS到基站的信道增益gn,B(t)为：其中，d是反射元件之间的间距，λ是载波波长；表示从第k个用户到第2个RIS的到达角的余弦值，表示从第k个用户到第N个RIS的到达角的余弦值；表示从第2个RIS到基站的离去角的余弦值；表示从第M个RIS到基站的离去角的余弦值；

在时隙t，θn(t)是第n个RIS的对角相移矩阵，表示为：其中，θn,1(t)、θn,2(t)、…、θn,Z(t)分别是第n个RIS的第1个反射元件、第2个反射元件、…、第Z个反射元件在时隙t的相位偏移，Z是单个RIS中反射元件的数量；

如果用户k在时隙t被第m个UAV服务，即ak,m(t)＝1,m≠M+1，则此时第m个UAV相应的信噪比rk,m(t)表示为：2

其中，Pk表示用户k的发送功率，σ 是UAV接收端加性高斯白噪声的功率；

表示在时隙t中同信道内所有其他用户传输引起的干扰；

用户k在时隙t的卸载速率Rk,m(t)为：

如果用户k在时隙t获得基站服务，即ak,m(t)＝1,m＝M+1，则基站处相应的信噪比rk,B(t)为：用户k在时隙t的卸载速率Rk,B(t)为：

其中，Pk表示用户k的发送功率，σ 是UAV接收端加性高斯白噪声的功率；

表示在时隙t中同信道内所有其他用户的传输和RIS的

反射引起的干扰；

步骤S2中，构建用户卸载决策、卸载比例、UAV轨迹、RIS相位偏移、用户和UAV计算资源分配的计算模型过程如下：每个时隙都有一个用户面临一个计算密集型任务Sk(t)要执行，该任务被定义为：其中，Dk(t)表示时隙t用户k要处理的数据量，Fk(t)表示执行该计算任务所需的CPU周期总数；

将t时隙用户k本地计算的比例设为ρk(t)，划分后的本地任务量为ρk(t)Dk(t)，卸载到边缘服务器的任务量为(1‑ρk(t))Dk(t)；通过调整ρk(t)的值，使用户选择本地计算和卸载到边缘服务器之间的比例，以满足计算资源和电池容量的限制；

步骤S2中，构建用户卸载决策、卸载比例、UAV轨迹、RIS相位偏移、用户和UAV计算资源分配的时延模型过程如下：将用户k本地计算比例设为ρk(t)，卸载比例设为1‑ρk(t)，在t时隙，用户k的本地计算需要的时间为：其中，是t时隙用户k的本地计算能力，表示时隙t用户k计算的CPU数量；

每个用户在时隙t内的计算能力为：

其中，为每个用户最大本地计算能力；

如果用户k决定在时隙t中将其部分计算任务卸载给第m个UAV，则卸载所需时间和计算所需时间分别为：其中，为第m个UAV在时隙t允许分配给用户k的计算资源；

每个UAV在时隙t内的计算能力为：

其中，是每个UAV可分配的最大计算资源；

如果用户k决定在时隙t将其部分任务卸载给基站，则卸载所需时间和计算所需时间为：BS

其中，f 为基站可以分配给用户的计算资源；

步骤S2中，构建用户卸载决策、卸载比例、UAV轨迹、RIS相位偏移、用户和UAV计算资源分配的能耗模型过程如下：如果时隙t内用户k决定在本地执行计算任务，则用户k本地计算消耗的能量为：其中，是用户k一个大于零的系数；

如果时隙t内用户k决定将其部分计算任务卸载给第m个UAV，则卸载消耗的能量和计算消耗的能量分别为：如果时隙t内用户k决定将其部分计算任务卸载给基站，则卸载消耗的能量和计算消耗的能量分别为：步骤S2中，所述优化模型为：

定义卸载决策卸载比例

计算资源 RIS相位偏移 UAV

轨迹

以最大化整个网络的平均吞吐量为优化目标，将优化问题建模为：init final

C1.7:qm(0)＝q ,qm(T)＝q (1.7)max

C1.8:‖qm(t+1)‑qm(t)‖≤V t,t＝1,...T‑1(1.8)约束C1.1用于限制每个用户本地计算的比例；约束C1.2和C1.3用于保证每个时隙最多只有一个用户正在卸载计算任务到边缘服务器，以避免任务冲突和资源竞争；约束C1.4和C1.5用于限制每个用户和UAV的最大计算资源，以确保网络中的计算资源分配在可接受的范围内；约束C1.6用于表示RIS相移的调整范围；约束C1.7用于表示UAV的初始位置和最终位置，以确保UAV在时隙内的飞行轨迹合理；约束C1.8用于限制每个时隙UAV的最大移动距离，以确保飞行路径的可行性和安全性；约束C1.9用于保证UAV之间的最小安全距离，以避免碰撞和冲突；约束C1.10用于表示每个任务要在一个时隙内完成，以确保任务完成的时效性和可靠性；约束C1.11用于表示一个时隙内的能耗限制，通过限制整个网络可用的能量，以确保计算和通信任务能够在能耗约束下完成；

步骤S4中，依据当前最优RIS相位偏移和UAV轨迹，求解用户卸载决策、卸载比例、用户和UAV计算资源分配的过程包括以下步骤：给定RIS相位偏移ψ和UAV轨迹Q，求解卸载决策A、卸载比例ρ、UAV和用户设备计算资源分配f，构建的问题表示为：对于优化问题P2，将其中C2.2的二元变量放宽为连续变量，产生以下凸问题：对于凸优化问题P3，使用凸优化工具CVX求解卸载决策A、卸载比例ρ、UAV和用户设备计算资源分配f；

步骤S5中，依据当前最优用户卸载决策、卸载比例、用户和UAV计算资源分配以及UAV轨迹，采用解析法求解RIS相位偏移矩阵的过程包括以下步骤：在时隙t，为了最大化用户k到基站的卸载速率，在信号接收端对接收信号进行相位对齐，得到第t个时隙第n个RIS第z个反射元件的相位偏移θn,z(t)：RIS相位偏移 θn(t)为第t个时隙第n个RIS的相位偏移；

步骤S6中，依据当前最优用户卸载决策、卸载比例、用户和UAV计算资源分配以及RIS相位偏移，应用深度强化学习算法求解UAV轨迹的过程包括以下步骤：构建以下问题：

init final

s.t.C4.7:qm(0)＝q ,qm(T)＝q (4.1)max

C4.8:‖qm(t+1)‑qm(t)‖≤V t,t＝1,...T‑1(4.2)构建两个深度神经网络：演员网络和评论家网络，演员网络的所有参数记为θ，评论家网络的所有参数记为ω；当前网络状态S(t)表示为：当在某个时隙t下的状态S(t)时，深度强化学习算法根据当前的状态不断更新动作，在时隙t下，动作空间A(t)表示为：奖励函数R(t)表示为：

R(t)＝(1‑ρk(t))Rk,m(t)t+(1‑ρk(t))Rk,B(t)t+Dk(t)t；

在时隙t，演员网络的输入是当前网络的状态S(t)，输出是下一个状态S(t+1)、动作A(t)、奖励R(t)以及状态S(t)下各个用户设备完成卸载动作选择后整个网络的平均吞吐量，其中动作A(t)使用ε‑greedy贪婪算法进行选择；将状态S(t)和S(t+1)分别输入到评论家网络，并计算时差g＝Vt‑(R(t)+γVt+1)，其中Vt＝V(A(t),S(t)；ω(t))，Vt+1＝V(A(t+1),S(t+

1)；ω(t+1))，γ为衰落因子，0≤γ≤1；在执行选择的动作A(t)后进入下一个状态S(t+1)，得到奖励R(t+1)，进行演员网络参数θ和评论家网络参数ω的更新。