买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于RIS辅助的NOMA边缘计算动态任务传输功率分配方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于RIS辅助的NOMA边缘计算动态任务传输功率分配方法

￥20300

专利号： 202310553022X

申请人：重庆邮电大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-04-09

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于RIS辅助的NOMA边缘计算动态任务传输功率分配方法，其特征在于，包括以下步骤：S1：构建RIS‑NOMA边缘计算任务传输系统，该系统包括：配备M根天线和MEC服务器的AP、K个单天线的UE、以及具有N个反射元件的RIS；通过控制RIS的相移改变AP和每个UE之间的信道增益；每个UE将计算任务划分为本地计算任务和边缘计算任务；每个UE采用上行NOMA分别通过UE‑RIS‑AP链路和UE‑AP链路同时将边缘计算任务传输到AP，AP接收到叠加信号，利用SIC技术进行解码并进行边缘计算；

所述AP接收到叠加信号包括：

其中，为第k个UE的传输功率，为均值和单位方差为零的传输信号，2

为以σ为噪声功率的AP端的加性高斯白噪声，IM是一个M×M的单位向量矩阵，表示第k个UE到RIS的信道增益系数，表示第k个UE到AP的信道增益系数，G表示RIS到AP的信道增t益系数，Θ 表示RIS的反射系数矩阵；

S2：根据UE动态任务到达及处理的过程构建排队模型，在队列长度约束下成立UE端总成本表达式；

所述构建排队模型包括：

S21：调整UE端芯片的电压控制UE端的CPU频率；

其中，g为有效的开关电容，表示第k个UE的本地计算功率；

S22：根据UE端的CPU频率和UE端处理一bit任务数据所需的CPU周期数量计算UE端在单个时隙内本地计算的任务bit数量；

其中，表示第k个UE端在第t个时隙内本地计算的任务bit数量，Lk表示第k个UE端处理一bit任务数据所需的CPU周期数量，τ0表示单个时隙的长度，表示用户k的CPU频率S23：根据UE在RIS‑NOMA边缘计算任务传输系统中的数据传输速率计算UE端在单个时隙内传输到AP端的任务bit数量；

其中，表示第k个UE端的数据传输速率，表示第k个UE端在第t个时隙内传输到AP端的任务bit数量；

S24：根据UE端在单个时隙内本地计算的任务bit数量和传输到AP端的任务bit数量构建排队模型；

所述排队模型包括：

其中，表示第t+1个时隙任务队列的长度，表示在时隙t期间到达用户k的任务bit数，表示在时隙t期间处理的总任务bit数；

所述UE在RIS‑NOMA边缘计算任务传输系统中的数据传输速率包括：其中，B表示系统的带宽，表示第k个UE在时隙t内的信噪比，2

为波束赋形向量，σ为噪声功率，为第k个UE的传输功率，为第k个UE在t时隙内的总信道增益；

S3：利用惩罚理论加入惩罚因子将队列约束转换为稳定性表达式构建UE端总成本稳定表达式；

所述UE端总成本表达式包括：

其中，ω1∈[0,1]和ω2∈[0,1]为非负权重系数且满足ω1+ω2＝1，T表示时隙最大值，即t∈{1,...,T}，Ck表示UE端总成本表达式，表示预定义的平均队列长度值，对于所有的UE，其平均队列长度不超过为第k个UE的传输功率，表示第k个UE的本地计算功率；

所述UE端总成本稳定表达式包括：

其中， V1表示为加权参数，表示虚拟队列；

S4：根据马尔可夫的决策过程对RIS‑NOMA边缘计算任务传输过程进行建模得到基于RIS‑NOMA边缘计算任务传输的MDP模型；

所述基于RIS‑NOMA边缘计算任务传输的MDP模型Ξ包括：其中，象征状态空间，为动作空间，表示奖励，为状态转移概率；

状态空间

其中，表示信道状态，表示用户队列任务数据bit数；

动作空间

其中，表示本地计算功率集合表示任务传输发射功率集合表示无源相移器的相移集合

奖励

其中，C′k表示UE端总成本稳定表达式；

状态转移概率：设表示状态转移概率，即给定状态s和所选择的动t t+1

作a后到达状态s 的概率分布；

S5：根据基于RIS‑NOMA边缘计算任务传输的MDP模型以UE端总成本最小化为目标利用DDQN算法计算得到最优的UE传输功率分配方案；

所述利用DDQN算法计算得到最优的用户功率分配方案包括：S51：指定奖励衰减因子γ，随机初始化Q网络的参数，构建DDQN方法所需的目标网络Q'，目标网络Q'网络的网络结构及网络参数与Q网络相同，指定目标网络Q'网络的更新步长J；指定经验回放梯度批量下降的每批次采样样本数W，清空经验回放合集D；指定探索率ε；

S52：初始化系统环境，将初始化环境状态向量赋值给当前环境状态s；

t t

S53：将当前环境状态s作为输入向量输入Q网络，得到所有对应的输出Q(s ,a)；

使用ε‑greedy策略在输出中选择动作a，ε‑greedy策略：π表示策略函数；

t t t

S54：在当前环境状态的变量s下执行动作a，转换环境状态，得到动作执行后状态s 与t t t t t+1动作执行过程中的奖励反馈r，将过度序列(s ,a ,r ,s )存入经验回放合集D；

S55：使用均方差损失函数，采用随机梯度下降法更新Q神经网络参数；

S56：根据DDQN方法流程，每经过J轮迭代，更新目标网络Q'网络为Q网络，即更新网络参数；

t+1 t

S57：将动作执行后状态s 赋值给当前环境状态s，转至步骤S53进行下一轮迭代；

所述均方差损失函数如下：

t t‑