利索能及
我要发布
收藏
专利号: 202211270835X
申请人: 中国矿业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种能量收集辅助的矿山物联网智能计算卸载方法,其特征在于,具体步骤如下:步骤1:针对煤矿井下的复杂环境,通过在矿山物联网设备近端布置多个边缘服务器提供视距LOS通信并增强覆盖范围,使用能量收集EH技术辅助矿山环境下难以频繁更换电池的物联网设备供电,构建一个矿山物联网设备和M个井下边缘服务器组成的矿井MEC网络架构模型,其中矿山物联网设备安置了能量收集EH技术的产能模块为矿山物联网设备的电池充电,并且矿山物联网设备周围的井下边缘服务器分布在矿井下的不同位置,通过无线与矿山物联网设备进行数据连接,该模型中的矿山物联网设备可基于信道条件、矿山物联网设备的电池电量信息选择最优的边缘服务器进行任务处理;

步骤2:针对矿山物联网应用中待处理的计算任务不仅数据密集而且时延敏感的问题,因此设计矿井MEC网络架构模型计算卸载的优化目标,不仅兼顾矿山物联网设备的能量损耗与计算时延,也将矿山物联网设备的电池电量不足以完成一次完整计算卸载过程的任务失败情形作为重要指标,综合定义矿山物联网设备的计算卸载效益函数包含任务共享收益、能量损耗、计算时延和任务失败率函数,将最大化计算卸载效益函数作为优化目标;

步骤3:充分考虑井下导致信号衰落的复杂多变因素和时空变化的各类干扰,由于目前尚欠缺面向煤矿井下复杂环境的无线传输信道模型,因此将矿山物联网设备计算卸载过程建模成马尔科夫决策过程,并将无线传输信道带宽B建模成马尔科夫链,用来简化和表征矿山物联网设备与井下边缘服务器之间的信号传输速率,利用不依赖模型的强化学习算法动态探索最优计算卸载策略;

步骤4:构建基于DDPG算法的矿山物联网计算卸载机制,构建矿山物联网计算卸载系统下的深度强化学习模型,将矿山物联网设备作为学习智能体在复杂多变的矿山物联网环境中根据系统状态动态探索计算卸载策略,实现最优计算卸载效益的目标;

步骤1具体包括:

步骤1.1:对矿井MEC网络的计算卸载过程具体建模:M个边缘服务器部署在矿山物联网(k)设备可视距通信的范围内;物联网设备至边缘服务器的无线信道带宽为Bi ,其中1≤i≤(k) (k)M,物联网设备在时隙k内选择无线信道带宽最大的井下边缘服务器i,并将R x Bit计算(k) (k) (k)任务量卸载至该边缘服务器i,其中x (0≤x ≤1)为卸载率,当x =0时,矿山物联网设(k)备本地处理全部计算任务;当x =1时,矿山物联网设备将所有计算任务卸载到无线信道(k) (k) (k)带宽最大的井下边缘服务器;当0≤x ≤1时,该矿山物联网设备将R x Bit数据卸载至(k) (k)无线信道带宽最大的井下边缘服务器i,剩余的(1‑x )R Bit数据在本地处理;

步骤1.2:具体分析计算时延和能量损耗问题:矿山物联网设备进行本地计算,处理(k) (k)

1bit数据需要N个CPU周期,则本地计算需要(1‑x )R N个CPU周期,设CPU周期频率为f,本地计算1bit数据所需的时间为S1=N/f,利用e0表示物联网设备本地处理1bit数据消耗的能量, 和 分别表示矿山物联网设备的本地计算时延和能耗,表达式如下:(k) (k) (k)

矿山物联网设备通过带宽为Bi 的无线信道,在时隙k内卸载R x bit计算任务至边缘服务器i,S2表示井下边缘服务器计算1bit数据所需的时间,且有S1>>S2,表明边缘服务(k)器具有更强的计算处理能力;P为矿山物联网设备的发射功率;T1 和 分别表示任务卸载产生的时延和能耗,表达式如下:(k)

步骤1.3:对再生能源和任务失败问题具体建模:令时隙k内收集的能量为g ,且本地计算和计算卸载的总能量损耗为 矿山物联网设备的电池电量表示为b(k) (k+1)

,b 则表示获取EH产能后下一时刻的电池电量,其表达式如下:

(k+1) (k) (k) (k)

b =max{b ‑E +g ,0}                        (5)(k+1) (k+1)

设计指示函数Ι(b =0)表示任务能否成功处理,其中若I(b =0)中函数体不成立时函数值为0,表示电量充足任务可成功处理;反之,则表示任务因电量不足而处理失败,即:步骤2中,矿山物联网应用中待处理的计算任务不仅数据密集而且时延敏感,包括实时检测甲烷浓度的时延敏感型计算任务、采煤工作面高效运行大量感知参数处理的数据密集型任务以及火灾/爆炸警报的生命保障型任务;通过设计矿山物联网设备计算卸载机制的优化目标,不仅兼顾矿山物联网设备的能量损耗与计算时延,也将减小任务失败率作为重要指标,定义由任务共享收益、能量损耗、计算时延和任务失败率共同组成的计算卸载效益函数,具体如下:由于本地和卸载处理计算任务同时进行,那么执行部分卸载方案时的总时延为本地处理时延与卸载时延的较大值,即MEC卸载模型总的计算时延定义为 当Ι(k+1)

(b =0)=0时,矿山物联网设备将计算任务卸载至边缘服务器,可降低资源有限的矿山(k) (k) (k+1)物联网设备的任务处理负担,得到任务共享收益θ0x R ;当Ι(b =0)=1时,计算任务(k)因电量不足而处理失败,无任务共享收益;于是,效益函数U 用如下分段函数表示:式中θx(x=0,1,2,3)为各项指标的权重值;将最大化计算卸载效益函数作为优化目标,即:max(U);                                (8)步骤4中,提出基于DDPG的矿山物联网计算卸载机制,构建了矿山物联网计算卸载系统下的深度强化学习模型,利用DDPG算法得到最优任务卸载策略,以实现步骤2中的优化目标,具体包括如下步骤:步骤4.1、初始化相关学习参数,包括学习率α、折扣因子γ、记忆池大小、OU噪声参数、软更新学习率κ(κ<<1)、回合数以及回合内探索步长;初始化DDPG算法涉及的Actor网络参数ξ2及Critic网络参数ξ1,通过将ξ1和ξ2赋值给Target Critic网络参数ξ1′和Target Actor网络参数ξ2′,完成两个Target网络参数的初始化,随机给出初始系统状态进行回合探索以及网络训练;

步骤4.2、进行回合内的一步探索,即时隙数k+1,Actor网络基于当前输入的初始化系(k)统状态s 输出确定性动作 矿山物联网设备基于 和OU过程采样得

(k)

到的噪声 选择计算卸载策略a ,具体公式如下:

(k)

接下来,矿山物联网设备执行计算卸载策略,即选择对应的边缘服务器i 和卸载率x(k) (k),并根据公式(7)评估得到奖励U ,即计算卸载效用值;然后根据计算卸载过程观察MEC(k+1)网络状态更新得到下一步状态s ;具体来说,无线信道带宽和EH产能通过马尔科夫链转移,矿山物联网设备的电池电量根据计算卸载执行后的能耗、EH产能以及前一个时隙的电(k) (k) (k) (k+1)池电量情况而更新;随后,将上述元素组成计算卸载经验(s ,a ,U ,s )存储到经验池;

步骤4.3、判断经验池的计算卸载经验数是否达到Z;若没有,则直接跳转至步骤4.4,继续探索累计计算卸载经验,直至计算卸载经验不断累计达到Z组;若有,则基于经验回放技术,矿山物联网设备从经验池中随机采样Z组计算卸载经验,即(sh,ah,Uh,sh+1),h∈[1,Z],并利用这些计算卸载经验迭代更新四个神经网络参数,包括Actor网络参数ξ2、Critic网络参数ξ1、Target Actor网络参数ξ2′、Target Critic网络参数ξ1′;其中用Adam优化器作为梯度下降算法更新Critic网络参数ξ1,具体公式如下:通过随机梯度下降SGD算法更新Actor网络参数ξ2具体公式如下:

Target Actor网络参数ξ2′和Target Critic网络参数ξ1′则以学习率κ(κ<<1)进行软更新来放慢对Actor网络参数和Critic网络参数的追踪速度,具体软更新过程如下:ξ1′=κξ1+(1‑κ)ξ1′and ξ2′=κξ2+(1‑κ)ξ2′          (14)步骤4.4、最后,判断时隙数是否达到最大回合内训练步长数,若没有,则令下一步状态(k+1) (k)s 为新的初始化系统状态s ,回到步骤步骤4.2;若有,则结束回合训练。

2.根据权利要求1所述的一种能量收集辅助的矿山物联网智能计算卸载方法,其特征在于,步骤3中,根据步骤1具体所述的矿井MEC网络架构模型和步骤2所述的计算卸载优化目标,同时针对目前尚欠缺面向复杂环境的无线通信理论来精确刻画井下通信模型的问题,将矿山物联网设备计算卸载过程建模成马尔科夫过程,并将信道带宽B建模成马尔科夫链,并用来简化和表征信号传输速率;建立系统状态、动作及奖励函数,得到深度强化学习框架如下:(k) (k) (k)

令矿山物联网设备作为学习智能体;在时隙k内,动作a =[i ,x ]为计算卸载策(k) (k) (k) (k)略,其中,i 表示选择井下边缘服务器i,x (0≤x ≤1)为卸载率;系统状态s ,即由物联网设备到边缘服务器的无线信道带宽、EH产能和电(k)

池电量组成;将计算卸载效益函数作为系统奖励U 。