1.一种卫星云边协同计算的卸载方法,其特征在于,包括:基于终端‑卫星‑云的三层云边协同计算框架,构建任务在各层计算下的开销模型;
基于各所述开销模型,以总开销最小为优化目标,以卸载决策、CPU 工作频率和传输功率为优化变量,构建优化问题模型;
基于所述优化问题模型,采用模型辅助法和内点法对CPU 工作频率和传输功率进行优化求解,采用Q‑learning算法对卸载决策进行优化求解;
根据CPU 工作频率、传输功率以及卸载决策的最优求解结果,对所述任务进行卸载和计算;
其中,所述终端‑卫星‑云的三层云边协同计算框架包括IoT终端、低地球轨道卫星、地球同步轨道卫星以及云计算中心; 所述IoT终端接收到的任务选择本地计算、卸载到低地球轨道卫星计算以及通过地球同步轨道卫星卸载到云计算中心计算中任一种计算方式进行计算;
所述构建任务在各层计算下的开销模型包括:设第 个IoT终端接收到的任务为 , 分别为第 个IoT终端接收到的任务的大小、执行所需CPU周期数、时延需求;
构建第 个IoT终端的任务 在本地计算的开销模型 :;
式中, 为本地计算下的时延敏感系数, 为第 个IoT终端的任务 在本地计算的处理时延和处理能耗:;
;
式中, 为第 个IoT终端的CPU 工作频率,为电气系数;
构建第 个IoT终端的任务 在低地球轨道卫星计算的开销模型 :;
式中, 为低地球轨道卫星计算下的时延敏感系数, 为第 个IoT终端的任务 在低地球轨道卫星计算的处理总时延和处理总能耗:;
;
式中, 为第 个IoT终端的任务 在低地球轨道卫星计算的处理时延、传播时延; 为第 个IoT终端到低地球轨道卫星的传输时延、传输速率和传输距离; , 为第 个IoT终端到低地球轨道卫星的信道带宽和信道增益, 为第 个IoT终端的传输功率; 为低地球轨道卫星的CPU工作频率;为光速;
;
;
式中, 为第 个IoT终端到低地球轨道卫星的传输能耗, 为第 个IoT终端的任务 在低地球轨道卫星计算的处理能耗;
构建第 个IoT终端的任务 在云计算中心计算的开销模型 :;
式中, 为云计算中心计算下的时延敏感系数, 为第 个IoT终端的任务 在云计算中心计算的处理总时延和处理总能耗:;
;
式中, 为第 个IoT终端到地球同步轨道卫星的传输时延、传输距离和传输速率; , 为第 个IoT终端到地球同步轨道卫星的信道带宽和信道增益; 为地球同步轨道卫星到云计算中心的传输时延、传输距离和传输速率; ,为地球同步轨道卫星到云计算中心的信道带宽和信道增益, 为地球同步轨道卫星的传输功率; 为第 个IoT终端的任务 在云计算中心的处理时延和传播时延, 为云计算中心的单核CPU工作频率,为参与计算的核心数量;
;
;
式中, 为第 个IoT终端到地球同步轨道卫星的传输能耗, 为地球同步轨道卫星到云计算中心的传输能耗, 为第 个IoT终端的任务 在云计算中心的处理能耗;
所述优化问题模型 为:;
式中, 为卸载决策, , 为第 个IoT终端选择的卸载决策, 为IoT终端的总数, 为第 个IoT终端选择本地计算、卸载到低地球轨道卫星计算、通过地球同步轨道卫星卸载到云计算中心计算;为IoT终端的传输功率,, 为IoT终端的CPU 工作频率, ;
为第 个IoT终端选择卸载决策 对应的时延敏感系数、处理时延和处理能耗;
;
所述优化问题模型 的约束条件为:;
;
;
;
;
;
;
;
;
;
式中, 为第 个IoT终端的任务 在本地计算、在低地球轨道卫星计算的处理能耗最大值; 为第 个IoT终端到低地球轨道卫星、第 个IoT终端到地球同步轨道卫星、地球同步轨道卫星到云计算中心的传输能耗; 为第 个IoT终端的CPU 工作频率最大值和传输功率最大值,为低地球轨道卫星的CPU 工作频率最大值和地球同步轨道卫星的传输功率最大值;
所述采用模型辅助法和内点法对CPU 工作频率和传输功率进行优化求解包括:以CPU 工作频率为优化变量,采用模型辅助法对开销模型 进行最小化求解:确定开销模型 :
;
通过导数等于零求解开销模型 的极值点 :;
通过约束条件 变换可得:;
根据约束条件 的变换结果确定可行解范围的下界 和上界 :;
;
根据下界 、上界 以及极值点 确定开销模型 的最小化求解结果:;
以CPU 工作频率和传输功率为优化变量,采用模型辅助法和内点法对开销模型 进行最小化求解:通过约束条件 变换可得:;
根据约束条件 的变换结果确定可行解范围的下界 和上界 :;
;
通过约束条件 变换可得:;
根据约束条件 的变换结果确定 ;
根据约束条件 的变换结果确定可行解范围的下界 和上界 :;
;
引入松弛变量 ,将约束条件 由不等式约束变换为等式约束:;
;
;
;
构建对数障碍函数 , ,并代入开销模型 得到模型 :;
式中, 为惩罚强度;
基于下界 、上界 、下界 、上界 以及模型 进行迭代,直至达到最大的迭代次数:;
;
式中, , ,学习率,为修正因子, ; 为模型 在当前解 处的梯度:;
式中, 为模型 与x轴、y轴方向相同的单位向量;
以传输功率为优化变量,采用模型辅助法和内点法对开销模型 进行最小化求解:通过约束条件 变换可得:;
;
根据约束条件 的变换结果确定 ;
根据约束条件 的变换结果确定可行解范围的下界 和上界 :;
;
通过约束条件 变换可得:;
;
根据约束条件 的变换结果确定 ;
根据约束条件 的变换结果确定可行解范围的下界 和上界 :;
;
引入松弛变量 ,将约束条件 由不等式约束变换为等式约束:;
;
;
;
构建对数障碍函数 , ,并代入开销模型 得到模型 :;
基于下界 、上界 、下界 、上界 以及模型 进行迭代,直至达到最大的迭代次数:;
;
式中, , ; 为模型在当前解 处的梯度:;
式中, 为模型 与x轴、y轴方向相同的单位向量;
所述采用Q‑learning算法对卸载决策进行优化求解包括:初始化学习率 、折扣因子 、探索因子 、迭代次数 ;
设置状态总数 和动作总数 :;
;
式中,为任务数量;
初始化 为零矩阵:
;
式中, 为 函数, 为创建一个大小 为的零矩阵;
令 ,重复以下步骤,直至 :随机选择状态 :
;
式中, 为 函数, 为生成一个 中的随机整数;
采用 策略选择动作 :若 ,则 ;
若 ,则 ;
式中, 为状态 下的最大Q值估计对应的动作;
计算奖励 :
;
式中, 为根据CPU 工作频率和传输功率的最优求解结果构建的开销模型;
更新状态 和动作 的Q值:;
式中, 为状态 下的最大Q值估计;
将更新后的状态 和动作 的Q值存入矩阵 ;
令 。
2.一种卫星云边协同计算的卸载装置,其特征在于,采用如权利要求1所述卸载方法,所述装置包括:开销模型构建模块,用于基于终端‑卫星‑云的三层云边协同计算框架,构建任务在各层计算下的开销模型;
优化模型构建模块,用于基于各所述开销模型,以总开销最小为优化目标,以卸载决策、CPU 工作频率和传输功率为优化变量,构建优化问题模型;
模型求解模块,用于基于所述优化问题模型,采用模型辅助法和内点法对CPU 工作频率和传输功率进行优化求解,采用Q‑learning算法对卸载决策进行优化求解;
卸载计算模块,用于根据CPU 工作频率、传输功率以及卸载决策的最优求解结果,对所述任务进行卸载和计算。
3.一种电子设备,其特征在于,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1所述方法的步骤。
4.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1所述方法的步骤。
5.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1所述方法的步骤。