1.一种车联网节能联合计算卸载与资源分配方法,其特征在于,包括以下步骤:
对路边单元的感知数据与任务车辆的感知数据进行融合处理,生成计算任务;
利用K均值任务分类方法对计算任务分类,分为在本地执行的计算任务、以及在可卸载车辆或边缘服务器执行的计算任务;
根据任务车辆将计算任务卸载到可卸载车辆或边缘服务器的长期时延约束和长期能耗约束,构建出计算任务的最小化排队时延模型;表示为:s.t.C1:
C2:
C3:
C4:
C5:
其中,I表示任务车辆数量;K表示卸载节点数量,包括可卸载车辆和边缘服务器;T表示时隙数量;wi,k(t)表示任务ψi(t)在卸载节点k处的排队延迟,xi,k(t)表示任务车辆vi对于卸载节点的选择函数,xi,k(t)=1表示任务车辆vi选择卸载节点k,xi,k(t)=0表示任务车辆vi不选择卸载节点k; 表示t时隙时在可卸载车辆或边缘服务器执行的计算任务集合;C1表示每辆车在一个时隙内只能选择一个卸载节点, 表示时隙集合;C2和C3表示卸载节点分配给任务卸载请求车辆的计算资源之和不能超过该卸载节点最大计算能力, 表示任务ψi(t)卸载到RSU上的MEC服务器中, 表示由第m个RSU上的MEC服务器分配给任务ψi(t)的计算资源, 表示到第m个RSU上的MEC服务器的最大计算能力, 表示RSU集合;
表示任务ψi(t)卸载到可卸载车辆, 表示由第j个可卸载车辆分配给任务ψi(t)的计算资源, 表示第j个可卸载车辆的计算能力; 表示可卸载车辆集合;C4是长期排队延迟约束,tQ是计算任务的排队时延上限,Li,k(t)表示在卸载节点k上任务车辆vi的任务队列积压, 是基于时间平均的任务到达率,E[]表示求期望;Ei,k(t)表示在时隙t时在卸载节点k上任务车辆vi的能耗;Et表示在时间段T内系统的平均能耗;
利用李雅普诺夫优化算法将最小化排队时延模型的长期时延约束和长期能耗约束转化为队列稳定性约束,构建出优化后的最小化排队时延模型;采用李雅普诺夫优化方法对长时延约束C4和能耗约束C5进行变换,采用两个虚拟队列对长时间能耗和长时间时延约束进行重构,表示为:s.t.C1:
C2:
C3:
其中, 表示任务ψi(t)在卸载节点k处在时隙t的一个虚拟队列, 表示任务ψi(t)在卸载节点k处在时隙t的另一虚拟队列, 是控制李雅普诺夫漂移函数和目标函数Ti(t)重要性的权重因子;
根据任务车辆将计算任务卸载到可卸载车辆或边缘服务器的过程,将优化后的最小化排队时延模型建模为马尔科夫决策过程;
利用深度强化学习模型对马尔科夫决策过程进行求解,计算出最优的卸载决策和资源分配决策。
2.根据权利要求1所述的一种车联网节能联合计算卸载与资源分配方法,其特征在于,所述对路边单元的感知数据与任务车辆的感知数据进行融合处理包括路边单元和车辆各自获取感知数据;路边单元对获取的感知数据进行估计,得到感知数据的局部参数;路边单元向车辆上传所述局部参数;车辆对获取的感知数据以及路边单元上传的所述局部参数进行数据融合处理,生成融合计算任务。
3.根据权利要求1所述的一种车联网节能联合计算卸载与资源分配方法,其特征在于,所述利用K均值任务分类方法对计算任务分类,分为在本地执行的计算任务、以及在可卸载车辆或边缘服务器执行的计算任务包括根据当前计算任务的最大可容忍时延与所有计算任务的最大可容忍时延之和的比值,得到当前计算任务的时延因子;根据当前任务所需的计算资源与所有计算任务所需的计算资源之和的比值,得到当前计算任务的计算因子;将当前计算任务的时延因子和计算因子依次作为当前计算任务的横纵位置坐标;利用欧式距离公式计算得到当前计算任务与两个质心计算任务的距离;若当前计算任务与某一质心计算任务的欧式距离最小,则将当前计算任务聚类到对应的质心计算任务中;计算出每个聚类中除质心计算任务以外的所有计算任务的横纵位置坐标的平均值,将该横纵位置坐标的平均值作为更新后的质心计算任务的横纵位置坐标,直至确定出在本地执行的计算任务聚类、以及在可卸载车辆或边缘服务器执行的计算任务聚类。
4.根据权利要求3所述的一种车联网节能联合计算卸载与资源分配方法,其特征在于,初始的质心计算任务的横纵位置坐标的确定方式包括:根据所有计算任务的最大可容忍时延的均值,与所有计算任务的最大可容忍时延之和的比值,得到本地执行的计算任务聚类所代表的初始质心计算任务的时延因子;
根据所有计算任务所需的计算资源的均值与车辆计算能力的乘积,将该乘积与所有计算任务所需的计算资源之和的比值,得到本地执行的计算任务聚类所代表的初始质心计算任务的计算因子;
根据所有计算任务的最大可容忍时延的均值,与所有计算任务的最大可容忍时延之和的比值,得到在可卸载车辆或边缘服务器执行的初始质心计算任务的时延因子;
根据所有计算任务的最大可容忍时延的最大值与车辆计算能力的乘积,将该乘积与所有计算任务所需的计算资源之和的比值,得到在可卸载车辆或边缘服务器执行的初始质心计算任务的计算因子。
5.根据权利要求1所述的一种车联网节能联合计算卸载与资源分配方法,其特征在于,所述利用本地车辆将计算任务卸载到可卸载车辆或边缘服务器的过程,将队列稳定性约束建模为马尔科夫决策过程包括根据当前队列信息,确定出车辆的状态向量;根据车辆选择可卸载车辆或边缘服务器进行计算卸载,确定出车辆的动作向量;根据车辆的队列稳定性约束,确定出车辆在折扣因子下所获得的奖励;根据车辆从当前状态开始,选择动作后,确定出进入下一个状态的转移概率。
6.根据权利要求1所述的一种车联网节能联合计算卸载与资源分配方法,其特征在于,利用深度强化学习模型对马尔科夫决策过程进行求解,计算出最优的卸载决策和资源分配决策包括车辆利用ε‑greedy算法选择卸载节点,依据所选节点计算奖励,并转移到下一个状态Si(t+1);采用神经网络来逼近行为‑值函数,其中θ是神经网络参数的集合;将转换序列 存储在经验池中,随机抽样l作为小批量执行,计算损失,并更新网络参数集θ;该算法采用两个神经网络分别逼近两个动作‑值函数,当前行为‑‑值函数 的参数集θ每次迭代都需要更新以减少和目标值的均方误差;θ是目标行‑
为‑值函数 的参数集,θ 的值来自于之前迭代的θ值,不同于θ每一步都需要更‑
新,θ每隔指定的步数更新一次。