利索能及
我要发布
收藏
专利号: 2025111093898
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,包括:获取车辆产生的任务单元;

根据任务单元、预构建的车辆与路侧单元的通信模型,计算任务单元在车辆上执行时的处理时延和能耗、任务单元卸载至路侧单元的传输时延以及任务单元在路侧单元上执行时的处理时延和能耗;

根据任务单元在车辆执行时的处理时延和能耗、任务单元卸载至路侧单元的传输时延以及任务单元在路侧单元执行时的处理时延和能耗,计算车辆对任务单元的能耗成本函数和时间成本函数;

根据车辆对任务单元的能耗成本函数和时间成本函数,构建任务单元的时延能耗协同优化模型;

将所述时延能耗协同优化模型转化为路侧单元的马尔科夫决策模型,对所述马尔科夫决策模型进行在线决策,得到任务单元的卸载缓存结果;

所述任务单元的时延能耗协同优化模型表示为:;

其中, 表示任务单元的时延能耗协同优化模型的优化问题; 分别表示能耗权重系数、时延权重系数; 表示车辆对任务单元的能耗成本函数; 表示车辆对任务单元的时间成本函数; 表示约束; 分别表示第一约束、第二约束、第三约束、第四约束;表示任务单元的数量; 表示车辆的数量; 表示第t时刻任务卸载决策; 表示第t时刻路侧单元r分配给第i个任务单元的计算能力; 表示路侧单元r的计算能力上限; 表示第t时刻任务缓存决策; 表示第i个任务单元处理后的数据量大小; 表示路侧单元r的存储容量上限。

2.根据权利要求1所述的基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,所述预构建的车辆与路侧单元的通信模型表示为:;

其中, 表示预构建的车辆v与路侧单元r的下行传输速率; 表示信道带宽;

分别表示第t时刻车辆v和路侧单元 r之间的信道增益、传输功率; 表示加性高斯白噪声功率; 表示第t时刻车辆v和路侧单元r之间的干扰功率。

3.根据权利要求2所述的基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,所述任务单元在车辆上执行时的处理时延和能耗的计算包括:;

其中, 表示第i个任务单元在车辆v上执行时的处理时延; 表示第i个任务单元所需的计算量; 表示车辆v的本地计算能力; 表示第i个任务单元在车辆v上执行时的能耗;

表示车辆芯片结构的系数;

所述任务单元卸载至路侧单元的传输时延以及任务单元在路侧单元上执行时的处理时延和能耗的计算包括:;

其中, 表示第i个任务单元从车辆v卸载至路侧单元r的传输时延; 表示第i个任务单元的任务数据量大小; 表示预构建的车辆v与路侧单元r的下行传输速率; 表示第i个任务单元在路侧单元上执行时的处理时延; 表示第i个任务单元处理后的数据量大小; 表示第t时刻第i个任务单元在路侧单元r上执行时的任务缓存决策; 表示第t时刻路侧单元r分配给第i个任务单元的计算能力; 表示第i个任务单元在路侧单元r上执行时的能耗; 表示第t时刻车辆v和路侧单元 r之间的传输功率。

4.根据权利要求3所述的基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,所述车辆对任务单元的能耗成本函数的计算包括:;

其中, 表示车辆v在第t时刻任务卸载决策 条件下的总能耗;表示任务单元的数量; 表示第i个任务单元在车辆v上执行时的能耗; 表示第i个任务单元在路侧单元r上执行时的能耗; 表示任务单元全部在车辆v上执行时的能耗; 表示车辆对任务单元的能耗成本函数;表示车辆的数量;

所述车辆对任务单元的时间成本函数的计算包括:;

其中, 表示第i个任务单元在第t时刻任务卸载决策 和第t时刻任务缓存决策 条件下的总处理时延; 表示第i个任务单元在路侧单元上执行时的处理时延; 表示任务单元全部在车辆v上执行时的处理时延; 表示第i个任务单元在车辆v上执行时的处理时延; 表示车辆对任务单元的时间成本函数。

5.根据权利要求1所述的基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,所述路侧单元的马尔科夫决策模型表示为:;

其中, 表示第t时刻路侧单元的系统状态; 表示第t时刻路侧单元的系统动作;

表示第t时刻路侧单元的奖励函数; 表示第t时刻车辆v和路侧单元 r之间的信道增益; 表示加性高斯白噪声功率; 表示第t时刻车辆v和路侧单元r之间的干扰功率; 分别表示第t时刻任务卸载决策、第t时刻任务缓存决策; 表示第t时刻车辆的传输功率决策; 表示任务单元的时延能耗协同优化模型的成本函数; 分别表示能耗权重系数、时延权重系数; 表示车辆对任务单元的能耗成本函数; 表示车辆对任务单元的时间成本函数。

6.根据权利要求5所述的基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,采用META‑A3C算法,对所述马尔科夫决策模型进行在线决策,得到任务单元的卸载缓存结果,包括:根据路侧单元的奖励函数确定第t时刻时延能耗关联系数 ,根据第t时刻时延能耗关联系数确定第t时刻优化场景类型 ,根据第t时刻优化场景类型生成决策任务 ;其中, 表示获取第t时刻时延能耗关联系数构成的优化场景类型;表示第n种优化场景类型;

从历史任务数据集 中取出K个样本数据,根据K个样本数据计算决策任务 的损失函数 ,根据决策任务 的损失函数更新策略网络 的参数、价值网络的参数,得到更新策略网络 、更新价值网络 ;其中, 、 分别表示策略网络 的参数、价值网络 的参数; 分别表示更新策略网络的参数、更新价值网络 的参数;表示路侧单元的系统状态;表示路侧单元的系统动作;表示网络参数;

根据更新策略网络 、更新价值网络 ,计算决策任务 的更新损失函数 ,根据决策任务 的更新损失函数 计算元损失函数 ;

根据元损失函数 ,对更新策略网络 的参数、更新价值网络的参数进行全局更新,得到全局策略网络 、全局价值网络 ;其中,分别表示全局策略网络 的参数、全局价值网络 的参数;

根据全局策略网络 的参数、全局价值网络 、第t时刻路侧单元的系统状态 ,执行第t时刻路侧单元的系统动作 ,获取第t时刻路侧单元的系统奖励 和第t+1时刻路侧单元的系统状态 ;生成任务数据( , , , ),执行任务数据并将任务数据存储在决策任务 的经验缓存器中,更新历史任务数据集 ;

其中,第t时刻路侧单元的系统动作 为任务单元的卸载缓存结果;

重复执行,直至得到所有任务单元的卸载缓存结果。

7.根据权利要求6所述的基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,所述决策任务 的损失函数 表示为:;

其中, 表示第t时刻的数学期望; 分别表示第1个样本的第t时刻、第2个样本的第t时刻、…、第K个样本的第t时刻; 表示叠加因子;

表示使用价值网络 估计在系统状态 下执行系统动作 的动作价值; 表示使用价值网络 估计在系统状态 下执行系统动作 的动作价值;

更新策略网络 的参数 、更新价值网络 的参数 分别表示为:;

其中, 分别表示策略网络 的学习率、价值网络 的学习率; 表示关于参数 的梯度运算。

8.根据权利要求7所述的基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,决策任务 的更新损失函数 表示为:;

其中, 表示第t时刻的数学期望; 分别表示第1个样本的第t时刻、第2个样本的第t时刻、…、第K个样本的第t时刻; 表示叠加因子;

表示使用更新价值网络 估计在系统状态 下执行系统动作 的动作价值; 表示使用更新价值网络 估计在系统状态 下执行系统动作 的动作价值; 表示参数更新过程;

所述元损失函数 表示为:

其中, 表示优化场景类型集合。

9.根据权利要求8所述的基于时延‑能耗协同优化的车联网任务卸载缓存方法,其特征在于,全局策略网络 的参数 、全局价值网络 的参数 分别表示为:;

其中, 表示元学习率; 表示关于参数 的梯度运算; 表示元损失函数。