1.一种车联网中基于移动边缘计算的内容缓存决策和资源分配联合优化方法,其特征在于:该方法包括以下步骤:
S1:将内容缓存决策和资源分配建模成马尔可夫决策过程;
在步骤S1中,一个路侧单元RSU覆盖范围内为车辆用户分配正交信道,RSU内没有传输干扰;对RSUm下的车辆v的下行链路的信干噪比γv,m进行量化,分为D个区间,当γv,m处于某个区间内时,用对应量化值表示信干噪比,当γ0≤γv,m<γ1时,用Γ1表示信噪比的值;
网络可用的总带宽大小为B,平均分成K个子信道,每个子信道大小为b;
移动边缘计算MEC服务器可用总计算资源为F,分为N部分,每部分计算资源为f, 为MEC服务器分配给车辆v的计算资源; 为车辆v本地的计算资源大小;
所有车辆共请求C个内容,c∈{1,2,...,C},内容c的大小为lc,MEC服务器的储存空间为L; 表示内容c已经储存在MEC服务器; 则表示内容c没有储存在MEC服务器;
经过量化后,缓存决策和资源分配不是离散的,缓存决策与资源分配能够建模成马尔可夫决策过程;
S2:根据优化目标和网络信息确定系统状态;
在所述步骤S2中,模型中系统状态由三个参数表示,车辆v与RSUm之间的信干噪比γv,m;内容c存储指示参数 MEC服务器为计算任务 分配的计算资源S3:根据优化目标和系统状态确定系统行为;
在所述步骤S3中,模型中系统行为包括信道分配,内容缓存决策,任务计算节点的选择和MEC服务器计算资源分配;
S4:根据优化目标、系统状态和系统行为确定系统奖励;
在所述步骤S4中,模型中系统奖励是将信道分配收益、内容缓存收益和计算资源分配收益之和作为奖励;
S5:根据系统状态,行为和奖励,得出最优内容缓存决策和资源分配。
2.根据权利要求1所述的一种车联网中基于移动边缘计算的内容缓存决策和资源分配联合优化方法,其特征在于:在所述步骤S1中,对优化问题进行建模;装配有车载单元OBU的车辆,RSU与相连的MEC组成两层网络;MEC服务器部署在RSU侧,配备OBU的车辆通过V2I技术与RSU连接,车辆的分布服从泊松分布1‑D PPP模型; 表示RSU/MEC服务器的集合, 表示RSUm范围内的卸载请求车辆集合,v表示RSUm覆盖范围内车辆v;将车辆v与RSUm之间的信干噪比、信道资源、MEC计算资源量化,内容决策是0‑1的二元变量,缓存决策与资源分配能够建模成马尔可夫决策过程。
3.根据权利要求2所述的一种车联网中基于移动边缘计算的内容缓存决策和资源分配联合优化方法,其特征在于:在所述步骤S4中,信道分配收益等于车辆用户的传输速率与租用信道的代价差值;内容缓存收益等于MEC服务器存储内容减少的时延与存储内容的代价差值;计算资源收益等于MEC服务器分配给车辆用户的计算资源与使用计算资源的代价差值。
4.根据权利要求1所述的一种车联网中基于移动边缘计算的内容缓存决策和资源分配联合优化方法,其特征在于:在所述步骤S5中,根据系统状态、行为和奖励,利用深度强化学习中的深度Q网络DQN方法,得出最优行为,行为包括内容缓存决策和资源分配。