利索能及
我要发布
收藏
专利号: 2021101222362
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种时延感知的云雾协作视频分发方法,其特征在于:包括以下步骤:采集用户、云节点和雾节点的状态信息:用户向雾节点发送视频请求,所述视频请求包括用户请求的视频、视频比特率版本以及用户播放缓冲区的大小,雾节点将所述视频请求以及自身的缓存和计算资源发送到集中控制器;

构建视频请求调度模型:集中控制器根据用户请求视频的信息,判断云节点和雾节点是否缓存了该视频或者更高的视频比特率,进而根据资源分配策略,建立视频请求调度模型;

分析用户观看视频时的时延:集中控制器通过分配的无线资源和计算资源计算不同视频请求调度下的时延,分析用户获取视频的具体路径,以最小化用户观看视频的时延为优化目标,构建目标函数;

确定视频请求调度策略、视频缓存决策,计算和无线资源分配:在保证用户时延的约束条件下,集中控制器利用Actor‑Critic深度强化学习算法对目标函数进行优化,得到用户的视频请求调度策略、视频缓存决策、计算和无线资源分配方案。

2.根据权利要求1所述的时延感知的云雾协作视频分发方法,其特征在于:所述用户状态信息包括:用户的视频请求 表示用户请求第v个视频,比特率版本为 的视频片段,其中,v∈V表示系统中共有V个视频, 表示视频比特率版本的集合,l代表用户i当前时刻的播放缓冲队列长度表示为:li(t)=max[li(t‑1)‑ui(t‑1),0]+L其中,li(t‑1),ui(t‑1)表示时刻(t‑1)用户i的播放缓冲区长度和视频播放速度,L表示每个视频片段的固定长度。

3.根据权利要求1所述的时延感知的云雾协作视频分发方法,其特征在于:所述雾节点的状态信息包括:分配给雾节点n子的子信道数目 分配的子信道数目不超过系统子信道的总数即 雾计算服务器n的缓存容量为Mn,每个雾节点n缓存的视频总量不能超过其存储空间大小Mn,即 n≠0,v∈V;缓存决策变量用来表示雾节点n是否缓存了视频 当视频 由雾节点n缓存时,否则 雾节点n的可用计算资源F(n,t)在时隙t时服从独立分布的随机过程,F(n,t)在 服从均值为 的分布,单位是CPU周期/秒。

4.根据权利要求1所述的时延感知的云雾协作视频分发方法,其特征在于:所述云节点的状态信息包括:云节点的缓存容量M0,云节点中缓存的视频总量不超过其存储空间大小M0;云节点中的计算资源与雾节点的计算资源模型一样,但云节点中的计算资源远大于雾节点中的计算资源即F(0,t)>>F(n,t)。

5.根据权利要求1所述的时延感知的云雾协作视频分发方法,其特征在于:所述视频请求调度模型具体为:

当视频请求 到达雾节点n时,云雾协作缓存与转码的动态自适应视频流共有7种传输模式,用二进制变量 表示;用户请求的视频比特率版本为

当 时,表示视频 缓存在雾节点n处,直接从缓存处向用户提供服务,否则,当 时,表示雾节点n将 转码为 后向用户提供服务,否则,当 时,表示用户请求的视频片段 没有直接缓存在雾节点n处,而是由相邻的雾节点n'通过光纤传输到雾节点n处向用户提供服务,否则,当 时,表示用户请求的视频片段 没有直接缓存在雾节点n处,相邻雾节点n'缓存了更高的视频版 利用转码器转码后,通过光纤传输到雾节点n向用户提供服务,否则,

当 时,表示用户请求的视频片段 没有直接缓存在雾节点n处,相邻雾节点n'缓存了更高的视频版 先通过光纤传输到雾节点n处,然后雾节点n的转码器转码向用户提供服务,否则,

当 时,表示视频 缓存在云节点中,通过前传链路将视频发送到雾节点n处向用户提供服务,否则,

当 时,表示在云节点中将 转码为 后,通过前传链路将视频 发送到雾节点n处向用户提供服务,否则,视频请求到达雾节点时,会出现以上情况中的一种,为了确保每一个请求都能被服务,要满足请求调度约束,即

6.根据权利要求1所述的时延感知的云雾协作视频分发方法,其特征在于:所述用户观看视频时的时延具体为:

首先,采用频分正交多址技术将频谱分配给雾节点的每个用户,用户i和雾节点n之间的信噪比计算为

2

其中,σ(t)为加性高斯白噪声功率, 表示雾节点n和用户i之间的信道增益, 为雾节点n到用户i的发射功率,pn'(t)和gn'(t)分别为雾节点n'(n'≠n)到用户i的发射功率和信道增益;

系统的总频带带宽为BHz,分为若干个子信道,每个子信道的大小为bHZ,共有B/b个子信道,用 表示时隙t雾节点n为用户i分配子信道的数量,用户的下载速率表示为然后计算用户请求视频的传输时间:当 时,表示雾节点n缓存了用户请求的视频 由雾节点n传输给用户的时间为:

其中, 表示视频文件的大小;

当 时,表示选择在雾节点n处进行转码传输,视频传输的时间包括雾节点n中的转码时间和视频片段的传输时延,由雾节点n转码传输的时延计算为其中, 由公式 求出,表示将 转码为 所需要的CPU周期数,cn(cycles/bit)表示节点n处理1bit数据所需要的CPU周期数;

当 时,表示选择从相邻雾节点n'处向目标雾节点n传输,再由雾节点n向用户传输,所消耗的时间为

其中,a表示从相邻节点传输到目标雾节点的跳数,所需要的传输时间为aτ,τ表示雾节点之间传输的时间,与距离成正比;

当 时,表示从相邻雾节点n'处转码后发送到目标雾节点n,所消耗的时间为当 时,表示从相邻雾节点n'处送到目标雾节点n处进行转码处理和传输,所消耗的时间为

当 时,表示从云节点的缓存中向目标雾节点提供服务,由云节点直接命中并传输的时间为

其中c1代表前传链路的传播时延,跟基站到BBU池的距离有关;

当 表示用户请求的视频片段 被云节点转码命中,利用云中强大的计算能力进行转码传输,云节点转码命中总的时间表示为最后,视频 请求传输到用户i的时间为:为保证视频观看的流畅程度,Tni的时间消耗必须满足Tni≤li,否则用户i在观看视频时会出现Dni=Tni‑li的时间延迟,因此减少用户观看视频过程中的时间延迟,表示为

7.根据权利要求1所述的时延感知的云雾协作视频分发方法,其特征在于:所述视频请求调度策略、视频缓存决策,计算和无线资源分配,包括以下步骤:首先将最小化时延问题转化为强化学习模型:状态空间:假设在时隙t处, 表示前节点视频缓存的情况,当n=0时表示云节点中视频缓存的状态,n={1,2,...,i}时表示雾节点中视频的缓存状态,Pn表示节点中可用的计算资源数量,Bn,n≠0表示雾节点中可用的子信道数目,在时刻t时系统的状态空间S表示为:动作空间:在时隙t时系统的动作空间 包括视频 的缓存策略用户i的视频请求调度决策Qi、分配给用户i的计算资源fni和无线资源数目Bni,A中的每一个动作向量都满足约束条件;

奖励:在时隙t时,在一个确定的状态s(s∈S)下采取动作a(a∈A),环境立即给代理一个奖励值R,状态由st→st+1,将立即奖励设置为优化目标的相反数即表示为最小化播放延迟,奖励函数设置为:

定义期望回报为:

其中γ是折扣因子,γ∈[0,1],实际的价值函数是通过立即奖励和未来奖励组成的状π

态‑动作值函数,在状态s下价值函数用贝尔曼方程表示为Q (s,a)=E(R(s,a)+γQ(st+1,at+1));

进而,分别使用两个神经网络DNNs逼近Actor和Critic的策略函数和价值函数,DNNs通过两组权重为θ和w被参数化,其中策略和值函数表示为πθ(s,a)和Qw(s,a),两层都使用ReLU作为非线性激活函数,通过最小化损失函数,训练神经网络学习最合适的权重θ,w;

Critic的损失函数定义为:其中,w是价值网络的参数,利用随机梯度下降方法更新状态‑值函数的参数:其中,αc是学习效率,δt是TD‑error,通过数学公式表示为:δ(t)=R(s(t),a(t))+γQω(st+1,at+1)‑Qω(st,at)Actor的目标函数定义为:

π

其中,d (s)表示状态分布函数,通过不断地更新策略参数 以最大化目标函数,其中,αa是参与者学习率;

最后通过不断地迭代,输出Actor网络参数θ,Critic网络参数w,集中控制器根据πθ(s,a)选择相应的视频缓存、请求调度、无线和计算资源分配决策。