利索能及
我要发布
收藏
专利号: 2022111807112
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种虚拟现实网络资源管理方法,其特征在于,包括:基于Q‑learning算法,对预先获取的整数优化模型进行资源分配,最小化传输时延;

预先获取整数优化模型,通过以下步骤实现:

构建非线性初始优化模型;

基于大M法,将非线性初始优化模型转化为线性混合的整数优化模型;

构建的非线性初始优化模型的表达式为:

其中,u为用户与室内小基站之间的关系,T为服务顺序, ,N为用户的数量,τn为用户n的传输时延;

其中, , , ,K为可见光接入点的数量,I为服务时隙的数量,B为室内小基站的数量;

γnki=1表示第k个可见光接入点在第i个时隙为第n个用户服务,unβ=1表示第β个室内小基站为第n个用户服务,Tni=1表示在第i个时隙为第n个用户服务;

基于大M法,将非线性初始优化模型转化为线性混合的整数优化模型,通过以下步骤实现:引入变量 ,非线性初始优化模型转化为:

其中,K为可见光接入点的数量, ;

利用大M法,将转化后的非线性初始优化模型转变为线性混合的整数优化模型:其中,S为在卫星处生成的VR图像大小,M为预设的中间参数,Cβ表示卫星传输到第β个室内小基站的信息速率;Cnβi表示在第i个服务时隙时第β个室内小基站传输给第n个用户的信息速率;

基于Q‑learning算法,对预先获取的整数优化模型进行资源分配,最小化传输时延,通过以下步骤实现:若不符合C7‑C12的约束,则将设定的奖励值赋予给状态si下采取第i个动作ai时的奖励值Ri,更新Q值表;

若符合C7‑C12的约束,则将 赋予给状态si下采取第i个动作ai时的奖励值Ri,更新Q值表。

2.根据权利要求1所述的一种虚拟现实网络资源管理方法,其特征在于,Q值表的更新公式如下:

其中,Q(si+1, ai+1)为Q值表中的第i+1行第i+1列的值,Q(si, ai)为Q值表中的第i行第i列的值,ai是第i个动作,si是采取动作ai‑1后的状态,α为学习率,Ri是在状态si下采取第i个动作ai时的奖励值,γ为折扣率,si+1是采取动作ai后的状态;a为动作ai的集合, 是在状态si+1下采取的动作。

3.一种虚拟现实网络资源管理分配系统,其特征在于,包括:资源分配模块,用于基于Q‑learning算法,对预先获取的整数优化模型进行资源分配,最小化传输时延;

构建模块,用于构建非线性初始优化模型;

转换初始模型模块,用于基于大M法,将非线性初始优化模型转化为线性混合的整数优化模型。

4.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至3中任一项所述方法的步骤。

5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至3中任一项所述方法的步骤。