利索能及
我要发布
收藏
专利号: 2020107115092
申请人: 北京工业大学
专利类型:发明专利
专利状态:授权未缴费
更新日期:2025-07-12
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,包括如下具体步骤:基于ISP与CP联合内容分发机制系统模型,构建ISP与CP联合利润模型;

基于强化学习对所述ISP与CP联合利润模型进行求解。

2.根据权利要求1所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,所述ISP与CP联合内容分发机制系统模型具体步骤包括:根据Zipf分布构建内容流行度模型;

构建网络模型;所述网络模型包括网络服务与架构模型、网络拓扑模型。

3.根据权利要求2所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,所述内容流行度模型构建,假设内容种类数为K,按照从1到k给视频内容编号;在给定的固定时间内,网络总的请求数为R,内容编号为k的内容流行度的分布为:其中,齐普夫偏度系数α表征了内容流行度。

4.根据权利要求1所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,所述ISP与CP联合利润模型为其中,I0为所述ISP与CP联合利润模型的利润; 为ISP收入模型的收入; 为CP收入模型的收入; 为ISP成本模型的成本, 为CP成本模型的成本。

5.根据权利要求4所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,所述ISP收入模型包括鼓励ISP在基站附近部署缓存的激励收入、ISP为CP提供内容传输的收费、ISP为CP提供内容传输的收费:其中, 是用户i对内容k的请求数,sk为内容k的大小,PISP为ISP单位带宽产生的平均利润, 为布尔变量,M终端移动用户数量,K为内容种类数,B为基站数,I为CP为了鼓励ISP在基站附近部署缓存的激励费用。

6.根据权利要求4所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,所述CP收入模型的收入来自于终端用户所交的会员费:其中,M终端移动用户数量,Pcp终端用户所缴纳的会员费。

7.根据权利要求4所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,所述ISP成本模型的成本来自于购买网络带宽成本、网络流量处理成本、缓存成本、检索成本:其中, 是用户i对内容k的请求数,sk为内容k的大小,C0来表示ISP购买每单位带宽的平均成本, 为布尔变量,M终端移动用户数量,K为内容种类数,B为基站数,Cca来表示部署单位缓存的成本,Cre来表示到达缓存的每个用户请求的检索成本,Cn来表示基站和CP之间路径节点的每单位网络流量的平均处理成本,用C1来表示基站和CP之间链路的每单位网络流量的平均处理成本,Hj,cp表示基站和CP之间路径的跳数。

8.根据权利要求4所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,所述CP成本模型的成本支出来自于网络流量处理成本、网络带宽成本、激励成本、检索成本:其中,M终端移动用户数量,K为内容种类数,B为基站数, 是用户i对内容k的请求数,sk为内容k的大小, 为布尔变量,PISP为ISP单位带宽产生的平均利润,Cre来表示到达缓存的每个用户请求的检索成本,Ccp为CP支付的每单位网络流量的平均处理成本。

9.根据权利要求1所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,基于构建的ISP与CP联合利润模型,设计强化学习寻找内容传输最优路径算法,利用Q-learning算法与利润模型结合与求解。

10.根据权利要求9所述的一种基于边缘缓存的网络利润最优化分配机制构建方法,其特征在于,Q-Learning算法的具体实现:设置拓扑背景,用邻接矩阵来表示网络节点的邻接关系,同时初始化Q表,后续根据Q表更新策略直接替换更新Q表内的值;

设置Q-learning算法,当内容请求没有到达目标节点,随机选择下一个去向节点,并根据Reward矩阵获取这一动作的当前奖励值,根据这个奖励值计算新的Q值,并更新Q表中相应位置的Q值;经过重复训练这样的过程,最后得到的Q表作为一个内容请求选路的策略依据,能找到对于一个内容请求位于任何节点中的一个节点位置时能够到达目标节点的最佳动作选择。