利索能及
我要发布
收藏
专利号: 2018103678414
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-10-29
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于随机学习的接入网服务功能链部署方法,其特征在于:该方法包括以下步骤:

S1:针对5G云化接入网(Cloud-Radio Access Network,C-RAN)场景下物理网络拓扑变化引起的高时延问题,建立受约束的多目标接入网服务功能链(Service Function Chain,SFC)部署的数学模型;

S2:感知底层物理节点从而获得网络拓扑变化,并分析观测误差;

S3:根据部分感知的网络拓扑变化和服务功能链的动态数据到达,建立部分可观察马尔可夫决策过程(Partial Observation Markov Decision Process,POMDP)模型;

S4:针对POMDP的维度灾问题,设计高效的求解算法寻找最优的接入网SFC部署方式。

2.根据权利要求1所述的一种基于随机学习的接入网服务功能链部署方法,其特征在于:在步骤S1中,所述SFC部署的数学模型为:基础设施层的服务器网络由带权值无向图G={N,L},N=N1∪N2表示服务器节点集并由DU池的节点集N1和CU池的节点集N2组成,L=L1∪L2∪{lNGFI}表示链路集且由DU池的链路集L1、CU池的链路集L2和下一代前传网络接口(Next Generation Frontal Interface,NGFI)链路lNGFI构成; 是服务器节点nk的计算资源容量,vl表示链路l的带宽容量;

设系统的切片集合为U, 表示切片u里的SFC集合,切片u里第m个SFC在时刻t的队列长度为qu,m(t)且满足0≤qu,m(t)≤nq, nq表示最大队列长度。

3.根据权利要求1所述的一种基于随机学习的接入网服务功能链部署方法,其特征在于:所述接入网SFC部署的过程分为3个阶段:第1阶段是系统决策是否修复所有失效的节点,用aα(t)表示当前时刻节点修复行动,aα(t)=1表示修复所有失效的节点,其余为0;

第2阶段是为每个切片网络选择接入网虚拟网络功能(Virtualization Network Function,VNF)的部署方式,明确各切片的SFC的一组有序VNF在分布单元(Distribution Unit,DU)和集中单元(CentralizationUnit,CU)的分布情况,且aβ(t)={βu(t)|u∈U},βu(t)∈Ω表示切片u时刻t选择的VNF部署方式,Ω表示所有可能的接入网VNF部署方式的集合;

第3阶段是依据每个切片的VNF部署方式为其SFC进行资源分配;包括为各VNF在对应的资源池中分配计算资源和带宽资源,SFC中处在DU末端的VNF分配前传网络的带宽资源,处在CU末端的VNF不考虑分配带宽资源;设当前时刻全部切片的所有SFC资源分配方式设资源量都是离散的,则所有可能的SFC资源分配方式组成集合A'χ;

是t时刻SFCm的计算资源分配, 其中,

Fu,m表示切片u的第m个SFC的VNF集合, 表示第j(j∈Fu,m)个VNF可以实例化的节点集合,表示第j个VNF在服务器节点nk所分配的计算资源, 表示第j个VNF部署在节点nk时该参数为1,否则为0;

是t时刻SFCm的带宽资源分配方式, 其中,

表示第j个VNF在链路l上分配的带宽资源, 表示第j个VNF用链路l发送数据给下一个VNF时该参数为1,其余情况为0。

4.根据权利要求1所述的一种基于随机学习的接入网服务功能链部署方法,其特征在于:在所述步骤S1中,一方面会涉及修复失效的节点,会带来修复成本函数R1(t),其中,c表示修复一个节点的费用成本,μi=1表示时刻t节点i被修复,否则为0,|N1|和|N2|分别表示DU池和CU池的服务器节点总数;

另一方面涉及时延指标,考虑每条SFC的排队时延和从DU到CU的调度时延,得到系统的总时延函数R2(t),其中,γu表示切片u的优先级,λu,m(t)表示切片u的SFCm的数据到达率,假设SFC的数据到达量满足非齐次泊松分布;Fu',m表示SFCm中除去CU侧的最后一个VNF而形成的VNF集合,表示第j个VNF发送给相邻下一个VNF的数据量, 表示第j个VNF在节点nk的处理时延,b是一个均大于任意时刻系统总时延的正常数;所以接入网切片的SFC部署的优化目标是系统总时延和修复成本的联合最优,优化目标为:max R(t)=e1R1(t)+e2R2(t)

其中,e1和e2是正值且e1+e2=1。

5.根据权利要求1所述的一种基于随机学习的接入网服务功能链部署方法,其特征在于:在步骤S2中,所述感知底层物理节点从而获得网络拓扑变化是采用心跳包检测机制来实现,具体为:考虑节点的失效引起的物理网络拓扑变化,底层网络中的每个服务器节点在固定时间间隔发送一个简单包给中央监测器,中央监测器为每一个节点启动一个线程定时查看各节点的包到达时间,并设置一个阈值Ttimeout,设当前时间为Tnow,上一次心跳包到达时间为Tlast,如果Tnow-Tlast>Ttimeout,则判定该节点在当前时刻是失效的;节点i误判失效的概率

6.根据权利要求1所述的一种基于随机学习的接入网服务功能链部署方法,其特征在于:在步骤S3中,所述POMDP决策模型为:将物理网络拓扑和SFC的队列长度作为状态空间S,即 Q为队列状态,为拓扑

状态;将接入网SFC部署过程作为行动空间A,即A=(Aα,Aβ,Aχ),Aα是节点修复动作,Aβ是所有切片选择接入网VNF部署方式的动作,Aχ是所有SFC的资源分配动作;网络拓扑和队列长度都需要通过观察获得,所以其观测空间由拓扑观测状态和队列观测状态组成,但网络拓扑是部分感知获得,而队列状态是完全可知的。

7.根据权利要求6所述的一种基于随机学习的接入网服务功能链部署方法,其特征在于:在所述POMDP模型中引入信念状态,将接入网SFC部署优化目标转化为:π表示每个时刻的有序动作集合,bt(s)表示时刻t系统状态为s的概率,γ表示折扣因子,0<λ≤1,T代表时间段的终点,R(s,a(t))表示系统状态为s时采取行动a(t)的回报。

8.根据权利要求1所述的一种基于随机学习的接入网服务功能链部署方法,其特征在于:在步骤S4中,所述高效的求解算法为基于点的混合启发式算法:选择值函数上下界较大的点来寻找最远后继信念点更新当前的探索信念点集合Bsub,然后基于Bsub更新值函数向量集Γt为Γt+1,反复执行直到Γt+1对应的值函数和Γt对应的值函数的差值小于既定的阈值为止,并由最优策略值函数获得最佳SFC部署方式。