1.一种边云协同系统中基于学习优化方法的虚拟网络功能放置决策方法,其特征在于,包括以下步骤:S1,获取边云协同系统中各类资源的数据;
S2,根据获取的边云协同数据进行优化放置决策。
2.根据权利要求1所述的边云协同系统中基于学习优化方法的虚拟网络功能放置决策方法,其特征在于,在步骤S1中包括:其中,TL表示某个虚拟网络功能i放置在边云协同系统所产生的排队延迟;
γC表示服务节点的服务率;
δc表示虚拟网络请求的计算率;
fx表示当前边缘协同系统中的服务节点正在排队的虚拟网络请求;
h表示边缘云服务节点集合;
其中,TC表示虚拟网络请求在服务节点获得网络带宽资源与存储资源而产生的延迟;
δB表示服务节点已使用带宽资源占总带宽资源;
δS表示服务节点已使用存储资源;
γB表示总带宽资源;
γS表示节点总存储资源;
其中,Tt表示向第三方云传输虚拟网络请求的通信延迟;
δB表示服务节点已使用带宽资源占总带宽资源;
表示请求到第三方云的传输速率;
e
T=TL+Tc (4)C
T=TL+Tc+Tt (5)e
其中,T表示将请求放置于边缘云的总延迟;
TL表示某个虚拟网络功能i放置在边云协同系统所产生的排队延迟;
Tc表示虚拟网络请求在服务节点获得网络带宽资源与存储资源而产生的延迟;
C
T表示放置于第三方云的总延迟;
Tt表示向第三方云传输虚拟网络请求的通信延迟;
e
F=Ei+Eu (6)e
其中,F表示第三方云中每一个服务节点的付费成本;
Ei表示已开启的边缘云服务节点的维护成本和在服务节点以虚拟机形式放置虚拟网络请求的开销;
Eu表示边缘云服务节点提供计算服务时的服务成本;
其中,Eu表示边缘云服务节点提供计算服务时的服务成本;
δC表示使用服务节点中已使用计算资源;
γC表示总计算资源;
PC表示计算资源利用率的权重;
δB表示服务节点已使用带宽资源占总带宽资源;
γB表示总带宽资源;
PB表示带宽资源利用率的权重;
δS表示服务节点已使用存储资源;
γS表示节点总存储资源;
PS表示存储资源利用率的权重;
c
其中,F表示第三方云中每一个服务节点的付费成本;
表示第三方云中服务节点被使用的计算资源;
表示第三方云中计算资源的收费价格;
表示第三方云中服务节点被使用的带宽资源;
表示第三方云中带宽资源的收费价格;
表示第三方云中服务节点被使用的存储资源;
表示第三方云中存储资源的收费价格;
e
其中,k表示将虚拟网络请求以虚拟机的形式放置于边缘云中的代价;
e
H表示边缘云服务节点集合;
e
F表示虚拟网络请求的计算成本;
e
T表示虚拟网络请求的时延代价;
表示在边缘云中时延代价所占权重;
fx1表示决策变量;
c
其中,k表示将虚拟网络请求以容器的形式放置于第三方云中的代价;
C
H表示第三方云服务节点集合;
C
F表示虚拟网络请求的付费代价;
C
T表示虚拟网络请求的时延代价;
表示在第三方云中时延代价所占权重;
fx2表示第三方云决策变量;
e c
k=k+k (11)k表示当前边云协同系统的总代价;
e
k表示将虚拟网络请求以虚拟机的形式放置于边缘云中的代价;
c
k表示将虚拟网络请求以容器的形式放置于第三方云中的代价。
3.根据权利要求1所述的边云协同系统中基于学习优化方法的虚拟网络功能放置决策方法,其特征在于,在步骤S2中包括:其中,Min()取最小值;
e
H表示边缘云服务节点集合;
e
F表示虚拟网络请求的计算成本;
e
T表示虚拟网络请求的时延代价;
表示在边缘云中时延代价所占权重;
fx1表示决策变量;
C
H表示第三方云服务节点集合;
C
F表示虚拟网络请求的付费代价;
C
T表示虚拟网络请求的时延代价;
表示在第三方云中时延代价所占权重;
fx2表示第三方云决策变量;
s.t.表示受限于;
δC表示使用服务节点中已使用计算资源;
表示当前边缘云服务节点拥有的计算资源;
表示第三方云中服务节点被使用的计算资源;
表示当前第三方云服务节点的剩余可用计算资源;
δB表示服务节点已使用带宽资源占总带宽资源;
表示当前边缘云服务节点拥有的带宽资源;
表示第三方云中服务节点被使用的带宽资源;
表示当前第三方云服务节点的剩余可用带宽资源;
δS表示服务节点已使用存储资源;
表示当前边缘云服务节点拥有的存储资源;
表示第三方云中服务节点被使用的存储资源;
表示当前第三方云服务节点的剩余可用存储资源;
γL(n,u)表示边缘云服务节点间的链路带宽;
C C
γL(n ,u)表示第三方云服务节点间的链路带宽。
4.根据权利要求1所述的边云协同系统中基于学习优化方法的虚拟网络功能放置决策方法,其特征在于,还包括:其中,r(t)表示奖励函数;
e
H表示边缘云服务节点集合;
e
F表示虚拟网络请求的计算成本;
e
T表示虚拟网络请求的时延代价;
表示在边缘云中时延代价所占权重;
fx1表示决策变量;
C
H表示第三方云服务节点集合;
C
F表示虚拟网络请求的付费代价;
C
T表示虚拟网络请求的时延代价;
表示在第三方云中时延代价所占权重;
fx2表示第三方云决策变量;
J(t)表示惩罚函数;
λx表示违反不同约束的惩罚比重;
Jx(t)表示不同约束的惩罚函数;
其中,R(t)表示在t时刻的累积回报;
reward(t)表示放置虚拟网络请求的即时效益;
η表示折扣因子;
reward(t+1)表示迭代次数为1的回报值;
reward(t+2)表示迭代次数为2的回报值;
reward(t+n)表示迭代次数为n的回报值;
其中,E[R(t)|s(t),a(t)]表示状态s(t)下动作a(t)的期望;
π
π*=argmax(Q(s,a)) (22)其中,argmax()表示最大值。
5.根据权利要求1所述的边云协同系统中基于学习优化方法的虚拟网络功能放置决策方法,其特征在于,求解方式为:其中,r(t)表示回报函数;
J(t)表示惩罚函数;
e
H表示边缘云服务节点集合;
e
F表示虚拟网络请求的计算成本;
e
T表示虚拟网络请求的时延代价;
表示在边缘云中时延代价所占权重;
fx1表示决策变量;
C
H表示第三方云服务节点集合;
C
F表示虚拟网络请求的付费代价;
C
T表示虚拟网络请求的时延代价;
表示在第三方云中时延代价所占权重;
fx2表示第三方云决策变量;
λx表示违反不同约束的惩罚比重;
Jx(t)表示不同约束的惩罚函数;
π π Q
Q(s(t),a(t))≈Q(s(t),a(t),θ) (24)Q
其中,θ表示深度神经网络的权重值;
σ=rt+1+ξQ_(s(t),a(t))‑Q(s(t),a(t)) (25)其中,σ表示时间差分值;
rt+1表示回报值;
ξ表示权重因子;
Q_(s(t),a(t))表示上一次状态输入到判别网络中得到的Q值;
Q(s(t),a(t))表示将s状态输入到判别网络中得到的Q值;
σ'=L+rt+1+ξQ_(s(t),a(t))‑Q(s(t),a(t)) (26)Q 2
Loss(θ)=E[σ'(t) ] (27)其中,σ'表示基于拉格朗日对偶函数的时间差分值;
L表示拉格朗日对数值;
rt+1表示回报函数;
ξ表示权重因子;
Q_(s(t),a(t))表示上一次状态输入到判别网络中得到的Q值;
Q(s(t),a(t))表示将s状态输入到判别网络中得到的Q值Q
Loss(θ)表示判别网络的损失函数;
2
σ'(t) 表示平方损失函数;
μ
其中,θ表示行动网络的权重;
表示行动网络的放置策略;
σ表示判别网络的时间差分值;
μ
π*=π(s(t),a(t),θ) (29)其中,π*表示最优策略;
π(·,·,)表示策略;
s(t)表示状态;
a(t)表示动作;
μ
θ表示行动网络的权重。