1.边缘网络环境下基于随机森林算法的VOD业务缓存替换方法,其特征在于:包括如下步骤:S1:采集视频数据;
S2:使用随机森林填充法处理视频数据缺失值,建立预测模型;
S3:通过预测模型对平均访问时长进行预测;
S4:根据预测结果建立缓存替换模型;
S5:使用隐枚举法求解缓存替换模型,得到最终替换方案。
2.根据权利要求1所述的边缘网络环境下基于随机森林算法的VOD业务缓存替换方法,其特征在于:所述步骤S2中预测模型的建立具体为:以平均访问时长作为因变量,其余特征作为自变量进行回归训练,且进行数据集的划分,输出各个特征值的重要性排名,根据排名对特征进行筛选得到最终建模特征值,根据建模特征值建模形成预测模型。
3.根据权利要求1所述的边缘网络环境下基于随机森林算法的VOD业务缓存替换方法,其特征在于:所述步骤S4中缓存替换模型的建立流程具体为:假设边缘服务器的缓存空间大小为S,测试集中无法被边缘服务器缓存的视频存储在云上,测试集所有视频的预测访问时长集合为T={t1,t2,…,tK},视频体积集合为V={v1,v2,…,vK},其中K为测试集内的视频总数,缓存替换前边缘服务器内有缓存视频个数为R;云中有视频Q部,K=R+Q;建立缓存替换模型如下式所示:其中 为视频的最佳缓存替换方案,ai代表边缘服务器中第i部视频,ai=0表示视频i需要被替换,ai=1表示视频i不需要被替换,bj代表的是云中的第j部视频,bj=0代表视频j不用继续在云中存储,需要被替换进边缘服务器,bj=1代表视频j依然在云中存储,不需要被替换进边缘服务器;式子 代表以访问时长替换标准时的边缘服务器替换性价比,其有两种可能性,当ai=0时,该式为0,无实际意义,当ai=1时,表示视频i的访问时长与视频i体积的比值;
定义式子 表示视频i的缓存替换性价比;同样,式子 代表视频j的云缓存替换性价比,当bj=1时,该式为0,无实际意义。
4.根据权利要求3所述的边缘网络环境下基于随机森林算法的VOD业务缓存替换方法,其特征在于:所述步骤S5中缓存替换模型的求解过程为:令总访问时长性价比为:
假设边缘服务器的容量为S,将每次计算得到的新总访问时长为TC',为减少枚举个数,令初始条件为 其中{a1,a2,…,aK}部分为缓存替换前的视频缓存集合,{b1,b2,…,bQ}部分为云中视频初始缓存视频集合,将初始条件代入式(2),得到初始总访问时长性价比TC0,新增约束条件:TC>TC0 (3)
将约束条件式(3)、缓存替换模型中的两个约束式进行迭代计算,得到最优的替换方案。
5.根据权利要求4所述的边缘网络环境下基于随机森林算法的VOD业务缓存替换方法,其特征在于:所述迭代计算具体为:将约束条件式(3)作为约束式①、缓存替换模型中的两个约束式分别作为约束式②和约束式③,具体计算过程如下:
1)从后往前替换集合{a1,a2,…,aK}中的一部已缓存视频,即将该视频的ai=1置为ai=
0;
2)从后往前遍历集合{b1,b2,…,bQ},计算新的总访问时长TC;
3)比较TC和TC0,若TC≥TC0,则将TC0置为新的值TC,即令TC0=TC,继续步骤4,否则重新进行步骤1,进行下一次迭代,TC0不变;
4)计算约束条件②,若满足,则进行步骤5,否则重新进行步骤1,进行下一次迭代,TC0不变;
5)计算约束条件③,若满足,则本次迭代满足所有约束条件,TC0即为新值,并在此处进行剪枝,即停止遍历集合{b1,b2,…,bQ},从步骤1开始进行下一次迭代。