1.一种基于用户访问量以及预测机制的动态副本文件访问方法,其特征在于,包括以下步骤:
101、预先设置一个文件访问的响应时间阈值td,求取出在响应时间阈值td下存储节点所能处理的文件的最大访问量,从而求取出当前周期文件所需要的副本个数;
102、根据文件的历史访问记录,预测出文件下一周期的访问量,并根据步骤101动态求取出文件当前周期与下一周期的副本个数,并求取出文件的最佳副本个数;
103、在选取存储节点集合进行副本添加或删除时,动态地通过粒子群算法,选取最优的节点集合来放置文件副本的位置。
2.根据权利要求1所述的基于用户访问量以及预测机制的动态副本文件访问方法,其特征在于,步骤101中求取出在响应时间阈值td下存储节点所能处理的文件的最大访问量包括步骤:(1)设置响应时间阈值td;
(2)根据文件发送时间公式计算出节点所能处理的文件的最大访问量;
(3)根据用户访问量,求取文件的最佳副本个数。
3.根据权利要求2所述的基于用户访问量以及预测机制的动态副本文件访问方法,其特征在于,所述步骤(2)具体为:要求访问的响应时间tresponse不超过td,即tresponse≤td,因此,单个存储节点上处理单个文件的访问量不得超过:tresponse表示访问一个文件的响应时间;ttransfer表示文件的发送时间;s(i)表示文件i的大小;v(j)表示存储节点j的发送速度;k的最大值为:
其中,td表示某文件上单个访问发送时延的最大值,由用户设定;kmax表示文件在节点上的最大访问量;
假设某文件在存储系统上包含原文件本身在内及副本的个数为Ncurrent,则为了满足每个访问的发送时延不超过td,则文件的最大访问量应为:Amax=Ncurrent×kmax
其中,Ncurrent表示一文件在存储系统中的副本个数;Amax表示一文件在存储系统中的最大访问量。
4.根据权利要求1所述的基于用户访问量以及预测机制的动态副本文件访问方法,其特征在于,所述步骤102根据文件的历史访问记录,预测出文件下一周期的访问量采用指数平滑模型预测公式 其中,α表示平滑系数;A(t)表示的是第t个周期文件的实际访问量; 表示的是第t个周期文件的预测访问量,若当前访问量使得文件需要增加副本数,而由预测得到的下一个周期的访问量使得文件需要删除副本数时,则将不会为文件创建副本,此时文件的最佳副本数仍保持不变;若当前的与下一个周期的访问量同时使得文件增加或者删除副本数,则取当前的与下一个周期的副本数的平均值作为最佳副本数。
5.根据权利要求1所述的基于用户访问量以及预测机制的动态副本文件访问方法,其特征在于,所述步骤103通过多目标优化策略选取合理的节点集,包括实现系统的可靠性以及系统负载均衡的双目标优化。
6.根据权利要求5所述的基于用户访问量以及预测机制的动态副本文件访问方法,其特征在于,衡量实现系统的可靠性为:
其中,SR表示系统的可靠性;R(i)表示文件i的可用性;φ(i,j)表示文件i是否在节点j上,1表示存在,0则表示不存在;pj表示节点j的失效率。
衡量系统负载是否均衡可使用负载变化幅度即标准差SL来描述:
其中,m表示存储节点的个数;SL系统负载变化幅度的标准差值;表示系统中负载的平均值;A(i,j)表示文件i在节点j上的访问量。
7.根据权利要求6所述的基于用户访问量以及预测机制的动态副本文件访问方法,其特征在于,将目标函数按线性加权法得到一个优化的目标函数以及其约束条件:
其中,S表示目标函数;θ表示目标所占权重,由用户确定;C表示存储节点的最大容量。