1.一种基于经验模态分解聚类的网络流量预测方法,其特征在于,包括:S1:获取原始的网络流量数据并进行预处理;
S2:通过经验模态分解将网络流量分解为不同时间尺度上频率单一的有限个本征模函数IMF分量;
S3:通过K‑means算法对IMF分量进行聚类,将复杂度相近的IMF分量聚到一起;
S4:对聚类后的IMF分量采用自适应加权马尔可夫模型预测;
S41:初始化迭代次数d=1,并将网络流量序列δ={δ1,δ2,…,δN}均匀划分为m个进行状态空间E={1,2,…,m};
S42:计算一步转移概率矩阵和n步转移概率矩阵;
S43:检验网络流量序列δ的马尔可夫性,若检验通过,则进行步骤S44;
S44:计算各阶相关系数rk和规范相关权重wk;
S45:计算出网络流量序列δ的s步预测概率向量;
S46:计算l+s时刻的网络流量的预测值
S47:根据网络流量预测值 与其实际值δl+s的预测误差el+s修正权重,表示为w′k=wk+
2λ·el+sδl+s‑k;wk和w′k分别为更新前后的权重;λ为学习常数;
S48:判断是否el+s<ε,若是则输出并存储修正后的权重,将权重应用于马尔可夫模型返回步骤S45继续进行预测,否则进行S49;ε为误差指标;
S49:判断是否d>D,若是则输出并存储修正后的权重,将权重应用于马尔可夫模型返回步骤S45继续进行预测,否则令d=d+1,返回步骤S46;D为最大学习次数;
S5:将各IMF分量的预测值进行求和确定当前时刻网络流量的预测值。
2.根据权利要求1所述的一种基于经验模态分解聚类的网络流量预测方法,其特征在于,所述步骤S2中包括:S21:找出预处理后网络流量信号x(t)的所有局部极大值和局部极小值;
S22:通过极值拟合得到信号x(t)的上包络emax(t)和下包络emin(t);
S23:计算局部均值m(t),表示为:m(t)=(emin(t)+emax(t))/2;
S24:将原始输入信号减去局部均值得到振荡信号h(t),表示为:h(t)=x(t)-m(t);
S25:当h(t)满足IMF的条件时,令c1=h(t),则c1为第一个IMF,对应的余量r1=x(t)-c1;否则,用h(t)替换x(t)并转到步骤S21;
S26:当r1仍包含原始数据中的频率信息时,将r1替换x(t)并转到步骤S21,得到第二个IMF分量,以此类推,得到r1-c2=r2,...,rn‑1-cn=rn;当cn或rn小于设定值,或rn成为单调函数时,停止筛分过程。
3.根据权利要求1所述的一种基于经验模态分解聚类的网络流量预测方法,其特征在于,所述步骤S3中包括:S31:计算每一个IMF分量、余项rn与原始信号的相关系数,剔除相关系数最小的IMF分量;
S32:基于样本熵选择K个聚类中心;计算每一个IMF分量的样本熵,将样本熵最大的IMF分量作为第一个聚类中心Z1,将样本熵最小的IMF分量作为第二个聚类中心Z2,将样本熵中值的IMF分量作为第三个聚类中心Z3;
S33:计算其他分量与K个聚类中心的距离,将IMF分量分配到距离其最近的簇;
S34:计算每一个簇中所有样本熵的均值,将均值作为新的聚类中心;
S35:重复上述步骤S33、S34,直至聚类中心不再变化。
4.根据权利要求3所述的一种基于经验模态分解聚类的网络流量预测方法,其特征在于,所述步骤S3中计算每一个IMF分量的样本熵包括:S321:将IMF分量的时间序列{x(n)}={x(1),x(2),…,x(N)}按照序号组成一组m维矢量Xm(1),…,Xm(N‑m+1);
S322:计算第m维矢量中关于i的连续m个数据Xm(i)与第m维矢量中关于j的连续m个数据Xm(j)之间的距离:d[Xm(i),Xm(j)]=maxk=[0,m‑1][|x(i+k)‑x(j+k)|];
其中,Xm(i)={x(i),x(i+1),…,x(i+m‑1)};
Xm(j)={x(j),x(j+1),…,x(j+m‑1)};且i≠j。
S323:分别统计与连续m个数据之间的距离小于给定阈值r的数据个数Nm(i);并计算出该数据的统计值标签:S324:对第m维的所有统计值标签 求其平均值,即S325:令m+1,重复上述步骤S321~S324,得到第m+1维的所有统计值标签的平均值S326:计算出IMF分量的样本熵为其中,N表示数据总数,1≤m≤N;1≤i≤N‑m,1≤j≤N‑m。
5.根据权利要求1所述的一种基于经验模态分解聚类的网络流量预测方法,其特征在于,所述自适应加权马尔可夫模型包括通过马尔可夫模型根据聚类后的IMF分量计算出下一时刻的网络流量值;采用自适应过滤法对马尔可夫模型的权重进行调整,从而获取最佳的权重,更新马尔可夫模型。
6.根据权利要求1所述的一种基于经验模态分解聚类的网络流量预测方法,其特征在于,数据预处理采用归一化处理,而各IMF分量的预测值则进行反归一化处理。
7.一种基于经验模态分解聚类的网络流量预测装置,其特征在于,包括:数据获取模块,用于获取网络流量数据;
数据预处理模块,用于对获取的网络流量数据进行预处理;
经验分解模块,用于对预处理后网络流量数据进行经验模态分解;
K‑means算法聚类模块,用于对进行经验模态分解后的本征模函数分量进行聚类;
自适应加权马尔可夫模型模块,用于对聚类后的本征模函数分量进行预测,确定出每个本征模函数分量的预测值,执行如步骤S41‑S49的步骤:S41:初始化迭代次数d=1,并将网络流量序列δ={δ1,δ2,…,δN}均匀划分为m个进行状态空间E={1,2,…,m};
S42:计算一步转移概率矩阵和n步转移概率矩阵;
S43:检验网络流量序列δ的马尔可夫性,若检验通过,则进行步骤S44;
S44:计算各阶相关系数rk和规范相关权重wk;
S45:计算出网络流量序列δ的s步预测概率向量;
S46:计算l+s时刻的网络流量的预测值
S47:根据网络流量预测值 与其实际值δl+s的预测误差el+s修正权重,表示为w′k=wk+
2λ·el+sδl+s‑k;wk和w′k分别为更新前后的权重;λ为学习常数;
S48:判断是否el+s<ε,若是则输出并存储修正后的权重,将权重应用于马尔可夫模型返回步骤S45继续进行预测,否则进行S49;ε为误差指标;
S49:判断是否d>D,若是则输出并存储修正后的权重,将权重应用于马尔可夫模型返回步骤S45继续进行预测,否则令d=d+1,返回步骤S46;D为最大学习次数;
求和预测模块,用于将预测出的各个本征模函数分量进行求和,确定当前时刻网络流量的预测值。
8.一种电子设备,其特征在于,所述电子设备包括:处理器、机器可读存储介质和系统总线,所述处理器和机器可读存储介质通过所述系统总线完成相互间的通信,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述机器可执行指令包括:获取指令、分解指令、聚类指令和预测指令;
所述处理器被所述获取指令促使执行:获取原始的网络流量数据并进行预处理;
所述处理器被所述分解指令促使执行:通过经验模态分解将网络流量分解为不同时间尺度上频率单一的有限个本征模函数IMF分量;
所述处理器被所述聚类指令促使执行:通过K‑means算法对IMF分量进行聚类,将复杂度相近的IMF分量聚到一起;
所述处理器被所述预测指令促使执行:对聚类后的IMF分量采用自适应加权马尔可夫模型预测,执行如步骤S41‑S49的步骤:S41:初始化迭代次数d=1,并将网络流量序列δ={δ1,δ2,…,δN}均匀划分为m个进行状态空间E={1,2,…,m};
S42:计算一步转移概率矩阵和n步转移概率矩阵;
S43:检验网络流量序列δ的马尔可夫性,若检验通过,则进行步骤S44;
S44:计算各阶相关系数rk和规范相关权重wk;
S45:计算出网络流量序列δ的s步预测概率向量;
S46:计算l+s时刻的网络流量的预测值
S47:根据网络流量预测值 与其实际值δl+s的预测误差el+s修正权重,表示为w′k=wk+
2λ·el+sδl+s‑k;wk和w′k分别为更新前后的权重;λ为学习常数;
S48:判断是否el+s<ε,若是则输出并存储修正后的权重,将权重应用于马尔可夫模型返回步骤S45继续进行预测,否则进行S49;ε为误差指标;
S49:判断是否d>D,若是则输出并存储修正后的权重,将权重应用于马尔可夫模型返回步骤S45继续进行预测,否则令d=d+1,返回步骤S46;D为最大学习次数;
将各IMF分量的预测值进行求和确定当前时刻网络流量的预测值。