利索能及
我要发布
收藏
专利号: 2020113804069
申请人: 西安理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于时间序列聚类和深度学习LSTM的云服务器老化预测方法,具体包括以下步骤:步骤1,提取云服务器上CPU空闲率和系统可用内存时间序列数据;

步骤2,对步骤1的数据进行三层小波包分解预处理;

步骤3,对步骤2预处理后的数据进行K-means聚类并根据DBI指标评价聚类结果;

步骤4,对步骤3中得到的聚类结果建立LSTM模型并进行模型训练和预测;

步骤5,用均方根误差和平均绝对百分比误差函数,验证步骤4中的云服务器资源时间序列预测值与原始时间序列的预测精确度;

步骤6,检验LSTM模型预测时间序列和实际时间序列的拟合程度,根据云服务器资源时间序列预测数据,对软件老化趋势进行分析并判定最佳的软件再生时间点。

2.如权利要求1所述的基于时间序列聚类和深度学习LSTM的云服务器老化预测方法,其特征在于:所述步骤2中,首先对云服务器资源数据进行预处理,对数据进行频域分析;频域分析采用三层小波包分解技术,通过三层小波包分解对时间序列进行更加精细的分析,它将时间序列进行多层次划分,对每个分解后的频带进行再次划分;并且根据被分析时间序列的特征选择相应频带,对时间序列数据进行特征聚类。

3.如权利要求1所述的基于时间序列聚类和深度学习LSTM的云服务器老化预测方法,其特征在于:所述步骤3中,采用所述K-means聚类算法对云服务器资源的时间序列数据进行多次聚类;K-means算法用欧式距离表示数据之间的差异,通过直接求均值来计算聚类的中心点,其步骤如下:步骤3.1,选择初始聚类中心点m1,m2,…,mk,…,mN;

步骤3.2,将其他对象分配到与其距离最小的中心点所在的类;

步骤3.3,按照欧式距离的平均值最小的原则更新每个聚类的中心点;

步骤3.4,重复步骤3.2、步骤3.3,直至算法K-means收敛。

步骤3.1中,选择初始聚类中心点使用K-means++方法,其思想可以描述为:在选取第一个聚类中心n=1时通过随机的方法,假设已经选取了n个初始聚类中心0

4.如权利要求1所述的基于时间序列聚类和深度学习LSTM的云服务器老化预测方法,其特征在于:所述步骤4中,利用聚类后得到的结果构建深度学习LSTM模型,其具体步骤如下:步骤4.1,提取重负载阶段和宕机临界阶段的时间序列数据并转化,将云服务器资源时间序列数据进行数值化;

步骤4.2,生成模型训练数据集,确定训练集的窗口长度;

步骤4.3,网络模型结构和参数的确定和调整;

步骤4.4,模型训练和结果预测。

步骤4.1中,经过步骤3聚类得到四种类别的时间序列数据,分别为初始阶段、轻负载阶段、重负载阶段和宕机临界阶段。其中初始阶段和轻负载阶段都为云服务器都处于正常、良好运行的状态,所以只需要针对出现老化迹象的重负载阶段和系统接近崩溃的宕机临界阶段进行预测。

步骤4.3中,网络的模型结构确定涉及到许多参数的调整,包括需要确定LSTM模块的激活函数、确定接收LSTM输出的完全连接人工神经网络的激活函数、为了防止过度拟合需要确定每一层网络节点的舍弃率、确定误差的计算方式、确定权重参数的迭代更新方式、确定模型训练的epoch和batch size等参数。

步骤4.4中,为了防止过度拟合,将云资源时间序列数据按4:1的比例随机拆分为训练集和验证集训练模型。然后将时间序列数据作为参数导入模型便可得到预测时间序列数据,与实际的云资源时间序列数据相比便可得到拟合曲线。

5.如权利要求1所述的基于时间序列聚类和深度学习LSTM的云服务器老化预测方法,其特征在于:所述步骤6中,检验LSTM模型预测数据与原始数据的拟合程度,当云服务器资源预测时间序列显示处于宕机临界状态下,此时CPU空闲率和系统可用内存在0%~10%之间,云服务器运行负载压力极大,系统随时可能出现宕机现象。选择在此时进行软件再生操作,以保持系统处于正常、良好运行的状态。