1.一种基于深度确定性策略的云资源自适应配置方法,其特征在于,包括以下步骤:步骤S01:基于云虚拟机集群中的场景信息,构建MAPE自主控制循环参考模型,对所构建的模型进行参数的初始化设置;
步骤S02:通过监视器收集并记录云资源配置中的各项参数指标;
步骤S03:利用ARIMA模型分析时间序列,进行下一时间间隔工作负载的预测,具体步骤为:步骤S301:通过差分法对非平稳的用户请求历史数据进行平稳化预处理,得到新的平稳序列;
步骤S302:构建新的平稳序列的拟合ARIMA(p,q)模型,其中,非负整数p表示自回归阶数,非负整数q表示滑动平均阶数;
步骤S303:进行差分还原,得到下一时间间隔工作负载的预测;
步骤S04:预测下一时间间隔虚拟机的负载情况,根据设定阈值提前调整虚拟机的数量以实现云计算的垂直缩放;
步骤S05:基于DDPG算法进行云资源的分配,给用户分配匹配任务请求的虚拟机,具体步骤为:步骤S501:根据带有UO噪声的在线策略网络计算当前时间段需要执行的资源分配动作;
步骤S502:执行步骤S501中得到的资源分配动作,根据选择的动作将用户任务分配相应的虚拟机中排队完成;
步骤S503:记录奖励和新的环境状态;
步骤S504:将环境状态转换过程中所产生的数据对存储在经验池中,并作为在线网络模型的训练数据集;
步骤S505:从经验池中随机取出N个存储的数据对作为在线策略网络、在线价值网络的训练样本数据;
步骤S506:使用均方误差作为损失函数更新评论家网络;
步骤S507:使用随机梯度下降算法更新演员网络;
步骤S508:更新目标策略网络和目标价值网络,完成云资源的分配。
2.如权利要求1中所述的一种基于深度确定性策略的云资源自适应配置方法,其特征在于,所述MAPE自主控制循环参考模型包括监控阶段、分析阶段、规划阶段和执行阶段。
3.如权利要求2中所述的一种基于深度确定性策略的云资源自适应配置方法,其特征在于,所述监控阶段通过传感器从云资源中收集相关的数据信息并记录存储,所述分析阶段根据拟定的知识规则对所述监控阶段所得到的数据信息进行相关分析,所述规划阶段对所述分析阶段得到的数据信息进行处理并制定相应的行动计划,所述执行阶段通过执行器执行操作行为。
4.如权利要求1中所述的一种基于深度确定性策略的云资源自适应配置方法,其特征在于,所述ARIMA模型建立在平稳的时间序列基础上,通过ADF单位根检验模型验证检验时间序列模型的平稳性。
5.如权利要求1中所述的一种基于深度确定性策略的云资源自适应配置方法,其特征在于,在步骤S04中,当预测的虚拟机的利用率大于设定阈值上限时,先向IaaS供应商租用适量的虚拟机,再执行步骤S05;当预测的虚拟机的利用率小于设定阈值下限时,先释放适量租借中的虚拟机,再执行步骤S05;当预测的虚拟机的利用率在设定阈值范围内时,直接执行步骤S05。
6.一种基于深度确定性策略的云资源自适应配置系统,采用了权利要求1‑5中任一项所述的基于深度确定性策略的云资源自适应配置方法,其特征在于,包括:建模单元,基于云虚拟机集群中的场景信息,构建MAPE自主控制循环参考模型,对所构建的模型进行参数的初始化设置;
收集单元,用于收集并记录云资源配置中的各项参数指标
预测单元,利用ARIMA模型分析时间序列,进行下一时间间隔工作负载的预测,预测下一时间间隔虚拟机的负载情况,根据设定阈值提前调整虚拟机的数量以实现云计算的垂直缩放,具体步骤为:通过差分法对非平稳的用户请求历史数据进行平稳化预处理,得到新的平稳序列;
构建新的平稳序列的拟合ARIMA(p,q)模型,其中,非负整数p表示自回归阶数,非负整数q表示滑动平均阶数;
进行差分还原,得到下一时间间隔工作负载的预测;
配置单元,基于DDPG算法进行云资源的分配,给用户分配匹配任务请求的虚拟机,具体步骤为:根据带有UO噪声的在线策略网络计算当前时间段需要执行的资源分配动作;
执行步骤S501中得到的资源分配动作,根据选择的动作将用户任务分配相应的虚拟机中排队完成;
记录奖励和新的环境状态;
将环境状态转换过程中所产生的数据对存储在经验池中,并作为在线网络模型的训练数据集;
从经验池中随机取出N个存储的数据对作为在线策略网络、在线价值网络的训练样本数据;
使用均方误差作为损失函数更新评论家网络;
使用随机梯度下降算法更新演员网络;
更新目标策略网络和目标价值网络,完成云资源的分配。
7.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1‑5中任一项所述的基于深度确定性策略的云资源自适应配置方法中的步骤。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑5中任一项所述的基于深度确定性策略的云资源自适应配置方法中的步骤。