买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于深度确定性策略的云资源自适应配置方法及系统

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于深度确定性策略的云资源自适应配置方法及系统

￥21600

专利号： 2021107528704

申请人：山东师范大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-11-27

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于深度确定性策略的云资源自适应配置方法，其特征在于，包括以下步骤：步骤S01：基于云虚拟机集群中的场景信息，构建MAPE自主控制循环参考模型，对所构建的模型进行参数的初始化设置；

步骤S02：通过监视器收集并记录云资源配置中的各项参数指标；

步骤S03：利用ARIMA模型分析时间序列，进行下一时间间隔工作负载的预测,具体步骤为：步骤S301：通过差分法对非平稳的用户请求历史数据进行平稳化预处理，得到新的平稳序列；

步骤S302：构建新的平稳序列的拟合ARIMA(p,q)模型，其中，非负整数p表示自回归阶数，非负整数q表示滑动平均阶数；

步骤S303：进行差分还原，得到下一时间间隔工作负载的预测；

步骤S04：预测下一时间间隔虚拟机的负载情况，根据设定阈值提前调整虚拟机的数量以实现云计算的垂直缩放；

步骤S05：基于DDPG算法进行云资源的分配，给用户分配匹配任务请求的虚拟机,具体步骤为：步骤S501：根据带有UO噪声的在线策略网络计算当前时间段需要执行的资源分配动作；

步骤S502：执行步骤S501中得到的资源分配动作，根据选择的动作将用户任务分配相应的虚拟机中排队完成；

步骤S503：记录奖励和新的环境状态；

步骤S504：将环境状态转换过程中所产生的数据对存储在经验池中，并作为在线网络模型的训练数据集；

步骤S505：从经验池中随机取出N个存储的数据对作为在线策略网络、在线价值网络的训练样本数据；

步骤S506：使用均方误差作为损失函数更新评论家网络；

步骤S507：使用随机梯度下降算法更新演员网络；

步骤S508：更新目标策略网络和目标价值网络，完成云资源的分配。

2.如权利要求1中所述的一种基于深度确定性策略的云资源自适应配置方法，其特征在于，所述MAPE自主控制循环参考模型包括监控阶段、分析阶段、规划阶段和执行阶段。

3.如权利要求2中所述的一种基于深度确定性策略的云资源自适应配置方法，其特征在于，所述监控阶段通过传感器从云资源中收集相关的数据信息并记录存储，所述分析阶段根据拟定的知识规则对所述监控阶段所得到的数据信息进行相关分析，所述规划阶段对所述分析阶段得到的数据信息进行处理并制定相应的行动计划，所述执行阶段通过执行器执行操作行为。

4.如权利要求1中所述的一种基于深度确定性策略的云资源自适应配置方法，其特征在于，所述ARIMA模型建立在平稳的时间序列基础上，通过ADF单位根检验模型验证检验时间序列模型的平稳性。

5.如权利要求1中所述的一种基于深度确定性策略的云资源自适应配置方法，其特征在于，在步骤S04中，当预测的虚拟机的利用率大于设定阈值上限时，先向IaaS供应商租用适量的虚拟机，再执行步骤S05；当预测的虚拟机的利用率小于设定阈值下限时，先释放适量租借中的虚拟机，再执行步骤S05；当预测的虚拟机的利用率在设定阈值范围内时，直接执行步骤S05。

6.一种基于深度确定性策略的云资源自适应配置系统，采用了权利要求1‑5中任一项所述的基于深度确定性策略的云资源自适应配置方法，其特征在于，包括：建模单元，基于云虚拟机集群中的场景信息，构建MAPE自主控制循环参考模型，对所构建的模型进行参数的初始化设置；

收集单元，用于收集并记录云资源配置中的各项参数指标

预测单元，利用ARIMA模型分析时间序列，进行下一时间间隔工作负载的预测，预测下一时间间隔虚拟机的负载情况，根据设定阈值提前调整虚拟机的数量以实现云计算的垂直缩放,具体步骤为：通过差分法对非平稳的用户请求历史数据进行平稳化预处理，得到新的平稳序列；

构建新的平稳序列的拟合ARIMA(p,q)模型，其中，非负整数p表示自回归阶数，非负整数q表示滑动平均阶数；

进行差分还原，得到下一时间间隔工作负载的预测；

配置单元，基于DDPG算法进行云资源的分配，给用户分配匹配任务请求的虚拟机,具体步骤为：根据带有UO噪声的在线策略网络计算当前时间段需要执行的资源分配动作；

执行步骤S501中得到的资源分配动作，根据选择的动作将用户任务分配相应的虚拟机中排队完成；

记录奖励和新的环境状态；

将环境状态转换过程中所产生的数据对存储在经验池中，并作为在线网络模型的训练数据集；

从经验池中随机取出N个存储的数据对作为在线策略网络、在线价值网络的训练样本数据；

使用均方误差作为损失函数更新评论家网络；

使用随机梯度下降算法更新演员网络；