1.一种基于多维度权重算法的算力中心算力调度方法,其特征在于:调度方法包括如下步骤:
S1、通过调度门户获取用户的提交任务,将任务转发至调度管理服务,所述调度管理服务获取任务的资源需求、优先级及截止时间等元数据信息;S2、资源管理服务系统通过统一监控服务获取各计算节点最新的NodeMetrics,并按照所述任务资源需求特征划分任务类型,所述NodeMetrics为节点实时指标;
S3、调度管理服务系统通过权重计算器,基于所述任务类型按照多维度指标生成 W_final,并对候选节点按W_final由高到低进行排序;
其中,所述W_final为对每个节点多维度权重计算之后得出的最终权重值,用于调度器对节点排序使用;
所述多维度指标包括CPU、内存、GPU、存储和队列,所述队列为对应计算节点上待运行的任务队列;
S4、选中首节点后执行资源预留、任务下发与任务实时监控工作,若分配失败则回退并尝试下一节点;
S5、计算节点周期上报节点状态与任务运行状态,统一监控系统写入指标数据库供后续权重迭代使用;
S6、成功则释放资源并更新统计,失败或超时则触发重新调度。
2.根据权利要求1所述的基于多维度权重算法的算力中心算力调度方法,其特征在于:所述W_final的计算方法包括如下步骤:S101、指标归一化:
通过如下公式进行指标归一化:
;
;
为各个资源维度的归一化得分,用于衡量节点在不同资源维度上的空闲程度和可用性,得分 越高越空闲;其中,各个资源维度包括cpu、mem、gpu和io,cpu为中央处理器,mem为内存,gpu为图形处理器,io为存储的读写;
util为利用率,取值0 1,利用率越低代表剩余能力越多,通过反向取值通过进行计算~归一化公式;
为多维度权重计算中的队列维度得分,用于衡量节点当前的任务排队负载情况;
S102、基础权重计算:
基础权重计算的计算公式如下:
;
;
其中, 为基础权重值, 为每个维度的权重系数,按照任务类型进行调整, 、 、 、 和 由步骤S101进行计算;
S103、计算动态因子:
所述动态调整因子的计算公式如下:
;
为动态调整因子;
为任务优先级,通过调度管理服务进行获取,取值为 0.0‑1.0;
为节点过去 24 小时完成率与响应稳定度;
S104、计算最终权重:
所述W_final的计算公式如下:;
其中, 为最终权重值, 为基础权重,用于获得节点的静态可承载力,为动态调整因子。
3.根据权利要求2所述的基于多维度权重算法的算力中心算力调度方法,其特征在于:所述调度方法还进一步包括步骤S7:S7、调度主循环
负责从任务队列中持续取出待处理任务,结合实时的节点监控信息,计算权重、选择最优节点并完成任务下发与跟踪;循环不断执行,直至调度服务被停止。
4.根据权利要求2所述的基于多维度权重算法的算力中心算力调度方法,其特征在于:在步骤S102中,
若任务类型为混合型应用,则 均设置为0.2;
若CPU密集型应用则设置为 ,最终所有权重系数相加为1。
5.根据权利要求4所述的基于多维度权重算法的算力中心算力调度方法,其特征在于:在动态调整因子公式中的第一个0.5用于防止节点完全被排除以及短期内性能波动导致节点被长期排斥;第二个0.5系数为历史性能权重,可根据业务需求调整。
6.根据权利要求1所述的基于多维度权重算法的算力中心算力调度方法,其特征在于:所述调度方法通过调度系统实现;
所述调度系统包括:
调度管理层,所述调度管理器用于接收和分析资源需求,并指定最优的调度决策,策略引擎用于根据预设规则和实时状态选择合适的调度策略,所述调度管理层包括调度管理器和策略引擎;
资源管理层,用于统一管理和监控算力中心的资源,还用于发现资源、注册资源、分配资源和释放资源,其中,资源管理层维护完成的资源清单,监控资源的健康状态,为上层调度决策提供资源信息;
计算节点层,用于提供实际的计算能力和任务执行环境,包含分布在算力中心的各个计算节点,每个节点都配备了任务执行服务和资源监控服务,能够独立执行分配的任务并实时报告执行状态和节点资源状态;
持久化层,用于为整个系统提供持久化存储服务,包括任务队列、系统指标数据库和配置信息等存储,确保系统状态的持久化和数据的一致性。
7.一种存储介质,其特征在于:所述存储介质用于存储如权利要求6所述的调度系统,以实现如权利要求1‑5任意一项所述的基于多维度权重算法的算力中心算力调度方法。