1.一种基于容器云的系统资源监控方法,其特征在于,包括:
获取容器云平台下的容器编排框架部署情况后生成框架列表,所述框架列表中记录所有部署在所述容器云平台下的容器编排框架;
根据记录顺序从所述框架列表中按预设的获取周期逐一获取每一个容器编排框架中的各个应用的运行状态信息,将获取的运行状态信息记录在预设的存储单元内,所述存储单元内设有用于记录每个容器编排框架的物理机器资源配置数据的框架记录节点和用于记录每个应用的运行状态信息、物理机器资源占用数据的应用记录节点,所述运行状态信息用于标识应用在其所在容器编排框架中的运行状态;
当任一所述应用的运行状态信息在预设的判断时间阈值范围内持续为等待状态,则标记所述容器编排框架资源不足,此时,生成报警信息后推送给执行扩容操作的执行者后,便于通知其执行容器编排框架的扩容作业;
获取标记为资源不足的容器编排框架的物理机器资源配置数据和运行于所述容器编排框架中的任一应用所占用的物理机器资源占用数据,将两类数据记录在对应的记录节点中;
接收所述执行者反馈的扩容作业结束信号后,从所述存储单元中调取在前记录的所述标记为资源不足的容器编排框架中的每一个应用所占用的物理机器资源占用数据后进行应用的重新配置和重启,获取所述标记为资源不足的容器编排框架的当前的物理机器资源配置数据后记录于所述框架记录节点中;
汇总所述框架记录节点和所述应用记录节点的记录数据后生成扩容报告。
2.根据权利要求1所述的基于容器云的系统资源监控方法,其特征在于,所述获取容器云平台下的容器编排框架部署情况后生成框架列表,所述框架列表中记录所有部署在所述容器云平台下的容器编排框架,包括:连接所述容器云平台的管理控制台;
向所述容器云平台的管理控制台发送用于获取运行于所述容器云平台上的容器编排框架的情况的数据请求;
接收所述管理控制台的反馈后生成所述框架列表,所述框架列表中按反馈的时间顺序记录所有运行于所述容器云平台上的容器编排框架;
为所述框架列表中的每一个所述容器编排框架按照记录时间生成记录序号,所述记录序号为容器编排框架在容器云平台中的识别序号,用于区分不同的容器编排框架。
3.根据权利要求2所述的基于容器云的系统资源监控方法,其特征在于,所述根据记录顺序从所述框架列表中按预设的获取周期逐一获取每一个容器编排框架中的各个应用的运行状态信息,将获取的运行状态信息记录在预设的存储单元内,包括:为所述框架列表中的每个容器编排框架生成监控节点,所述监控节点用于在设定周期内连接容器编排框架的管理控制台后获取运行其上的各个应用的运行状态信息;
根据所述框架列表中的容器编排框架的记录序号,为每个所述容器编排框架上的应用在所述存储单元中生成对应的应用记录节点,所述应用记录节点用于记录所述监控节点获取的运行于容器编排框架上的各个应用的运行状态信息;
通过所述监控节点,按照设定的监测周期连接所述容器编排框架的管理控制台后,请求获取所有运行于所述容器编排框架上的应用的运行状态信息;
接收所述容器编排框架的管理控制台的反馈后,将应用的运行状态信息按接收到反馈的时间记录于所述应用记录节点内。
4.根据权利要求1或3所述的基于容器云的系统资源监控方法,其特征在于,所述当任一所述应用的运行状态信息在预设的判断时间阈值范围内持续为等待状态,则标记所述容器编排框架资源不足,此时,生成报警信息后推送给执行扩容操作的执行者后,便于通知其执行容器编排框架的扩容作业,包括:读取所述应用记录节点中的任一应用的运行状态信息;
判断所述应用在所述判断时间阈值范围内的运行状态信息是否持续为等待状态,如果是,则标记所述容器编排框架的状态为资源不足,如果否,则标记所述容器编排框架的状态为运行正常,所述判断时间阈值范围为预先设置的一段时长;
按上述步骤遍历所述框架列表中的所有的容器编排框架下的所有应用,标记所有的容器编排框架的状态;
调用邮件模板后生成报警邮件,在所述报警邮件中记录所述标记为资源不足的容器编排框架的记录序号和标识资源不足的提示信息;
从预设的收信人地址列表中读取所述执行者的邮件地址后将所述报警邮件推送给所述执行者。
5.根据权利要求1所述的基于容器云的系统资源监控方法,其特征在于,所述获取标记为资源不足的容器编排框架的物理机器资源配置数据和运行于所述容器编排框架中的任一应用所占用的物理机器资源占用数据,将两类数据记录在对应的记录节点中,包括:连接所述标记为资源不足的容器编排框架的管理控制台;
向所述管理控制台发送数据请求,用于获取所述容器编排框架的物理机器资源配置数据和运行于所述容器编排框架中的任一应用所占用的物理机器资源占用数据;
接收所述管理控制台的反馈后,按收到反馈的时间,将物理机器资源配置数据记录于所述框架记录节点、将物理机器资源占用数据记录至应用记录节点。
6.根据权利要求1所述的基于容器云的系统资源监控方法,其特征在于,所述接收所述执行者反馈的扩容作业结束信号后,从所述存储单元中调取在前记录的所述标记为资源不足的容器编排框架中的每一个应用所占用的物理机器资源占用数据后进行应用的重新配置和重启,获取所述标记为资源不足的容器编排框架的当前的物理机器资源配置数据后记录于所述框架记录节点中,包括:接收所述执行者的包含扩容作业结束信号的反馈信息;
连接所述存储单元后,从所述应用记录节点中读取所述标记为资源不足的容器编排框架中的每一个应用所占用的物理机器资源占用数据的距离当前时间最近的一次记录;
根据所述物理机器资源占用数据配置对应的应用,在配置完成后对所述应用进行重启;
连接所述容器编排框架的管理控制台,获取所述容器编排框架的当前的物理机器资源配置数据,将获取的数据按获取时间记录在所述框架记录节点中。
7.根据权利要求2所述的基于容器云的系统资源监控方法,其特征在于,所述获取容器云平台下的容器编排框架部署情况后生成框架列表之后,包括:根据所述框架列表中的记录顺序,逐一连接每一个所述容器编排框架的管理控制台;
对连接成功的容器编排框架,在所述记录序号后追加成功标记后生成新的记录序号;
对连接失败的容器编排框架,在所述记录序号后追加失败标记后生成新的记录序号;
所述根据记录顺序从所述框架列表中按预设的获取周期逐一获取每一个容器编排框架中的各个应用的运行状态信息,将获取的运行状态信息记录在预设的存储单元内之前,包括对所述容器编排框架的记录序号的识别,当所述记录序号中包含成功标记后,执行读取所述容器编排框架中的应用的运行状态信息的操作,当所述记录序号中包含失败标记时,不执行读取所述容器编排框架中的应用的运行状态信息的操作。
8.一种基于容器云的系统资源监控装置,其特征在于,包括:
列表生成模块,设置为获取容器云平台下的容器编排框架部署情况后生成框架列表;
应用状态获取模块,设置为根据记录顺序从所述框架列表中按预设的获取周期逐一获取每一个容器编排框架中的各个应用的运行状态信息,将获取的运行状态信息记录在预设的存储单元内;
报警信息推送模块,设置为当任一所述应用的运行状态信息在预设的判断时间阈值范围内持续为等待状态,标记所述容器编排框架资源不足,生成报警信息后推送给执行扩容操作的执行者;
数据记录模块,设置为获取标记为资源不足的容器编排框架的物理机器资源配置数据和运行于所述容器编排框架中的任一应用所占用的物理机器资源占用数据,将两类数据记录在对应的记录节点中;
应用重启模块,设置为接收所述执行者反馈的扩容作业结束信号后,从所述存储单元中调取在前记录的所述标记为资源不足的容器编排框架中的每一个应用所占用的物理机器资源占用数据后进行应用的重新配置和重启,获取所述标记为资源不足的容器编排框架的当前的物理机器资源配置数据后记录于所述框架记录节点中;
扩容报告生成模块,设置为汇总所述框架记录节点和所述应用记录节点的记录数据后生成扩容报告。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,其特征在于,所述计算机可读指令被所述处理器执行时,实现如权利要求1至7中任意一项所述的基于容器云的系统资源监控方法。
10.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被一个或多个处理器执行时,实现如权利要求1至7中任意一项所述的基于容器云的系统资源监控方法。