1.一种分布式文件存储集群的监控方法,其特征在于,所述分布式文件存储集群的监控方法包括:监控服务器接收监控平台发送的分布式文件存储集群的监控配置信息,其中,所述监控配置信息包括监控项目和异常条件;
所述监控服务器接收监控客户端定时发送的所述分布式文件存储集群的内部状态,其中,所述监控客户端预先部署在所述分布式文件存储集群的监控节点对应的节点服务器上,所述分布式文件存储集群的内部状态由所述监控客户端定时从所述监控节点对应的节点服务器中获取;
所述监控服务器根据所述监控配置信息,对所述分布式文件存储集群的内部状态进行统计分析,得到所述监控项目的实时监控数据;
若所述监控项目的实时监控数据符合所述异常条件,则所述监控服务器将所述监控项目确定为异常对象,将所述实时监控数据作为异常数据,并根据所述异常对象和所述异常数据生成异常问题;
所述监控服务器根据所述异常问题生成异常修复指令,并将所述异常修复指令发送到所述分布式文件存储集群的中心服务器;
所述中心服务器若接收到所述异常修复指令,则对所述异常修复指令进行解析,并根据解析结果调用相应的异常修复方案对所述异常问题进行修复。
2.如权利要求1所述的分布式文件存储集群的监控方法,其特征在于,在所述监控服务器根据所述监控配置信息,对所述分布式文件存储集群的内部状态进行统计分析,得到所述监控项目的实时监控数据之后,所述分布式文件存储集群的监控方法还包括:所述监控服务器将所述实时监控数据按照预设的输出模板进行监控数据填充,得到目标数据;
所述监控服务器将所述目标数据输出到所述监控平台,以使用户通过所述监控平台查看所述分布式文件存储集群的实时状态;
所述监控服务器将所述目标数据存储到预设的历史数据库中;
所述监控服务器根据所述历史数据库中的目标数据,对所述分布式文件存储集群的运行状态进行分析,得到分析结果,以使所述用户根据所述分析结果对所述分布式文件存储集群进行维护。
3.如权利要求1所述的分布式文件存储集群的监控方法,其特征在于,在若所述监控项目的实时监控数据符合所述异常条件,则所述监控服务器将所述监控项目确定为异常对象,将所述实时监控数据作为异常数据,并根据所述异常对象和所述异常数据生成异常问题之后,所述分布式文件存储集群的监控方法还包括:所述监控服务器根据预设的业务属性确定所述异常问题的严重程度;
所述监控服务器根据所述异常问题按照预设的格式生成告警信息,并选取与所述异常问题的严重程度对应的告警发送方式;
所述监控服务器按照所述告警发送方式将所述告警信息发送给预设的告警地址。
4.如权利要求1所述的分布式文件存储集群的监控方法,其特征在于,所述中心服务器若接收到所述异常修复指令,则对所述异常修复指令进行解析,并根据解析结果调用相应的异常修复方案对所述异常问题进行修复包括:所述中心服务器接收所述异常修复指令,并根据所述异常修复指令确定所述异常问题,以及出现所述异常问题的节点服务器;
所述中心服务器根据所述异常问题,从预设的异常修复方案库中查找与所述异常问题对应的异常修复方案和每个所述异常修复方案的优先级别;
所述中心服务器按照异常修复方案的优先级别从高到低的顺序,依次获取每个所述异常修复方案对所述节点服务器的异常问题进行修复,直到所述监控项目的实时监控数据不符合所述异常条件,或者每个所述异常修复方案均被调用为止。
5.如权利要求4所述的分布式文件存储集群的监控方法,其特征在于,在所述中心服务器若接收到所述异常修复指令,则对所述异常修复指令进行解析,并根据解析结果调用相应的异常修复方案对所述异常问题进行修复之后,所述分布式文件存储集群的监控方法还包括:所述中心服务器对所述节点服务器修复之后的监控项目进行检测,得到修复结果;
若所述修复结果为失败,所述中心服务器将所述异常问题和所述修复结果发送到预设的即时通讯地址,以使运维人员根据所述异常问题及时对所述分布式文件存储集群进行人工维护。
6.一种分布式文件存储集群的监控系统,其特征在于,所述分布式文件存储集群的监控系统包括监控服务器和中心服务器,其中,所述监控服务器和所述中心服务器之间通过网络连接;
所述监控服务器包括:
监控配置模块,用于接收监控平台发送的分布式文件存储集群的监控配置信息,其中,所述监控配置信息包括监控项目和异常条件;
数据接收模块,用于接收监控客户端定时发送的所述分布式文件存储集群的内部状态,其中,所述监控客户端预先部署在所述分布式文件存储集群的监控节点对应的节点服务器上,所述分布式文件存储集群的内部状态由所述监控客户端定时从所述监控节点对应的节点服务器中获取;
数据分析模块,用于根据所述监控配置信息,对所述分布式文件存储集群的内部状态进行统计分析,得到所述监控项目的实时监控数据;
异常确认模块,用于若所述监控项目的实时监控数据符合所述异常条件,则将所述监控项目确定为异常对象,将所述实时监控数据作为异常数据,并根据所述异常对象和所述异常数据生成异常问题;
异常通知模块,用于根据所述异常问题生成异常修复指令,并将所述异常修复指令发送到所述分布式文件存储集群的中心服务器;
所述中心服务器包括:
异常修复模块,用于若接收到所述异常修复指令,则对所述异常修复指令进行解析,并根据解析结果调用相应的异常修复方案对所述异常问题进行修复。
7.如权利要求6所述的分布式文件存储集群的监控系统,其特征在于,所述监控服务器还包括:数据填充模块,用于将所述实时监控数据按照预设的输出模板进行监控数据填充,得到目标数据;
数据输出模块,用于将所述目标数据输出到所述监控平台,以使用户通过所述监控平台查看所述分布式文件存储集群的实时状态;
数据存储模块,用于将所述目标数据存储到预设的历史数据库中;
数据统计模块,用于根据所述历史数据库中的目标数据,对所述分布式文件存储集群的运行状态进行分析,得到分析结果,以使所述用户根据所述分析结果对所述分布式文件存储集群进行维护。
8.如权利要求6所述的分布式文件存储集群的监控系统,其特征在于,在所述中心服务器中,所述异常修复模块包括:异常分析子模块,用于接收所述异常修复指令,并根据所述异常修复指令确定所述异常问题,以及出现所述异常问题的节点服务器;
方案获取子模块,用于根据所述异常问题,从预设的异常修复方案库中查找与所述异常问题对应的异常修复方案和每个所述异常修复方案的优先级别;
异常修复子模块,用于按照异常修复方案的优先级别从高到低的顺序,依次获取每个所述异常修复方案对所述节点服务器的异常问题进行修复,直到所述监控项目的实时监控数据不符合所述异常条件,或者每个所述异常修复方案均被调用为止。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至
5任一项所述分布式文件存储集群的监控方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述分布式文件存储集群的监控方法的步骤。