1.一种基于Bagging改进的GRU并行网络流量异常检测方法,其特征在于,包括:基于分布式获取数据,并转换为统一数据格式;
基于Spark大数据处理技术,利用Bagging算法对GRU模型进行并行训练;
根据二分类损失函数对检测模型进行评价,并利用所述检测模型进行检测,得到检测结果。
2.如权利要求1所述的基于Bagging改进的GRU并行网络流量异常检测方法,其特征在于,所述基于分布式获取数据,并转换为统一数据格式,包括:利用Spark平台以分布式方式进行数据采集,并对采集的数据经过预处理后落地存储或者存储到云端服务器。
3.如权利要求1所述的基于Bagging改进的GRU并行网络流量异常检测方法,其特征在于,所述基于分布式获取数据,并转换为统一数据格式,还包括:读取存储的数据,并将错误、残缺和冗余数据进行清洗后,将所述数据中非数值型数据转换为数值型数据,同时按照数据规约技术,将转换后的数据进行标准化处理,转换为统一的数据格式。
4.如权利要求3所述的基于Bagging改进的GRU并行网络流量异常检测方法,其特征在于,所述基于Spark大数据处理技术,利用Bagging算法对GRU模型进行并行训练,包括:根据转换为统一数据格式后的数据初始化样本集,并设置基检测器数量,同时基于Spark大数据处理技术创建并执行任务,以弹性分布式数据集形式对样本集进行有放回抽取采样,得到训练数据集。
5.如权利要求4所述的基于Bagging改进的GRU并行网络流量异常检测方法,其特征在于,所述基于Spark大数据处理技术,利用Bagging算法对GRU模型进行并行训练,还包括:根据所述训练数据集,利用Bagging算法以并行方式对GRU模型进行训练,并对得到的基检测器进行整合,同时利用模型平均法,得到集成检测器。
6.如权利要求5所述的基于Bagging改进的GRU并行网络流量异常检测方法,其特征在于,所述根据二分类损失函数对检测模型进行评价,并利用所述检测模型进行检测,得到检测结果,包括:利用二分类损失函数对所述集成检测器进行评价,并将除所述训练数据集外的数据作为测试数据集输入所述集成检测器中,利用所述集成检测器对所述测试数据集进行检测,得到异常检测结果。