1.一种网络恶意流量检测方法,其特征在于,包括:
获取待测网络流量数据,输入到预先训练好的网络恶意流量检测模型,根据网络恶意流量检测模型学习到的网络流量数据特征识别所述待测网络流量数据中的恶意流量数据,完成对网络恶意流量的检测;
获取所述训练好的网络恶意流量检测模型的过程包括:
收集网络流量数据包,对所述网络流量数据包进行数据预处理,获得网络流量数据;
使用主成分分析方法与K均值类聚方法对所述网络流量数据进行特征选择;
将特征选择后的网络流量数据按照设定比例划分为训练集和验证集;
使用一维卷积神经网络提取所述网络流量数据的空间特征,使用长短期记忆网络提取所述网络流量数据的时序依赖特征,利用自适应特征融合模块融合所述空间特征和所述时序依赖特征,实现网络恶意流量检测模型的构造;
将所述训练集输入所述网络恶意流量检测模型进行训练,提取不同类别的网络流量数据的特征;
将所述验证集输入训练后的所述网络恶意流量检测模型进行验证,验证完成后输出性能指标;
根据所述性能指标,使用TPE超参数优化算法调整所述网络恶意流量检测模型的超参数,以获得最优超参数下的网络恶意流量检测模型并保存,得到所述训练好的网络恶意流量检测模型。
2.根据权利要求1所述的网络恶意流量检测方法,其特征在于,使用抓包工具从模拟的网络环境中收集所述网络流量数据包,所述网络流量数据包包括多种恶意攻击的网络流量数据包和正常流量的网络流量数据包;将包括多种网络流量类别的所述网络流量数据包的报文头与其网络流量类别进行配对,位于同一所述网络流量数据包的网络流量数据确定为相同类别标签;
根据所述网络流量数据包发送的顺序,将完成标签确定的所述网络流量数据包中的网络流量数据分批次提取并保存在CSV文件中,最终获得所述网络流量数据。
3.根据权利要求2所述的网络恶意流量检测方法,其特征在于,所述网络流量类别由时间区间和主机ip地址共同决定;
在收集所述网络流量数据包的过程中,根据每种网络流量数据包的发送时间和主机ip地址将处于同一个时间区间的所述网络流量数据包根据不同ip地址标记为正常类别或者对应的攻击类别。
4.根据权利要求3所述的网络恶意流量检测方法,其特征在于,所述网络流量类别包含正常流量类别的情况,共有7种,分别为正常流量、DDOS攻击、DoS攻击、僵尸网络、BruteForce攻击、渗透攻击和SQL注入攻击。
5.根据权利要求1所述的网络恶意流量检测方法,其特征在于,所述数据预处理包括文本数据处理、缺失值填充、删除重复数据、弱化数据相关性以及数据标准化;
所述文本数据处理包括文本正则替换、文本整数编码和数据类型转化,其中,所述文本整数编码是指通过整数编码将文本标签数据转换为整数标签;所述数据类型转化是将时序特征从文本数据转换为时间戳数值;
使用缺失位置的特定时间区间内的均值实现所述缺失值填充操作;
所述弱化数据相关性指的是删除模拟网络环境中与网络流量类别强相关的特征。
6.根据权利要求1所述的网络恶意流量检测方法,其特征在于,所述使用主成分分析方法与K均值类聚方法对所述网络流量数据进行特征选择包括:使用所述主成分分析方法完成数据降维,得到特征子空间;
利用所述K均值类聚方法对降维后的数据进行类聚操作,形成多个类聚簇,根据每个所述类聚簇内数据点的均值建立类别子空间;
根据所述特征子空间与所述类别子空间计算余弦相似度,选取所述余弦相似度较高的特征,完成对所述网络流量数据的特征选择,余弦相似度公式如下:;
其中,表示点积运算,x表示特征子空间向量,y表示类别子空间向量, 表示特征子空间向量的范数, 表示类别子空间向量的范数,Cosine Similarity函数表示不同向量空间的余弦相似度。
7.根据权利要求1所述的网络恶意流量检测方法,其特征在于,所述网络恶意流量检测模型的构造包括:所述一维卷积神经网络为根据所述网络流量数据的空间特性构建的精简的miniVGGNet;
对所述一维卷积神经网络和所述长短期记忆网络处理后得到的特征数据进行上采样,并计算每个特征的权重,所述自适应特征融合模块包括权重计算公式,根据所述权重计算公式实现所述空间特征和所述时序依赖特征的融合,所述权重计算公式如下:;
其中,f表示空间特征,g表示时序依赖特征, 表示经过多次训练计算得到的空间特征权重, 表示经过多次训练计算得到的时序依赖特征权重,表示对所述特征数据进行上采样操作,fusion函数表示特征权重的计算与融合;
所述自适应特征融合模块后接入全连接层和softmax层,最终实现所述网络恶意流量检测模型的构造。
8.根据权利要求7所述的网络恶意流量检测方法,其特征在于,将所述训练集输入所述网络恶意流量检测模型后,使用交叉熵损失函数计算预测类别与真实类别的差异,使用Adam优化算法控制所述网络恶意流量检测模型反向传播的学习率和训练轮数;
所述交叉熵损失函数的计算公式为:
;
其中,i表示网络流量数据,所述网络流量数据共有N条,c表示网络流量类别,所述网络流量类别共有M个, 与 分别代表第i条数据的真实类别与预测类别,L函数表示预测的网络流量类别 与真实的网络流量类别Y之间误差的损失函数值。
9.根据权利要求1所述的网络恶意流量检测方法,其特征在于,所述性能指标包括准确率、精准率、召回率、F1值和分类结果矩阵。
10.根据权利要求1所述的网络恶意流量检测方法,其特征在于,在确认构建的所述网络恶意流量检测模型能够检测出恶意网络流量后,使用所述TPE超参数优化算法对所述网络恶意流量检测模型中的超参数进行优化,以获取最佳的超参数配置;
所述TPE超参数优化算法通过在指定的参数空间中选取一组超参数用于所述网络恶意流量检测模型的训练和评估,并根据该组参数所获得的性能指标选取下一组超参数组合,所述TPE超参数优化算法的计算公式如下:;
其中, 表示该组参数x优化更新后的新参数值,E表示期望, 表示在该组参数x下观测到所述网络恶意流量检测模型的性能指标的概率分布。