1.一种无监督异常检测方法,其特征在于,包括:
获取未知类别的网络流量文本数据,将所述未知类别的网络流量文本数据输入到预先训练好的基于双层注意力机制和变分自编码器的无监督异常检测模型,通过所述基于双层注意力机制和变分自编码器的无监督异常检测模型输出异常文本数据;
所述基于双层注意力机制和变分自编码器的无监督异常检测模型包括依次线性连接的输入层、输入注意力层、卷积神经网络层、变分自编码器、输出层;所述变分自编码器包括依次线性连接的编码器、特征注意力层和解码器;
所述通过所述基于双层注意力机制和变分自编码器的无监督异常检测模型输出异常文本数据,包括:对通过输入层输入的归一化后的未知类别的网络流量文本数据利用输入注意力层进行加权处理,得到加权后的网络流量文本数据;
将加权后的网络流量文本数据输入卷积神经网络层进行计算,提取未知类别的网络流量文本数据的空间特性;
利用所述编码器对所述未知类别的网络流量文本数据的空间特性进行降维处理同时提取所述未知类别的网络流量文本数据的空间特性的时间相关;
利用特征注意力层对降维得到的所述时间相关进行加权,得到二次加权后的筛选数据;
将所述筛选数据输入到所述解码器进行解码,通过所述输出层输出解码数据,对解码数据计算重构误差,重构误差大于预设阈值的作为异常文本数据;
所述双层注意力机制的计算过程表示为:
;
;
;
其中, 和 是可学习的网络参数,k表示当前所在节点, 表示当前第k个节点,注意力得分et取决于当前的输入和当前隐藏层状态,随后通过SoftMax函数进行归一化得到权重αt,ek表示在节点k时算出的注意力得分,t表示时间步长, 表示加权后的时间序列,为网络流量文本数据X中的网络数据流量,xt为网络数据流量中的第t个数据量;
将加权后的时间序列 输入到有Bi‑GRU为基础架构的变分自编码器进行计算的过程表示为:;
;
;
;
其中,Zt为更新门,rt为重置门,Wz和Wr为权重矩阵,σ为sigmoid激活函数, 表示过去的时间,r表示重置门的信息,W为可学习的网络参数;
所述变分自编码器中的代价函数 为:
;
其中,Lrec(θ)为均方误差损失函数,DKL表示散度, 表示根据给定的样本xi和网络参数φ 计算出的潜在变量z的后验分布,p(z)表示先验分布。
2.根据权利要求1所述的无监督异常检测方法,其特征在于,在将所述未知类别的网络流量文本数据输入到预先训练好的基于双层注意力机制和变分自编码器的无监督异常检测模型之前,对所述未知类别的网络流量文本数据依次进行数据清洗、重采样、数值化、归一化处理,得到归一化后的未知类别的网络流量文本数据。
3.根据权利要求1所述的无监督异常检测方法,其特征在于,所述基于双层注意力机制和变分自编码器的无监督异常检测模型的训练过程包括:收集各种类型的网络流量数据样本,包括正常网络状态下的正常网络流量数据样本以及各预设异常类型下的异常网络流量数据样本;
对收集的各种类型的网络流量数据样本进行数据清洗、重采样、数值化、归一化处理,得到网络流量数据集;
对所述网络流量数据集进行划分,划分为训练集、测试集;
构建基于双层注意力机制和变分自编码器的无监督异常检测模型;
对所述基于双层注意力机制和变分自编码器的无监督异常检测模型的初始参数以及超参数进行设置,得到搭建好的无监督异常检测模型;
将训练集的数据输入到搭建好的无监督异常检测模型进行训练,并用验证集对搭建好的无监督异常检测模型的异常检测准确率进行检测,获取搭建好的无监督异常检测模型的最优参数,根据最优参数得到训练好的基于双层注意力机制和变分自编码器的无监督异常检测模型。
4.根据权利要求1所述的无监督异常检测方法,其特征在于,所述卷积神经网络层的卷积运算过程表示为:;
其中, 为第l卷积层的卷积运算结果,l为卷积层数量,i为特征值的索引,j为特征图的索引, 表示为前一个卷积层中第m个滤波器的卷积核权重, 表示前一个卷积层中第i+m‑1个网络数据流量, 表示前一个卷积层中第j个特征图的偏置,M表示卷积层中滤波器的大小。
5.一种无监督异常检测装置,其特征在于,包括:
获取模块,用于获取未知类别的网络流量文本数据;
模型处理模块,用于将所述未知类别的网络流量文本数据输入到预先训练好的基于双层注意力机制和变分自编码器的无监督异常检测模型,通过所述基于双层注意力机制和变分自编码器的无监督异常检测模型输出异常文本数据;
所述基于双层注意力机制和变分自编码器的无监督异常检测模型包括依次线性连接的输入层、输入注意力层、卷积神经网络层、变分自编码器、输出层;所述变分自编码器包括依次线性连接的编码器、特征注意力层和解码器;
所述通过所述基于双层注意力机制和变分自编码器的无监督异常检测模型输出异常文本数据,包括:对通过输入层输入的归一化后的未知类别的网络流量文本数据利用输入注意力层进行加权处理,得到加权后的网络流量文本数据;
将加权后的网络流量文本数据输入卷积神经网络层进行计算,提取未知类别的网络流量文本数据的空间特性;
利用所述编码器对所述未知类别的网络流量文本数据的空间特性进行降维处理同时提取所述未知类别的网络流量文本数据的空间特性的时间相关;
利用特征注意力层对降维得到的所述时间相关进行加权,得到二次加权后的筛选数据;
将所述筛选数据输入到所述解码器进行解码,通过所述输出层输出解码数据,对解码数据计算重构误差,重构误差大于预设阈值的作为异常文本数据;
所述双层注意力机制的计算过程表示为:
;
;
;
其中, 和 是可学习的网络参数,k表示当前所在节点, 表示当前第k个节点,注意力得分et取决于当前的输入和当前隐藏层状态,随后通过SoftMax函数进行归一化得到权重αt,ek表示在节点k时算出的注意力得分,t表示时间步长, 表示加权后的时间序列,为网络流量文本数据X中的网络数据流量,xt为网络数据流量中的第t个数据量;
将加权后的时间序列 输入到有Bi‑GRU为基础架构的变分自编码器进行计算的过程表示为:;
;
;
;
其中,Zt为更新门,rt为重置门,Wz和Wr为权重矩阵,σ为sigmoid激活函数, 表示过去的时间,r表示重置门的信息,W为可学习的网络参数;
所述变分自编码器中的代价函数 为:
;
其中,Lrec(θ)为均方误差损失函数,DKL表示散度, 表示根据给定的样本xi和网络参数φ 计算出的潜在变量z的后验分布,p(z)表示先验分布。
6.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至4所述的方法中的任一方法。
7.一种计算机设备,其特征在于,包括,
一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至4所述的方法中的任一方法的指令。