1.一种针对二进制流量数据生成图像的注意力增强方法,其特征在于,所述方法包括以下步骤:
(1)对原始流量数据集中的二进制帧序列进行有效部分截取,截取到的有效部分转换为二维灰度图像;
(2)将步骤(1)获得的二维灰度图像使用特征提取模型进行特征提取,保留训练得到的网络各层参数;
(3)对步骤(2)中得到的各个特征作为根结点,对各层参数分别通过最长带权路径树进行遍历计算,得到三条最长带权路径;通过对该三条最长带权路径回溯,找到注意力最佳的三个像素集合;
(4)对步骤(3)中找到的注意力最佳的三个像素集合进行相应的三通道“染色”,生成注意力增强的二维彩色图像;
(5)对步骤(4)中所有得到的彩色图像排列成新的图像帧序列;
(6)将步骤(5)中得到的新图像帧序列输入CNN中进行最终的流量检测和分类。
2.根据权利要求1所述的方法,其特征在于,所述步骤(1)包括以下步骤:(1.1)将数据集中的原始流量截取784字节为有效帧,一个字节为8比特,正好对应了
256灰阶;
(1.2)对于步骤(1.1)中得到的784字节数据以一个字节转化为一个像素点,由该字节的8比特二进制值转化为十进制数得到该像素点的灰阶,以此为标准,输出一组二维灰度图像。
3.根据权利要求1所述的方法,其特征在于,所述步骤(2)包括以下步骤:(2.1)首先在数据集上使用特征提取模型训练,将训练好的网络各层神经元的权重对模型进行初始化;
(2.2)使用特征提取模型进行特征提取,得到特征图,将其连接到单个激活函数的神经元分类层,该层以sigmoid作为激活函数;
(2.3)使用小批量随机梯度下降作为优化器,并设置动量以及批次大小,将二分类交叉熵作为损失函数;将二维灰度图像集重新随机排列,在步骤(2.2)所述的模型上训练。
4.根据权利要求1所述的方法,其特征在于,所述步骤(3)包括以下步骤:(3.1)对于训练后的特征提取模型,将其最后一层单神经元分类层与全局平均池化层剔除,得到以二维灰度图像为输入,最后一层卷积层激活值为输出的特征提取模型,记作M(x;W),其中x表示输入的灰度图像,W表示模型的权值;
(3.2)将特征提取模型提取出的特征分别作为根结点,对得到的各层参数取绝对值后,使用最长带权路径树查找算法,找到最长的带权路径树e1、除e1之外的最长带权路径e2以及除e1、e2之外的最长带权路径e3;
(3.3)对(3.2)得到的三条最长带权路径e1、e2和e3进行回溯,找出这三条最长带权路径所在树,注意力最佳的三个像素集合A、B、C即分别是三棵树各自所有叶结点的并集。
5.根据权利要求1所述的方法,其特征在于,所述步骤(4)包括以下步骤:(4.1)对三个像素集合A、B和C的权重w1、w2和w3,其中w1>w2>w3,设置像素集合A、B和C集合中三个通道分量的增值分别为Er、Eg和Eb,其中设置Eb的初始值为50,Eg的计算公式为:Er的计算公式为:
并取所有二维图像的像素值做以下归一化:(4.2)对A、B、C分别进行“染色”,其中像素集合A中的三通道分量为:Cr,Cg,Cb=Cr+Er,Cg,Cb像素集合B中的三通道分量为:
Cr,Cg,Cb=Cr,Cg+Eg,Cb像素集合C中的三通道分量为:
Cr,Cg,Cb=Cr,Cg,Cb+Eb之后对所有图像的像素值向上取整:生成具注意力增强的二维彩色图像。
6.根据权利要求1所述的方法,其特征在于,所述步骤(6)包括以下步骤:(6.1)首先对得到的彩色图像像素值进行归一化,由0~255转换为0~1;之后进行第一次卷积,第一个卷积层C1使用尺寸为5*5的卷积核,共有32个通道,生成32个特征图,特征图尺寸为28*28;然后在池化层P1经过2*2的最大值池化操作,生成32个特征图,特征图尺寸为
14*14;
(6.2)在第二个卷积层C2中进行第二次卷积操作,第二个卷积层同样使用尺寸为5*5的卷积核,但通道数为64,生成64个特征图,特征图尺寸为14*14;然后在池化层P2经过2*2的最大值池化操作,生成64个特征图,特征图尺寸为7*7;
(6.3)之后经过两个全连接层,为了防止过拟合,加入了概率为0.5的dropout,最后使用softmax函数输出各类的概率值,即模型的预测值,将输出的取值规范到[0,1],输出越接近0,输入恶意流量概率则越大,输出越接近1,输入正常流量概率则越大。