利索能及
我要发布
收藏
专利号: 2021102246097
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-11-28
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于数据增强和BiLSTM的网络入侵检测方法,其特征在于,至少包括:S1.采集网络入侵检测流量数据,对网络入侵检测流量数据的特征进行提取;

S2.利用提取后的特征构建训练数据集,并对训练数据集进行预处理;

S3.根据训练数据集中每一个数据类型的数据量,确定数据量少于a的攻击类型数据样本,并增加数据量少于a的攻击类型数据样本的数量;

S4.构建BiLSTM神经网络模型,经步骤S2及步骤S3处理之后的训练数据集输入至BiLSTM神经网络模型后,进行迭代训练,BiLSTM神经网络模型提取网络入侵检测流量数据的高维特征;

S5.利用softmax逻辑回归函数对网络入侵检测流量数据的高维特征进行识别分类,得到网络入侵检测结果;

所述BiLSTM神经网络模型进行迭代训练时的损失函数采取对数损失函数,优化器采用自适应矩估计Adam,BiLSTM神经网络模型计算的过程为:其中, 表示后向LSTM层的网络隐藏层参数; 表示前向LSTM层的网络隐藏层参数;xt表示经步骤S2及步骤S3处理之后的训练数据集; 表示后向LSTM层在t时刻的输出结果;

表示前向LSTM层在t时刻的输出结果;表示后向LSTM层的偏置值;表示前向LSTM层的偏置值;

步骤S5所述利用softmax逻辑回归函数对网络入侵检测流量数据的高维特征进行识别分类的过程满足:其中,g表示softmax逻辑回归函数,U表示输出的权重矩阵,c表示输出的偏置,yt表示网络入侵检测结果。

2.根据权利要求1所述的基于数据增强和BiLSTM的网络入侵检测方法,其特征在于,步骤S1所述对网络入侵检测流量数据的特征进行提取的方法包括:过滤式方法、包裹式方法及嵌入式方法,提取到的网络入侵检测流量数据的特征的类标签为字符型特征。

3.根据权利要求1所述的基于数据增强和BiLSTM的网络入侵检测方法,其特征在于,步骤S2所述的预处理包括:通过独热编码技术将训练数据集中类标签的字符型特征映射为数值型特征;

将训练数据集中的流字节特征和流数据包特征中的无穷大值进行处理;

删除训练数据集中冗余特征,对训练数据集中的数据进行标准归一化操作。

4.根据权利要求3所述的基于数据增强和BiLSTM的网络入侵检测方法,其特征在于,对无穷大值进行处理的具体操作为:无穷大值通过无穷大值列的最大值加1进行替换,缺失值用零填充。

5.根据权利要求1所述的基于数据增强和BiLSTM的网络入侵检测方法,其特征在于,通过Smote过采样技术或ROS随机过采样技术增加步骤S3中所述数据量少于a的攻击类型数据样本的数量。

6.根据权利要求4所述的基于数据增强和BiLSTM的网络入侵检测方法,其特征在于,步骤S4中构建的BiLSTM神经网络模型包括:输入层、前向LSTM层、后向LSTM层及输出层,其中,前向LSTM层或后向LSTM层中均包括若干个LSTM单元,每一个LSTM单元均包括:遗忘门、输入门及输出门,所述遗忘门控制训练数据集中冗余特征的删除,输入门控制输入训练数据集的保留,所述输出门接受遗忘门和输出门的信息,经过筛选后传递给若干个LSTM单元中的一个LSTM单元。

7.根据权利要求6所述的基于数据增强和BiLSTM的网络入侵检测方法,其特征在于,经步骤S2及步骤S3处理之后的训练数据集输入至BiLSTM神经网络模型后进行迭代训练前,利用reshape函数转化为三维向量。

8.一种基于数据增强和BiLSTM的网络入侵检测系统,所述系统用于实现权利要求1~7任意一项所述的基于数据增强和BiLSTM的网络入侵检测方法,其特征在于,包括:数据采集与特征提取处理模块,用于采集网络入侵检测流量数据,对网络入侵检测流量数据的特征进行提取,提取后的特征构建为训练数据集;

预处理模块,对训练数据集进行预处理;

数据增强处理模块,根据训练数据集中每一个数据类型的数据量,确定数据量少于a的攻击类型数据样本,增加数据量少于a的攻击类型数据样本的数量;

BiLSTM神经网络模块,用于承载BiLSTM神经网络模型,对输入至BiLSTM神经网络模型后的训练数据集进行迭代训练,提取网络入侵检测流量数据的高维特征;

Softmax分类模块,用于承载softmax逻辑回归函数,对网络入侵检测流量数据的高维特征进行识别分类,得到网络入侵检测结果。