利索能及
我要发布
收藏
专利号: 2021109829918
申请人: 中南林业科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-31
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于HTTP请求文本的Web攻击检测方法,包括:

获取网络流量中完整的HTTP请求文本;

对所述完整的HTTP请求文本进行预处理,以生成编码向量;

利用预先训练好的记忆聚焦处理神经网络MFPNN模型,对所述编码向量进行检测,以得到预测向量,其中,所述MFPNN模型是通过将双向长短期记忆BiLSTM神经网络模型与多头注意力机制结合而构建的,包括嵌入矩阵、记忆分析模块、聚焦处理模块以及融合计算模块,所述记忆分析模块包括依次串联的多个BiLSTM神经网络模型和第一全连接层;所述聚焦处理模块包括依次串联的多个多头注意力层和一个Reshape层;

基于所述预测向量进行计算,得到Web攻击的分类结果;

其中,所述利用预先训练好的MFPNN模型,对所述编码向量进行检测,以得到所述预测向量,包括:通过所述嵌入矩阵,将所述编码向量变换成相同的第一词嵌入向量矩阵和第二词嵌入向量矩阵;将所述第一词嵌入向量矩阵输入所述记忆分析模块,以得到第一特征向量;将所述第二词嵌入向量矩阵加上he位置编码后输入所述聚焦处理模块,以得到第二特征向量;将所述第一特征向量和所述第二特征向量输入所述融合计算模块,以得到所述预测向量。

2.根据权利要求1所述的方法,其中,所述对所述完整的HTTP请求文本进行预处理,以生成编码向量,包括:基于语料库词典,按照预处理规则对所述完整的HTTP请求文本进行预处理,以生成整数编码向量,其中,所述语料库词典包括专家词典、通用高频词典、数据集高频词典、特殊字符和占位符。

3.根据权利要求2所述的方法,其中,所述基于语料库词典,按照预处理规则对所述完整的HTTP请求文本进行预处理,以生成整数编码向量,包括:对所述完整的HTTP请求文本进行统一资源定位符URL解码,以获得普通文本;

通过使用所述语料库词典中的特殊字符作为分隔符,对所述普通文本进行分词处理;

基于所述语料库词典和所述预处理规则,对经过分词处理的所述普通文本进行关键词处理,以生成预设长度的关键词文本;

通过将所述关键词文本中的每个关键词替换为所述语料库词典中与该关键词相应的数值,生成所述整数编码向量。

4.根据权利要求2或3所述的方法,其中,所述嵌入矩阵是基于word2vec模型而获得的;

所述融合计算模块包括级联的第二全连接层和第三全连接层。

5.根据权利要求4所述的方法,其中,每个所述多头注意力层包括多头注意力子层和全连接前馈网络子层,所述多头注意力子层和所述全连接前馈网络子层各自的周围使用残差连接。

6.根据权利要求1至3中任一项所述的方法,其中,所述基于所述预测向量进行计算包括:基于所述预测向量,利用argmax函数进行计算。

7.根据权利要求1至3中任一项所述的方法,其中,所述MFPNN模型是预先使用交叉熵损失函数训练的。

8.一种基于HTTP请求文本的Web攻击检测装置,包括:

获取模块,被配置为获取网络流量中完整的HTTP请求文本;

预处理模块,被配置为对所述完整的HTTP请求文本进行预处理,以生成编码向量;

检测模块,被配置为利用预先训练好的MFPNN模型,对所述编码向量进行检测,以得到预测向量,其中,所述MFPNN模型是通过将BiLSTM神经网络模型与多头注意力机制结合而构建的,包括嵌入矩阵、记忆分析模块、聚焦处理模块以及融合计算模块,所述记忆分析模块包括依次串联的多个BiLSTM神经网络模型和第一全连接层;所述聚焦处理模块包括依次串联的多个多头注意力层和一个Reshape层;所述利用预先训练好的MFPNN模型,对所述编码向量进行检测,以得到所述预测向量,包括:通过所述嵌入矩阵,将所述编码向量变换成相同的第一词嵌入向量矩阵和第二词嵌入向量矩阵;将所述第一词嵌入向量矩阵输入所述记忆分析模块,以得到第一特征向量;将所述第二词嵌入向量矩阵加上位置编码后输入所述聚焦处理模块,以得到第二特征向量;将所述第一特征向量和所述第二特征向量输入所述融合计算模块,以得到所述预测向量;

分类模块,被配置为基于所述预测向量进行计算,得到Web攻击的分类结果。

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如权利要求1至7中任意一项所述的方法。