利索能及
我要发布
收藏
专利号: 2024115494116
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于特征降维和图卷积的海洋网络入侵检测方法,其特征在于,包括以下步骤:步骤1,构建海洋网络入侵检测模型;

步骤2,接收海洋网络流量数据集,对海洋网络流量数据集进行预处理,其中,所述海洋网络流量数据集内包括海洋网络流量样本,所述海洋网络流量样本包括正常流量样本和攻击类样本;

步骤3,将预处理后的海洋网络流量数据集输入到预先建立的遗传随机森林GARF特征降维算法,对海洋网络流量数据集进行特征降维,得到最佳特征子集;

步骤4,将最佳特征子集输入到预先建立的近似最近邻算法ANN,得到最佳特征子集的最优近似最近邻节点集,将网络流量数据转化为图结构型数据集;

步骤5,将图结构型数据集输入至预先建立的图卷积神经网络GCN内,得到流量特征,将流量特征输入至预设的分类网络内,得到分类结果;

步骤6,结合分类结果,采用损失函数二元交叉熵Binary crossentropy作为评估标准,采用优化算法Adam作为优化器,对预先建立的海洋网络入侵检测模型进行训练,得到训练后的海洋网络入侵检测模型,从而实现了海洋网络入侵检测的功能。

2.根据权利要求1所述的方法,其特征在于,步骤1包括:所述海洋网络入侵检测模型包括数据采集模块、网络入侵检测模块和响应反馈模块;

所述数据采集模块用于采集MMSN的网络流量数据流,从中提取网络流量的数据特征,传递给网络入侵检测模块;

网络入侵检测模块用于对网络流量数据进行预处理,使用神经网络模型将网络流量数据特征进行分类检测,识别其中的异常网络流量数据和网络流量攻击,将网络入侵检测结果传递给响应反馈模块;

所述响应反馈模块用于中断受攻击节点业务,拒绝来自恶意节点的网络流量数据,并将网络受攻击情况反馈给人工以进行进一步处理。

3.根据权利要求2所述的方法,其特征在于,步骤2中,所述对海洋网络流量数据集进行预处理,包括:所述网络流量数据集中包含的特征类型为数值特征和符号特征,对网络流量数据集进行数值化和缺失值处理,所述数值化是采用独热编码将符号特征转换成数值特征表示;所述缺失值处理是用0填充缺失值;

对经过缺失值处理后的网络流量数据集进行最小最大归一化Min‑Max Scaling,将数值归一化到0到1之间。

4.根据权利要求3所述的方法,其特征在于,步骤2中,采用如下公式将数值归一化到0到1之间:,

其中x为网络流量数据集中其中一个数值特征对应的数据, 为数值特征对应数据中的最大值, 为数值特征对应数据中的最小值, 表示归一化后的数值特征对应数据。

5.根据权利要求4所述的方法,其特征在于,步骤3中,所述遗传随机森林GARF特征降维算法包括GA算法和RF算法;

所述GA算法通过如下步骤来产生缩减的特征向量:

步骤3‑1,创建初始种群;

步骤3‑2,找到种群中每个染色体的适应度得分,适应度得分计算公式为:,

其中,X是表示当前特征子集的二进制向量, 是适应度函数,是分类器精度, 是根据用户要求调整的预定义权重,以指示RF精度相对于子集长度的重要性;精度(X)是基于特征子集X的RF的精度,用于计算分类器的精度,表示是否使用第i个特征的位;因此, 给出了给定子集中的特征的数目;

步骤3‑3,从种群中选择最佳染色体;

步骤3‑4,在两个选择的亲本之间应用交叉操作;

步骤3‑5,对种群中的变异执行变异操作;

步骤3‑6,检查终止条件;

所述RF算法是一种由决策树DT构成的集成算法,所述RF算法包括两个以上的决策树DT,不同决策树DT之间没有关联,当进行分类任务时,新的输入样本进入,就让森林中的每一棵决策树DT分别进行判断和分类,每棵决策树DT会得到一个分类结果,将所有分类结果中类别最多的分类结果作为最终的结果。

6.根据权利要求5所述的方法,其特征在于,步骤4中,所述近似最近邻算法ANN包括:将网络流量数据集的每一条数据均视为一个节点,计算节点之间的欧氏距离,公式为:,

其中 表示两个节点dx和dy之间的欧氏距离,dn是特征的数量, 和 分别表示节点dx中第i个特征的取值和节点dy中第i个特征的取值;

通过循环遍历网络流量中的训练数据集和测试数据集中的节点,获取节点的相似的邻节点的索引,得到节点特征矩阵,将边的信息添加到边列表中,得到边连接数据,最后将边连接数据转为邻接矩阵,即将网络流量数据转化成图结构数据。

7.根据权利要求6所述的方法,其特征在于,步骤5中,所述图卷积神经网络GCN是基于图结构数据的,所述图结构数据包括特征矩阵和邻接矩阵;

所述图卷积神经网络GCN以特征矩阵M和邻接矩阵A作为初始输入,并从图结构数据中提取特征,设定图中有N个节点,每个节点具有d维特征,图的结构和节点特征用和 表示,其中R表示实数, 和 分别表示 N×N维度的实数矩阵和 N×d 维度的实数矩阵;

图卷积神经网络GCN将M和A作为输入,进行具有局部一阶近似的图卷积操作,所述图卷积神经网络GCN包括两个以上神经网络层,神经网络层之间的传播方式为:,

其中,Z为节点特征表示, 是非线性激活函数, 是近似的图卷积滤波器,是自环邻接矩阵,且 ,I是自环邻接矩阵的单位矩阵, 是度矩阵,W是输入到隐藏层的权重矩阵;

所述图卷积神经网络GCN通过编码图结构和节点特征来学习节点的隐藏表示,最终完成网络流量的分类任务,实现网络入侵检测的目标。

8.根据权利要求7所述的方法,其特征在于,步骤5中,将转化完的图结构数据输入到GCN中,得到图卷积神经网络GCN的输出,最后,使用sigmoid函数作为激活函数进行二分类输出,输出各海洋网络流量样本分别所对应的分类结果。

9.采用如权利要求1 8任一项所述的方法实现的基于特征降维和图卷积的海洋网络入~侵检测系统,其特征在于,包括:

数据预处理模块:用于接收网络流量数据集,对网络流量数据集进行预处理,其中,所述网络流量数据集内包括网络流量样本,所述网络流量样本包括正常流量样本和攻击类样本;

特征降维模块:用于将预处理后的网络流量数据集输入到预先建立的遗传随机森林GARF特征降维算法,对网络流量数据集进行特征降维,得到最佳特征子集,减少原始网络入侵检测数据集的特征维度,提高模型的入侵检测性能以及运行速度,将得到的最佳特征子集作为最终训练数据集;

数据转换模块:用于将最佳特征子集输入到预先建立的近似最近邻算法ANN,得到最佳特征子集的最优近似最近邻节点集,将网络流量数据转化为图结构型数据集;

分类模块:用于将最终图结构型数据集输入至预先建立的图卷积神经网络GCN内,得到流量特征,将流量特征输入至预设的分类网络内,得到分类结果;

模型训练模块:用于结合分类结果,采用损失函数Binary crossentropy作为评估标准、采用优化算法Adam作为优化器对预先建立的海洋网络入侵检测模型进行训练,得到训练后的海洋网络入侵检测模型,从而实现了海洋网络入侵检测的功能。

10.一种设备,其特征在于,包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当一个或多个所述程序被一个或多个所述处理器执行,使得一个或多个所述处理器实现如权利要求1 8中任一所述的方法。

~