1.一种基于改进线性判别式分析LDA降维的极限学习机ELM分类入侵检测方法,其特征在于,包括如下步骤:
(1)网络行为数据归一化:将不同维的有量纲数据转变成无量纲数据;
(2)网络行为数据降维:计算类内散度矩阵和类间散度矩阵,在线性判别分析中加入类内散度矩阵和类间散度矩阵,获得最优转换矩阵,对归一化后的网络行为数据进行降维;
(3)网络行为数据分类:利用极限学习机分类算法,通过对网络行为数据训练集分析获得用于分类隐藏层输出矩阵H和最优输出权重β,然后对测试集进行分类判断,判定网络是否安全及存在何种攻击;
所述步骤(2)中,根据如下步骤计算类内散度矩阵和类间散度矩阵:给定包含N条网络行为数据训练样本的集合D,D={xk,tk},k=1,2,...,N;假设Xij∈{xk},tij∈{tk},i=1,2,...,c,j=1,2,...,ni,Xij为第i类的第j个样本特征向量,tij为该N×d
特征向量对应的样本标签,其中样本特征为d维,则总样本特征矩阵可表示为X ,样本共有c类,ni代表i类样本数,即 对应总样本均值向量u和第i类样本的类均值向量ui分别是 则类内散度矩阵Sw为:类间散度矩阵Sb为
其中, ωij为高位数据空间相似性度量函数,表示数据μi和μj的空间相似度,μi,k和μj,k分别代表数据i和j在k维上的均值,d为数据特征维数,ni和nj分别代表i类和j类样本数;
所述步骤(2)中,根据如下广义瑞利商公式计算最优变换矩阵:*
其中,A 为最优变换矩阵,A是投影矩阵,I为单位矩阵;根据广义瑞利商极值性质,计算‑1
I (Sb‑Sw)的前m个特征值λ1,λ2,…,λm对应的特征向量a1,a2,…,am,将其组成矩阵,其中λ1>*
λ2>…>λm,即获得最优转换矩阵A,且m=c‑1;
所述步骤(2)中,对归一化后的网络行为数据进行降维,包括如下步骤:*
通过矩阵计算获得降维后样本特征向量yk=xkA,其中yk为归一化后的网络行为数据的N×m
特征向量Xk降维后对应的特征向量,降维后样本特征矩阵表示为Y ,其中m为降维后的特N×m
征矩阵Y 的维度。
2.根据权利要求1所述的基于改进线性判别式分析LDA降维的极限学习机ELM分类入侵检测方法,所述步骤(1)中网络行为数据归一化,包括如下步骤:网络行为数据采用0均值标准化方法进行归一化处理:将不同维的有量纲数据转变成无量纲数据,具体公式如下:
其中x为原始数据输入量,z为归一化后的输出数据,μ,σ分别为原始数据集各维的均值和方差。
3.根据权利要求2所述的基于改进线性判别式分析LDA降维的极限学习机ELM分类入侵检测方法,其特征在于,所述步骤(3)中,利用极限学习机分类算法,通过对网络行为数据训练集分析获得用于分类隐藏层输出矩阵H和最优输出权重β,包括如下步骤:降维后获得N个样本转化为具有新特征的样本集D’={yk,tk},k=1,2,...,N,其中yk=T T
[yk1,yk2,...,ykm]为降维后数据m维特征向量,tk=[tk1,tk2,...,tkc]为样本标签,样本共有c类;
将降维后获得的新样本集输入单层神经网络中,对于具有L个隐层节点的单隐层神经网络表示为:
T
其中,Wi=[Wi1,Wi2,…,Wim]为第i个隐层节点与输入层节点之间的输入权值,bi是第i个隐层节点的偏置量,βi为第i个隐层节点与输出层节点之间的输出权重,g(x)为激活函数, 表示 和yk的内积,且单隐层神经网络公式中输入权值Wi和偏置量bi为(‑1,1)或(0,1)间的随机量;
建立目标函数: Ok表示第k条训练样本数据的输出结果;即使得如下公式:
通过矩阵表示为Hβ=T,其中,H满足如下公式:H是隐层节点的输出矩阵,β为输出权重矩阵,T为期望输出;
采用H的Moore‑Penrose广义逆矩阵 分析确定最小范数的最优输出权重β:T T
其中,为了得到更好的泛化性能,在HH或H H的对角线加上正值I/c,用于修复矩阵,保证其为满秩矩阵。
4.根据权利要求1所述的基于改进线性判别式分析LDA降维的极限学习机ELM分类入侵检测方法,其特征在于,所述对测试集进行分类判断,判定网络是否安全及存在何种攻击,包括如下步骤:
通过训练集训练获得隐藏层输出矩阵H和最优输出权重β后,根据Hβ=T,将测试集代入计算出测试集标签,获得数据对应类别,进行网络安全判定,完成网络的入侵检测。