1.一种基于改进谱聚类的报警数据融合方法,其特征在于,包括对报警数据进行预处理;
将报警数据按照攻击类型进行分组;
对每个组中的报警数据利用属性相似度度量方法计算每两个报警之间的相似度,并构造相似度矩阵;
基于相似度矩阵利用谱聚类算法对报警数据进行聚类形成簇;
对同一个簇中的报警进行阈值判断,若达到阈值则对同一个簇中的报警数据进行融合,然后输入到融合数据集;若未达到阈值则直接输入到融合数据集;
将所有簇的融合数据集组成精简警报数据集输出。
2.如权利要求1所述的基于改进谱聚类的报警数据融合方法,其特征在于,所述对报警数据进行预处理的具体步骤是:输入原始数据集;
在原始数据集中提取报警数据的关键属性;
基于入侵检测消息交换格式将原始数据的格式转换成统一格式。
3.如权利要求2所述的基于改进谱聚类的报警数据融合方法,其特征在于,所述关键属性包括特征字符串、报警类别、报警日期、报警时间戳、源IP、源端口、目的IP和目的端口。
4.如权利要求3所述的基于改进谱聚类的报警数据融合方法,其特征在于,所述对每个组中的报警数据利用属性相似度度量方法计算每两个报警之间的相似度,并构造相似度矩阵的具体步骤是:计算攻击类型、源IP、目的IP、源端口、目的端口以及时间的相似度;
基于主成分分析法计算各个关键属性的权重;
基于相似度和权重构造相似度矩阵。
5.如权利要求1所述的基于改进谱聚类的报警数据融合方法,其特征在于,所述基于相似度矩阵利用谱聚类算法对报警数据进行聚类形成簇的具体步骤是:计算相似度矩阵的度矩阵和拉普拉斯矩阵,并对拉普拉斯矩阵进行规范化处理;
计算拉普拉斯矩阵的特征值,并对特征值进行降序排序,然后取前k个特征值并计算其对应的特征向量;
将特征向量作为列向量构成映射矩阵;
按行对映射矩阵进行归一化,得到归一化矩阵;
使用K‑Means算法对归一化矩阵进行聚类,并标记数据所属类别;
根据标记得到K个簇。