利索能及
我要发布
收藏
专利号: 2020101169544
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种新型映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,该方法具体包括以下步骤:S1:采集感知数据,定义训练数据;

S2:数据归一化,将训练数据通过z-score标准化方法进行归一化;

S3:使用随机哈希函数得到降维后的新数据集;

S4:使用主次哈希函数将新数据集映射分桶;

S5:计算数据的维度均值,再计算给定降维分桶后新数据集的维度均值;

S6:比较降维前后数据的维度均值,选出均值差最大的维度作为分割属性,分割属性对应的降维维度均值作为分割点;

S7:隔离森林依据分割属性和分割点来分割数据构建隔离树,并根据树的限制高度来提前结束树的构建过程;

S8:将实时数据点经归一化、降维后,依次放入构建的隔离森林中,计算每个数据点的路径长度和异常得分;

S9:将异常得分与阈值进行比较,判定数据点是否为异常点。

2.根据权利要求1所述的一种新型映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S1具体包括:假设无线传感器网络节点S={Sj:j=1,2,…m}每隔一个固定时间间隔Δt,各个节点收集一组感知数据并将其发送给基站;节点Sj记录的一组感知数据是一个p维的向量vj=(vj1,vj2,…vjp),vj∈Rp,其中p表示感知数据的类型数;在下一个Δt内,基站将收到n组感知数据V={v1,v2,…vn},其中组数n与节点ID无关;

定义感知数据集V的维度均值为 其中 其中时间t是检测

特征的接收时间;定义时间段[0,T]内收到的检测特征集为训练数据,其表示为矩阵XT={x1,x2,..,xk},k=T/Δt。

3.根据权利要求2所述的一种新型映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S3具体包括:S31:计算归一化后训练数据 对应的随机哈希函数:

其中,α是从满足p-稳定分布函数中随机抽样得到的q维向量,β是一个在 上均匀分布的随机变量;哈希函数hα,β(υ):Rq→Z能把一个q维向量υ映射到整数集上; 为向下取整操作;数据集经过L个随机哈希函数h=(h1(υ),h2(υ),...hL(υ))降维映射后得到一个L维向量V=(v1,v2,...vL);

S32:根据以下主、次哈希函数G1、G2公式计算得到主、次哈希函数的值g1、g2:

4.根据权利要求3所述的一种新型映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S4具体包括:S41:比较主次哈希函数值,若g1=g2,将对应的数据点分到同一个桶内;

S42:对N个桶内哈希值点数进行统计数量,若桶内数量大于等于隔离森林子采样大小,则筛选出满足条件的所有的桶;将筛选出的桶内的点所对应的索引号排序,并从[V]n*L中选出索引号中一一对应的每一条记录,从而组成桶所对应的经过降维子采样的新数据集[A]k*L,k

5.根据权利要求4所述的一种新型映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S5中,计算新数据集的维度均值具体包括:将新数据集[A]k*L作为改进后的隔离森林算法的输入数据集,若有L个维度,L个维度分别计算均值Vnew,将矩阵XT的列均值μ和Vnew分别对应索引后,求出均值差MLi,找出MLi最大值对应的属性Li作为分割属性,Vnewi作为分割点。

6.根据权利要求5所述的一种新型映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S7具体包括:隔离森林算法根据分割属性和分割值sp来分割数据点,数据点中小于sp的数据分到左子树,将大于等于sp的数据分到右子树,依次将属性中所有点进行分割,得到隔离树,并根据树的限制高度H=In(i)+0.5772156649来提前结束树的构建过程。

7.根据权利要求6所述的一种新型映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S8具体包括:将实时数据点放入构建的隔离树中,记录数据点在树中的平均路径长度c(n)和异常得分s(x,n):其中,E(h(x))为样本x在隔离树中的路径长度的期望。

8.根据权利要求7所述的一种新型映射隔离森林的无线传感器网络异常数据检测方法,其特征在于,所述步骤S9具体包括:将异常得分与阈值进行迭代计算比较,若异常得分大于等于阈值,数据点被判断为异常点;若异常得分小于阈值,数据点被判定为正常点。