利索能及
我要发布
收藏
专利号: 2022107194784
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-24
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于,包括以下步骤:S1.构建结合了GCN网络和LSTM网络的GCN‑LSTM模型,并构建基于GCN‑LSTM模型的序列重构模型;所述的序列重构模型为融入了注意力模型的基于GCN‑LSTM模型的编码器‑解码器模型;

S2.对得到的序列重构模型进行训练和测试,得到测试好的序列重构模型;

S3.将待检测数据序列以时序排列并输入训练好的序列重构模型中,通过编码器提取待检测数据序列的特征,并通过注意力模型得到待检测数据序列的特征的加权向量,最后通过解码器结合特征与加权向量生成重构序列;

S4.将重构序列和待检测数据序列作差,构建误差序列,并将误差序列分为训练数据集和测试数据集两部分;

S5.构建基于Copula函数的异常检测模型,并将训练数据集输入异常检测模型中进行训练;

S6.将测试数据集输入训练好的异常检测模型进行异常检测,得到测试集异常序列数据检测结果。

2.如权利要求1所述的基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于:在所述步骤S3中,将待检测数据序列以时序排列并输入训练好的序列重构模型中,通过编码器提取待检测数据序列的特征,并通过注意力模型得到待检测数据序列的特征的加权向量,最后通过解码器结合特征与加权向量生成重构序列的过程具体为;

S301.获取待检测数据序列,将待检测数据序列以时序排列,将排列好的待检测数据序列输入序列重构模型中的编码器‑解码器模型中的编码器,通过编码器提取待检测数据序列的特征;

S302.将特征的序列输入注意力模型,通过注意力模型以分配权重的方式计算得到加权向量;

S303.将特征结合加权向量输入到解码器中,通过解码器解码得到重构序列。

3.如权利要求2所述的基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于:在所述步骤S301中,将排列好的待检测数据序列输入序列重构模型中的编码器‑解码器模型中的编码器,通过编码器提取待检测数据序列的特征的过程具体为:A1.设初始时间t0=t‑s+1,其中s为待检测数据序列时长,t为时间变量,将排列好的待检测数据序列表示为待检测数据序列A2.结合GCN网络的边集合E,通过第1个GCN‑LSTM模型的GCN网络单元提取待检测数据序列中数据 的空间特征,将得到的空间特征输入第1个GCN‑LSTM模型的LSTM网络中提取其时间特征并得到 的隐藏层状态 将得到的隐藏层状态 输入下一个GCN‑LSTM模型中;

A3.结合上一个GCN‑LSTM模型得到的隐藏层状态 和GCN网络的边集合E,通过第2个GCN‑LSTM模型的GCN网络提取待检测数据序列中数据 的空间特征,将得到的空间特征输入第2个GCN‑LSTM模型的LSTM网络中,提取其时间特征并得到 的隐藏层状态将得到的隐藏层状态 输入下一个GCN‑LSTM模型中;以此递进,直到得到整个待检测数据序列的隐藏层状态,将整个待检测数据序列的隐藏层状态整理为特征的序列

4.如权利要求3所述的基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于:在所述的步骤S302中,将特征的序列输入注意力模型,通过注意力模型以分配权重的方式计算得到加权向量的过程具体为:B1.将特征的序列输入注意力模型,计算当前时刻t对应各个历史时刻的时间注意力权重向量at,具体表示为:其中,Wa是可训练权重矩阵;ba是注意力权重的偏置向量;tanh表示激活函数;最后有:其中,ai为第i时刻的注意力权重值;

B2.通过softmax函数对得到的各个时间的注意力权重系数进行归一化处理,得到时间注意力权重 有:B3.将得到时间注意力权重与其对应的特征的序列进行加权,得到加权向量ct,具体表示为:

5.如权利要求1所述的基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于:在所述的步骤S6中,将测试数据集输入训练好的异常检测模型进行异常检测,得到测试集异常序列数据检测结果的过程具体为:S601.面向测试数据集的每一个维度,使用非参数方法估计其异常样本在概率分布的左尾部以及右尾部的经验累积联合分布,并且计算偏度系数;

S602.根据得到的测试数据集的每一个维度异常样本在概率分布的左尾部以及右尾部的经验累积联合分布,计算测试数据集中每一个时间快照的empiricalcopula观测值;

S603.根据测试数据集中每一个时间快照的empirical copula观测值获得偏度系数的empirical copula观测值;

S604.根据得到的测试数据集中每一个时间快照的empirical copula观测值和偏度系数的empirical copula观测值,计算测试数据集中每一个时间快照的左尾部、右尾部以及偏度系数的概率;

S605.根据测试数据集中每一个时间快照的左尾部、右尾部以及偏度系数的概率,计算每一个时间快照对应的异常分数和异常阈值,并将每一个时间快照对应的异常分数与异常阈值对比,得到测试集异常序列数据检测结果。

6.如权利要求5所述的基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于:面向测试数据集的每一个维度,使用非参数方法估计其异常样本在概率分布的左尾部以及右尾部的经验累积联合分布,并且计算偏度系数,具体为:C1.使用非参数方法估计d维测试数据集E=(e1,i,e2,i,…,ed,i)中左尾部的经验累积联合分布 以及右尾部的经验累积联合分布 具体为:其中n为测试数据集中的数据的总数;

C2.计算测试数据集的偏度系数bi,具体为:

7.如权利要求6所述的基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于:在所述步骤S603中,根据测试数据集中每一个时间快照的empirical copula观测值获得偏度系数的empirical copula观测值的过程具体为:D1.计算每个时间快照的左尾部的empirical copula观测值 和右尾部的empirical copula观测值D2.根据测试数据集的d维偏度系数bd的值确定偏度系数的empirical copula观测值若bd≥0,则 反之

8.如权利要求7所述的基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于:计算测试数据集中每一个时间快照的左尾部、右尾部以及偏度系数的概率,具体为:计算测试数据集中每一个时间快照的左侧pl、右侧以及偏度的尾部概率:其中,pl为第i个时间快照的左侧尾部概率,pr为第i个时间快照的右侧尾部概率,ps为第i个时间快照的偏度的尾部概率, 为第j个i个时间快照的左尾部empiricalcopula观测值, 为第j个i个时间快照的右尾部empirical copula观测值, 为第j个i个时间快照的右尾部偏度系数的empirical copula观测值。

9.如权利要求8所述的基于GCN‑LSTM和注意力机制的异常检测方法,其特征在于:根据测试数据集中每一个时间快照的左尾部、右尾部以及偏度系数的概率,计算每一个时间快照对应的异常分数和异常阈值,并将每一个时间快照对应的异常分数与异常阈值对比,得到测试集异常序列数据检测结果,具体步骤为:E1.得到每一个时间快照(ei)对应的异常分数O(ei):

O(ei)=max{pl,pr,ps}

其中,max函数返回一组数据中最大的数据;

E2.计算得到异常阈值,具体为:

OThershold(ei)=percentile(O(ei),1‑α)

其中,OThershold(ei)为时间快照(ei)的异常阈值,α为历史性能指标序列的总体异常率,percentile函数计算分析百分比数值点;

E3.将每一个时间快照对应的异常分数与异常阈值进行对比,判断每个时间快照下的数据是否存在异常:若O(ei)>OThershold(ei)时,当前时间快照为异常;

若O(ei)≤OThershold(ei)时,当前时间快照为正常;

E4.整理每个时间快照下的数据的异常结果,得到测试集异常序列数据结果。

10.一种基于GCN‑LSTM和注意力机制的异常检测系统,其特征在于:包括重构模型构建模块、模型训练模块、序列重构模型、数据处理模块、检测模型构建模块、Copula训练模块、异常检测模型;所述的重构模型构建模块用于构建结合了GCN网络和LSTM网络的GCN‑LSTM模型,并构建基于GCN‑LSTM模型的序列重构模型;所述的模型训练模块用于对序列重构模型进行训练和测试;所述的序列重构模型用于提取待检测数据序列的特征并得到待检测数据序列的特征的加权向量,并通过解码器结合特征与加权向量生成重构序列;所述的数据处理模块用于将重构序列和待检测数据序列作差,构建误差序列,并将误差序列分为训练数据集和测试数据集两部分;所述的检测模型构建模块用于构建基于Copula函数的异常检测模型;所述的Copula训练模块用于将训练数据集输入异常检测模型中进行训练;所述的异常检测模型用于将测试数据集输入训练好的异常检测模型进行异常检测得到检测结果。