利索能及
我要发布
收藏
专利号: 2025102732661
申请人: 浙江理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于VAE与关联差异的多元时序数据异常检测方法,包括如下步骤:(1)获取多元时序数据并对其进行预处理,以获得适合模型训练的清洁数据集,进而将数据集划分成训练集和测试集;所述多元时序数据为来自于SMAP数据集关于土壤湿度的多元时间序列数据;

(2)建立基于VAE和关联差异机制的异常检测模型,其包括:

关联差异模块,用于捕捉多元时序数据中的时间依赖性,计算多元时序数据的关联差异,作为异常检测的指标的一部分;

重构模块,用于将关联差异模块输出的特征向量映射到潜空间以捕捉其潜在特征,之后在潜空间中随机采样得到重构时序数据;

随机关联差异模块,用于捕捉重构时序数据中的时间依赖性,计算重构时序数据的关联差异,以进一步提高模型的异常检测识别能力;

所述重构模块首先利用降维卷积层将关联差异模块输出的特征向量映射到潜空间以拟合隐变量近似后验分布的均值和方差,从而得到隐变量的近似后验分布即潜在特征,进而利用升维卷积层在潜空间中采用重参数化技术随机采样得到最终的隐变量即作为重构时序数据;

(3)利用训练集的多元时序数据对上述模型进行训练,采用重构误差和关联差异损失作为模型训练的目标;

(4)将测试集的多元时序数据输入至训练好的模型中得到对应的关联差异,根据关联差异和重构误差通过以下公式计算出多元时序数据中每个时间点的异常得分;

其中:X表示多元时序数据, 表示重构时序数据, 为X的异常得

分序列,序列中每个元素值即对应多元时序数据中每个时间点的异常得分;AssDis(P,S;X)为多元时序数据X的关联差异, 为重构时序数据 的关联差异,重构误差由两部分组成即X与 的均方误差 和KL散度KLD,⊙表示元素级乘法,Softmax()表示Softmax函数;

(5)将多元时序数据中每个时间点的异常得分与设定的阈值进行比较,若超过阈值即判定为异常,以此识别出多元时序数据中的异常时间点。

2.根据权利要求1所述的一种基于VAE与关联差异的多元时序数据异常检测方法,其特征在于:所述步骤(1)中对多元时序数据进行预处理包括去噪、归一化和缺失值填充。

3.根据权利要求1所述的一种基于VAE与关联差异的多元时序数据异常检测方法,其特征在于:所述多元时序数据输入模型之前需对其进行位置编码,即将多元时序数据与基于正弦和余弦函数生成的位置编码向量进行元素级相加,用以编码数据中的顺序信息。

4.根据权利要求1所述的一种基于VAE与关联差异的多元时序数据异常检测方法,其特征在于:所述关联差异模块由多个关联差异层级联组成,所述关联差异层首先将输入x经过Anomaly‑Attention,然后将Anomaly‑Attention的输出与输入x相加并经层归一化处理后输入至前馈神经网络,最后将前馈神经网络的输入与输出相加并经层归一化处理后作为关联差异层的输出。

5.根据权利要求1所述的一种基于VAE与关联差异的多元时序数据异常检测方法,其特征在于:所述随机关联差异模块由多个随机关联差异层级联组成,所述随机关联差异层首先将输入x'经过Anomaly‑Attention,然后将Anomaly‑Attention的输出与输入x'相加并经层归一化处理后输入至前馈神经网络,最后将前馈神经网络的输入与输出相加并经层归一化处理后输入至全连接层,全连接层的输出即作为随机关联差异层的输出。

6.根据权利要求1所述的一种基于VAE与关联差异的多元时序数据异常检测方法,其特征在于:所述关联差异AssDis(P,S;X)的表达式如下:其中: 表示 相对于 的KL散度, 表示 相对于 的KL散

l

度,L为关联差异模块的层数, 表示先验关联矩阵P中第i行的分布, 表示序列关联矩l阵S中第i行的分布,N为多元时序数据的序列长度。

7.根据权利要求6所述的一种基于VAE与关联差异的多元时序数据异常检测方法,其特l l征在于:所述先验关联矩阵P和序列关联矩阵S的表达式如下:

其中:Q、K、σ分别为查询向量矩阵、键向量矩阵、尺度参数矩阵,

l

X为多元时序数据X输入至关联差异模块中第l层的输出,

分别对应为Q、K、σ在第l层的权值参数矩阵,σi为尺度参数矩阵σ中的第i个l T元素值,dmodel为X的特征维度,表示转置,Rescale()表示重缩放操作。

8.根据权利要求1所述的一种基于VAE与关联差异的多元时序数据异常检测方法,其特征在于:所述步骤(5)中的阈值采用基于极值理论的超阈值模型来自动设定,该超阈值模型通过拟合异常得分序列的极值概率分布,推导出超出阈值的区域,并根据Pickands定理推导其尾部分布近似收敛为广义帕雷托分布函数,从而确定得到最佳的阈值。