1.一种基于深度堆叠策略的挖泥船施工数据异常检测方法,其特征在于,包括如下步骤:S1、数据预处理:对挖泥船施工数据进行滤波和归一化处理,并将处理后的数据样本划分为训练集和测试集两个部分;
S2、使用训练集数据构建卷积自编码器和CNN‑LSTM神经网络:采用卷积自编码器对训练集中的数据特征分布进行学习,同时采用CNN‑LSTM神经网络对训练集中的数据趋势进行预测;
S3、采用测试集数据对卷积自编码器和CNN‑LSTM神经网络进行精度测试;
S4、计算卷积自编码器和CNN‑LSTM神经网络的最优精度测试结果与测试集数据真实值之间的偏差,并将偏差进行堆叠,建立堆叠偏差数据样本;
S5、采用高斯异常检测算法对堆叠偏差数据样本进行阈值设置,并进行测试集数据样本的异常检测;
S6、选取评价指标对异常检测精度进行量化评估。
2.根据权利要求1所述的一种基于深度堆叠策略的挖泥船施工数据异常检测方法,其特征在于:步骤S1所述数据预处理的具体内容和方法,包括以下步骤:S11、对挖泥船多个施工周期施工数据中包含的控制参数及观测量进行筛选,得出疏浚作业过程起主导作用的控制参数及观测量;
S12、根据所选的控制参数及观测量的数据特性,采用Hampel滤波和归一化的方法对挖泥船施工数据进行预处理,消除环境噪声和传感器采集数据量纲不一的问题。
3.根据权利要求1所述的一种基于深度堆叠策略的挖泥船施工数据异常检测方法,其特征在于:步骤S2,所述构建卷积自编码器和CNN‑LSTM神经网络的具体内容和方法,包括以下步骤:S21、卷积自编码器包括卷积层、池化层、反池化层结构,使卷积自编码器网络输入、输出结构呈现明显的镜像分布;CNN‑LSTM神经网络由卷积神经网络CNN和长短期记忆网络LSTM组成,其中,卷积神经网络CNN负责对输入数据特征进行提取并导入至LSTM神经网络中,实现CNN‑LSTM神经网络对下一时刻控制参数及观测量的预测;
S22、卷积自编码器计算公式为:
其中,f和g分别为编码和解码过程,x为编码器的网络输入,w1和w2分别为输入层到隐藏层和隐藏层到输出层的权重矩阵,b1、b2为偏置项,x'为自编码器的输出;
S23、CNN通过两层卷积操作后连接有一个LSTM神经网络以实现数据趋势预测,其中,LSTM网络中的遗忘门,更新门,输出门的计算方法如下:ft=σ(Wxf*xt+Whfht‑1+bf)
it=σ(Wxi*xt+Whiht‑1+bi)
ct=ft*ct‑1+it*tanh(Wxg*xt+Whght‑1+bg)ot=σ(Wxo*xt+Whoht‑1+bo)
Et=ot*tanh(ct)
其中,ft为遗忘门输出,σ为网络的激活函数,Whf、Whi、Wxg、Whg、Wxo、Who为网络的参数,it为更新门输出,ht‑1为隐藏状态,ct、ct‑1为单元状态,ot为输出门,bi、bo、bg为偏置项;S24、采用训练集数据对卷积自编码器和CNN‑LSTM神经网络进行训练,其中,卷积自编码器输入和输出的节点相同,能够识别训练集数据中的异常分布的位置;CNN‑LSTM神经网络基于当前时刻控制参数及观测量对下一时刻的控制参数及观测量数据进行预测输出,能够识别训练集数据中的异常时间点或时间段。
4.根据权利要求1所述的一种基于深度堆叠策略的挖泥船施工数据异常检测方法,其特征在于:步骤S3,所述采用测试集数据对卷积自编码和CNN‑LSTM神经网络进行精度测试的具体方法是,以最小平均绝对误差作为精度的指标,对卷积自编码器和CNN‑LSTM神经网络的结构进行调整,获得最优测试集数据的测试结果。
5.根据权利要求1所述的一种基于深度堆叠策略的挖泥船施工数据异常检测方法,其特征在于:步骤S4,所述计算卷积自编码和CNN‑LSTM神经网络测试结果与测试集数据真实值之间的偏差,并将偏差进行堆叠,建立堆叠偏差数据样本的具体方法和计算公式如下:e=y‑y'
e'=y‑yAE
E=(e;e')
其中,e为CNN‑LSTM神经网络基于测试集数据的测试结果与真实数据的偏差,大小为n*m;e'为卷积自编码器基于测试集数据的测试结果与真实数据的偏差,大小为n*m;E为堆叠偏差数据样本,大小为2n*m;y为测试集真实数据,y'为CNN‑LSTM神经网络基于测试集数据的测试结果,yAE为卷积自编码器基于测试集数据的测试结果。
6.根据权利要求1所述的一种基于深度堆叠策略的挖泥船施工数据异常检测方法,其特征在于:步骤S5,所述采用高斯异常检测算法对堆叠偏差数据样本进行阈值设置,并进行测试集数据样本的异常检测的具体内容和方法步骤包括:将堆叠偏差数据样本转换为高斯分布,对样例的分布进行分析,得出堆叠偏差数据样本在各个维度上的数学期望和方差,计算出堆叠偏差数据样本的概率密度分布函数,并基于堆叠偏差数据样本选取少量的Cross Validation集确定一个阈值;当给定一个新的点,则根据其在高斯分布上算出的概率密度P以及计算出的阈值ε,判断当前概率密度是否满足p<ε,当是,则判定为异常,反之,则判定为正常,在此过程中,堆叠偏差数据样本的均值和方差的计算方式如下:同时,采用均值和方差计算概率密度分布函数P(x)
其中,m为堆叠误差数据样本总数,n为堆叠误差数据样本维度。
7.根据权利要求1所述的一种基于深度堆叠策略的挖泥船施工数据异常检测方法,其特征在于:步骤S6,所述对异常检测精度进行量化评估的具体内容包括:准确率、召回率、正确率,当准确率和召回率最优结果不一致时,以正确率为唯一指标进行模型性能验证,分别指标定义和计算公式如下:准确率p:
召回率R:
Accuracy正确率:
其中,TP为实际为正常且算法检测为正常的实例数;FP为实际为异常但算法检测为正常的实例数;FN为实际为正常但算法检测为异常的实例数;TN为实际为异常且算法检测为异常实例数。