1.一种基于时序数据分析的异常数据判别方法,其特征在于,包括:
获取最后一个数据的采集时间均为当前时刻的磷酸根浓度时间序列和温度时间序列,磷酸根浓度时间序列中磷酸根浓度的采集时间和温度时间序列中温度的采集时间一一对应;
根据磷酸根浓度时间序列中相邻磷酸根浓度以及温度时间序列中相邻温度之间的差异情况计算若干邻域差异因子,将所有的邻域差异因子排列为邻域差异因子时间序列,根据邻域差异因子时间序列中邻域差异因子前后的邻域差异因子的变化趋势计算若干初始分段点,根据初始分段点将邻域差异因子时间序列划分为若干参考因子段;
根据参考因子段中不同邻域差异因子之间的变化差异计算每个参考因子段的差异波动程度,根据参考因子段与整体参考因子段之间差异波动程度的占比情况,计算每个参考因子段的初始平滑参数,根据参考因子段与整体参考因子段之间差异波动程度的差异以及参考因子段的长度,计算每个参考因子段的平滑贡献程度,根据参考因子段与整体参考因子段之间平滑贡献程度的占比情况,计算每个参考因子段的平滑权重,根据初始平滑参数和平滑权重计算邻域差异因子时间序列的自适应平滑参数;
根据自适应平滑参数计算邻域差异因子的预测值,基于所述预测值计算异常差异值,若所述异常差异值大于预设的第四阈值,则当前时刻的磷酸根浓度和温度为异常数据。
2.根据权利要求1所述的基于时序数据分析的异常数据判别方法,其特征在于,所述根据磷酸根浓度时间序列中相邻磷酸根浓度以及温度时间序列中相邻温度之间的差异情况计算若干邻域差异因子,通过以下公式进行:;
其中, 表示第 个磷酸根浓度与第 个磷酸根浓度的邻域差异因子,表示第个磷酸根浓度, 表示第 磷酸根浓度, 表示第 个温度, 表示第 个温度,表示预设的超参数,表示取绝对值。
3.根据权利要求1所述的基于时序数据分析的异常数据判别方法,其特征在于,所述根据邻域差异因子时间序列中邻域差异因子前后的邻域差异因子的变化趋势计算若干初始分段点,通过以下方法进行:将邻域差异因子与第一个邻域差异因子之间所有邻域差异因子所构成的数据段记为邻域差异因子的前置邻域因子段,将邻域差异因子后T1个邻域差异因子所构成的数据段记为邻域差异因子的后置邻域因子段,若邻域差异因子之后剩余的邻域差异因子数量小于T1,则将邻域差异因子之后剩余的邻域差异因子所构成的数据段记为邻域差异因子的后置邻域因子段,其中,T1为预设的第一阈值;
通过以下公式计算邻域差异因子的初始分割因子:
;
其中,表示邻域差异因子的初始分割因子, 表示邻域差异因子的前置邻域因子段中所有邻域差异因子的均值, 表示邻域差异因子的后置邻域因子段中所有邻域差异因子的均值, 表示邻域差异因子的前置邻域因子段中最大邻域差异因子与最小邻域差异因子的差值的绝对值, 表示邻域差异因子的后置邻域因子段中最大邻域差异因子与最小邻域差异因子的差值的绝对值, 表示邻域差异因子的前置邻域因子段与后置邻域因子段的DTW距离,表示取绝对值;
获取所有邻域差异因子的初始分割因子并进行线性归一化,将线性归一化后的每个初始分割因子记为初始分割程度;
遍历所有的邻域差异因子,直至第一次出现初始分割程度大于T2的邻域差异因子时停止遍历,并将这个邻域差异因子记为一个初始分段点,将该初始分段点之后的所有邻域差异因子所构成的时间序列记为待处理分段因子时间序列,其中,T2为预设的第二阈值;
在待处理分段因子时间序列中,将在邻域差异因子之前并且与该邻域差异因子距离最接近的初始分段点作为参考因子,将该参考因子与该邻域差异因子之间所有邻域差异因子构成的数据段记为该邻域差异因子的前置分割邻域段,然后通过以下公式计算邻域差异因子的分割程度:;
其中, 表示邻域差异因子的分割程度, 表示邻域差异因子的前置分割邻域段中所有邻域差异因子的均值, 表示邻域差异因子的前置分割邻域段中最大邻域差异因子与最小邻域差异因子的差值的绝对值, 表示邻域差异因子的前置分割邻域段与后置邻域因子段的DTW距离;
将分割程度大于T3的邻域差异因子记为初始分段点,得到若干初始分段点,其中,T3为预设的第三阈值;
所述根据初始分段点将邻域差异因子时间序列划分为若干参考因子段,包括:将任意两个相邻的初始分段点之间所有邻域差异因子所构成的数据段记为参考因子段。
4.根据权利要求1所述的基于时序数据分析的异常数据判别方法,其特征在于,所述根据参考因子段中不同邻域差异因子之间的变化差异计算每个参考因子段的差异波动程度,通过以下公式进行:;
其中, 表示参考因子段的差异波动程度, 表示参考因子段中所有邻域差异因子的最大值, 表示参考因子段中所有邻域差异因子的最小值, 表示参考因子段中邻域差异因子的数量, 表示参考因子段中第 个邻域差异因子, 表示参考因子段中所有邻域差异因子的均值, 表示参考因子段中第 个邻域差异因子, 表示参考因子段中第个邻域差异因子,表示取绝对值。
5.根据权利要求1所述的基于时序数据分析的异常数据判别方法,其特征在于,所述根据参考因子段与整体参考因子段之间差异波动程度的占比情况,计算每个参考因子段的初始平滑参数,通过以下公式进行:;
其中, 表示参考因子段的初始平滑参数, 表示参考因子段的差异波动程度,表示参考因子段的数量, 表示第 个参考因子段的差异波动程度。
6.根据权利要求1所述的基于时序数据分析的异常数据判别方法,其特征在于,所述根据参考因子段与整体参考因子段之间差异波动程度的差异以及参考因子段的长度,计算每个参考因子段的平滑贡献程度,通过以下公式进行:;
其中,表示参考因子段的平滑贡献程度, 表示参考因子段的初始平滑参数, 表示所有参考因子段的初始平滑参数的均值, 表示参考因子段中邻域差异因子的数量,表示以自然常数为底的指数函数。
7.根据权利要求1所述的基于时序数据分析的异常数据判别方法,其特征在于,所述根据参考因子段与整体参考因子段之间平滑贡献程度的占比情况,计算每个参考因子段的平滑权重,通过以下公式进行:;
其中,表示参考因子段的平滑权重,表示参考因子段的平滑贡献程度,表示参考因子段的数量, 表示第 个参考因子段的平滑贡献程度。
8.根据权利要求1所述的基于时序数据分析的异常数据判别方法,其特征在于,所述根据初始平滑参数和平滑权重计算邻域差异因子时间序列的自适应平滑参数,通过以下公式进行:;
式中,表示邻域差异因子时间序列的自适应平滑参数,表示参考因子段的数量,表示第 个参考因子段的初始平滑参数, 表示第 个参考因子段的平滑权重。
9.根据权利要求1所述的基于时序数据分析的异常数据判别方法,其特征在于,所述基于所述预测值计算异常差异值,包括:将邻域差异因子的预测值与邻域差异因子的差值的绝对值作为异常差异值。
10.一种基于时序数据分析的异常数据判别装置,其特征在于,包括:
时序数据获取模块,被配置为:获取最后一个数据的采集时间均为当前时刻的磷酸根浓度时间序列和温度时间序列,磷酸根浓度时间序列中磷酸根浓度的采集时间和温度时间序列中温度的采集时间一一对应;
参考因子段划分模块,被配置为:根据磷酸根浓度时间序列中相邻磷酸根浓度以及温度时间序列中相邻温度之间的差异情况计算若干邻域差异因子,将所有的邻域差异因子排列为邻域差异因子时间序列,根据邻域差异因子时间序列中邻域差异因子前后的邻域差异因子的变化趋势计算若干初始分段点,根据初始分段点将邻域差异因子时间序列划分为若干参考因子段;
自适应平滑参数计算模块,被配置为:根据参考因子段中不同邻域差异因子之间的变化差异计算每个参考因子段的差异波动程度,根据参考因子段与整体参考因子段之间差异波动程度的占比情况,计算每个参考因子段的初始平滑参数,根据参考因子段与整体参考因子段之间差异波动程度的差异以及参考因子段的长度,计算每个参考因子段的平滑贡献程度,根据参考因子段与整体参考因子段之间平滑贡献程度的占比情况,计算每个参考因子段的平滑权重,根据初始平滑参数和平滑权重计算邻域差异因子时间序列的自适应平滑参数;
异常数据判别模块,被配置为:根据自适应平滑参数计算邻域差异因子的预测值,基于所述预测值计算异常差异值,若所述异常差异值大于预设的第四阈值,则当前时刻的磷酸根浓度和温度为异常数据。