1.一种时序数据异常值检测方法,其特征在于,所述方法包括:
获取商品销量增长型的时序数据;
根据所述时序数据和预设滑动窗口大小,生成每个滑动窗口的最小值滑动树和最大值滑动树;其中滑动树是通过滑动窗口获取最值作为根节点、同时将滑动窗口内的时序数据点作为叶子生成的树;
根据每个滑动窗口的最小值滑动树和最大值滑动树,确定对应滑动窗口的离均差滑动树和最大均差值;
计算每棵所述离均差滑动树的变异系数;
根据所述最大均差值和所述预设滑动窗口大小,确定滑动窗口的满窗口率为:
其中, 表示满窗口率, 表示滑动窗口的最大均差值被识别的次数,k表示预设滑动窗口大小;
根据每棵所述离均差滑动树的变异系数和对应滑动窗口的所述满窗口率,确定滑动异常率,并根据所述滑动异常率确定异常滑动树和其中的异常值;
当第一轮滑动窗口范围内被识别的最大均差值不少于1次,并且变异系数大于预设变异阈值时,则将异常滑动树合并为一棵第一异常滑动树,将第一轮异常滑动树中的异常值更新为滑动窗口平均值,进入第二轮滑动窗口计算,直到遍历完所有所述第一异常滑动树对应的序列为止,得到相邻异常值;
其中,根据所述时序数据和预设滑动窗口大小,生成每个滑动窗口的最小值滑动树和最大值滑动树,包括:设置预设滑动窗口大小为k;
采用窗口大小为k的窗口在所述时序数据上进行滑动,得到若干个滑动窗口;滑动窗口内包括k个序列点;
计算每个滑动窗口的最大值和最小值;
将每个滑动窗口的最大值作为该滑动窗口内序列点的根节点,将该滑动窗口内的序列点作为叶子,生成该滑动窗口最大值滑动树;
将每个滑动窗口的最小值作为该滑动窗口内序列点的根节点,将该滑动窗口内的序列点作为叶子,生成该滑动窗口最小值滑动树;
当连续k棵最大值滑动树的根节点为同一个数值时,则将该k棵最大值滑动树合并为一棵最大值滑动树;
当连续k棵最小值滑动树的根节点为同一个数值时,则将该k棵最小值滑动树合并为一棵最小值滑动树。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:采用尾部特殊处理方式对尾部异常值进行识别;其中在尾部特殊处理方式中,从滑动窗口1至滑动窗口7,都进行常规计算,不考虑是否满足滑动窗口等于7的条件,只考虑是否存在可计算的时序数值。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在 的7个滑动窗口中出现了至少2个的相等数值并判断为异常值时,在第一轮滑动窗口计算过程中,将窗口最大值和最小值分别设置为随机数值,第一轮滑动窗口计算过后,再将所述相等数值直接标记为异常值;其中k为预设滑动窗口大小。
4.根据权利要求1所述的方法,其特征在于,根据每个滑动窗口的最小值滑动树和最大值滑动树,确定对应滑动窗口的离均差滑动树和最大均差值,包括:计算每个滑动窗口的最大均差距离和最小均差距离,第i个滑动窗口的最大均差距离和最小均差距离的表达式为:其中, 表示第i个滑动窗口的最大均差距离, 表示第i个滑动窗口的最
大值, 为滑动窗口的滑动平均值, 表示滑动窗口范围的序列段,下标 表示预设滑动窗口大小; 表示最小均差距离, 表示滑动窗口的最小值;
将每个滑动窗口的最大均差距离和最小均差距离中较大值对应的滑动树的根节点对应的序列数据点作为最大均差值;
将所述最大均差值作为最大值滑动树和最小值滑动树的根节点,生成离均差滑动树。
5.根据权利要求1所述的方法,其特征在于,根据每棵所述离均差滑动树的变异系数和对应滑动窗口的所述满窗口率,确定滑动异常率,并根据所述滑动异常率确定异常滑动树和其中的异常值,包括:根据每棵所述离均差滑动树的变异系数和对应滑动窗口的所述满窗口率,确定滑动异常率为:其中, 表示滑动异常率, 表示50%的变异系数, 表示滑动窗口实际计算的变异系数, 表示预设变异阈值的变异系数, 表示50%的满窗口率, 表示设定的阈值满窗口率,取值为100%; 表示实际计算的滑动窗口率;
将所述滑动异常率大于100%的均差滑动树识别为异常滑动树,将异常滑动树的最大均差值对应的序列点识别为异常值。
6.一种时序数据异常值检测装置,其特征在于,所述装置包括:
时序数据获取模块,用于获取商品销量增长型的时序数据;
离均差滑动树生成模块,用于根据所述时序数据和预设滑动窗口大小,生成每个滑动窗口的最小值滑动树和最大值滑动树;根据每个滑动窗口的最小值滑动树和最大值滑动树,确定对应滑动窗口的离均差滑动树和最大均差值;其中滑动树是通过滑动窗口获取最值作为根节点、同时将滑动窗口内的时序数据点作为叶子生成的树;
异常滑动树识别模块,用于计算每棵所述离均差滑动树的变异系数;根据所述最大均差值和所述预设滑动窗口大小,确定滑动窗口的满窗口率;根据每棵所述离均差滑动树的变异系数和对应滑动窗口的所述满窗口率,确定滑动异常率,并根据所述滑动异常率确定异常滑动树和其中的异常值;其中滑动窗口的满窗口率为:其中, 表示满窗口率, 表示滑动窗口的最大均差值被识别的次数,k表示预设滑动窗口大小;
相邻异常值检测模块,用于当第一轮滑动窗口范围内被识别的最大均差值不少于1次,并且变异系数大于预设变异阈值时,则将异常滑动树合并为一棵第一异常滑动树,将第一轮异常滑动树中的异常值更新为滑动窗口平均值,进入第二轮滑动窗口计算,直到遍历完所有所述第一异常滑动树对应的序列为止,得到相邻异常值;
其中,离均差滑动树生成模块,还用于设置预设滑动窗口大小为k;采用窗口大小为k的窗口在所述时序数据上进行滑动,得到若干个滑动窗口;滑动窗口内包括k个序列点;计算每个滑动窗口的最大值和最小值;将每个滑动窗口的最大值作为该滑动窗口内序列点的根节点,将该滑动窗口内的序列点作为叶子,生成该滑动窗口最大值滑动树;将每个滑动窗口的最小值作为该滑动窗口内序列点的根节点,将该滑动窗口内的序列点作为叶子,生成该滑动窗口最小值滑动树;当连续k棵最大值滑动树的根节点为同一个数值时,则将该k棵最大值滑动树合并为一棵最大值滑动树;当连续k棵最小值滑动树的根节点为同一个数值时,则将该k棵最小值滑动树合并为一棵最小值滑动树。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法。