1.一种企业数据挖掘方法,其特征在于,该方法包括以下步骤:
获取企业前年和去年每种商品的功能、销售数量、库存数量、老客户数量和新客户数量;其中,每种商品为完全相同的商品,老客户为购买同一种商品至少两次的客户,新客户为第一次购买商品的客户;
根据每种商品去年的销售数量、库存数量、老客户数量和新客户数量,通过孤立森林算法,获取每种商品的异常得分;
将相同功能的每种商品划分为同一集合,根据每个集合中每种商品去年的销售数量、库存数量、老客户数量和新客户数量,获取每种商品的初始受欢迎特征值;
根据每种商品去年和前年之间的销售数量差异、库存数量差异、老客户数量差异和新客户数量差异,获取每种商品的欢迎修正系数;
根据每种商品的初始受欢迎特征值和欢迎修正系数,获取每种商品的实际受欢迎特征值;根据所述实际受欢迎特征值,将每种商品进行划分,获得至少两个类别;根据每个类别中的异常得分,筛选出异常类别;
根据每个异常类别中每种商品的异常得分的分布,获取每个异常类别中每种商品的异常得分的判别值;根据所述判别值,获取每个异常类别中的异常得分阈值,确定每个异常类别中的异常商品;
根据异常商品的实际受欢迎特征值,对企业今年异常商品的生产量进行管控。
2.如权利要求1所述一种企业数据挖掘方法,其特征在于,所述初始受欢迎特征值的计算公式为:式中,θi,j为第i个集合中第j种商品的初始受欢迎特征值;ai,j为第i个集合中第j种商品去年的销售数量;K为第i个集合中商品种类的总数量;ai,k为第i个集合中第k种商品去年的销售数量;bi,j为第i个集合中第j种商品去年的库存数量;min(bi)为第i个集合中所有商品去年的最小库存数量; 为第i个集合中第j种商品去年新客户数量的反映值; 为第i个集合中第j种商品去年老客户数量的反映值; 为第i个集合中第j种商品去年的新客户数量; 为第i个集合中第k种商品去年的新客户数量; 为第i个集合中第j种商品去年的老客户数量; 为第i个集合中第k种商品去年的老客户数量;β为第一预设常数,大于
0;| |为绝对值函数;min为取最小值函数。
3.如权利要求1所述一种企业数据挖掘方法,其特征在于,所述欢迎修正系数的计算公式为:式中,λi,j为第i个集合中第j种商品的欢迎修正系数;ωi,j(a)为第i个集合中第j种商品的销售数量调整权重;ωi,j(b)为第i个集合中第j种商品的库存数量调整权重;ωi,j(c)为第i个集合中第j种商品的客户数量调整权重;σi,j(a)为第一调整系数;ai,j为第i个集合中第j种商品去年的销售数量;a′i,j为第i个集合中第j种商品前年的销售数量;σi,j(b)为第二调整系数;bi,j为第i个集合中第j种商品去年的库存数量;b′i,j为第i个集合中第j种商品前年的库存数量;σi,j(c)为第三调整系数; 为第i个集合中第j种商品去年的新客户数量; 为第i个集合中第j种商品前年的新客户数量; 为第i个集合中第j种商品去年的老客户数量;
为第i个集合中第j种商品前年的老客户数量;γ为第二预设常数,大于0;else代表三种情况,分别为 和||为绝对值函数。
4.如权利要求1所述一种企业数据挖掘方法,其特征在于,所述实际受欢迎特征值的获取方法为:计算每种商品的初始受欢迎特征值和欢迎修正系数的乘积,作为每种商品的实际受欢迎特征值。
5.如权利要求1所述一种企业数据挖掘方法,其特征在于,所述根据所述实际受欢迎特征值,将每种商品进行划分,获得至少两个类别的方法为:根据所述实际受欢迎特征值的大小,通过K‑means聚类算法将每种商品进行划分,获得至少两个类别。
6.如权利要求1所述一种企业数据挖掘方法,其特征在于,所述根据每个类别中的异常得分,筛选出异常类别的方法为:获取每个类别中每种商品的异常得分,将每个类别中最大的异常得分,作为每个类别的目标异常得分;
当目标异常得分大于或者等于预设的目标阈值时,将对应的类别作为异常类别。
7.如权利要求1所述一种企业数据挖掘方法,其特征在于,所述根据每个异常类别中每种商品的异常得分的分布,获取每个异常类别中每种商品的异常得分的判别值的方法为:对于任一个异常类别,将该异常类别中的每种商品根据异常得分从大到小的顺序进行排列,获得异常得分序列;
获取异常得分序列中每种商品的异常得分与相邻的下一种商品的异常得分的差值,作为该异常类别中每种商品的异常得分的判别值。
8.如权利要求1所述一种企业数据挖掘方法,其特征在于,所述根据所述判别值,获取每个异常类别中的异常得分阈值,确定每个异常类别中的异常商品的方法为:将每个异常类别中最大的判别值对应的异常得分,作为每个异常类别中的异常得分阈值;
将每个异常类别中大于或者等于异常得分阈值的异常得分对应的商品,作为每个异常类别中的异常商品。
9.如权利要求1所述一种企业数据挖掘方法,其特征在于,所述根据异常商品的实际受欢迎特征值,对企业今年异常商品的生产量进行管控的方法为:获取每种商品的实际受欢迎特征值的均值,作为分析特征值;
当异常商品的实际受欢迎特征值大于分析特征值时,则今年企业增加该异常商品的生产量;
当异常商品的实际受欢迎特征值小于分析特征值时,则今年企业减少该异常商品的生产量;
当异常商品的实际受欢迎特征值等于分析特征值时,则今年企业对该异常商品的生产量不进行调整。
10.一种企业数据挖掘系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器在执行所述计算机程序时,实现上述权利要求1‑9任意一项所述一种企业数据挖掘方法的步骤。