1.一种基于加权频繁序列的商品组合挖掘方法,其特征在于,包括:S1:获取基于时间的商品交易的订单信息,组成商品数据集D;
商品数据集D={S1,S2,…,Sn},其中Sn表示第n段时间的订单序列,每个订单序列称为商品数据集的项集;订单序列Sn={I1,I2,…,Im},其中Im表示第m个订单,每个订单称为商品数据集的项,每个订单包含至少一个商品;
S2:根据商品的收益情况为每个商品赋予不同的权值;
*
S3:根据商品权值大小,对多元项中包含的商品进行排序,获得排序后的商品数据集D;
S4:建立候选加权频繁序列集WFUBr、加权频繁序列集WSr和加权频繁项集FIr,令r=1;
*
S5:判断排序后的商品数据集D是否为空,若为空,则执行步骤S10;否则,根据候选加权*
频繁序列集WFUBr的r序列与排序后的商品数据集D中的一元项进行扩展,获得扩展r序列,执行步骤S6;
S6:计算扩展r序列中每个序列的加权支持上界值和加权支持度,依据向下闭包特性,确定是否将每个序列加入候选加权频繁序列集WFUBr和加权频繁序列集WSr中;并将加入候选加权频繁序列集WFUBr中的序列的项添加到加权频繁项集FIr中;
*
S7:根据先验性原理,利用加权频繁项集FIr中的项对排序后的商品数据集D进行压缩,形成压缩数据集D′;
S8:基于压缩数据集D′,分别以其中的每个项为前缀,构建投影数据集Dr,将投影数据集*
Dr作为下一轮次的数据集D;
S9:令r=r+1,返回步骤S5;
S10:根据每一轮次获得的加权频繁序列集组成加权频繁序列总集;
S11:根据加权频繁序列总集进行商品组合推荐。
2.根据权利要求1所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S3中,根据商品权值大小,对多元项中包含的商品进行升序排序。
3.根据权利要求2所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步*
骤S5中,根据候选加权频繁序列集WFUBr的r序列与排序后的商品数据集D中的一元项进行扩展包括项集扩展或序列扩展;
*
项集扩展表示将排序后的商品数据集D中的一元项分别添加到r序列中最后一个项集的末尾;
*
序列扩展表示将排序后的商品数据集D中的一元项分别添加到r序列的末尾。
4.根据权利要求3所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,计算扩展r序列的加权支持上界值的具体方法为:*
式中,swubr表示扩展r序列的加权支持上界值,tsmw表示排序后的商品数据集D的相对加权频繁总值,Sy表示第y段时间的订单序列;RUPr表示扩展r序列在所属订单序列的上界值,ωr表示扩展r序列的权值,lengthr表示扩展r序列所包含的项数,rswubr表示扩展r序列所在订单序列的剩余最大值,|X|表示添加至r序列的项的个数。
5.根据权利要求3所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,计算扩展r序列的加权支持度的具体方法为:式中,wsupr表示扩展r序列的加权支持度。
6.根据权利要求4或5所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,依据向下闭包特性,确定是否将每个序列加入候选加权频繁序列集WFUBr和加权频繁序列集WSr中的具体方法为:预设最小加权支持度min WS,分别将扩展r序列中每个序列的加权支持上界值与最小加权支持度进行比较,若swub≥min WS,则该序列加入候选加权频繁序列集WFUBr中,否则不加入;
分别将扩展r序列中每个序列的加权支持度与最小加权支持度进行比较,若wsup≥min WS,则该序列加入加权频繁序列集WSr中,否则不加入。
7.根据权利要求6所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,将加入候选加权频繁序列集WFUBr中的序列的项添加到加权频繁项集FIr中,相同的项仅添加一次。
8.根据权利要求7所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步*
骤S7中,根据先验性原理,利用加权频繁项集FIr中的项对排序后的商品数据集D进行压缩,形成压缩数据集D′的具体方法为:*
判断排序后的商品数据集D中的项是否存在于加权频繁项集FIr中,若存在,则保留该项,若不存在,则剔除该项,形成压缩数据集D′。
9.根据权利要求8所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,压缩数据集D′中的所有项集中,若存在包含一个项的项集,则从压缩数据集D′中删除该项集。
10.根据权利要求9所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S8中,基于压缩数据集D′,分别以其中的每个项为前缀,构建投影数据集Dr的具体方法为:
压缩数据集D′包含若干个序列,每个序列中包含若干项;以任意一项为前缀,则保留该项在每个序列中第一次出现位置之后的所有项,形成投影数据集Dr。