利索能及
我要发布
收藏
专利号: 2021115566549
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于加权频繁序列的商品组合挖掘方法,其特征在于,包括:S1:获取基于时间的商品交易的订单信息,组成商品数据集D;

商品数据集D={S1,S2,…,Sn},其中Sn表示第n段时间的订单序列,每个订单序列称为商品数据集的项集;订单序列Sn={I1,I2,…,Im},其中Im表示第m个订单,每个订单称为商品数据集的项,每个订单包含至少一个商品;

S2:根据商品的收益情况为每个商品赋予不同的权值;

*

S3:根据商品权值大小,对多元项中包含的商品进行排序,获得排序后的商品数据集D;

S4:建立候选加权频繁序列集WFUBr、加权频繁序列集WSr和加权频繁项集FIr,令r=1;

*

S5:判断排序后的商品数据集D是否为空,若为空,则执行步骤S10;否则,根据候选加权*

频繁序列集WFUBr的r序列与排序后的商品数据集D中的一元项进行扩展,获得扩展r序列,执行步骤S6;

S6:计算扩展r序列中每个序列的加权支持上界值和加权支持度,依据向下闭包特性,确定是否将每个序列加入候选加权频繁序列集WFUBr和加权频繁序列集WSr中;并将加入候选加权频繁序列集WFUBr中的序列的项添加到加权频繁项集FIr中;

*

S7:根据先验性原理,利用加权频繁项集FIr中的项对排序后的商品数据集D进行压缩,形成压缩数据集D′;

S8:基于压缩数据集D′,分别以其中的每个项为前缀,构建投影数据集Dr,将投影数据集*

Dr作为下一轮次的数据集D;

S9:令r=r+1,返回步骤S5;

S10:根据每一轮次获得的加权频繁序列集组成加权频繁序列总集;

S11:根据加权频繁序列总集进行商品组合推荐。

2.根据权利要求1所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S3中,根据商品权值大小,对多元项中包含的商品进行升序排序。

3.根据权利要求2所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步*

骤S5中,根据候选加权频繁序列集WFUBr的r序列与排序后的商品数据集D中的一元项进行扩展包括项集扩展或序列扩展;

*

项集扩展表示将排序后的商品数据集D中的一元项分别添加到r序列中最后一个项集的末尾;

*

序列扩展表示将排序后的商品数据集D中的一元项分别添加到r序列的末尾。

4.根据权利要求3所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,计算扩展r序列的加权支持上界值的具体方法为:*

式中,swubr表示扩展r序列的加权支持上界值,tsmw表示排序后的商品数据集D的相对加权频繁总值,Sy表示第y段时间的订单序列;RUPr表示扩展r序列在所属订单序列的上界值,ωr表示扩展r序列的权值,lengthr表示扩展r序列所包含的项数,rswubr表示扩展r序列所在订单序列的剩余最大值,|X|表示添加至r序列的项的个数。

5.根据权利要求3所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,计算扩展r序列的加权支持度的具体方法为:式中,wsupr表示扩展r序列的加权支持度。

6.根据权利要求4或5所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,依据向下闭包特性,确定是否将每个序列加入候选加权频繁序列集WFUBr和加权频繁序列集WSr中的具体方法为:预设最小加权支持度min WS,分别将扩展r序列中每个序列的加权支持上界值与最小加权支持度进行比较,若swub≥min WS,则该序列加入候选加权频繁序列集WFUBr中,否则不加入;

分别将扩展r序列中每个序列的加权支持度与最小加权支持度进行比较,若wsup≥min WS,则该序列加入加权频繁序列集WSr中,否则不加入。

7.根据权利要求6所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,将加入候选加权频繁序列集WFUBr中的序列的项添加到加权频繁项集FIr中,相同的项仅添加一次。

8.根据权利要求7所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步*

骤S7中,根据先验性原理,利用加权频繁项集FIr中的项对排序后的商品数据集D进行压缩,形成压缩数据集D′的具体方法为:*

判断排序后的商品数据集D中的项是否存在于加权频繁项集FIr中,若存在,则保留该项,若不存在,则剔除该项,形成压缩数据集D′。

9.根据权利要求8所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,压缩数据集D′中的所有项集中,若存在包含一个项的项集,则从压缩数据集D′中删除该项集。

10.根据权利要求9所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S8中,基于压缩数据集D′,分别以其中的每个项为前缀,构建投影数据集Dr的具体方法为:

压缩数据集D′包含若干个序列,每个序列中包含若干项;以任意一项为前缀,则保留该项在每个序列中第一次出现位置之后的所有项,形成投影数据集Dr。