利索能及
我要发布
收藏
专利号: 2022110489678
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-24
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于模糊列表缓冲区的高模糊效用项集挖掘方法,其特征在于,包括以下步骤:

S1:初始化数据挖掘运行参数,所述数据挖掘运行参数包括:待挖掘的定量数据库D,预定义的隶属度函数R,结果集最小模糊效用阈值minUtil;

S2:扫描事务数据库D并根据隶属度函数R计算单一项的模糊效用上界FUUB,并创建初始化列表I*;

S3:将模糊效用上界值不小于最小阈值minUtil的单一模糊项存入初始化列表I*,并按照模糊效用上界值升序排序;

S4:再次扫描数据库D,构建评估模糊效用共现结构EFuCS、模糊列表缓冲区FLBuf及其辅助的概要列表SL;

S5:调用递归搜索子程序Search,传入参数,所述参数包括:初始前缀模糊项集 初始化列表I*、最小模糊效用阈值minUtil、评估模糊效用共现结构EFuCS、模糊列表缓冲区FLBuf及其概要列表SL;

S6:输出模糊效用不低于最小阈值的所有高模糊效用项集HFUIs,完成数据挖掘;

其中,步骤S5中调用递归搜索子程序Search,包括如下步骤:

S501:在递归搜索子程序Search中,对于模糊项集P的一个扩展模糊项集X,如果概要列表SL(X)中存储的模糊项集X的模糊效用之和sumFu不小于最小阈值minUtil,那么将模糊项集X加入到高模糊效用项集的集合HFUIs中;

S502:如果模糊项集X的概要列表SL(X)中的模糊效用之和sumFu与剩余模糊效用之和sumRfu相加结果不小于最小阈值minUtil,那么模糊项集X的扩展模糊项集则可能是高模糊效用项集;

S503:对于模糊项集P的另一个扩展模糊项集Y,其中Y在模糊项集X之后,找到模糊项集Y满足:在评估模糊效用共现结构EFuCS中模糊项集X和Y的模糊效用上界值不小于最小阈值minUtil;

S504:将模糊列表缓冲区FLBuf,概要列表SL,模糊项集P、X、Y,最小阈值minUtil作为参数调用模糊列表缓冲区构建程序,返回构建结果;

S505:若构建结果返回真,那么合并模糊项集X和Y为Pxy,若模糊项集Pxy的概要列表SL(Pxy)的模糊效用之和大于0,那么将模糊项集Pxy加入模糊项集X的扩展模糊项集的集合ExtensionsOfX中;

S506:合并模糊项集P和X作为新的前缀模糊项集Px,递归调用搜索子程序Search,直到遍历完所有的扩展模糊项集;

其中,步骤S504所述的模糊列表缓冲区构建程序,包括以下步骤:

S5041:在模糊列表缓冲区构建程序中,设指针PPnt,PxPnt,PyPnt分别为概要列表中SL(P),SL(Px),SL(Py)的起始位置,指针指向模糊列表缓冲区中的元组;

S5042:设变量EAMeasure为模糊项集Px,Py的概要列表SL(Px),SL(Py)的模糊效用之和与剩余模糊效用之和的相加结果,设变量insertPos为概要列表SL最后一个模糊项集的起始位置;

S5043:如果指针PxPnt指向的元组中Tids小于PyPnt指向的元组中的Tids,那么将指针PxPnt向右移动一位,变量EAMeasure减去PxPnt指向的元组的fus和rfus之和;

S5044:如果指针PxPnt指向的元组中Tids大于PyPnt指向的元组中的Tids,那么将指针PyPnt向右移动一位,变量EAMeasure减去PyPnt指向的元组的fus和rfus之和;

S5045:如果指针PxPnt指向的元组中Tids等于PyPnt指向的元组中的Tids,并且概要列表SL(P)不为空,那么PPnt的指针连续向右移动,直到PPnt移动到SL(P)的末尾或者PPnt指向的元组中的Tids与PxPnt指向的元组中的Tids相等为止;

S5046:如果待插入位置insertPos超过模糊列表缓冲区大小,那么分配新的内存空间,否则回收再利用内存空间,模糊列表缓冲区添加新元组,令Tids为PxPnt的Tids,fus为PxPnt的fus加PyPnt的fus减去PPnt的fus,rfus为PyPnt的rfus;

S5047:插入数据后,指针PxPnt和PyPnt同时向右移动一位;

S5048:当指针PxPnt没有指向概要列表SL(Px)的末位置EndPos,并且指针PyPnt没有指向概要列表SL(Py)的末位置EndPos时,重复执行模糊列表缓冲区程序;

S5049:如果变量EAMeasure小于最小阈值minUtil,返回结果false;

S50410:更新概要列表SL(Pxy),返回结果true,结束模糊列表缓冲区构建程序。

2.根据权利要求1所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法,其特征在于,模糊列表缓冲区FLBuf利用三元组(Tids,fus,rfus)构成,Tid为数据库中的事务标识符,fu为事务的模糊效用,rfu为事务的剩余模糊效用。

3.根据权利要求1所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法,其特征在于,概要列表SL利用元组(Itemsets,StartPoss,EndPoss,sumFus,sumRfus)构成,其中,Itemset表示模糊项集,StartPos和EndPos分别表示模糊列表缓冲区FLBuf中对应模糊项集的起始和结束位置,sumFu表示模糊列表缓冲区中对应模糊项集的模糊效用fus之和,sumRfu表示模糊列表缓冲区FLBuf中对应模糊项集的剩余模糊效用rfus之和。

4.根据权利要求3所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法,其特征在于,在递归搜索子程序Search检查完一个结点及其所有子孙结点后,程序开始回溯,此时已经检查过的结点不再被使用,模糊列表缓冲区FLBuf中分配用于存储该结点的内存空间将被回收再利用,新的潜在的模糊项集的数据直接覆盖写入被回收的内存空间,同时更新概要列表SL中的信息,实现内存复用,减少程序的内存消耗。

5.根据权利要求1所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法,其特征在于,评估模糊效用共现结构EFuCS以矩阵形式表示,索引为模糊项集,数值表示两个模糊项集合并后的模糊效用上界FUUB。

6.一种基于模糊列表缓冲区的高模糊效用项集挖掘系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括一种基于模糊列表缓冲区的高模糊效用项集挖掘方法程序,所述一种基于模糊列表缓冲区的高模糊效用项集挖掘方法程序被所述处理器执行时实现如下步骤:S1:初始化数据挖掘运行参数,所述数据挖掘运行参数包括:待挖掘的定量数据库D,预定义的隶属度函数R,结果集最小模糊效用阈值minUtil;

S2:扫描事务数据库D并根据隶属度函数R计算单一项的模糊效用上界FUUB,并创建初始化列表I*;

S3:将模糊效用上界值不小于最小阈值minUtil的单一模糊项存入初始化列表I*,并按照模糊效用上界值升序排序;

S4:再次扫描数据库D,构建评估模糊效用共现结构EFuCS、模糊列表缓冲区FLBuf及其辅助的概要列表SL;

S5:调用递归搜索子程序Search,传入参数,所述参数包括:初始前缀模糊项集 初始化列表I*、最小模糊效用阈值minUtil、评估模糊效用共现结构EFuCS、模糊列表缓冲区FLBuf及其概要列表SL;

S6:输出模糊效用不低于最小阈值的所有高模糊效用项集HFUIs,完成数据挖掘。

7.根据权利要求6所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘系统,其特征在于,步骤S5中调用递归搜索子程序Search,包括如下步骤:S501:在递归搜索子程序Search中,对于模糊项集P的一个扩展模糊项集X,如果概要列表SL(X)中存储的模糊项集X的模糊效用之和sumFu不小于最小阈值minUtil,那么将模糊项集X加入到高模糊效用项集的集合HFUIs中;

S502:如果模糊项集X的概要列表SL(X)中的模糊效用之和sumFu与剩余模糊效用之和sumRfu相加结果不小于最小阈值minUtil,那么模糊项集X的扩展模糊项集则可能是高模糊效用项集;

S503:对于模糊项集P的另一个扩展模糊项集Y,其中Y在模糊项集X之后,找到模糊项集Y满足:在评估模糊效用共现结构EFuCS中模糊项集X和Y的模糊效用上界值不小于最小阈值minUtil;

S504:将模糊列表缓冲区FLBuf,概要列表SL,模糊项集P、X、Y,最小阈值minUtil作为参数调用模糊列表缓冲区构建程序,返回构建结果;

S505:若构建结果返回真,那么合并模糊项集X和Y为Pxy,若模糊项集Pxy的概要列表SL(Pxy)的模糊效用之和大于0,那么将模糊项集Pxy加入模糊项集X的扩展模糊项集的集合ExtensionsOfX中;

S506:合并模糊项集P和X作为新的前缀模糊项集Px,递归调用搜索子程序Search,直到遍历完所有的扩展模糊项集。

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于模糊列表缓冲区的高模糊效用项集挖掘方法程序,所述基于模糊列表缓冲区的高模糊效用项集挖掘方法程序被处理器执行时,实现如权利要求1至5中任一项所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法的步骤。