利索能及
我要发布
收藏
专利号: 2017100341692
申请人: 淮阴工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于皮尔逊相似度和FP-Growth的图审专家推荐方法,其特征在于,包括如下步骤:步骤1:对待审查项目和综合项目记录集中的项目属性进行归一化预处理,所述待审查项目和综合项目通过综合项目类型、综合项目类型的分支项目类型和项目属性表示;

步骤2:通过皮尔逊相似度方法对归一化后的数据集处理得出与待审查项目规模最接近的十个项目,并抽取十个项目的审查专家,所述审查专家通过研究的分支项目类型和审查项目记录表示;

步骤3:根据待审查的综合项目的分支项目类型和图审专家研究方向,对抽取出的专家进行组合,得到所有备选组合专家集;

步骤4:使用FP-Growth方法对历史项目审查专家集处理,得到图审专家组合频繁项集;

步骤5:利用组合频繁项集通过每种专家组合自适应契合度方法计算每种备选专家组合集的支持度,最终支持度最大即契合度最高的专家组合集即为参与待审查项目的专家集。

2.根据权利要求1所述的基于皮尔逊相似度和FP-Growth的图审专家推荐方法,其特征在于,所述步骤1的具体方法为:步骤1.1:定义综合型项目类型、分支项目类型和项目属性;

步骤1.2:记录综合项目记录集项目属性中各项数据的最大值和最小值;

步骤1.3:对综合项目记录集和待处理项目项目属性的数据进行归一化处理,具体公式为:Anorm=(A-Amin)/(Amax-Amin)

式中,Amax和Amin分别为项目属性各项数据的最大值和最小值,A为归一化前的数据,Anorm为归一化后的数据。

3.根据权利要求1所述的基于皮尔逊相似度和FP-Growth的图审专家推荐方法,其特征在于,所述步骤2的具体方法为:步骤2.1:定义图审专家数据集和已审查项目记录集,所述图审专家数据用专家编号和专家研究的分支项目类型表示,所述图审专家数据集用项目编号和图审专家编号表示;

步骤2.2:根据项目编号对已审查项目记录集中的专家进行整合,得到审查不同项目的工程项目审查专家集;

步骤2.3:计算待审查项目与综合项目记录集中各项目的相似度,具体公式为:式中,simi为待审查项目与第i个项目的相似度,Xj和Yij分别为待审查项目和第i个项目的项目属性数据集元素; 和 分别为待审查项目和第i个项目的项目属性数据的均值;

步骤2.4:对相似对进行排序,提取前十个项目对应的项目编号及对应的审查专家集,即得预选图审专家集。

4.根据权利要求1所述的基于皮尔逊相似度和FP-Growth的图审专家推荐方法,其特征在于,所述步骤3的具体方法为:步骤3.1:从预选图审专家集中剔除有审查任务的专家;

步骤3.2:从步骤3.1得到的专家集中选择研究分支项目类型与待审查项目分支项目类型相同的图审专家,并将专家按照分支项目类型表示;

步骤3.3:若步骤3.2得到的专家集存在待审查项目某分支类型没有专家,则针对该项目分支类型,从所有图审专家数据集中寻找审查该分支项目类型且没有工作任务的专家加入;

步骤3.4:从步骤3.3得到的专家集对应的每个分支项目类型中至少抽取一个专家,即得所有备选组合专家集。

5.根据权利要求1所述的基于皮尔逊相似度和FP-Growth的图审专家推荐方法,其特征在于,所述步骤5的具体方法为:步骤5.1:以一种备选组合专家集为例,该专家集共有n个专家,从备选组合专家集中抽取1位专家,共有 种抽取方式,从备选组合专家集中抽取2位专家,共有 种抽取方式,以此类推,一直抽取到n为专家,共有 种抽取方式,即所有的抽取结果组合成Subset集,Subset包含集合数量为 初始化备选组合专家集的契合度SValue为0;

步骤5.2:遍历Subset,若Subset中的一种抽取后的专家组合在图审专家组合频繁项集中,则步骤5.1中备选组合专家集的契合度应加上该抽取后的专家组合对应频繁项集中的频数与该抽取后的专家组合中的专家数的乘积,即:SValue=SValue+f*k

式中,SValue为备选组合专家集的契合度,f为抽取后的专家组合对应频繁项集中的频数,k为抽取后的专家组合中的专家数的乘积,遍历结束,即得到步骤5.1中备选组合专家集的最终契合度;

步骤5.3:通过步骤5.1、5.2方法计算所有备选组合专家集的契合度,最终契合度最高的备选组合专家集即为参与待审查项目的专家集。