利索能及
我要发布
收藏
专利号: 2019102939271
申请人: 淮阴工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于图向量的专家组合推荐方法,其特征在于,具体步骤如下:

(1)从专家审查数据中抽取实体VecID和关系ReID,构建领域知识图谱G,包括:(1.1)抽取专家和项目的编号ID={id1,id2,…,ide,…,idA}及领域标签Label={label1,label2,…,labele,…,labelA},得到7维领域标签数据集G1,G1=G1∪{ID,Label};其中,变量e∈[1,A];

(1.2)抽取实体关系的编号,得到ReID={reid1,reid2,…,reide,…,reidA},得到实体集VecID=VecID∪ID和关系集ReID;其中,变量e∈[1,A];

(1.3)定义循环变量i1来遍历VecID、ReID,G为领域知识图谱;i1赋初值1,G赋初值为空;

(1.4)通过实体间关系搭建领域知识图谱G=(VecID,ReID);

(1.5)得到专家审查项目领域知识图谱G;

(2)运用deepwalk算法将知识图谱投射到64维空间,得到实体向量集V1;运用独热码将领域标签转换成7维标签向量;构建神经网络进行多标签分类,包括:(2.1)取知识图谱G=(VecID,ReID),VecID为实体编号,ReID为关系编号;

(2.2)定义循环变量i2来遍历G;运用deepwalk将G投射到64维空间,得到实体向量v1,V1=V1∪{v1};运用独热码将领域标签转换成7维标签向量l1,L1=L1∪{l1};

(2.3)得到V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;L1={l1,l2,…,lc,…,lA},lc为实体向量集中第c个实体向量,其中,变量c∈[1,A];

(2.4)得到Res={{id1,res1},{id2,res2},...,{ide,rese},...,{idA,resA}},ide为实体集中第e个编号,rese为标签集中第e个实体的标签向量,其中,变量e∈[1,A];

(2.5)构建以binary_crossentropy为损失函数的神经网络,在训练过程中不断降低交叉嫡,使标签1的节点输出靠近1,标签0的节点输出靠近0;

(2.6)得到Pre={{id1,pre1},{id2,pre2},...,{ide,pree},...,{idA,preA}},ide为实体集中第e个编号,pree为标签集中第e个实体的标签向量,其中,变量e∈[1,A];

(2.7)在真实标签集Res={{id1,res1},{id2,res2},...,{ide,rese},...,{idA,resA}}和预测标签集Pre={{id1,pre1},{id2,pre2},...,{ide,pree},...,{idA,preA}}中对标签值进行排序,截取前N个标签进行准确度度量;

(3)分别运用node2vec算法deepwalk算法将知识图谱投射到128维空间和64维空间;再分别运用皮尔逊相关度算法和曼哈顿距离度量公式计算得到TopN个最相关实体集合U,包括:(3.1)取知识图谱G=(VecID,ReID),VecID为实体编号,ReID为关系编号;

(3.2)定义循环变量i3用来遍历G;运用deepwalk将G投射到64维空间,得到实体向量v1,V1=V1∪{v1};

(3.3)得到V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;L1={l1,l2,…,lc,…,lA},lc为实体向量集中第c个实体向量,其中,变量c∈[1,A];

(3.4)对于实体向量集中第c个实体向量vc,运用皮尔逊相关度算法计算得到topN个最相关实体集合U1={u11,u12,…,u1A},运用曼哈顿距离计算得到topN个最相关实体集合U2={u21,u22,…,u2A};

(3.5)定义专家组合推荐列表U=u1∩u2,实现专家组合推荐;

(3.6)定义循环变量i4用来遍历G;运用node2vec将G投射到128维空间,得到实体向量v2,V2=V2∪{v2};

(3.7)运用皮尔逊相关度算法计算得到topN个最相关实体集合W1={u11,u12,…,u1A},运用曼哈顿距离计算得到topN个最相关实体集合U2={u21,u22,…,u2A};

(3.8)得到以皮尔逊相关度算法为度量方式的推荐集合W和以曼哈顿距离为度量方式的推荐集合U;

(4)取实体向量集V1,利用PCA分别降维到2维和7维空间;得到2维向量数据集R和7维向量数据集Q;运用余弦相似度算法计算得到TopN个最相关实体U1,U2;定义得到的推荐列表为Recommend=U1∩U2,包括:(4.1)取实体向量集V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;vc的维度是64维;

(4.2)利用PCA降维后得到实体的2维向量集,R={r1,r2,…,rc,…,rA},rc为实体向量集R中第c个实体向量;

(4.3)对于实体向量集中第c个实体向量rc=vc,运用余弦相似度算法计算得到topN个最相关实体集合U1={u1top1,u1top2,…,u1topx,…,u1topA};u1topx为U1中的第x个数据项,x∈[1,A];

(4.4)利用PCA降维后得到实体的7维向量集,Q={q1,q2,…,qc,…,qA},qc为实体向量集Q中第c个实体向量;

(4.5)对于实体向量集中第c个实体向量qc=vc,运用余弦相似度算法计算得到topN个最相关实体集合U2={u2top1,u2top2,…,u2topx,…,u2topA};u2topx为U2中的第x个数据项,u2topx∈U2,x∈[1,A];

(5)取实体向量集V1,基于知识图谱中实体间关系,搭建CNN,RESNET模型对实体间关系进行学习,使得模型能够拟合知识库中的实体关系数据;基于此模型,对输入的实体向量挖掘知识库中的隐藏关系;得到推荐列表U3;

(6)用未通过降维处理的数据所形成的推荐列表U和降维后运用不同算法得到的推荐列表Recommend以及通过模型预测的推荐列表U3得到最终的推荐列表Result=U∪Recommend∪U3;定义Set={set1,set2,…,setA},计算组合推荐的准确率previous=(set∩Result)/Result;得到最终推荐结果和推荐准确率。

2.根据权利要求1所述的一种基于图向量的专家组合推荐方法,其特征在于,所述步骤(5)中搭建CNN,RESNET模型,基于此模型,对输入的实体向量挖掘知识库中的隐藏关系;得到推荐列表U3的具体步骤如下:(5.1)通过两个搭建的模型进行实体间关系的挖掘,匹配出与所给实体有关的相关实体集合LIST;其中LIST中实体的意义为和所给实体间不存在直接的历史合作关系,而是隐藏的可能合作关系;

(5.2)定义最终的列表Recommend=U1∩U2∩LIST。

3.根据权利要求1所述的一种基于图向量的专家组合推荐方法,其特征在于,所述步骤(6)中得到最终推荐结果和推荐准确率的具体步骤如下:(6.1)定义最终推荐列表Recset=U∪Recommend;

(6.2)判断

(6.3)Set为测试项目原本的专家组合;Set={set1,set2,…,setA};

(6.4)计算组合推荐的准确率previous=(set∩Recset)/Recset;

(6.5)得到最终的推荐结果Recset和推荐准确率。