利索能及
我要发布
收藏
专利号: 2018113087016
申请人: 桂林电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于位置服务领域的知识图谱的推荐方法,其特征在于,包括如下步骤:

1)从用户的搜索内容或从用户的历史记录中抽取位置实体,得到实体集,实体集作为知识图谱KG的种子集;

2)将种子集与知识图谱KG中的实体进行一一对应,构成实体对应表;

3)将知识图谱KG中的头实体(h)、尾实体(t)与实体之间的关系(r)组成的富有语义信息的知识图谱三元组,通过Word2Vec模型将词汇嵌入到一个n维空间中,并生成对应的向量,从而得到位置或领域实体向量集E和关系向量集R,并运用TransE算法对实体向量集E和关系向量集R进行翻译,得到一个能够快速计算实体间的语义相似性的三元组向量集,使在知识图谱中相似的实体,在低维空间里面的距离相近,头实体的向量加上关系向量基本等于尾实体的向量;

4)根据步骤3)得到的位置或领域实体向量集E,分别计算搜索位置或领域间的语义相似性simA,B(A,B),生成旅游位置的语义相似性矩阵;

5)根据步骤4)得到的语义相似性矩阵进行Top-k推荐列表,再将推荐列表按机器学习聚类算法进行聚类得到结果,然后将聚类结果作为最终推荐结果推荐给用户。

2.根据权利要求1所述的一种基于位置服务领域的知识图谱的推荐方法,其特征在于,步骤1)中,从用户的历史记录中抽取位置实体,需要将抽取的实体经过实体消歧处理。

3.根据权利要求1所述的一种基于位置服务领域的知识图谱的推荐方法,其特征在于,步骤3)中,所述的Trans E算法,是将知识图谱中的实体与关系嵌入一个低维的向量空间中,同时将实体与关系转化为向量表示,具体是对向量集E和R组成的三元组向量集进行训练,对于知识图谱KG中的一个三元组(h,r,t),用如下的损失公式进行训练:公式(1)中,γ为间距大小,一般设γ=1,h为头实体向量,r为关系向量,t为尾实体向量,符号|| ||代表求向量的模长,符号∑代表对数进行求和,符号[]+表示合页损失函数,合页损失函数形式化描述如下式:公式(2)中,x代表需要进行损失计算的参数;

在进行训练过程中,不仅需要正确的三元组,还需要错误的三元组,h'和t'是错误的三元组向量,作为训练的负样本,负样本的选取遵循如下原则:

1)当面对是一对一关系的三元组时,该类负样本是将TransE算法定义的正样本,即原始的头实体或尾实体随机替换成其他实体而得到一个新的三元组,新的负样本三元组为(h',t,r');

2)当面对于一对多、多对一或者多对多的关系的三元组时,引入伯努利抽样算法,它是面对一对多,多对一或者一对多关系,采用不同的概率换头实体和尾实体;具体是对于知识图谱中的每一个关系r,首先统计两个值,一个是每个头实体对应的尾实体数量的平均值,记为Ntph,另一个是每个尾实体对应的头实体数量的平均值,记为Nhpt,然后定义概率p,计算公式如下:则替换头实体和替换尾实体服从参数为p的伯努利分布,令

则X的分布律为:

P{X=x}=px(1-p)1-x,x=0,1            (5)即以p的概率替换头实体并且以1-p的概率替换尾实体来打破原有的三元组,新的负样本三元组为(h',t,r')。

4.根据权利要求1所述的一种基于位置服务领域的知识图谱的推荐方法,其特征在于,步骤4)中,所述的语义相似性矩阵,由计算语义相似性所得,具体的计算方式如下:假设对于A和B实体,通过数学变换使两个值域一一对应,最终语义相似度量的计算公式如下(6)所示:

5.根据权利要求1所述的一种基于位置服务领域的知识图谱的推荐方法,其特征在于,步骤5)中,所述的聚类算法为k-means算法。