利索能及
我要发布
收藏
专利号: 2017111156905
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种知识图谱建立方法,其特征在于,所述方法包括:对待添加数据进行处理得到第一实体数据以及与所述第一实体数据对应的关系数据;

当所述第一实体数据与预先设置的实体数据库中存储的第二实体数据未完全匹配时,则从转换逻辑库中选取与所述第一实体数据对应的转换逻辑;

通过所述转换逻辑对所述第一实体数据进行转换,得到转换后的第一实体数据,所述转换后的第一实体数据对应的关系数据与所述第一实体数据对应的关系数据相同;

计算所述转换后的第一实体数据与所述实体数据库中存储的所述第二实体数据的相似度;

当所述相似度等于预设值时,则将所述转换后的第一实体数据对应的所述关系数据添加到所述实体数据库中与所述第二实体数据形成知识图谱。

2.根据权利要求1所述的方法,其特征在于,所述对待添加数据进行处理得到第一实体数据以及与所述第一实体数据对应的关系数据的步骤,包括:检测所爬取的爬取数据中是否存在预设字符;

当存在所述预设字符时,则根据所述预设字符获取所述爬取数据的不同字段;

分别从所述爬取数据的不同字段中提取一标准数据并组合为待添加数据;

提取所述待添加数据的实体数据字段对应的数据作为所述待添加数据的第一实体数据,提取所述待添加数据的关系数据字段对应的数据作为所述待添加数据的关系数据。

3.根据权利要求1所述的方法,其特征在于,所述对待添加数据进行处理得到第一实体数据以及与所述第一实体数据对应的关系数据的步骤之后,还包括:计算所述第一实体数据和实体数据库中存储的第二实体数据的相似度;

当所述相似度等于预设值时,则将所述关系数据添加到所述实体数据库中与所述第二实体数据形成知识图谱。

4.根据权利要求3所述的方法,其特征在于,所述计算所述第一实体数据和实体数据库中存储的第二实体数据的相似度的步骤,包括:根据所述第一实体数据的字符数与实体数据库中存储的第二实体数据的字符数,计算字符匹配率以及将所述第一实体数据转换为所述第二实体数据的步骤数;

根据所述第一实体数据与所述第二实体数据的字符数和以及所述步骤数计算转换匹配率;

计算所述字符匹配率与所述转换匹配率的加权平均值作为所述第一实体数据和所述实体数据库中存储的第二实体数据的相似度。

5.根据权利要求1所述的方法,其特征在于,所述计算所述转换后的第一实体数据与所述实体数据库中存储的实体数据的相似度的步骤之后,还包括:当所述转换后的第一实体数据与所述实体数据库中存储的第二实体数据未完全匹配时,则接收审核指令;

当所述审核指令表示将所述第一实体数据和与所述第一实体数据对应的关系数据添加到所述实体数据库中时,则将所述第一实体数据和与所述第一实体数据对应的关系数据添加到所述实体数据库中形成知识图谱。

6.根据权利要求1所述的方法,其特征在于,所述对待添加数据进行处理得到第一实体数据以及与所述第一实体数据对应的关系数据的步骤之前,还包括:提取待添加数据上携带的数据来源标识;

从网站信用库中获取与所述数据来源标识对应的信用等级;

当所述信用等级未达到预设的等级时,则删除所述待添加数据。

7.一种知识图谱建立装置,其特征在于,所述装置包括:处理模块,用于对待添加数据进行处理得到第一实体数据以及与所述第一实体数据对应的关系数据;

选取模块,用于当所述第一实体数据与预先设置的实体数据库中存储的第二实体数据未完全匹配时,则从转换逻辑库中选取与所述第一实体数据对应的转换逻辑;

转换模块,用于通过所述转换逻辑对所述第一实体数据进行转换,得到转换后的第一实体数据,所述转换后的第一实体数据对应的关系数据与所述第一实体数据对应的关系数据相同;

计算模块,用于计算所述转换后的第一实体数据与所述实体数据库中存储的实体数据的相似度;

添加模块,用于当所述相似度等于预设值时,则将所述转换后的第一实体数据对应的所述关系数据添加到所述实体数据库中与所述第二实体数据形成知识图谱。

8.根据权利要求7所述的方法,其特征在于,所述处理模块还包括:检测单元,用于检测所爬取的爬取数据中是否存在预设字符;

获取单元,用于当存在所述预设字符时,则根据所述预设字符获取所述爬取数据的不同字段;

第一提取单元,用于分别从所述爬取数据的不同字段中提取一标准数据组合为待添加数据;

第二提取单元,用于提取所述待添加数据的实体数据字段对应的数据作为所述待添加数据的第一实体数据,提取所述待添加数据的关系数据字段对应的数据作为所述待添加数据的关系数据。

9.一种计算机设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至

6中任意一项所述方法中的步骤。

10.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任意一项所述方法中的步骤。