利索能及
我要发布
收藏
专利号: 2020116357885
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种知识图谱构建方法,其特征在于,所述知识图谱构建方法包括:调用信息爬虫工具从业务数据库中获取选定的业务类型的业务文本;

将所述各类型业务的业务文本输入预先建立的专名识别模型中,进行关键名词的提取,得到关键名词集;

根据所述关键名词集,在预设的信息数据库中获取所述关键名词集中各关键名词之间的实体关系;

调用预先建立的文本分类模型,分析所述关键名词和对应的实体关系与选定的业务类型的相关性,得到分析结果,其中,所述分析结果中包含与所述选定的业务类型之间的相关程度指数;

根据所述分析结果,将与所述选定的业务类型无关的关键名词从所述关键名词集中剔除,并删除对应的实体关系;

将剔除无关的关键名词后的关键名词集以及剩余的相关实体关系按照所述相关程度指数,构建所述选定的业务类型的知识图谱。

2.根据权利要求1所述的知识图谱构建方法,其特征在于,所述调用信息爬虫工具从业务数据库中获取不同选定的业务类型的业务文本包括:向所述业务数据库中的目标网站发送源代码获取请求,源代码获取请求通过后读取目标网站源代码;

根据所述目标网站源代码下载所述目标网站中的页面数据;

对所述页面数据中的内容进行识别,得到选定的业务类型的业务文本。

3.根据权利要求2所述的知识图谱构建方法,其特征在于,在所述将所述各类型业务的业务文本输入预先建立的专名识别模型中,进行关键名词的提取,得到关键名词集之前,还包括:

收集文本语料信息;

将所述文本语料信息中的词语进行标注,将标注后的文本语料信息进行分句与重组,得到文本语料训练集;

调用所述文本语料训练集对所述深度学习模型进行训练,得到专名识别模型。

4.根据权利要求3所述的知识图谱构建方法,其特征在于,在调用预先建立的文本分类模型,分析所述关键名词和对应的实体关系与对应的业务的相关性,得到分析结果之前,还包括:

收集所述选定的业务类型的业务语料,对所述业务语料进行业务分类标签的标注,得到语料分类训练集;

获取Bert预训练模型,将所述语料分类训练集作为Bert预训练模型的新增输入向量,对所述Bert预训练模型进行微调训练,得到训练完毕的文本分类模型。

5.根据权利要求4所述的知识图谱构建方法,其特征在于,所述获取Bert预训练模型,将所述语料分类训练集作为Bert预训练模型的新增输入向量,对所述Bert预训练模型进行微调训练,得到训练完毕的文本分类模型之前,还包括:调用所述文本语料训练集对双通道Transformer模型进行预训练,得到初始参数;

将所述初始参数保存,得到Bert预训练模型。

6.根据权利要求4所述的知识图谱构建方法,其特征在于,在所述根据所述关键名词集,在预设的信息数据库中获取所述关键名词集中各关键名词之间的实体关系之前,还包括:

获取至少一个知识资源网站,其中,所述知识资源网站包括百度百科、中国知网以及MBA智库;

调用信息爬虫工具对所述至少一个知识资源网站知识资源网站进行爬取,得到所述至少一个知识资源网站知识资源网站中的数据信息;

根据所述数据信息,构建信息数据库。

7.根据权利要求1‑6中任一项所述的知识图谱构建方法,其特征在于,在所述构建所述选定的业务类型的知识图谱之后,还包括:基于接收到的知识图谱更新请求,调用信息爬虫工具从业务数据库中获取不同类型的业务的新增业务文本;

将所述各类型业务的新增业务文本输入预先建立的专名识别模型中,进行关键名词的提取,得到新增关键名词集;

根据所述新增关键名词集,在预设的信息数据库中获取所述新增关键名词集中各新增关键名词之间的实体关系;

调用预先建立的文本分类模型,分析所述新增关键名词和对应的实体关系与选定的业务类型的相关性,得到分析结果;

根据所述分析结果,将与所述选定的业务类型无关的新增关键名词从所述新增关键名词集中剔除,并删除对应的实体关系,更新所述选定的业务类型的知识图谱。

8.一种知识图谱构建装置,其特征在于,所述知识图谱构建装置包括:文本获取模块,调用信息爬虫工具从业务数据库中获取选定的业务类型的业务文本;

名词提取模块,将所述各类型业务的业务文本输入预先建立的专名识别模型中,进行关键名词的提取,得到关键名词集;

实体关系获取模块,用于将所述各类型业务的业务文本输入预先建立的专名识别模型中,进行关键名词的提取,得到关键名词集;

相关性分析模块,用于调用预先建立的文本分类模型,分析所述关键名词和对应的实体关系与选定的业务类型的相关性,得到分析结果,其中,所述分析结果中包含与所述选定的业务类型之间的相关程度指数;

知识图谱建立模块,用于根据所述分析结果,将与所述选定的业务类型无关的关键名词从所述关键名词集中剔除,并删除对应的实体关系;将剔除无关的关键名词后的关键名词集以及剩余的相关实体关系按照所述相关程度指数,构建所述选定的业务类型的知识图谱。

9.一种知识图谱构建设备,其特征在于,所述知识图谱构建设备包括:存储器和至少一个处理器,所述存储器中存储有指令;

所述至少一个处理器调用所述存储器中的所述指令,以使得所述知识图谱构建设备执行如权利要求1‑7中任一项所述的知识图谱构建方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1‑7中任一项所述知识图谱构建方法的步骤。