1.基于自然资源产业链知识图谱的智能问答方法,其特征是,所述方法包括:获取自然资源产业数据;其中,所述自然资源产业数据,包括半结构化数据和结构化数据;将半结构化数据转换为新的结构化数据;将新的结构化数据与原结构化数据存储到关系数据库中;
对所有的结构化数据进行分析,构建出自然资源产业链的领域本体;将领域本体作为自然资源产业链知识图谱的模式层;
配置领域本体与关系数据库中结构化自然资源产业链数据之间的映射关系;基于映射关系将数据库中存储的结构化数据导出为三元组数据,将三元组数据作为自然资源产业链知识图谱的数据层;进而构建出自然资源产业链知识图谱;
获取自然资源产业方面的自然语言问题,基于自然资源产业链知识图谱对自然语言进行答案搜索,输出与自然语言对应的答案。
2.如权利要求1所述的基于自然资源产业链知识图谱的智能问答方法,其特征是,所述将半结构化数据转换为新的结构化数据;具体包括:通过网络爬虫工具对网页内容中的非结构化数据进行噪声剔除;
将噪声剔除后得到的结构化数据导入到关系数据库MYSQL中,以实现将半结构化的数据转换为结构化的数据。
3.如权利要求1所述的基于自然资源产业链知识图谱的智能问答方法,其特征是,对所有的结构化数据进行分析,构建出自然资源产业链的领域本体;具体包括:对结构化数据进行人工抽取、分析与总结,得到自然资源产业领域内的术语、基本概念以及概念之间的关系,最终构建出自然资源产业链领域本体,该本体作为自然资源产业链知识图谱中的模式层,模式层定义本体的概念以及关系。
4.如权利要求1所述的基于自然资源产业链知识图谱的智能问答方法,其特征是,对所有的结构化数据进行分析,构建出自然资源产业链的领域本体;具体包括:通过自顶向下的方式构建自然资源产业链本体;
分析关系数据库中存储的自然资源产业链数据,确定本体构建所需要覆盖领域的常见概念和术语;
分析关系数据库中存储的自然资源产业链数据;该产业分为资源谱系、资产谱系、资本谱系、产业谱系、技术谱系;
创建自然资源产业链本体的类以及类的层次结构、关系、属性和本体公理。
5.如权利要求4所述的基于自然资源产业链知识图谱的智能问答方法,其特征是,创建自然资源产业链本体的类以及类的层次结构、关系、属性和本体公理;具体包括:对于类的定义,自然资源领域本体中定义了资源谱系、技术谱系、资本谱系、资产谱系、产业谱系,每个抽象类中又根据不同领域和不同的分类定义了各级子类;
对于关系的定义,产业链中还大量存在着上下游关系以及相互具有价值的信息交换,因此父类与子类之间有“属于”、“前向带动”、“后向带动”关系。
6.如权利要求1所述的基于自然资源产业链知识图谱的智能问答方法,其特征是,配置领域本体与关系数据库中结构化自然资源产业链数据之间的映射关系;具体包括:使用映射工具OnTop来自定义两种数据之间的映射规则;利用映射工具OnTop,以访问知识图谱的形式直接访问关系数据库,将存储在MySQL中的结构化数据转换成RDF数据,并通过预先构建的映射文件映射到 定义的本体上,映射工具OnTop能够直接使用SPARQL语句将知识图谱表达为由关系源执行的SQL查询,进而查询到映射在本体中的产业链数据库中的信息,但数据保留在关系数据库中,而不是移动到另一个数据库中;通过映射工具OnTop将结构化数据映射到本体开发工具 所编辑的本体上。
7.如权利要求1所述的基于自然资源产业链知识图谱的智能问答方法,其特征是,所述基于映射关系将数据库中存储的结构化数据导出为三元组数据,将三元组数据作为自然资源产业链知识图谱的数据层;具体包括:使用OnTop内部的materialize命令将关系数据库中的结构化数据导出为RDF三元组格式的数据。
8.如权利要求1所述的基于自然资源产业链知识图谱的智能问答方法,其特征是,获取自然资源产业方面的自然语言问题,基于自然资源产业链知识图谱对自然语言进行答案搜索,输出与自然语言对应的答案;具体包括:获取自然资源产业方面的自然语言问题;
对所述自然语言问题,进行分词、词性标注和关键词提取处理;
将关键词与预定义的问题模板进行匹配,筛选出相似度最高的问题模板;
查找相似度最高的问题模板对应的查询语句,根据查询语句在自然资源产业链知识图谱中进行查询,通过响应函数输出最终的查询结果。
9.基于自然资源产业链知识图谱的智能问答系统,其特征是,包括:
获取模块,其被配置为,获取自然资源产业数据;其中,所述自然资源产业数据,包括半结构化数据和结构化数据;将半结构化数据转换为新的结构化数据;将新的结构化数据与原结构化数据存储到关系数据库中;
本体构建模块,其被配置为,对所有的结构化数据进行分析,构建出自然资源产业链的领域本体;将领域本体作为自然资源产业链知识图谱的模式层;
映射关系配置模块,其被配置为,配置领域本体与关系数据库中结构化自然资源产业链数据之间的映射关系;基于映射关系将数据库中存储的结构化数据导出为三元组数据,将三元组数据作为自然资源产业链知识图谱的数据层;进而构建出自然资源产业链知识图谱;
答案输出模块,其被配置为,获取自然资源产业方面的自然语言问题,基于自然资源产业链知识图谱对自然语言进行答案搜索,输出与自然语言对应的答案。
10.如权利要求9所述的基于自然资源产业链知识图谱的智能问答系统,其特征是,获取自然资源产业方面的自然语言问题,基于自然资源产业链知识图谱对自然语言进行答案搜索,输出与自然语言对应的答案;具体包括:获取自然资源产业方面的自然语言问题;
对所述自然语言问题,进行分词、词性标注和关键词提取处理;
将关键词与预定义的问题模板进行匹配,筛选出相似度最高的问题模板;
查找相似度最高的问题模板对应的查询语句,根据查询语句在自然资源产业链知识图谱中进行查询,通过响应函数输出最终的查询结果。