1.一种基于知识图谱的智能问答方法,其特征在于,所述方法包括:步骤A:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的答案数据集,并组成问答数据集,根据所述问答数据集构建知识图谱关系型数据集,将所述知识图谱关系型数据集存入数据库中;
步骤B:从所述数据库中读取所述知识图谱关系型数据集,并基于隐性马尔科夫模型和关键字抽取算法对所述知识图谱关系型数据集进行包括分词和关键字抽取的预处理操作,得到逻辑问答数据集,其中,所述逻辑问答数据集包括逻辑问题数据集和逻辑答案数据集;
步骤C:提取所述逻辑问答数据集内的逻辑问题数据集,并计算所述逻辑问题数据集内数据之间的问题相似度,基于所述问题相似度的值清理所述逻辑问题数据集,根据清理完成的所述逻辑问题数据集建立网页链式接口;
步骤D:接收用户输入的问题,对所述用户输入的问题进行分词和关键字抽取的预处理后,计算所述用户输入的问题与所述逻辑问题数据集内数据的问题相似度,得到问题相似度集合,判断所述问题相似度集合与预设问题阈值的大小关系;
步骤H:当所述问题相似度集合中相似度最高的值大于所述预设问题阈值时,搜索所述逻辑问答数据集内的逻辑答案数据集,找到并输出所述用户输入的问题的答案;
步骤E:当所述问题相似度集合中相似度最高的值小于所述预设问题阈值时,通过所述网页链式接口访问网页得到所述用户输入的问题的网页答案集,并对所述网页答案集进行分词和关键字抽取的预处理后,计算所述网页答案集与所述逻辑答案数据集的答案相似度集合,并判断所述答案相似度集合与预设答案阈值的大小关系;
步骤F:当所述答案相似度集合中相似度最高的值小于预设答案阈值时,输出所述答案相似度最高的网页答案集所对应的答案;
步骤G:当所述答案相似度集合中相似度最高的值大于预设答案阈值时,输出所述答案相似度最高的逻辑答案数据集所对应的答案。
2.如权利要求1所述的基于知识图谱的智能问答方法,其特征在于,根据所述问答数据集构建知识图谱关系型数据集,将所述知识图谱关系型数据集存入数据库包括:将所述问答数据集内的数据输入至循环神经网络与卷积神经网络的组合模型中,所述组合模型将所述问答数据集内的数据划分至所属的领域范围;
对所述各领域范围内的数据按照实体、关系、实体的数据关系重新构建,得到知识图谱关系型数据集;
将所述知识图谱关系型数据集按照所述实体、关系、实体的数据关系存储至所述数据库中。
3.如权利要求2所述的基于知识图谱的智能问答方法,其特征在于,所述分词根据所述知识图谱关系型数据集建立分词概率模型P(S),并最大化所述分词概率模型,完成分词操作,所述分词概率模型P(S)为:其中,W1,W2,...,Wm为所述知识图谱关系型数据集内数据的词,m为所述知识图谱关系型数据集的数量;
所述关键字抽取包括构建所述词的相关度并基于所述相关度提取关键字,所述相关度为:
其中,f(Wi,Wj)为词Wi和词Wj的相关度,tfidf(Wi)为词Wi的词频与逆向频率值,d为词Wi和词Wj关于词向量的欧式距离。
4.如权利要求3所述的基于知识图谱的智能问答方法,其特征在于,计算所述逻辑问题数据集内数据之间的问题相似度包括:其中,sim(Wi,Wj)为词Wi和词Wj的问题相似度,n为所述逻辑问题数据集内的数据总数。
5.如权利要求4所述的基于知识图谱的智能问答方法,其特征在于,基于所述问题相似度的值清理所述逻辑问题数据集,包括:判断所述词Wi和词Wj的问题相似度与所述预设问题阈值,当所述词Wi和词Wj的问题相似度大于所述预设问题阈值时,则从所述逻辑问题数据集中去除所述词Wj,保留所述词Wi,当所述词Wi和词Wj的问题相似度小于所述预设问题阈值时,同时保留所述词Wi和词Wj,直至完成所述逻辑问题数据集内所有数据与所述预设问题阈值的判断,完成清理。
6.一种基于知识图谱的智能问答装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的基于知识图谱的智能问答程序,所述基于知识图谱的智能问答程序被所述处理器执行时实现如下步骤:步骤A:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的答案数据集,并组成问答数据集,根据所述问答数据集构建知识图谱关系型数据集,将所述知识图谱关系型数据集存入数据库中;
步骤B:从所述数据库中读取所述知识图谱关系型数据集,并基于隐性马尔科夫模型和关键字抽取算法对所述知识图谱关系型数据集进行包括分词和关键字抽取的预处理操作,得到逻辑问答数据集,其中,所述逻辑问答数据集包括逻辑问题数据集和逻辑答案数据集;
步骤C:提取所述逻辑问答数据集内的逻辑问题数据集,并计算所述逻辑问题数据集内数据之间的问题相似度,基于所述问题相似度的值清理所述逻辑问题数据集,根据清理完成的所述逻辑问题数据集建立网页链式接口;
步骤D:接收用户输入的问题,对所述用户输入的问题进行分词和关键字抽取的预处理后,计算所述用户输入的问题与所述逻辑问题数据集内数据的问题相似度,得到问题相似度集合;
步骤H:当所述问题相似度集合中相似度最高的值大于预设问题阈值时,搜索所述逻辑问答数据集内的逻辑答案数据集,找到并输出所述用户输入的问题的答案;
步骤E:当所述问题相似度集合中相似度最高的值小于预设问题阈值时,通过所述网页链式接口访问网页得到所述用户输入的问题的网页答案集,并对所述网页答案集进行分词和关键字抽取的预处理后,计算所述网页答案集与所述逻辑答案数据集的答案相似度集合,并判断所述答案相似度集合与预设答案阈值的大小关系;
步骤F:当所述答案相似度集合中相似度最高的值小于预设答案阈值时,输出所述答案相似度最高的网页答案集所对应的答案;
步骤G:当所述答案相似度集合中相似度最高的值大于预设答案阈值时,输出所述答案相似度最高的逻辑答案数据集所对应的答案。
7.如权利要求6所述的基于知识图谱的智能问答装置,其特征在于,根据所述问答数据集构建知识图谱关系型数据集,将所述知识图谱关系型数据集存入数据库包括:将所述问答数据集内的数据输入至循环神经网络与卷积神经网络的组合模型中,所述组合模型将所述问答数据集内的数据划分至所属的领域范围;
对所述各领域范围内的数据按照实体、关系、实体的数据关系重新构建,得到知识图谱关系型数据集;
将所述知识图谱关系型数据集按照所述实体、关系、实体的数据关系存储至所述数据库中。
8.如权利要求7所述的基于知识图谱的智能问答装置,其特征在于,所述分词根据所述知识图谱关系型数据集建立分词概率模型P(S),并最大化所述分词概率模型,完成分词操作,所述分词概率模型P(S)为:其中,W1,W2,...,Wm为所述知识图谱关系型数据集内数据的词,m为所述知识图谱关系型数据集的数量;
所述关键字抽取包括构建所述词的相关度并基于所述相关度提取关键字,所述相关度为:
其中,f(Wi,Wj)为词Wi和词Wj的相关度,tfidf(Wi)为词Wi的词频与逆向频率值,d为词Wi和词Wj关于词向量的欧式距离。
9.如权利要求7所述的基于知识图谱的智能问答装置,其特征在于,计算所述逻辑问题数据集内数据之间的问题相似度包括:其中,sim(Wi,Wj)为词Wi和词Wj的问题相似度,n为所述逻辑问题数据集内的数据总数。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于知识图谱的智能问答程序,所述基于知识图谱的智能问答程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的基于知识图谱的智能问答方法的步骤。