1.一种基于对抗网络的知识库扩展方法,其特征在于,包括:获取本地的初始问答标准知识库,并获取所述初始问答标准知识库中的初始问题集和初始答案集;
将所述初始问题集作为训练样本对待训练对抗网络模型进行训练,得到训练后的对抗网络模型;
将所述初始问题集输入至所述训练后的对抗网络模型进行运算,得到扩展问题集;
获取预先存储的数据获取地址信息,在所述数据获取地址信息对应的数据集中检索获取与所述扩展问题集中每一扩展问题对应的扩展答案,组成扩展答案集;以及将所述扩展问题集和所述扩展答案集进行组合得到扩展问答标准知识库,将所述扩展问答标准知识库进行本地存储。
2.根据权利要求1所述的基于对抗网络的知识库扩展方法,其特征在于,所述将所述扩展问题集和所述扩展答案集进行组合得到扩展问答标准知识库,将所述扩展问答标准知识库进行本地存储之后,还包括:
将扩展问答标准知识库发送至目标接收端;
若接收到目标接收端发送的人工校准知识库,将人工校准知识库进行本地存储。
3.根据权利要求1所述的基于对抗网络的知识库扩展方法,其特征在于,所述将所述初始问题集作为训练样本对待训练对抗网络模型进行训练,得到训练后的对抗网络模型,包括:
获取所述初始问题集中每一初始问题的语义向量;
获取所述初始问题集根据各初始问题的语义向量之间的向量相似度,并根据预设的分组策略对所述初始问题集进行分组,得到问题集分组结果;其中,所述问题集分组结果中包括若干个问题集子分组,且分别记为第1问题集子分组至第k问题集子分组,k为问题集分组结果中包括的问题集子分组总个数;
统计获取每一问题集子分组中对应包括的问题总个数,并获取其中包括问题总个数最多的问题集子分组,作为目标问题集子分组;
不断从目标问题集子分组中任意获取两个初始问题的语义向量以对待训练cycle‑GAN模型进行训练,直至待训练cycle‑GAN模型收敛时停止从目标问题集子分组中任意获取两个初始问题的语义向量,得到cycle‑GAN模型作为训练后的对抗网络模型。
4.根据权利要求3所述的基于对抗网络的知识库扩展方法,其特征在于,所述获取所述初始问题集根据各初始问题的语义向量之间的向量相似度,并根据预设的分组策略对所述初始问题集进行分组,得到问题集分组结果,包括:将所述初始问题集根据各初始问题的语义向量之间的欧式距离作为向量相似度进行K‑means聚类,得到问题集分组结果。
5.根据权利要求1所述的基于对抗网络的知识库扩展方法,其特征在于,所述将所述初始问题集作为训练样本对待训练对抗网络模型进行训练,得到训练后的对抗网络模型,包括:
获取所述初始问题集中每一初始问题的语义向量;
获取所述初始问题集根据各初始问题的语义向量之间的向量相似度,并根据预设的分组策略对所述初始问题集进行分组,得到问题集分组结果;其中,所述问题集分组结果中包括若干个问题集子分组,且分别记为第1问题集子分组至第k问题集子分组,k为问题集分组结果中包括的问题集子分组总个数;其中,i的初始取值为1,且i的取值范围是[1,k];
从第i个问题集子分组中任意获取两个初始问题的语义向量以对待训练cycle‑GAN模型进行训练,直至待训练cycle‑GAN模型收敛时,得到第i个cycle‑GAN模型,并以第i个cycle‑GAN模型更新作为待训练cycle‑GAN模型;
将i自增1以更新i的取值,判断i是否超出k;若i未超出k,返回执行从第i个问题集子分组中任意获取两个初始问题的语义向量以对待训练cycle‑GAN模型进行训练,直至待训练cycle‑GAN模型收敛时,得到第i个cycle‑GAN模型,并以第i个cycle‑GAN模型更新作为待训练cycle‑GAN模型的步骤;
若i超出k,获取第i‑1个cycle‑GAN模型作为训练后的对抗网络模型。
6.根据权利要求1所述的基于对抗网络的知识库扩展方法,其特征在于,所述在所述数据获取地址信息对应的数据集中检索获取与所述扩展问题集中每一扩展问题对应的扩展答案,包括:
获取扩展问题对应的当前语义向量;
获取预先训练的稠密段落检索模型,将所述当前语义向量输入至所述稠密段落检索模型进行运算,得到检索结果集;
获取预先训练的BERT模型,将所述检索结果集输入至所述BERT模型进行运算,得到与所述当前语义向量对应的当前扩展答案;其中,当前扩展答案作为扩展答案集中的其中一个扩展答案。
7.根据权利要求1所述的基于对抗网络的知识库扩展方法,其特征在于,所述在所述数据获取地址信息对应的数据集中检索获取与所述扩展问题集中每一扩展问题对应的扩展答案,包括:
获取所述扩展问题集中每一扩展问题对应的问题语义向量;
获取所述数据获取地址信息对应的数据集中所包括的每一文本集,及与每一文本集对应的文本语义向量;
在与每一文本集对应的文本语义向量中分别获取与各问题语义向量的向量相似度为最大值的文本语义向量,以组成与各问题语义一一对应的目标文本语义向量;
获取各目标文本语义向量分别对应的目标文本,组成扩展答案集。
8.一种基于对抗网络的知识库扩展装置,其特征在于,包括:初始知识库获取单元,用于获取本地的初始问答标准知识库,并获取所述初始问答标准知识库中的初始问题集和初始答案集;
模型训练单元,用于将所述初始问题集作为训练样本对待训练对抗网络模型进行训练,得到训练后的对抗网络模型;
扩展问题集获取单元,用于将所述初始问题集输入至所述训练后的对抗网络模型进行运算,得到扩展问题集;
扩展答案集获取单元,用于获取预先存储的数据获取地址信息,在所述数据获取地址信息对应的数据集中检索获取与所述扩展问题集中每一扩展问题对应的扩展答案,组成扩展答案集;以及
扩展知识库获取单元,用于将所述扩展问题集和所述扩展答案集进行组合得到扩展问答标准知识库,将所述扩展问答标准知识库进行本地存储。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于对抗网络的知识库扩展方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于对抗网络的知识库扩展方法。