1.一种扩展问答知识库的方法,其特征在于,包括:利用预设原始语料对词向量模型进行训练,利用所述训练完成的词向量模型获取每组同义词中所有词语的词向量,以及所述预设原始语料中所有词语的词向量;根据词向量之间的距离确定每组同义词中所有词语的相关词;
将每组同义词中所有词语的相关词取交集,以确定多组新增相关词,并更新同义词词典,以用于进行相关词替换;
获取待处理问题,并对所述待处理问题进行分词,以得到多个原始词语,所述待处理问题为问答知识库中的标准问或扩展问;
对所述多个原始词语进行相关词替换,以得到原始词语与相关词组合或者相关词与相关词组合的多个扩展问句;
对每一扩展问句中包括所述相关词的相邻词语之间的组合有效性进行判断;
根据判断结果对所述多个扩展问句进行过滤;
将过滤后的多个扩展问句作为待处理问题的扩展问加入问答知识库。
2.根据权利要求1所述的扩展问答知识库的方法,其特征在于,所述对所述多个原始词语进行相关词替换包括:利用所述多个原始词语对应的词类对所述多个原始词语进行相关词替换;
或者,利用同义词词典对所述多个原始词语进行同义词替换。
3.根据权利要求1所述的扩展问答知识库的方法,其特征在于,所述对每一扩展问句中包括所述相关词的相邻词语之间的组合有效性进行判断包括:确定每一扩展问句中包括所述相关词的相邻词语之间的组合概率;
利用所述组合概率计算扩展问句的有效分数;
将所述扩展问句的有效分数与设定阈值比较,以得到所述判断结果。
4.根据权利要求3所述的扩展问答知识库的方法,其特征在于,所述根据判断结果对所述多个扩展问句进行过滤包括:如果所述判断结果表示所述扩展问句的有效分数达到所述设定阈值,则保留所述扩展问句,以作为所述待处理问题的扩展问。
5.根据权利要求3所述的扩展问答知识库的方法,其特征在于,所述利用所述组合概率计算扩展问句的有效分数包括:计算所述组合概率之和,以作为所述扩展问句的有效分数。
6.根据权利要求3所述的扩展问答知识库的方法,其特征在于,所述确定每一扩展问句中包括所述相关词的相邻词语之间的组合概率包括:利用汉语语言模型或神经网络语言模型确定每一扩展问句中包括所述相关词的相邻词语之间的组合概率。
7.根据权利要求6所述的扩展问答知识库的方法,其特征在于,所述获取待扩展的问句之前还包括:利用预设原始语料对所述汉语语言模型或所述神经网络语言模型进行训练。
8.根据权利要求1所述的扩展问答知识库的方法,其特征在于,所述问答知识库包括多个知识点,每个知识点包括一个标准问、一个或多个扩展问和一个答案。
9.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至8中任一项所述扩展问答知识库的方法的步骤。
10.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至8中任一项所述扩展问答知识库的方法的步骤。