1.一种扩展问答知识库的装置,其特征在于,包括:词向量模型训练模块,用以利用预设原始语料对词向量模型进行训练;
更新模块,用以利用训练完成的词向量模型获取多组新增相关词,并更新同义词词典,以用于进行相关词替换;所述更新模块包括:第二词向量计算单元,用以利用所述训练完成的词向量模型获取每组同义词中所有词语的词向量,以及所述预设原始语料中所有词语的词向量;相关词计算单元,用以根据词向量之间的距离确定每组同义词中所有词语的相关词;
第二相关词确定单元,用以将每组同义词中所有词语的相关词取交集,以确定所述多组新增相关词数据获取模块,用以获取待扩展问题,并对所述待扩展问题进行分词,以得到多个原始词语,所述待处理问题为问答知识库中的标准问或扩展问;
替换模块,用以对所述多个原始词语进行相关词替换,以得到原始词语与相关词组合或者相关词与相关词组合组合的多个扩展问句;
判断模块,用以对每一扩展问句中包括所述相关词的相邻词语之间的组合有效性进行判断;
过滤模块,用以根据判断结果对所述多个扩展问句进行过滤;
输出模块,用以将过滤后的多个扩展问句作为待处理问题的扩展问加入问答知识库。
2.根据权利要求1所述的扩展问答知识库的装置,其特征在于,所述替换模块包括:第一更换单元,用以利用所述多个原始词语对应的词类对所述多个原始词语进行相关词替换;
第二更换单元,用以利用同义词词典对所述多个原始词语进行同义词替换。
3.根据权利要求2所述的扩展问答知识库的装置,其特征在于,所述判断模块包括:组合概率确定单元,用以确定每一扩展问句中包括所述相关词的相邻词语之间的组合概率;
有效分数计算单元,用以利用所述组合概率计算扩展问句的有效分数;
存储单元,用于存储设定阈值;
比较单元,用以将所述扩展问句的有效分数与设定阈值比较,以得到所述判断结果。
4.根据权利要求3所述的扩展问答知识库的装置,其特征在于,所述过滤模块包括:保留单元,用以在所述判断结果表示所述扩展问句的有效分数达到所述设定阈值时,保留所述扩展问句,以作为所述待扩展问题的扩展问。
5.根据权利要求3所述的扩展问答知识库的装置,其特征在于,所述有效分数计算单元计算所述组合概率之和,以作为所述扩展问句的有效分数。
6.根据权利要求3所述的扩展问答知识库的装置,其特征在于,所述组合概率确定单元利用汉语语言模型或神经网络语言模型确定每一扩展问句中包括所述相关词的相邻词语之间的组合概率。
7.根据权利要求6所述的扩展问答知识库的装置,其特征在于,还包括:语言模型训练模块,用以利用预设原始语料对所述汉语语言模型或所述神经网络语言模型进行训练。
8.根据权利要求1所述的扩展问答知识库的装置,其特征在于,所述问答知识库包括多个知识点,每个知识点包括一个标准问、一个或多个扩展问和一个答案。