1.一种搜索系统的优化方法,其特征在于,所述搜索系统包括预设召回模块和预设排序模块,所述方法包括:基于所述预设召回模块,分别计算预设问题集合中每个预设问题与预设文章数据库中各个预设文章之间的第一得分,并依据所述第一得分,确定与每个所述预设问题相似度较高的第一数量的目标文章;
基于所述预设排序模块,分别计算任一所述预设问题和与任一所述预设问题对应的所述目标文章之间的第二得分;
依据所述第一得分以及所述第二得分,确定第一KL散度值;
基于所述第一KL散度值,对所述预设召回模块以及所述预设排序模块的参数进行调整,得到优化后的搜索系统。
2.根据权利要求1所述的方法,其特征在于,所述基于所述预设召回模块,分别计算预设问题集合中每个预设问题与预设文章数据库中各个预设文章之间的第一得分,具体包括:将所述预设问题集合中任一所述预设问题输入至所述预设召回模块的第一编码器中,得到与所述任一所述预设问题对应的问题向量;
将所述预设文章数据库中各个所述预设文章分别输入至所述预设召回模块的第二编码器中,得到与每个所述预设文章对应的文章向量;
分别计算所述任一所述问题向量与每个所述文章向量之间的内积,得到所述第一得分。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述预设排序模块,分别计算任一所述预设问题和与任一所述预设问题对应的所述目标文章之间的第二得分,具体包括:将所述任一所述预设问题以及与任一所述预设问题对应的所述目标文章作为所述预设排序模块的输入,得到第一输出向量;
基于所述第一输出向量以及全连接层,得到所述第二得分。
4.根据权利要求1所述的方法,其特征在于,所述依据所述第一得分以及所述第二得分,确定第一KL散度值,具体包括:分别对任一所述预设问题和与任一所述预设问题对应的所述目标文章之间的所述第一得分进行标准化处理,得到每个所述第一得分对应的第一标准化分值;
分别对任一所述预设问题和与任一所述预设问题对应的所述目标文章之间的所述第二得分进行标准化处理,得到每个所述第二得分对应的第二标准化分值;
依据所述第一标准化分值以及所述第二标准化分值,确定所述第一KL散度值。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一KL散度值,对所述预设召回模块以及所述预设排序模块的参数进行调整,得到优化后的搜索系统,具体包括:判断所述第一KL散度值与预设散度阈值的关系,并当所述第一KL散度值大于所述预设散度阈值时,对所述预设召回模块以及所述预设排序模块的参数进行调整,得到更新后的预设召回模块以及预设排序模块;
基于更新后的预设召回模块以及预设排序模块,确定更新后的第一得分以及第二得分,并基于所述更新后的第一得分以及第二得分,确定第二KL散度值;
再次判断所述第二KL散度值与所述预设散度阈值的关系,并当所述第二KL散度值大于所述预设散度阈值时,对更新后的预设召回模块以及预设排序模块再次进行参数调整,直至KL散度值小于或等于所述预设散度阈值时,得到优化后的搜索系统。
6.根据权利要求5所述的方法,其特征在于,所述得到优化后的搜索系统之后,所述方法还包括:获取测试问题集合,通过优化后的搜索系统中的召回模块从测试文章数据库中分别召回与所述测试问题集合中任一测试问题对应的第二数量的目标测试文章;
基于优化后的搜索系统中的排序模块对任一所述测试问题对应的所述目标测试文章进行排序,得到测试排序结果;
依据所述任一所述测试问题对应的所述目标测试文章以及所述测试排序结果,与所述任一所述测试问题对应的真实目标文章以及真实排序结果进行比对,并当比对通过时,所述优化后的搜索系统中的所述召回模块和所述排序模块测试通过。
7.根据权利要求1所述的方法,其特征在于,所述基于所述第一KL散度值,对所述预设召回模块以及所述预设排序模块的参数进行调整之前,所述方法还包括:获取样本问题集合以及与所述样本问题集合中每个样本问题对应的至少一个文章正样本和至少一个文章负样本;
将任一所述样本问题和与所述任一所述样本问题对应的任一所述文章正样本作为所述预设排序模块的输入,得到第二输出向量,并基于所述第二输出向量以及所述全连接层,得到第三得分;
将所述任一所述样本问题和与所述任一所述样本问题对应的任一所述文章负样本作为所述预设排序模块的输入,得到第三输出向量,并基于所述第三输出向量以及所述全连接层,得到第四得分;
基于所述样本问题集合中各个所述样本问题对应的第三得分,以及与每个所述第三得分对应的不同所述文章负样本的所述第四得分,确定所述预设排序模块对应的目标损失值;
所述基于所述第一KL散度值,对所述预设召回模块以及所述预设排序模块的参数进行调整,具体包括:基于所述第一KL散度值以及所述目标损失值,对所述预设召回模块以及所述预设排序模块的参数进行调整。
8.一种搜索系统的优化装置,其特征在于,所述搜索系统包括预设召回模块和预设排序模块,所述装置包括:第一计算模块,用于基于所述预设召回模块,分别计算预设问题集合中每个预设问题与预设文章数据库中各个预设文章之间的第一得分,并依据所述第一得分,确定与每个所述预设问题相似度较高的第一数量的目标文章;
第二计算模块,用于基于所述预设排序模块,分别计算任一所述预设问题和与任一所述预设问题对应的所述目标文章之间的第二得分;
散度值确定模块,用于依据所述第一得分以及所述第二得分,确定第一KL散度值;
参数调整模块,用于基于所述第一KL散度值,对所述预设召回模块以及所述预设排序模块的参数进行调整,得到优化后的搜索模块。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法。