1.一种基于意图识别模型的实体消歧方法,其特征在于,包括:
获取待消歧的第一句子,并根据预设的歧义标注方法,对所述第一句子进行歧义标注处理,从而获取所述第一句子中的被标注为歧义的实体词语;
根据预设的标准句子挑选方法,从预设的标准句子数据库中选出指定标准句子;
根据预设的距离计算公式,计算所述第一句子与所述指定标准句子之间的第一距离,并判断所述第一距离是否小于预设的第一距离阈值;
若所述第一距离小于预设的第一距离阈值,则根据预设的标准句子与意图识别模型的对应关系,获取与所述指定标准句子对应的指定意图识别模型,其中所述指定意图识别模型采用样本数据训练而成,所述样本数据仅由被标注为指定类型意图的句子构成;
将所述第一句子输入所述指定意图识别模型中进行运算,从而得到所述指定意图识别模型输出的识别结果,其中所述识别结果包括识别成功或者识别失败;
判断所述识别结果是否为识别成功;
若所述识别结果为识别成功,则根据预设的第一句子-标准句子-意图识别模型-实体含义的对应关系,获取与所述第一句子对应的指定实体含义,并对所述第一句子中进行消歧标注操作,从而使所述被标注为歧义的实体词语被标注上所述指定实体含义。
2.根据权利要求1所述的基于意图识别模型的实体消歧方法,其特征在于,所述根据预设的歧义标注方法,对所述第一句子进行歧义标注处理,从而获取所述第一句子中的被标注为歧义的实体词语的步骤,包括:将所述第一句子输入预设的歧义标注模型中的双向编码器进行处理,从而与所述第一句子中的每个词语一一对应的第一歧义标注序列,并获取所述双向编码器的最后一层转换单元的隐藏状态向量集合,其中所述歧义标注模型由双向编码器和支持向量机构成,双向编码器包括多层转换单元;
将所述隐藏状态向量集合输入所述支持向量机进行运算,得到与所述第一句子的每个词语一一对应的第二歧义标注序列,其中支持向量机进行运算时使用的函数为其中 为所述第一句子的第i个词语对应的标注值,y为自变量,yi为所述第一句子的第i个词语对应的标注,wyi为第i个词语对应的参数向量,hi为第i个词语对应的隐藏状态向量,wyi与hi具有相同数量的分向量;
根据预设的相似程度值计算方法,计算所述第一歧义标注序列与所述第二歧义标注序列的相似程度值,并判断所述相似程度值是否大于预设的相似程度阈值;
若所述相似程度值大于预设的相似程度阈值,则获取所述第二歧义标注序列中被标注为歧义的实体词语。
3.根据权利要求1所述的基于意图识别模型的实体消歧方法,其特征在于,所述根据预设的标准句子挑选方法,从预设的标准句子数据库中选出指定标准句子的步骤,包括:根据公式: 计算出所述第一句子和所述标准句子数据库中
的一个标准句子的句子相似度值sim,其中,A为所述第一句子的词频向量,B为标准句子的词频向量,Ai为第一句子的第i个词语在整个句子中出现的次数;Bi为标准句子的第i个词语在整个句子中出现的次数;
判断所述标准句子数据库中是否存在所述句子相似度值sim大于预设的句子相似度阈值的标准句子;
若存在,则将所述句子相似度值sim大于预设的句子相似度阈值的标准句子记为指定标准句子。
4.根据权利要求1所述的基于意图识别模型的实体消歧方法,其特征在于,所述根据预设的距离计算公式,计算所述第一句子与所述指定标准句子之间的第一距离的步骤,包括:通过查询预设的词向量库,获取与所述第一句子对应的第一词向量序列I,以及获取与所述指定标准句子对应的第二词向量序列R;
根据公式:
计算所
述第一句子与所述指定标准句子之间的第一距离D,其中|I|是所述第一词向量序列中的词语数;|R|是所述第二词向量序列中的词语数;w是词向量;α为调整两个词向量之间的余弦相似度的放大系数;max(α×cosDis(w,R)是计算第二词向量序列R中所有词语对应的词向量与第一词向量序列I中的词向量w的余弦相似度中的最大值。
5.根据权利要求1所述的基于意图识别模型的实体消歧方法,其特征在于,所述若所述第一距离小于预设的第一距离阈值,则根据预设的标准句子与意图识别模型的对应关系,获取与所述指定标准句子对应的指定意图识别模型,其中所述指定意图识别模型采用样本数据训练而成,所述样本数据仅由被标注为指定类型意图的句子构成的步骤之前,包括:获取预先收集的多个样本数据,并将所述多个样本数据划分为训练数据和测试数据;
其中,所述样本数据为被标注为指定类型意图的句子;
将训练数据输入到预设的神经网络模型中进行训练,其中训练采用随机梯度下降法,从而得到中间意图识别模型;
采用所述测试数据对所述中间意图识别模型进行验证,并判断验证是否通过;
若验证通过,则将所述中间意图识别记为所述指定意图识别模型。
6.根据权利要求1所述的基于意图识别模型的实体消歧方法,其特征在于,所述指定标准句子存在多个,所述判断所述识别结果是否为识别成功的步骤之后,包括:若所述识别结果为识别失败,则从多个指定标准句子中获取备选标准句子,其中,所述备选标准句子与所述第一句子之间的第二距离大于所述第一距离阈值并且小于预设的第二距离阈值;
根据预设的标准句子与意图识别模型的对应关系,获取与所述备选标准句子对应的备选意图识别模型;
将所述第一句子输入所述备选意图识别模型中进行运算,从而得到所述备选意图识别模型输出的第二识别结果,其中所述第二识别结果包括识别成功或者识别失败;
判断所述第二识别结果是否为识别成功;
若所述第二识别结果为识别成功,则根据预设的第一句子-标准句子-意图识别模型-实体含义的对应关系,获取与所述第一句子对应的备选实体含义,并对所述第一句子中进行消歧标注操作,从而使所述被标注为歧义的实体词语被标注上所述备选实体含义。
7.根据权利要求6所述的基于意图识别模型的实体消歧方法,其特征在于,所述判断所述第二识别结果是否为识别成功的步骤之后,包括:若所述第二识别结果为识别失败,则获取所述指定标准句子的数量;
判断所述指定标准句子的数量是否大于预设的数量阈值;
若所述指定标准句子的数量不大于预设的数量阈值,则执行标注修改操作,其中所述标注修改操作用于将被标注为歧义的实体词语的标注修改为无歧义标注。
8.一种基于意图识别模型的实体消歧装置,其特征在于,包括:
实体词语获取单元,用于获取待消歧的第一句子,并根据预设的歧义标注方法,对所述第一句子进行歧义标注处理,从而获取所述第一句子中的被标注为歧义的实体词语;
指定标准句子获取单元,用于根据预设的标准句子挑选方法,从预设的标准句子数据库中选出指定标准句子;
第一距离判断单元,用于根据预设的距离计算公式,计算所述第一句子与所述指定标准句子之间的第一距离,并判断所述第一距离是否小于预设的第一距离阈值;
指定意图识别模型获取单元,用于若所述第一距离小于预设的第一距离阈值,则根据预设的标准句子与意图识别模型的对应关系,获取与所述指定标准句子对应的指定意图识别模型,其中所述指定意图识别模型采用样本数据训练而成,所述样本数据仅由被标注为指定类型意图的句子构成;
识别结果获取单元,用于将所述第一句子输入所述指定意图识别模型中进行运算,从而得到所述指定意图识别模型输出的识别结果,其中所述识别结果包括识别成功或者识别失败;
识别结果判断单元,用于判断所述识别结果是否为识别成功;
指定实体含义标注单元,用于若所述识别结果为识别成功,则根据预设的第一句子-标准句子-意图识别模型-实体含义的对应关系,获取与所述第一句子对应的指定实体含义,并对所述第一句子中进行消歧标注操作,从而使所述被标注为歧义的实体词语被标注上所述指定实体含义。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。