1.一种少样本关系抽取模型的训练方法,其特征在于,包括:
根据获取的句子文本集确定正向训练的第一支持集和第一查询集,所述句子文本集中的实例标注有实体对和关系标签,第一支持集中根据所述关系标签划分有多个类别的第一实例集;
利用所述第一支持集与所述第一查询集对预设的少样本关系抽取模型进行正向训练,得到所述第一查询集中每个第二实例与所述第一支持集中每个类别的第一实例集的正向关系原型,以及根据所述正向关系原型确定所述每个第二实例与所述每个类别的第一实例集之间的第一匹配得分,和所述每个第二实例的伪关系标签;
根据所述第一查询集与所述第二实例的伪关系标签构建逆向训练的第二支持集,根据所述句子文本集和所述第二支持集构建逆向训练的第二查询集,所述第二支持集中根据关系标签划分有多个类别的第二实例集,所述第二实例集的类别与所述第一实例集的类别相对应;
利用所述第二支持集与所述第二查询集对预设的少样本关系抽取模型进行逆向训练,得到所述第二查询集中每个第四实例与所述第二支持集中每个类别的第二实例集的逆向关系原型,以及根据所述逆向关系原型确定所述每个第四实例与所述每个类别的第二实例集之间的第二匹配得分;
根据所述第一匹配得分和所述第二匹配得分确定交叉熵损失值,根据所述正向关系原型和所述逆向关系原型对所述预设的少样本关系抽取模型进行调参,并根据所述交叉熵损失值得到更新后的少样本关系抽取模型。
2.根据权利要求1所述的少样本关系抽取模型的训练方法,其特征在于,所述根据获取的句子文本集确定正向训练的第一支持集和第一查询集,包括:根据获取的句子文本集和预设任务场景确定正向训练的第一支持集和第一查询集;所述预设任务场景确定了所述第一支持集中第一实例集的类别和所述第一实例集中第一实例的数量;所述第一查询集中第二实例的类别与所述第一实例集的类别相对应。
3.根据权利要求2所述的少样本关系抽取模型的训练方法,其特征在于,所述根据所述第一查询集与所述第二实例的伪关系标签构建逆向训练的第二支持集,根据所述句子文本集和所述第二支持集构建逆向训练的第二查询集,包括:根据所述预设任务场景、第一查询集与所述第二实例的伪关系标签构建逆向训练的第二支持集;所述第二支持集中包括所述第一查询集中的所有第二实例;所述预设任务场景确定了所述第二支持集中第二实例集的类别和所述第二实例集中第三实例的数量;
根据所述句子文本集和所述第二支持集构建逆向训练的第二查询集;所述第二查询集中第四实例的类别与所述第二实例集的类别相对应。
4.根据权利要求1所述的少样本关系抽取模型的训练方法,其特征在于,所述根据所述第一匹配得分和所述第二匹配得分确定交叉熵损失值,包括:根据所述第二实例对应的多个所述第一匹配得分,计算正向交叉熵损失值;
根据所述第四实例对应的多个所述第二匹配得分,计算逆向交叉熵损失值;
计算所述正向交叉熵损失值和所述逆向交叉熵损失值之和作为交叉熵损失值。
5.根据权利要求4所述的少样本关系抽取模型的训练方法,其特征在于,所述根据所述第二实例对应的多个所述第一匹配得分,计算正向交叉熵损失值;根据所述第四实例对应的多个所述第二匹配得分,计算逆向交叉熵损失值,包括:根据所述第二实例对应的多个所述第一匹配得分,计算所述第二实例对应每个类别的概率值;根据所述第二实例对应每个类别的概率值,计算正向交叉熵损失值;
根据所述第四实例对应的多个所述第二匹配得分,计算所述第四实例对应每个类别的概率值;根据所述第四实例对应每个类别的概率值,计算逆向交叉熵损失值。
6.根据权利要求1所述的少样本关系抽取模型的训练方法,其特征在于,所述根据所述正向关系原型和所述逆向关系原型对所述预设的少样本关系抽取模型进行调参,并根据所述交叉熵损失值得到更新后的少样本关系抽取模型,包括:根据所述正向关系原型、所述逆向关系原型和预设学习率对所述预设的少样本关系抽取模型进行调参,得到调参后的少样本关系抽取模型;
对所述调参后的少样本关系抽取模型进行下一轮正向训练和逆向训练,直至所述交叉熵损失值最小,得到更新后的少样本关系抽取模型。
7.根据权利要求1‑6任一项所述的少样本关系抽取模型的训练方法,其特征在于,所述方法还包括:根据所述每个第四实例与所述每个类别的第二实例集之间的第二匹配得分确定所述每个第四实例的伪关系标签;
相应的,根据所述更新后的少样本关系抽取模型对应的第二实例对应的伪关系标签和第四实例对应的伪关系标签,以及句子文本集中所述第二实例对应的关系标签和第四实例对应的关系标签计算所述更新后的少样本关系抽取模型的模型精度;
根据所述句子文本集确定不同的第一支持集与第一查询集,并重复确定更新后的少样本关系抽取模型的步骤,得到多个更新后的少样本关系抽取模型与对应的模型精度,确定模型精度最高的更新后的少样本关系抽取模型作为最终的少样本关系抽取模型,以使根据所述最终的少样本关系抽取模型对标注有实体对的句子进行实体关系的抽取。
8.一种少样本关系抽取模型的训练装置,其特征在于,包括:
第一确定模块,用于根据获取的句子文本集确定正向训练的第一支持集和第一查询集,所述句子文本集中的实例标注有实体对和关系标签,第一支持集中根据所述关系标签划分有多个类别的第一实例集;
第一训练模块,用于利用所述第一支持集与所述第一查询集对预设的少样本关系抽取模型进行正向训练,得到所述第一查询集中每个第二实例与所述第一支持集中每个类别的第一实例集的正向关系原型,以及根据所述正向关系原型确定所述每个第二实例与所述每个类别的第一实例集之间的第一匹配得分,和所述每个第二实例的伪关系标签;
第二确定模块,用于根据所述第一查询集与所述第二实例的伪关系标签构建逆向训练的第二支持集,根据所述句子文本集和所述第二支持集构建逆向训练的第二查询集,所述第二支持集中根据关系标签划分有多个类别的第二实例集,所述第二实例集的类别与所述第一实例集的类别相对应;
第二训练模块,用于利用所述第二支持集与所述第二查询集对预设的少样本关系抽取模型进行逆向训练,得到所述第二查询集中每个第四实例与所述第二支持集中每个类别的第二实例集的逆向关系原型,以及根据所述逆向关系原型确定所述每个第四实例与所述每个类别的第二实例集之间的第二匹配得分;
调参模块,用于根据所述第一匹配得分和所述第二匹配得分确定交叉熵损失值,根据所述正向关系原型和所述逆向关系原型对所述预设的少样本关系抽取模型进行调参,并根据所述交叉熵损失值得到更新后的少样本关系抽取模型。
9.一种终端设备,包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的少样本关系抽取模型的训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的少样本关系抽取模型的训练方法。