1.一种基于深度差异特征的机器译文自动评价方法,其特征在于:步骤如下:步骤S1,获取训练集,对训练集进行规范化处理,获得规范化处理后的训练集;训练集由多个不同样本组成,每个样本包括由待评价机器译文翻译信息组成的三元组和待评价机器译文的人工评价分值;三元组为源语言句子、机器译文和人工参考译文;
步骤S2,提取表征机器译文与人工参考译文差异特征的向量;将规范化处理后的训练集内每个样本中机器译文和人工参考译文分别输入预训练语言模型,输出子词级别语义表征向量,将子词级别语义表征向量横向拼接输入多头注意力层获取交互表征向量,将交互表征向量输入最大池化和平均池化,输出句子级别语义表征向量,将句子级别语义表征向量输入差异特征提取层,输出表征机器译文与人工参考译文差异特征的向量;
步骤S3,提取表征机器译文与源语言句子语义差异特征的向量;将规范化处理后的训练集内每个样本中机器译文和源语言句子分别输入跨语言预训练模型,输出子词级别语义表征向量,将子词级别语义表征向量横向拼接输入多头注意力层获取交互表征向量,将交互表征向量输入最大池化和平均池化,输出句子级别语义表征向量,将句子级别语义表征向量输入差异特征提取层,输出表征机器译文与源语言句子语义差异特征的向量;
步骤S4,提取机器译文与人工参考译文和机器译文与源语言句子的深度差异特征;将步骤S2中表征机器译文与人工参考译文差异特征的向量与步骤S3中表征机器译文与源语言句子语义差异特征的向量,输入交互差异特征提取层,输出交互差异向量,将交互差异向量输入多头注意力层获取机器译文与人工参考译文和机器译文与源语言句子的深度差异特征;
步骤S5,预测机器译文质量分值;将步骤S4中机器译文与人工参考译文和机器译文与源语言句子的深度差异特征,纵向拼接后输入三层前馈神经网络,输出机器译文质量分值;
步骤S6,训练基于深度差异特征的机器译文自动评价模型;根据步骤S5中输出的机器译文质量分值和步骤S1中规范化处理后的训练集内机器译文的人工评价分值,通过最小化在规范化处理后的训练集上的均方差损失来训练基于深度差异特征的机器译文自动评价模型的参数,得到训练后的基于深度差异特征的机器译文自动评价模型;
步骤S2中提取表征机器译文与人工参考译文差异特征的向量,具体为:将机器译文h和人工参考译文r分别输入预训练语言模型RoBERTa,由预训练语言模型RoBERTa使用子词切分方法BPE算法对机器译文h和人工参考译文r进行子词切分,分别得到包含m个子词和n个子词的子词序列:;
其中,m和n分别表示机器译文和人工参考译文使用子词切分方法BPE算法切分后包含的子词个数;bh1,bh2,bhm表示机器译文使用子词切分方法BPE算法切分后的第1个子词,第2个子词,第m个子词;r1,r2,rn表示人工参考译文切分后的第1个子词,第2个子词,第n个子词;
预训练语言模型RoBERTa根据子词和子词在句子中的位置输出每个子词的语义表征向量;
(1);
(2);
其中,RBvh和RBvr分别表示机器译文和人工参考译文使用预训练语言模型RoBERTa的语义表征向量,RoBERTa(•)表示预训练语言模型RoBERTa,RBvh1、RBvh2、RBvhm分别表示机器译文第1个子词、第2个子词和第m个子词输入预训练语言模型RoBERTa获得的输出向量,RBvr1、RBvr2、RBvrn表示人工参考译文第1个子词、第2个子词和第n个子词输入预训练语言模型RoBERTa获得的输出向量;
横向拼接机器译文和人工参考译文使用预训练语言模型RoBERTa得到的语义表征向量,获取机器译文和人工参考译文联合特征:(3);
其中,RBvhr表示机器译文和人工参考译文联合特征;
将机器译文和人工参考译文联合特征输入多头注意力层,获取机器译文和人工参考译文交互表征向量:(4);
其中,RBuhr表示机器译文和人工参考译文交互表征向量,Multi‑head()为多头注意力层函数,RBuh1、RBuh2、RBuhm表示机器译文基于预训练语言模型RoBERTa的第1个子词、第2个子词和第m个子词交互表征向量,RBur1、RBur2、RBurn表示人工参考译文基于预训练语言模型RoBERTa的第1个子词、第2个子词和第n个子词交互表征向量;
分别将机器译文基于预训练语言模型RoBERTa的子词交互表征向量和人工参考译文基于预训练语言模型RoBERTa的子词交互表征向量进行最大池化和平均池化提取句子级别语义表征向量:(5);
(6);
(7);
(8);
其中,RBvhmax,RBvhavg分别表示机器译文使用预训练语言模型RoBERTa表征情况下最大池化后的表征向量和平均池化后的表征向量,RBvrmax,RBvravg分别表示人工参考译文使用预训练语言模型RoBERTa表征情况下最大池化后的表征向量和平均池化后的表征向量,RBvhmax,RBvhavg,RBvrmax,RBvravg都表示句子级别表征向量,MaxPooling()和AvgPooling()分别表示最大池化操作和平均池化操作;
将机器译文使用预训练语言模型RoBERTa表征情况下最大池化后的表征向量和平均池化后的表征向量、人工参考译文使用预训练语言模型RoBERTa表征情况下最大池化后的表征向量和平均池化后的表征向量输入差异特征提取层提取表征机器译文与人工参考译文差异特征的向量:(9);
其中,RBdhr表示表征机器译文和人工参考译文差异特征的向量,符号“⊕”表示两向量纵向拼接操作,符号“☉”表示两向量逐元素相乘操作,符号“‑”表示两向量逐元素相减操作,符号“| |”表示向量逐元素取绝对值操作。
2.根据权利要求1所述的一种基于深度差异特征的机器译文自动评价方法,其特征在于:步骤S1中训练集由多个不同样本组成,每个样本具体为:
给定训练集中一个样本d={(s, h, r), y},其中d表示一个训练样本,s表示源语言句子,h表示机器译文,r表示人工参考译文, y表示对机器译文h的人工评价分值,人工评价分值介入0‑1之间的实数值。
3.根据权利要求2所述的一种基于深度差异特征的机器译文自动评价方法,其特征在于:步骤S3中提取表征机器译文与源语言句子语义差异特征的向量,具体为:将机器译文h和源语言句子s分别输入跨语言预训练模型XLM‑RoBERTa,由跨语言预训练模型XLM‑RoBERTa使用子词切分方法SentencePiece算法对机器译文h和源语言句子s进行子词切分,分别得到包含p个子词和q个子词的子词序列;
;
其中,p和q分别表示机器译文和源语言句子使用SentencePiece算法子词切分后包含的子词个数;sh1,sh2,shp表示机器译文使用SentencePiece算法切分后的第1个子词,第2个子词,第p个子词;s1,s2,sq表示源语言句子切分后的第1个子词,第2个子词,第q个子词;
跨语言预训练模型XLM‑RoBERTa根据子词和子词在句子中的位置输出每个子词的语义表征向量;
(10);
(11);
其中,XRvh和XRvs分别表示机器译文和源语言句子基于跨语言预训练模型XLM‑RoBERTa的语义表征向量,XLM‑RoBERTa(•)表示跨语言预训练模型XLM‑RoBERTa,XRvh1、XRvh2、XRvhp表示机器译文第1个子词、第2个子词和第p个子词基于跨语言预训练模型XLM‑RoBERTa的语义表征向量,XRvs1、XRvs2、XRvsq表示源语言句子第1个子词、第2个子词和第q个子词基于跨语言预训练模型XLM‑RoBERTa的语义表征向量;
横向拼接机器译文和源语言句子基于跨语言预训练模型XLM‑RoBERTa的语义表征向量,获取机器译文和源语言句子的联合特征:(12);
其中,XRvhs表示机器译文和源语言句子的联合特征;
将机器译文和源语言句子的联合特征输入多头注意力层,获取机器译文和源语言句子交互表征向量:(13)
其中,XRuhs表示机器译文和源语言句子交互表征向量,Multi‑head()为多头注意力层函数,XRuh1、XRuh2、XRuhp表示机器译文基于跨语言预训练模型XLM‑RoBERTa的第1个子词、第2个子词和第p个子词交互表征向量,XRus1、XRus2、XRusq表示源语言句子基于跨语言预训练模型XLM‑RoBERTa的第1个子词、第2个子词和第q个子词交互表征向量;
分别将机器译文基于跨语言预训练模型XLM‑RoBERTa的子词交互表征向量和源语言句子基于跨语言预训练模型XLM‑RoBERTa的子词交互表征向量进行最大池化和平均池化提取句子级别语义表征向量:(14);
(15);
(16);
(17);
其中,XRvhmax,XRvhavg分别表示机器译文使用跨语言预训练模型XLM‑RoBERTa表征情况下最大池化后的表征向量和平均池化后的表征向量,XRvsmax,XRvsavg分别表示源语言句子使用跨语言预训练模型XLM‑RoBERTa表征情况下最大池化后的表征向量和平均池化后的表征向量,XRvhmax,XRvhavg,XRvsmax,XRvsavg都表示句子级别表征向量;
将机器译文使用跨语言预训练模型XLM‑RoBERTa表征情况下最大池化后的表征向量和平均池化后的表征向量、源语言句子使用跨语言预训练模型XLM‑RoBERTa表征情况下最大池化后的表征向量和平均池化后的表征向量输入差异特征提取层提取表征机器译文与源语言句子语义差异特征的向量:(18);
其中,XRdhs表示表征机器译文和源语言句子差异特征的向量。
4.根据权利要求3所述的一种基于深度差异特征的机器译文自动评价方法,其特征在于:步骤S4中提取机器译文与人工参考译文和机器译文与源语言句子的深度差异特征,具体为:将步骤S2中表征机器译文和人工参考译文差异特征的向量RBdhr与步骤S3中表征机器译文和源语言句子语义差异特征的向量XRdhs,输入交互差异特征提取层,输出交互差异向量;
(19);
其中,mdf为交互差异向量;
将交互差异向量输入多头注意力层获取机器译文与人工参考译文和机器译文与源语言句子的深度差异特征;
(20);
其中,df为深度差异特征,df1,df2,df3,df4分别为深度差异特征的第1列列向量,第2列列向量,第3列列向量和第4列列向量。
5.根据权利要求4所述的一种基于深度差异特征的机器译文自动评价方法,其特征在于:步骤S5中,预测机器译文质量分值,具体为:
将步骤S4中深度差异特征的第1列列向量,第2列列向量,第3列列向量和第4列列向量,纵向拼接后输入三层前馈神经网络,输出机器译文质量分值;
(21);
其中,Score为机器译文质量分值,Feed‑Forward为三层前馈神经网络。
6.根据权利要求5所述的一种基于深度差异特征的机器译文自动评价方法,其特征在于:步骤S6中均方差损失见公式(22)所示;
(22);
(i)
其中,MSE表示均方差损失,N表示训练集中样本的数量,i表示训练集中第i条样本,y(i)表示训练集中第i条样本机器译文的人工评价分值,Score 表示第i条样本预测的机器译文质量分值。
7.根据权利要求6所述的一种基于深度差异特征的机器译文自动评价方法,其特征在于:还包括:步骤S7,对待评价机器译文翻译信息组成的三元组中源语言句子、机器译文和人工参考译文进行规范化处理;
步骤S8,将步骤S7中规范化处理后的源语言句子、机器译文和人工参考译文输入至步骤S6中训练后的基于深度差异特征的机器译文自动评价模型,预测机器译文质量分值。