1.一种情感分析方法,其特征在于,包括以下步骤:
获得源语言集、目标语言集以及目标语言未标记句子集,其中,所述源语言集包括源语言句子集以及方面词替换源语言句子集;所述目标语言集包括目标语言句子集以及方面词替换目标语言句子集;
将所述源语言集、目标语言集以及目标语言未标记句子集输入至预设的编码模型中进行编码处理,获得所述源语言集、目标语言集以及目标语言未标记句子集的句子编码表示集;
将所述源语言集以及目标语言集的句子编码表示集输入至预设的教师模型中进行情感概率分布计算,获得所述源语言集以及目标语言集的预测情感概率分布集,其中,所述预测情感概率分布集包括若干个句子的预测情感概率分布句向量,所述句子的预测情感概率分布句向量包括若干个单词的预测情感概率分布词向量;
获得所述源语言集以及目标语言集的真实情感概率分布集;根据所述源语言集以及目标语言集的预测情感概率分布集、真实情感概率分布集进行交叉熵计算,获得交叉熵损失值;
分别提取所述源语言集以及目标语言集中相应句子的方面词,构建源语言方面词集以及目标语言方面词集;根据所述源语言方面词集、目标语言方面词集、所述源语言集以及目标语言集的预测情感概率分布集进行散度损失计算,获得散度损失值;
根据所述交叉熵损失值以及散度损失值,获得总损失值,根据所述总损失值,对预设的教师模型进行训练,获得目标教师模型;
将所述目标语言未标记句子集的句子编码表示集分别输入至所述目标教师模型以及预设的学生模型,获得所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集;根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,对所述学生模型进行训练,获得目标学生模型;
获得待分析句子,将所述待分析句子输入至所述编码模型中进行编码处理,获得所述待分析句子的句子编码表示,将所述待分析句子的句子编码表示输入至所述目标学生模型,获得所述待分析句子的方面词情感分析结果;
对所述编码模型进行训练,包括:采用语言鉴别器,根据预设的二分类概率分布计算算法,对所述源语言集以及目标语言集的句子编码表示集进行二分类概率分布计算,获得所述源语言集以及目标语言集的二分类概率分布集,其中,所述二分类概率分布集包括若干个句子的二分类概率分布,所述二分类概率分布包括若干个单词的二分类概率分布向量;
根据所述源语言集以及目标语言集的二分类概率分布集进行推土机距离计算,根据计算获得的推土机距离,采用对偶性近似最小化对抗学习方法对所述编码模型进行训练,获得目标编码模型。
2.根据权利要求1所述的情感分析方法,其特征在于:所述目标教师模型包括若干个子教师模型;
所述将所述目标语言未标记句子集的句子编码表示集分别输入至所述目标教师模型以及预设的学生模型,获得所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,包括步骤:将所述目标语言未标记句子集的句子编码表示集分别输入至若干个所述子教师模型中,对所述句子编码表示集中若干个未标记句子的句子编码表示进行情感概率分布计算,获得若干个所述子教师模型输出的若干个未标记句子的预测情感概率分布句向量;
将同一个所述子教师模型输出的若干个未标记句子的预测情感概率分布句向量进行组合,获得若干个所述子教师模型输出的所述目标语言未标记句子集的预测情感概率分布集;对若干个所述子教师模型输出的所述目标语言未标记句子集的预测情感概率分布集进行多教师蒸馏,获得所述目标教师模型输出的所述目标语言未标记句子集的预测情感概率分布集。
3.根据权利要求2所述的情感分析方法,其特征在于,所述根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,对所述学生模型进行训练,获得目标学生模型,包括步骤:根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,采用均方误差损失计算方法,获得均方误差损失值,根据所述均方误差损失值,对所述学生模型进行训练,获得目标学生模型。
4.根据权利要求3所述的情感分析方法,其特征在于,所述将所述待分析句子的句子编码表示输入至所述目标学生模型,获得所述待分析句子的方面词情感分析结果,包括步骤:对所述待分析句子的句子编码表示进行情感概率分布计算,获得所述待分析句子的预测情感概率分布句向量;
根据所述待分析句子的预测情感概率分布句向量中若干个方面词的预测情感概率分布词向量中若干个维度的情感极性对应的预测情感概率向量,获得概率最大的维度对应的情感极性,作为若干个方面词的方面词情感分析结果,获得所述待分析句子的方面词情感分析结果。
5.一种应用于权利要求1至4任一项所述的情感分析方法的装置,其特征在于,包括:
数据获取模块,用于获得源语言集、目标语言集以及目标语言未标记句子集,其中,所述源语言集包括源语言句子集以及方面词替换源语言句子集;所述目标语言集包括目标语言句子集以及方面词替换目标语言句子集;
句子编码模块,用于将所述源语言集、目标语言集以及目标语言未标记句子集输入至预设的编码模型中进行编码处理,获得所述源语言集、目标语言集以及目标语言未标记句子集的句子编码表示集;
教师模型训练模块,用于将所述源语言集以及目标语言集的句子编码表示集输入至预设的教师模型中进行情感概率分布计算,获得所述源语言集以及目标语言集的预测情感概率分布集;根据所述源语言集以及目标语言集的预测情感概率分布集,对预设的教师模型进行训练,获得目标教师模型;
学生模型训练模块,用于将所述目标语言未标记句子集的句子编码表示集分别输入至所述目标教师模型以及预设的学生模型,获得所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集;根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,对所述学生模型进行训练,获得目标学生模型;
情感分析模块,用于获得待分析句子,将所述待分析句子输入至所述编码模型中进行编码处理,获得所述待分析句子的句子编码表示,将所述待分析句子的句子编码表示输入至所述目标学生模型,获得所述待分析句子的方面词情感分析结果。
6.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的情感分析方法的步骤。
7.一种存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的情感分析方法的步骤。