1.一种基于词屏蔽数据增强与对抗学习的特定目标情感分析方法,其特征在于,包括以下步骤:
S1,运用屏蔽目标实体的方式对句子进行数据增强,生成有效的样本并与原始样本进行融合;
S2,构建了基于BERT‑BASE的对抗学习特定目标情感分类模型,将S1融合后的数据作为模型的输入,运用干净样本训练情感分类模型;
S3,最终得到特定目标情感分析结果。
2.根据权利要求1所述的一种基于词屏蔽数据增强与对抗学习的特定目标情感分析方法,其特征在于,所述屏蔽目标实体的方式采用同义词替换。
3.根据权利要求2所述的一种基于词屏蔽数据增强与对抗学习的特定目标情感分析方法,其特征在于,所述同义词替换的计算方法为:其中,SSr表示同义词替换后的数据;
FSR(·)表示同义词替换数据增强函数;
SIn表示原始语料库的输入;
是一条原始样本的第i个单词
aspect表示特定目标实体;
Rep(·)表示单词替换函数;
表示需要替换的第id个单词;
idSr表示单词替换的位置;
表示根据第i个单词 在Wordnet库中随机寻找num1个同义词;
!=表示不等于。
4.根据权利要求1所述的一种基于词屏蔽数据增强与对抗学习的特定目标情感分析方法,其特征在于,所述S2包括:对于干净样本的每个batch,使用BERT模型进行干净样本的每个batch训练。
5.根据权利要求4所述的一种基于词屏蔽数据增强与对抗学习的特定目标情感分析方法,其特征在于,所述干净样本的每个batch训练的损失函数计算如下:其中Lclean(·)表示干净样本的损失函数,Nbatch表示一个batch的大小,θ表示神经网络参数,p(yi|Ei,aspecti;θ)表示一个batch中第i个样本的情感预测概率函数。
6.根据权利要求4所述的一种基于词屏蔽数据增强与对抗学习的特定目标情感分析方法,其特征在于,所述BERT模型的隐藏层采用采用高斯误差线性单元作为激活函数:其中gelu(·)表示高斯误差线性单元,θ表示神经网络参数,tanh为双曲正切函数。