1.一种基于词向量增强的文本对抗防御方法,其特征在于,包括:
S1:通过集成WordNet的Python第三方库nltk查询常用英语单词各自的语义关联单词并根据单词之间的语义关联关系组成单词关系图网络;并将常用单词嵌入向量表示得到常用单词的原始词向量;
S2:根据单词关系图网络计算常用英语单词与其语义关联单词的相似度得到常用英语单词的坐标;
S3:根据常用英语单词的坐标利用势函数计算常用英语单词与其语义关联单词之间的语义交互强度;
S4:根据常用英语单词的原始词向量、常用英语单词与其语义关联单词的语义交互强度对常用英语单词的原始词向量进行加强得到常用英语单词的加强词向量;
S5:将原始单词的加强词向量作为目标模型的嵌入层权重,输入训练样本,对目标模型进行训练,通过训练好的目标模型对文本进行检测。
2.根据权利要求1所述的一种基于词向量增强的文本对抗防御方法,其特征在于,所述语义关联关系包括:两个单词之间的上位、下位或同义词关系。
3.根据权利要求1所述的一种基于词向量增强的文本对抗防御方法,其特征在于,所述常用英语单词的坐标包括:pi=(si0,...,sij,...sin)
其中,L代表英语单词wi和其语义关联单词wj在单词关系图网络中的最短路径长度,δ是一个调节参数,pi表示英语单词wi的坐标,sij代表wi和wj的相似度,n表示英语单词wi的语义关联单词的数量。
4.根据权利要求1所述的一种基于词向量增强的文本对抗防御方法,其特征在于,所述常用英语单词与其语义关联单词之间的语义交互强度包括:其中,φ(w0,wi)代表常用英语单词w0和其语义关联单词Wi的语义交互强度,d(w0,w1)代表常用英语单词w0和其语义关联单词wi位置坐标之间的欧氏距离,σ是取值大于0调节参数。
5.根据权利要求1所述的一种基于词向量增强的文本对抗防御方法,其特征在于,所述常用英语单词的加强词向量包括:其中,E(w0)代表常用英语单词w0的原始词向量,φ(w0,wi)表示常用英语单词w0与其第i个语义关联单词的语义交互强度,n代表常用英语单词的语义关联单词的数量。