利索能及
我要发布
收藏
专利号: 2022114225984
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种针对同义词替换攻击的防御方法,其特征在于,包括:

S1:获取具有标签信息的新闻文本数据;所述标签信息为新闻的类别;

S2:利用Counter‑fitting将新闻文本中的词嵌入向量表示得到新闻文本中每个句子的隐向量并生成新闻文本的句子向量序列;

S3:利用TextRank算法提取新闻文本中每个句子的关键词生成候选关键词集;

S4:分别将候选关键词集中每个关键词的词向量和glove训练词向量进行余弦相似度计算,将余弦相似度大于设定阈值的M个glove训练词向量对应的词作为该关键词的候选同义词;

S5:对关键词的候选同义词进行语法检查;将与关键词词性相同的候选同义词作为关键词的最终候选词,并用最终候选词对新闻文本中相应的关键词进行替换得到第二新闻文本;将第二新闻文本嵌入向量表示得到第一新闻文本向量;

S6:将新闻文本的句子向量序列输入LSTM计算得到包含上下文信息的第二新闻文本向量;

S7:根据第一新闻文本向量和第二新闻文本向量的余弦相似度,将余弦相似度超过设定阈值的第一新闻文本向量映射为文本并作为新闻文本的对抗样本;

S8:将新闻文本的对抗样本和新闻文本作为训练样本对目标模型进行训练,并根据新闻文本的标签信息创建目标损失函数,通过反向传播的机制更新目标模型的参数。

2.根据权利要求1所述的一种针对同义词替换攻击的防御方法,其特征在于,所述关键词的词向量和glove训练词向量的余弦相似度包括:其中,w表示候选单词集中关键词的词向量,Vi表示glove中的预训练词向量,δ表示设置的余弦相似度阈值,cosθ表示候选单词集中关键词的词向量和glove词向量的余弦相似度。

3.根据权利要求1所述的一种针对同义词替换攻击的防御方法,其特征在于,所述将余弦相似度超过设定阈值的第一新闻文本向量映射为文本并作为新闻文本的对抗样本包括:cos(Vadv,gori)>λ

cos([v1,v2,v3,....,vn],[g1,g2,g3,...gn])>λ其中,Vadv表示第一新闻文本向量,gori表示第二新闻文本向量,vi表示第一新闻文本中的句子向量,gi表示第二新闻文本向量中的句子向量,λ表示设置的阈值。