利索能及
我要发布
收藏
专利号: 202510619864X
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-01-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种破坏中间层特征的对抗样本生成方法,其特征在于,设定分类模型为,对于该分类模型,使用对抗样本生成方法P2FA在特征空间内沿着特征重要性 方向以步长 将分类模型的中间层特征扰动,得到扰动后的中间层特征 ;

其中,和 分别表示输入原始图像和对应的真实标签; 表示第 层中间层的特征图;

进行T次上述扰动时,引入动量以稳定特征空间内的更新方向,并防止扰动后的特征陷入局部最优,具体过程如下:;

其中,为动量中的衰减因子,为扰动步长, 为第 次迭代时中间层特征更新方向,|| ||2表示L2范数; 为特征重要性, 的迭代公式如下:;

n是求取特征重要性的聚合次数,取值范围是1‑N, 表示第n次迭代时的拟合图像,表示扰动大小,表示交叉熵损失;

最后,将扰动后的特征 反演到像素空间,得到对应的对抗样本 ,即将特征反演总结为下述优化问题:;

其中, 表示L2范数的平方。

2.根据权利要求1所述的破坏中间层特征的对抗样本生成方法,其特征在于,对于分类模型的中间层特征进行T次扰动前,先初始化未迭代时的对抗样本 和中间层特征更新方向 ,公式如下:; ; ;

则在上述T次扰动过程中,第 次迭代时生成的对抗样本和中间层特征更新方向分别记为 、 ,;

上述t的取值范围为[0,T‑1];进而得到第T次扰动所得对抗样本 。