利索能及
我要发布
收藏
专利号: 2024117872650
申请人: 广州大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-07
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于频域的特征空间对抗样本攻击方法,其特征在于,包括以下步骤:获取图像数据集,构建得到训练数据;

对所述训练数据中的图像进行预处理后,通过Pytorch深度学习框架搭建得到的生成器网络;

根据所述生成器网络,通过小波变换来对所述训练数据中的图像进行分解与重构,得到初始化的对抗样本;

基于频域的特征空间攻击方法,将生成的对抗样本输入至目标模型中进行训练,利用目标模型所提取的图像特征构建损失函数,并得到最终的对抗样本;

根据最终的对抗样本,完成对抗样本攻击过程。

2.根据权利要求1所述的一种基于频域的特征空间对抗样本攻击方法,其特征在于,所述对所述训练数据中的图像进行预处理后,通过Pytorch深度学习框架搭建得到的生成器网络,包括以下步骤:对数据集图像进行预处理,裁剪至统一的大小,具体为:首先使用transforms.Resize将图像的较短边 调整为256像素,保持图像 的长宽比不变;接着使 用transforms.CenterCrop将图像从中心位置裁剪出一个224×224的正方形区域;最后使用transforms.ToTensor()将图像数据转为tensor格式;

使用Pytorch深度学习框架搭建生成器网络,所述生成器网络的模型结构包括下采样H×W×C模块、残差模块和上采样模块;具体为:给定输入图像X∈R ,其中H和W为输入图像的空H×W×C间分辨率,C为输入图像通道数;输出的初始化扰动为Xadv∈R ;

其中,输入图像首先通过有三个下采样块组成的下采样模块;每个下采样块由一个卷积层、一个BatchNorm层和一个ReLU激活函数组成;通过下采样模块完成图像下采样操作;

每个残差块由两个卷积层、两个BatchNorm层、一个ReLU激活函数和一个Dropout层组成;通过残差模块将对经下采样后的图像进行特征提取及运算;上采样块由一个反卷积层、一个BatchNorm层和一个ReLU激活函数组成,通过上采样模块将图像还原回图像原始的大小,得到初始化的对抗扰动。

3.根据权利要求1所述的一种基于频域的特征空间对抗样本攻击方法,其特征在于,所述根据所述生成器网络,通过小波变换来对所述训练数据中的图像进行分解与重构,得到初始化的对抗样本,包括以下步骤:使用小波变换来对图像进行分解与重构;其中,小波变换将图像x分解为四个部分,其中包含一个低频分量和三个高频分量,分别为xll、xlh、xhl和xhh;

通过逆变换方法使用所有的四个分量来重建原始图像,进而去除高频分量,使用低频分量来重建图像;

通过对原始图像的分解与重建,去除原始图像中的高频分量;

将重构后的图像与生成器网络生成的原始扰动进行叠加,得到初始化的对抗样本。

4.根据权利要求1所述的一种基于频域的特征空间对抗样本攻击方法,其特征在于,所述损失函数由两部分组成,第一部分是图像特征部分、第二部分为频域限制;

所述基于频域的特征空间攻击方法,将生成的对抗样本输入至目标模型中进行训练,利用目标模型所提取的图像特征构建损失函数,并得到最终的对抗样本,包括以下步骤:在第一部分中,从特征相似性的角度来生成对抗样本,通过最小化不同类别间的欧几里得距离的同时最大化相同类别内的距离,使得分类神经网络将对抗样本映射到不同的特征空间;

在第二部分中,使用小波变换工具对原始图像与对抗样本分别进行分解与重构,去除图像高频分量,仅使用低频分量来重建图像,建立一个新的扰动约束;

根据第一部分的处理和第二部分的处理,采用基于频域的特征空间攻击方法对对抗样本进行迭代优化,得到最终的对抗样本。

5.根据权利要求4所述的一种基于频域的特征空间对抗样本攻击方法,其特征在于,所述在第一部分中,从特征相似性的角度来生成对抗样本,通过最小化不同类别间的欧几里得距离的同时最大化相同类别内的距离,使得分类神经网络将对抗样本映射到不同的特征空间,包括以下步骤:给定一个批次的原始图像X,其中包含N个原始图像x,原始图像X的表达式为X=[x1,x2,...,xN],其中,优化第i个对抗样本 的公式表示为:′ ′

其中,[]+表示max(.,0),xi 是正在优化的对抗样本,初始化为xi,其中的si,i=sim(f(xi′),f(xi)),s′i,j=sim(f(xi′),f(xj))表示图像之间的相似度,目标是最小化对抗样本与原始图像的相似度,最大化对抗样本与某一类别图像的相似度;f(xj)代表图像x输入至分类网络f后得到的原始输出值;

其中,相似度的表达式为:

根据相似度的表达式,将对抗样本的优化公式进行更新,在非目标攻击场景下表示为:其中,j为与原始图像类别不同的随机类别图像序号;

在目标攻击场景下可表示为: 其中,t为目标类别的图像序

号。

6.根据权利要求4所述的一种基于频域的特征空间对抗样本攻击方法,其特征在于,所述在第二部分中,使用小波变换工具对原始图像与对抗样本分别进行分解与重构,去除图像高频分量,仅使用低频分量来重建图像,建立一个新的扰动约束,包括以下步骤:使用小波变换工具将对原始图像与对抗样本分别进行分解与重构,去除图像高频分量,仅使用低频分量来重建图像,该过程的表达式为:通过对原始图像的分解与重建,去除原始图像中的高频分量,保留原始图像的主要信息,进而建立一个新的扰动约束: 其中,x为原始图像,x′为对抗样本;

通过对D(x,x′)进行最小化,来将对抗扰动限制在高频部分;

其中, 代表由低频分量重建的图像;L代表低通滤波器;xll代表一个低频分量。

7.根据权利要求4‑6中任一项所述的一种基于频域的特征空间对抗样本攻击方法,其特征在于,所述根据第一部分的处理和第二部分的处理,采用基于频域的特征空间攻击方法对对抗样本进行迭代优化,得到最终的对抗样本这一步骤中,采用的优化公式为:其中,λ为超参数;Loss代表损失函数。

8.一种基于频域的特征空间对抗样本攻击系统,其特征在于,包括:第一模块,用于获取图像数据集,构建得到训练数据;

第二模块,用于对所述训练数据中的图像进行预处理后,通过Pytorch深度学习框架搭建得到的生成器网络;

第三模块,用于根据所述生成器网络,通过小波变换来对所述训练数据中的图像进行分解与重构,得到初始化的对抗样本;

第四模块,用于基于频域的特征空间攻击方法,将生成的对抗样本输入至目标模型中进行训练,利用目标模型所提取的图像特征构建损失函数,并得到最终的对抗样本;

第五模块,用于根据最终的对抗样本,完成对抗样本攻击过程。

9.一种电子设备,其特征在于,包括处理器以及存储器;

所述存储器用于存储程序;

所述处理器执行所述程序实现如权利要求1至7中任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至7中任一项所述的方法。