利索能及
我要发布
收藏
专利号: 2022103005478
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于模型授权访问控制的黑盒可逆对抗样本生成方法,其特征在于,包括以下步骤:(1)基于生成对抗网络获取原始图像的对抗扰动,将生成的对抗扰动进行截断生成对抗样本;

(2)对步骤(1)中生成的对抗扰动进行预处理变换,生成新的对抗扰动和对抗样本;

(3)对步骤(2)中生成的新的对抗扰动进行无损压缩,生成无损压缩后的对抗扰动;

(4)将步骤(3)中生成的无损压缩后的对抗扰动的数据通过可逆数据隐藏技术将其嵌入到步骤(2)中生成的对抗样本,得到可逆对抗样本;

所述生成对抗网络的训练方法具体包括:

(1)设计扰动损失Lnoise来约束生成对抗扰动Mnoise的大小,扰动损失表示如下:Lnoise=MSELoss(Mnoise,Matrixzero)其中,Matrixzero表示元素皆为0的矩阵,MSELoss表示均方误差损失;

(2)设计分类损失Lclassify公式如下:

(3)设计一个二进制交叉熵损失作为对抗训练中的对抗损失Ladv,公式如下:生成对抗网络的总损失函数L表示如下:

L=Ladv+λ1*Lclassify+λ2*Lnoise其中,权重λ1的值设置为0.005,权重λ2的值设置为1。

2.根据权利要求1所述一种用于模型授权访问控制的黑盒可逆对抗样本生成方法,其特征在于,所述步骤(1)具体包括:(1.1)将原始图像作为生成对抗网络的输入,获取生成对抗网络的输出,即原始图像的对抗扰动;

(1.2)对步骤(1.1)中获取到的对抗扰动进行截断,通过设置的截断参数将截断后的扰动施加到原始图像中,生成初步对抗样本(1.3)将生成的初步对抗样本 输入到鉴别器中,鉴别器判断其输入的是真实的原始图像还是生成的“假”对抗样本;

(1.4)将生成的初步对抗样本 和原始图像输入到被攻击模型中,被攻击模型作为一个查询端口,从而获得被攻击模型的分类结果。

3.根据权利要求2所述一种用于模型授权访问控制的黑盒可逆对抗样本生成方法,其特征在于,所述步骤(1.2)中,扰动截断方法如下:针对生成的对抗扰动Mnoise,采用截断参数5,对扰动的大小进行截断;即,将对抗扰动Mnoise的值限制在5的范围内,截断公式表示为:其中, 表示对抗扰动Mnoise中坐标为(i,j,z)的像素点的值, 表示截断后的对抗扰动Tnoise中坐标为(i,j,z)的像素点的值。

4.根据权利要求2所述一种用于模型授权访问控制的黑盒可逆对抗样本生成方法,其特征在于,所述步骤(1.3)中训练鉴别器的鉴别损失Ldis表示如下:其中,b表示预定义的标签,b=0时表示真实的原始图像,b=1时表示生成的“假”对抗样本;表示鉴别器的输出;

5.根据权利要求1所述一种用于模型授权访问控制的黑盒可逆对抗样本生成方法,其特征在于,所述步骤(2)具体包括:(2.1)获取截断后的对抗扰动的符号sign(Tnoise),sign(Tnoise)中的值包括0,+1和‑1;

(2.2)对步骤(2.1)中获取的截断扰动的符号sign(Tnoise)进行转换,只保留符号+1和‑

1,得到sign(Tnoise)′;

(2.3)获取步骤(2.2)中转换数据,对转换后的sign(Tnoise)′进行预处理,以获得具有攻′击能力、同时数据量少于sign(Tnoise) 数据量的新的对抗扰动sign(Tnoise)″;

(2.4)根据步骤(2.3)中预处理后的对抗扰动sign(Tnoise)″,生成新的对抗样本。

6.根据权利要求4所述一种用于模型授权访问控制的黑盒可逆对抗样本生成方法,其特征在于,所述步骤(3)具体包括:(3.1)获取步骤(2.4)中新的对抗扰动sign(Tnoise)″中的第一通道值,并采用算术编码对其第一通道值进行无损压缩;

(3.2)将截断参数和扰动参数设置为5并将上述参数均编码为3bit的二进制数据。

7.一种根据权利要求1‑5任一项所述一种用于模型授权访问控制的黑盒可逆对抗样本生成方法的原始图像恢复方法,其特征在于,包括以下步骤:(1)从可逆对抗样本中提取隐藏数据,恢复载体图像;

(2)从隐藏数据中分离扰动相关数据和截断参数、扰动参数,重构对抗扰动;

(3)根据扰动参数和重构的对抗扰动,从载体图像中去除已添加的对抗扰动,从而获得无失真的原始图像。