1.一种基于隐性噪声的对抗人脸图像攻击防御方法,其特征在于,假设已知人脸识别模型为 : ,人脸对抗攻击为 ,为输入的人脸图像,且,具体防御过程为:
步骤1、将人脸图像 进行强化生成强化人脸图像 ;
步骤2、当检测到遭受对抗攻击时,采用优化截断梯度下降方向的方法来求解 ,详细过程为:首先,使用截断函数 对 进行t+1次迭代,得到 ;
;
;
表示第t次迭代后的 , 为人脸图像库中与 身份相同的人脸图像;
表示脸图像和 的特征表示之间的差异; 表示图像 和 的特征表示之间的差异; 表示经历对抗攻击 后的强化人脸图像;
表示 关于 的梯度,表示 与 之间差异化损失的权重,表示步长因子,用于控制更新的速度;
接着,计算 和 二者在第k维上的变化量 ;为表示方便,将写作 ,则 的表达式如下:;
表示 的二范数, 代表在当 不完全趋近于零时方向导数的近似误差; 为误差项;
所述方向导数的计算公式为: ; 代表内积操作;
然后,通过掩膜操作 来消除 的更新方向与 的更新方向二者之间不对齐的维度,进而消除误差,;
进而求得 ;
上式中, 表示哈达马乘积;
步骤3、将步骤2所得 和 分别输入人脸识别模型 ,若与人脸图像库中对应身份的人脸均匹配成功,则判断成功防御保护人脸识别模型 ,若匹配不成功,则防御失败。
2.根据权利要求1所述的基于隐性噪声的对抗人脸图像攻击防御方法,其特征在于,所述步骤1人脸识别模型 将人脸图像 映射到特征空间中来提取一个固定长度的特征表示,所述人脸对抗攻击 通过添对抗扰动来攻击人脸识别模型 ;由 生成的强化人脸图像 满足以下条件:;
上式中,是预先确定的阈值,用于衡量人脸图像是否属于同一身份, 表示Lp范数,称为强化人脸图像的扰动(ID), 表示经历人脸对抗攻击后的强化人脸图像,为人脸图像库中与 身份相同的人脸图像,用于调节ID的不可感知性,使生成的 和原始的人脸图像视觉上一样自然。
3.根据权利要求1所述的基于隐性噪声的对抗人脸图像攻击防御方法,其特征在于,步骤2中根据方向导数 求解 ;
;
由上式可知, 沿着梯度倒数的负方向以的步长
变化;
由于梯度倒数的方向和梯度方向保持一致,并且 与的负方向都朝 着损 失减小的方 向更新的,即 的方 向与一致。
4.根据权利要求1所述的基于隐性噪声的对抗人脸图像攻击防御方法,其特征在于,所述步骤2中在获取 后,对 多次迭代,迭代过程分为:
初始迭代阶段:保留 的值,通过同时优化 和 ;
初始迭代阶段完成后,将 值置零,此时 的表达式如下:;
最终得到 的表达式如下:
。