1.一种大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,主要包括步骤如下:(1)原始信息的初始化;
(1‑1)首先,生成器Gfg(·,·,·)从原始载体图像集Xbg随机采样出一个批次的原始载体图像 其中n表示Batch的尺寸,即一个Batch包含的样本数量,k代表Batch的序号,即第k个Batch;
k
(1‑2)生成器Gfg(·,·,·)从随机噪声分布Pz中随机采样出一个Batch的随机噪声z=(z1,z2,…,zn)∈Pz;
(1‑3)生成器Gfg(·,·,·)从前景蒙版集M中随机采样一个Batch的真实前景蒙版(2)通过生成器生成载体图像和通过对抗攻击生成对抗扰动图像;
(2‑1)根据上述的初始条件,生成器Gfg生成一个Batch的结果,即表示在背景图像上生成前景物体的过程;
k k
(2‑2)判别器D(·,·)从真实图像数据集中随机采样一组(x ,m)∈Pdata;
(2‑3)由于判别器D(·,·)将“图像‑蒙版”作为输入格式,即将图像与蒙版的特征相拼接;
判别器D(·,·)分别计算真实的一组“图像‑蒙版”,和以随机采样蒙版为驱动生成的一组“图像‑蒙版”的卷积特征,即计算 和(2‑4)判别器D(·,·)根据计算结果,最后实施分类;将交叉熵函数作为损失函数,判别生成图像的效果,即计算(2‑5)生成器Gfg(·,·,·)通过共享得到其损失函数的结果:(2‑6)以Adam为随机梯度下降算法更新参数梯度,以最小化判别器D(·,·)的损失,即计算θD=θD+ΔD,ΔD为针对判别器D(·,·)计算出的梯度;
(2‑7)以Adam为随机梯度下降算法更新参数梯度,以最小化生成器Gfg(·,·,·)的损失,即计算θG=θG‑ΔG,ΔG为针对生成器Gfg(·,·,·)计算出的梯度,此时完成前景物体生成模块的一次迭代过程;
(2‑8)接下来,强对抗扰动生成模块从步骤(1‑3)得到真实前景蒙版(2‑9)通过将预训练隐写分析模型Φw(·)作为白盒攻击的对象,以前景蒙版 控制形状,训练生成具有对抗扰动特性的强扰动图像 此过程的目标函数如下式所示;
其中,F代表预训练的隐写分析模型Φw(·),y代表带有对抗扰动的前景蒙版变量,y=ystego代表该隐写分析模型Φw(·)将y分类为含密图像,y=ycover代表该隐写分析模型Φw(·)将y分类为载体图像;
(3)将载体图像和对抗扰动图像进行线性混合;
将步骤(2‑1)生成的的生成载体图像 与步骤(2‑9)生成的强扰动图像 做线性混合,合成 为了同时保证合成载体图像 的视觉保真度和强攻击性,将λ设置为0.3;至此完成了对原始载体图像 到合成载体图像 的安全性提升;
(4)对合成载体图像应用信息隐藏算法进行处理;
将合成载体图像 应用信息隐藏算法嵌入隐私数据,以信息隐藏方式完成隐私数据保护,得到含密图像a b c
(4‑1)定义水平、垂直和对角线三个方向滤波算子K、K 和K ,令h和g分别代表低通滤波器系数和高通滤波器系数,T代表矩阵转置,则:
1 T 2 T 3 T
K=h·g,K=g·h,K=g·g;
(4‑2) 和 分别代表合成载体图像和含密图像的第k组滤波残差,其中k=(1,2,3);
(4‑3)令(4‑2)中的滤波残差在坐标(u,v)位置上的小波系数在合成载体图像和含密图像上分别为 和 则失真代价为:其中调节参数σ设为1;
(4‑4)参照(4‑3)中的失真代价,使用STC编码的方式将需要保护的信息m嵌入到线性混合函数输出的合成载体图像;定义一个校验矩阵H,通过在含密图像对于H的所有右陪集中找到使失真代价最小的y,来实现嵌入m,目标函数为:T T
Hy=m
所述步骤(1)~(4)中通过建立前景物体生成模块、强对抗扰动生成模块、信息隐藏模块以及线性混合函数实现大数据隐私保护的安全性。
2.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(1)中所述的原始信息包括随机噪声、原始载体图像和前景蒙版;信息初始化包括:生成器从原始载体图像随机采样一个批次的原始数据,生成器从随机噪声分布中随机采样一个批次的随机噪声,生成器从前景蒙版集中随机采样一个批次的真实前景蒙版。
3.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,所述前景物体生成模块包括生成器和判别器,所述生成器将整体呈残差连接进行同等尺度上的特征复用;所述判别器为一个下采样网络,将特征映射成向量并用以分类。
4.根据权利要求1或3所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(2)根据步骤(1)的初始条件,生成器生成一个批次的生成载体图像;所述生成器通过共享得到其损失函数。
5.根据权利要求1或3所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(2)中判别器从真实图像数据集中随机采样一组数据;
所述判别器将“图像‑蒙版”作为输入格式,将图像与蒙版的特征相拼接;
所述判别器分别计算真实的一组“图像‑蒙版”和以随机采样蒙版为驱动生成的一组“图像‑蒙版”的卷积特征;
所述判别器根据计算结果实施分类,将交叉熵函数作为损失函数,判别生成图像的效果。
6.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(2)通过强对抗扰动生成模块从步骤(1)得到真实前景蒙版。
7.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(2)通过对抗攻击将预训练隐写分析模型作为白盒攻击的对象,以前景蒙版控制形状,训练生成具有对抗扰动特性的强扰动图像。
8.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(3)将步骤(2)生成的生成载体图像和强扰动图像进行线性混合,完成对原始载体图像到合成载体图像的安全性提升。
9.根据权利要求1所述的大数据隐私保护中基于生成对抗样本的安全性提升方法,其特征在于,步骤(4)将步骤(3)得到的合成载体图像通过信息隐藏模块应用信息隐藏算法嵌入隐私数据,以信息隐藏方式完成隐私数据保护。