1.一种误差约束条件下的差分隐私保护方法,其特征在于:该方法包括以下步骤,步骤S1,根据待保护数据的维度和设定的参数计算截断拉普拉斯噪声的概率密度函数,并生成对应维度的噪声;
步骤S2,根据待保护数据X的维度对X进行扰动;
步骤S3,根据待保护数据的维度利用粒子滤波对扰动结果进行优化,得到优化后的扰动结果;若待保护数据X是一维数据,执行步骤S3-1至S3-4;若待保护数据X是二维数据,则跳转至步骤S4;
步骤S4,利用粒子滤波对扰动结果进行优化,得到优化后的扰动结果。
2.根据权利要求1所述的一种误差约束条件下的差分隐私保护方法,其特征在于:所述步骤S1具体为:步骤S1-1,判断待保护数据X={x1,x2,…,xn}的维度,若X是一维数据,则进入步骤S1-
2;若X是二维数据,则进入步骤S1-3;
步骤S1-2,根据设定的隐私保护强度ε和误差上限α计算一维截断拉普拉斯噪声的概率密度函数f(y),f(y)由如下公式计算得到:其中 Δf是待保护数据X的敏感度函数;
步骤S1-3,根据设定的隐私保护强度ε和误差上限α计算平面截断拉普拉斯噪声的概率密度函数f(z),f(z)由如下公式计算得到:步骤S1-4,根据S1-2和S1-3的截断拉普拉斯概率密度函数生成对应的一维和二维拉普拉斯噪声序列Y={y1,…,yi,…yn}和Z={z1,…,zi,…zn}。
3.根据权利要求1所述的一种误差约束条件下的差分隐私保护方法,其特征在于:所述步骤S2具体为:步骤S2-1,若待保护数据X是一维数据,将步骤S1-2得到的一维截断拉普拉斯噪声加入到X中,得到扰动结果x′i:x′i=xi+yi,i=1,2,…,n
其中,xi∈X,yi∈Y,X′={x′1,…,x′i,…,x′n};
步骤S2-2,若待保护数据X是二维数据,将步骤S1-3得到的平面截断拉普拉斯噪声加入到X中,得到扰动结果其中,zi∈Z,
4.根据权利要求1所述的一种误差约束条件下的差分隐私保护方法,其特征在于:所述步骤S3具体为:步骤S3-1,若待保护数据X是一维数据,计算重要概率密度函数p(xi|x′1:i),计算方式如下:其中,x′i∈X′,函数p(·)表示概率密度函数;
步骤S3-2,从p(x1|x′1:1),p(x2|x′1:2),…,p(xi|x′1:i)中随机抽取M个样本q1(x1),q2(x2),…,qM(xM),计算M个样本对应的权重wk(xk):步骤S3-3,将步骤S3-2得到的权重wk(xk)归一化得到更新后的权重w′k(xk):步骤S3-4,计算扰动结果x′k经过粒子滤波后的优化值,得到优化后的发布结果X″={x″1,…,x″k,…,x″n},其中x″k的计算方式如下:
5.根据权利要求1所述的一种误差约束条件下的差分隐私保护方法,其特征在于:所述步骤S4具体为:步骤S4-1,若待保护数据X是二维数据,首先将二维笛卡尔坐标系扰动数据 变换到极坐标系,得到扰动半径R′和角度Θ′,计算重要概率密度函数p(ri|r′1:i)和p(θi|θ′1:i),计算方式如下:其中,ri∈R,r′i∈R′,θi∈Θ,θ′i∈Θ′,函数p(·)表示概率密度函数;
步骤S4-2,分别从p(r1|r′1:1),p(r2|r′1:2),…,p(ri|r′1:i)和p(θ1|θ′1:1),p(θ2|θ′1:2),…,p(θi|θ′1:i)中随机抽取M个样本,得到扰动半径和角度的采样样本q1(r1),q2(r2),…,qM(rM)和q1(θ1),q2(θ2),…,qM(θM),计算扰动半径和角度样本值对应的权重uk(rk)和vk(θk):步骤S4-3,将权重uk(rk)和vk(θk)归一化得到更新后的权重u′k(rk)和v′k(θk):步骤S4-4,计算经过粒子滤波后的扰动半径和角度优化值r″k,θ″k:步骤S4-5,将优化后的极坐标系中的半径和角度变换到笛卡尔坐标系,得到优化的加扰结果
6.一种误差约束条件下的差分隐私保护系统,其特征在于:包括以下模块,初始化模块,用于判断待保护数据维度,根据待保护数据的维度生成对应噪声的概率密度函数,便于后续处理;包含以下子模块,判断子模块,判断当前需要发布数据的维度;
概率密度函数生成子模块,用于生成对应维度噪声的概率密度函数,根据给定的参数和待保护数据的维度计算一维截断拉普拉斯概率密度函数f(y)或者平面截断拉普拉斯概率密度函数f(z);
截断拉普拉斯噪声生成模块,用于生成与原始待保护数据长度相同的截断拉普拉斯噪声序列,包含以下子模块,噪声生成子模块,用于生成与待保护数据对应的截断拉普拉斯噪声,若待保护数据是一维数据,根据计算得到的一维截断拉普拉斯概率密度函数f(y)生成对应的噪声Y={y1,…,yk,…yn};若待保护数据是二维数据,根据计算得到的平面截断拉普拉斯概率密度函数f(z)生成对应的噪声Z={z1,…,zk,…zn};
扰动子模块,用于扰动待保护数据,根据待保护数据的维度,计算得到一维扰动结果x′k=xk+yk或二维扰动结果滤波器模块,用于对扰动结果进行优化,提高发布结果的可用性;包含以下子模块,输入子模块,用于存储加入截断拉普拉斯噪声后的扰动结果X′或 并将其输入到粒子滤波子模块;
粒子滤波子模块,对于输入序列X′或 进行粒子滤波,得到相应的优化结果X″或者输出子模块,输出优化结果X″或者 得到经优化后的差分隐私扰动数据。