利索能及
我要发布
收藏
专利号: 2021109411131
申请人: 中南民族大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于差分隐私的直方图数据发布方法,其特征在于,包括:S1:对原始直方图数据设置中心点的数量K;

S2:在直方图数据中随机选取一个点作为初始中心点,利用非中心点与中心点之间的最短距离结合指数机制,计算出每个直方图桶的抽样概率,利用轮盘抽样从所有非中心点中依次选取出下一次作为中心点的点,直到中心点的数量达到K;

S3:利用选取好的K个中心点对直方图数据H(H1,H2,...,Hn)进行K‑means聚类得到分组数据G(G1,G2,...,Gk),其中,H1、H2、Hn分别表示第一个直方图数据、第二个直方图数据和第n个直方图数据,n表示直方图数据的数量,G1、G2、Gk分别表示第一个分组数据、第二个分组数据和第k个分组数据,k表示分组的个数;

S4:对通过K‑means聚类得到的各分组数据求平均值,得到分组数据的均值其中, 分别表示第一个分组数据的均值、第二个分组数据的均值和第k个分组数据的均值;

S5:在各分组数据均值上添加拉普拉斯噪声,并还原直方图顺序,得到差分隐私直方图数据 其中, 分别表示第一个差分隐私直方图数据、第二个差分隐私直方图数据和第n个差分隐私直方图数据;

S6:对差分隐私保护直方图数据进行发布。

2.如权利要求1所述的基于差分隐私的直方图数据发布方法,其特征在于,步骤S1中的中心点数量K预先给定,其中K=1,2,3,...,n。

3.如权利要求1所述的基于差分隐私的直方图数据发布方法,其特征在于,步骤S2包括:

S2.1:在原始直方图数据中随机选取一个桶作为初始中心点,一个桶对应一个直方图数据;

S2.2:计算每个非中心点桶到中心点桶的最短距离:(其中Ci∈C,i=1,2,...,k)其中,Hj表示原始直方图数据中的非中心点桶;Ci表示已经选取为中心点的桶,u(H,Hj)表示每个非中心点桶到中心点桶的最短距离;

S2.3:基于步骤S2.2中计算的最短距离并结合指数机制,计算非中心点桶的抽样概率:其中,抽样概率Pr(H,Cj)用以表示非中心点桶Hj被选择为下一个中心点Cj的概率,ε1为隐私预算;Δu为全局敏感度; 为适应度函数,m表示非中心点桶的数量,分子计算的是某一个非中心点桶的适应度值,分母计算的是所有非中心点桶的适应度值的和;

S2.4:根据每个非中心点桶到中心点桶的最短距离和非中心点桶的抽样概率,采用轮盘法从所有非中心点桶中选取出一个桶作为下一个中心点桶;

S2.5:循环执行步骤S2.2‑S2.4,直至选出K个中心点桶。

4.如权利要求1所述的基于差分隐私的直方图数据发布方法,其特征在于,步骤S3中通过K‑means聚类得到的各分组数据为符合聚类条件的最优划分,所有最优划分合并构成G。

5.如权利要1所述的基于差分隐私的直方图数据发布方法,其特征在于,步骤S5中得到的差分隐私直方图数据的维数为一维。