利索能及
我要发布
收藏
专利号: 2021101011840
申请人: 河南师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种具有差分隐私的安全多方k‑means聚类方法,其特征在于:存在m个参与方U1,U2,…,Um,各个参与方Ui有输入数据集Di,其中Di=di,1,…,di,l,i∈{1,…,m},添加噪声采用的两个差分隐私预算分别为ε1,ε2,首先此方案初始化聚类中心,每个参与者Ui接收添加噪声之后的聚类中心{C1,1,…,C1,k},如果相邻两次聚类中心之间的距离和η大于阈值 则继续迭代,参与者Ui计算出数据点px,px∈D与各个聚类中心Cj(1≤j≤k)的欧几里得距离,得到数据点px与聚类中心Cj的距离最小,则把数据点px统计到Oj集合中,统计出Oj集合中的数据点数目Numi,j,以及数据点属性和Sumi,j,为保护聚类中心的隐私,参与方Ui产生随机数ai.j,gi.j,并把ai.j,gi.j发送至主机S1,把Sumi,j‑ai,j,Numi,j‑gi,j发送至主机S2,主机S1将从所有用户接收到的随机数ai.j,gi.j进行累加,得到第j个聚类对应的随机数和,分别为主机S2将从所有用户接收到的Sumi,j‑ai,j,Numi,j‑gi,j进行累加,分别为主机S1,S2分别根据差分隐私预算ε1,ε2,产生噪声bz,j,gz,j,对主机S1,S2计算的Aj,Vj,Bj,Wj进行隐私保护,同时主机S1,S2利用混淆电路进行聚类中心更新得到新的聚类中心Cz,j(Cz,j为第z次迭代产生的聚类中心),每个用户通过判断新的聚类中心与上次迭代求出的聚类中心之间的距离η,如果η大于阈值 则执行下次迭代,否则返回最终的聚类中心Cz,1,…,Cz,k。

2.根据权利要求1所述的一种具有差分隐私的安全多方k‑means聚类方法,其特征在于:所述初始化参数设置:参数设置:m个参与方U1,U2,…,Um,每个参与方Ui有数据集Di,其中每个数据集包含的数据表示为Di=di,1,…,di,l,i={1,…,m},ε1,ε2分别是本方案添加噪声采用的两个差分隐私预算,k是聚类的个数,所有参与者:U1,U2,…,Um执行下列步骤:a.如果参与方的个数m小于聚类分类个数k,则每个参与方Ui从各自所拥有的数据集Di中选择 个数据点作为前 个初始聚类中心 然后再随机选择个参与方,每个选中的参与方各自从他们的数据集Di中随机选取一个数据点作为后 个初始聚类中心 如果参与方的个数m大于或等于聚类个数k,则随机选择k个参与者,每个选中的参与方各自从他们的数据集Di中随机选取一个数据点作为初始聚类中心;

b.参与方产生与聚类中心对应的随机数{a1,…,ak},并将随机数{a1,…,ak}发送至主机S1,将{c1‑a1,…,ck‑ak}发送到主机S2;

c.主机S1,S2分别以差分隐私预算分别为ε1,ε2为{a1,…,ak}和{c1‑a1,…,ck‑ak}生成对应的Laplace噪声{b1,…,bk},{g1,…,gk},主机S1,S2用混淆电路计算C1,i=(ci‑ai)+ai+bi+gi,i={1,…,k};

d.每个用户Ui接收添加噪声之后的聚类中心{C1,1,…,C1,k}。

3.根据权利要求1所述的一种具有差分隐私的安全多方k‑means聚类方法,其特征在于:所述迭代参数设置:m个参与方U1,U2,…,Um,每个参与方Ui拥有数据集Di,其中px表示数据集Di中的数据点,记作px∈Di,ε1,ε2分别是本方案添加噪声采用的两个差分隐私预算,k是聚类个数,O1,O2,…,Ok是k个聚类集合,阈值 η是距离参数,迭代参数为z,Sumi,j,Numi,j分别为第i次迭代中聚类Oj集合中数据点属性之和以及数据点数目之和,所有参与者:U1,U2,…,Um执行下列步骤:

A.判断距离参数η与阈值 的大小关系,如果 则迭代次数z=z+1;

B.计算参与者中的所有数据点到各个聚类中心的距离||px‑Cz,j||,px∈Di,j={1,…,k},如果||px‑Cz,j||≤||px‑Cz,v||,px∈Di,1≤v≤k则把数据划分到聚类Oj,统计出聚类Oj集合中的数据点数目Numi,j=|Oj|,以及聚类Oj集合中数据点属性和 为保护聚类中心的隐私,参与方Ui产生随机数ai.j,gi.j,并把ai.j,gi.j发送至主机S1,把Sumi,j‑ai,j,Numi,j‑gi,j发送至主机S2;

C.主机S1将从所有用户接收到的随机数ai.j,gi.j进行累加,得到第j个聚类对应的随机数和,分别为 主机S1根据差分隐私预算ε1,为Aj,Vj产生噪声D.主机S2将从所有用户接收到的Sumi,j‑ai,j,Numi,j‑gi,j进行累加,分别为主机S2分别根据差分隐私预算ε2,为Bj,Wj产生噪声达到对Bj,Wj的隐私保护;

E .主机S1 ,S2利用混淆电 路计算 每个用户令进行聚类中心更新,并计算两次迭代之间聚类中心的距离如果 则输出最终的聚类中心Cz,1,…,Cz,k,否则返回步骤a。