利索能及
我要发布
收藏
专利号: 2018105899464
申请人: 哈尔滨工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于属性相关的差分隐私保护方法,其特征在于,包含以下步骤:

步骤一 设输入样本X=[X1,X2,…XN],N为样本个数,每一个样本Xl=[xl1,xl2,…,xln]T∈Rn,对输入数据X进行标准化:得到标准化矩阵计算矩阵Z的最大信息系数矩阵Ci,j=MIC(zi,zj);其特征在于:给定有序对数据集D={(xi,yi),i=1,2,...,n},将X轴分成数量为x的格子,将Y轴分成了数量为y的格子,从而得出x×y格式的网格划分,并且用G表示,把位于D点同时进入了G中的网格而存在的比例判定为它的概率分配D|G;所有的数据集D,当其具有一定的固定性时,每一个网格划分都有它自己的概率分布特征D|G;最大信息系数MIC定义为:步骤二 数据降维,构建投影算子;数据降维是采用线性变换的方式将高维空间的数据投影变换到低维空间上;

步骤三 根据投影算子,将原始数据投影到另一个空间中,得到相应的投影矩阵;

计算Fk×n=Φ×Z,得到投影矩阵Fk×n;对投影矩阵Fk×n中的元素fij添加噪声,计算fij=fij+lap(Δf/ε),fij构成矩阵Fnoisy;添加服从拉普拉斯分布的噪声,其中Δf为全局敏感度;

步骤四 计算D=Uk×Fnoisy+repmat(Enoisy,1,n),即将加噪后的投影矩阵还原;E为原始特征变量对应的均值,Enoisy为加噪后均值,防止均值泄露隐私;

步骤五 发布还原数据集D,使得发布后的数据能够在差分隐私的框架下为相关的查询和数据挖掘等工作提供支持。