利索能及
我要发布
收藏
专利号: 2023109598819
申请人: 山东省计算中心(国家超级计算济南中心)
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-22
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,包括:计算待发布数据质量评估度;

计算待发布数据中各属性数据的互信息,并基于所述互信息,以各属性数据作为节点构建动态贝叶斯网络;

基于所述动态贝叶斯网络中各属性数据节点间的相干邻近度以及预设阈值,对各属性数据进行类别划分;

基于所述相干邻近度及数据质量评估度计算各属性数据节点的隐私预算分配权值,并基于所述隐私预算分配权值对不同类别的属性数据分别进行隐私预算分配;

根据分配的隐私预算对各属性数据进行加噪,并将加噪后的高维数据进行发布。

2.如权利要求1所述的一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,所述动态贝叶斯网络包括若干个时间片,每一个时间片具有一个相同结构的静态贝叶斯网络,每一个静态贝叶斯网络描述了在特定时刻的状态。

3.如权利要求2所述的一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,每个静态贝叶斯网络的构建具体为:基于各属性数据之间互信息值的大小,根据最大支撑图方法为每个属性挑选与其依赖关系最强的属性节点加入贝叶斯网络,直至完成贝叶斯网络的构建。

4.如权利要求1所述的一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,基于所述相干邻近度及数据质量评估度计算各属性数据节点的隐私预算分配权值,具体采用如下公式;

其中, 为隐私预算分配权值, 为相干邻近度均值,为数据质量评估度。

5.如权利要求1所述的一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,所述对各属性数据进行类别划分,将各属性数据划分为两类,相干邻近度大于预设阈值的为高关联属性数据,相干邻近度小于等于预设阈值的为低关联属性数据。

6.如权利要求5所述的一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,所述基于所述隐私预算分配权值对不同类别的属性数据分别进行隐私预算分配,具体为:对于高关联属性数据,基于预设的总隐私预算、高关联属性数据对应的隐私预算分配权值以及高关联属性数据权重值的乘积,获得高关联属性数据初次分配的隐私预算;对于低关联属性数据,基于预设的总隐私预算、低关联属性数据对应的隐私预算分配权值以及低关联属性数据权重值的乘积,获得低关联属性数据初次分配的隐私预算;基于不同类别属性数据初次分配的隐私预算构建协调因子;通过所述协调因子与属性数据所属类别的总隐私预算的乘积,获得各属性数据的隐私预算分配。

7.如权利要求6所述的一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,对于高关联属性数据隐私预算的初次分配,具体表示如下:其中, 表示高关联属性数据初次分配的隐私预算, 表示高关联属性数据权重值, 为总隐私预算, 表示隐私预算分配权值。

8.如权利要求6所述的一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,对于低关联属性数据隐私预算的初次分配,具体表示如下:其中, 表示低关联属性数据初次分配的隐私预算, 表示低关联属性数据权重值。

9.如权利要求1所述的一种基于相干邻近度与贝叶斯网络的隐私数据发布方法,其特征在于,所述待发布数据质量评估度,基于待发布数据内容多样性、数据集准确性以及数据集完整性的加权和得到。

10.一种基于相干邻近度与贝叶斯网络的隐私数据发布系统,其特征在于,包括:质量评估单元,其用于计算待发布数据质量评估度;

贝叶斯网络构建单元,其用于计算待发布数据中各属性数据的互信息,并基于所述互信息,以各属性数据作为节点构建动态贝叶斯网络;

属性数据分类单元,其用于基于所述动态贝叶斯网络中各属性数据节点间的相干邻近度以及预设阈值,对各属性数据进行类别划分;

隐私预算分配单元,其用于基于所述相干邻近度及数据质量评估度计算各属性数据节点的隐私预算分配权值,并基于所述隐私预算分配权值对不同类别的属性数据分别进行隐私预算分配;

加噪发布单元,其用于根据分配的隐私预算对各属性数据进行加噪,并将加噪后的高维数据进行发布。