1.基于敏感度分层的多敏感属性隐私保护方法,其特征是,包括:获取待发布的若干个患者的诊疗数据,每个患者均对应一条诊疗数据,每一条诊疗数据均包括:一个非敏感属性和若干个敏感属性;
按照非敏感属性的分层标准,对诊疗数据进行分成若干层级,计算分层后每一层非敏感属性值的个数;按照非敏感属性值的个数由高到低,对所有层级进行重新排列;
根据诊疗数据之间的相似性,对不同层级之间的诊疗数据进行聚类;
对分类后的每一类诊疗数据中的所有敏感属性均进行泛化处理,相同类别的诊疗数据的泛化处理的程度是一样的;将泛化处理后的诊疗数据进行发布;对分类后的每一类诊疗数据中的所有敏感属性均进行泛化处理,是对分类后的每一类诊疗数据中的所有敏感属性均采用l‑diversity隐私保护方式进行泛化处理;
根据诊疗数据之间的相似性,对不同层级之间的诊疗数据进行聚类,具体步骤包括:计算最高层中每一条诊疗数据,与最低层中每一条诊疗数据的距离,筛选出最小距离对应的诊疗数据a和诊疗数据b;
从除了最高层和最低层以外的剩余所有层中,分别筛选出与诊疗数据a的距离最小的诊疗数据 ; 表示第 层的被筛选出来的诊疗数据, 为正整数, 的取值范围是2到, 表示层的个数;将筛选出的诊疗数据a、诊疗数据b和诊疗数据 划分为一类;
将已筛选出的诊疗数据从原层级中删除;
对剩余的诊疗数据,采用同样的方式继续划分下一类;直至划分完毕。
2.如权利要求1所述的方法,其特征是,按照非敏感属性的分层标准,对诊疗数据进行分成若干层级;其中分层标准,包括:轻度疾病、中度疾病和重度疾病。
3.如权利要求1所述的方法,其特征是,计算分层后,每一层非敏感属性值的个数;
重度疾病中患癌症的个数为n个,则该层的非敏感属性值为n;
中度疾病中患炎症的个数为m个,则该层的非敏感属性值为m;
轻度疾病中患轻度疾病的个数为p个,则该层的非敏感属性值为p。
4.如权利要求1所述的方法,其特征是,按照非敏感属性值的个数由高到低,对所有层级进行重新排列,即根据m、n和p的从大到小,对对应的层级进行重新排列。
5.基于敏感度分层的多敏感属性隐私保护系统,其特征是,包括:获取模块,其被配置为:获取待发布的若干个患者的诊疗数据,每个患者均对应一条诊疗数据,每一条诊疗数据均包括:一个非敏感属性和若干个敏感属性;
层级划分模块,其被配置为:按照非敏感属性的分层标准,对诊疗数据进行分成若干层级,计算分层后每一层非敏感属性值的个数;按照非敏感属性值的个数由高到低,对所有层级进行重新排列;
聚类模块,其被配置为:根据诊疗数据之间的相似性,对不同层级之间的诊疗数据进行聚类;
泛化处理模块,其被配置为:对分类后的每一类诊疗数据中的所有敏感属性均进行泛化处理,相同类别的诊疗数据的泛化处理的程度是一样的;将泛化处理后的诊疗数据进行发布;对分类后的每一类诊疗数据中的所有敏感属性均进行泛化处理,是对分类后的每一类诊疗数据中的所有敏感属性均采用l‑diversity隐私保护方式进行泛化处理;
根据诊疗数据之间的相似性,对不同层级之间的诊疗数据进行聚类,具体步骤包括:计算最高层中每一条诊疗数据,与最低层中每一条诊疗数据的距离,筛选出最小距离对应的诊疗数据a和诊疗数据b;
从除了最高层和最低层以外的剩余所有层中,分别筛选出与诊疗数据a的距离最小的诊疗数据 ; 表示第 层的被筛选出来的诊疗数据, 为正整数, 的取值范围是2到, 表示层的个数;将筛选出的诊疗数据a、诊疗数据b和诊疗数据 划分为一类;
将已筛选出的诊疗数据从原层级中删除;
对剩余的诊疗数据,采用同样的方式继续划分下一类;直至划分完毕。
6.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1‑4任一项所述的方法。
7.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1‑4任一项所述的方法。