1.基于多敏感关联数据泛化的个性化保护方法,其特征在于,包括具体步骤如下:S1,根据在知识图谱构建的敏感数据集,提取用户的某一列敏感特征属性序列A;
S2,基于属性序列A中数据的敏感度构建泛化层次树;
S3,同时,用户可以根据自身的个性化需求对树中的敏感节点通过引入敏感值权重设定敏感度级别来消除过度泛化所造成的信息损失,运用Aprior算法建立属性间的关联规则,利用信息量度量敏感节点的关联度,从而保护敏感属性的关联关系;
S4,将用户多维敏感数据构成的复合敏感数据作为一个高维向量,将关系表中的记录按照随机决策方法将复合敏感数据向量每一维的值分别映射到不同的桶中,通过分桶将用户的敏感数据进行关联分割,其次,对每一桶的敏感数据表再进行分组操作,增加伪数据,使其每一个组均满足L‑多样性;
S5,最后,通过敏感数据表的组ID进行无损连接,完成用户与敏感数据一对多的关系,使某一用户的隐私被披露的概率降低为1/L。
2.根据权利要求1所述的基于多敏感关联数据泛化的个性化保护方法,其特征在于,所述S1中,是利用爬虫方法提取用户的某一列敏感特征属性序列A。
3.根据权利要求1所述的基于多敏感关联数据泛化的个性化保护方法,其特征在于,所述S2中,基于属性序列A中数据的敏感度由用户自己设定。
4.根据权利要求1所述的基于多敏感关联数据泛化的个性化保护方法,其特征在于,所述S2中,泛化层次树可以定义为四元组ITAX(A)={rA,LA,INA,RA};
其中,rA表示层次树的根节点,LA表示层次树叶子节点的集合,INA表示层次树中间节点的集合,集合中的元素代表了敏感属性A各种取值的泛化节点,节点所处的泛化层次越高,表示敏感度越低,敏感数据的边界越大,攻击者攻击就越困难,RA表示层次树中各节点间的关联关系。
5.根据权利要求1所述的基于多敏感关联数据泛化的个性化保护方法,其特征在于,所述S2中,泛化层次树中不敏感的作为根节点,敏感的作为叶子节点。
6.根据权利要求1所述的基于多敏感关联数据泛化的个性化保护方法,其特征在于,所述S4中,分桶的计算公式为:其中, 表示代表行和列的元素之和。