利索能及
我要发布
收藏
专利号: 2021100228840
申请人: 北京工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-24
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种药物推荐方法,其特征在于,包括:

获取目标对象的相关信息;

对所述相关信息进行隐私保护预处理;

基于已进行隐私保护预处理的所述相关信息以及基于梯度提升决策树算法的模型来生成针对所述目标对象的药物推荐信息,其中,所述对所述相关信息进行隐私保护预处理包括:确定所述相关信息中的准标识符属性;对所述相关信息中的数值型准标识符属性添加随机扰动;对所述相关信息中的分类型准标识符属性进行K‑匿名处理,所述基于梯度提升决策树算法的模型包括具有差分隐私保护功能的基于梯度提升决策树算法的模型;

所述基于梯度提升决策树算法的模型包括具有差分隐私保护功能的基于梯度提升决策树算法的模型;

在对所述相关信息中的数值型准标识符属性添加随机扰动以及对所述相关信息中的分类型准标识符属性进行K‑匿名处理之前,所述对所述相关信息进行隐私保护预处理还包括:基于患者的人口统计信息、患者的病症属性以及所用药物属性,生成患者‑药物矩阵C,其中,n表示患者的属性数量,m表示患者数量,A为患者的人口统计信息、患者的病症属性以及所用药物属性中的一个;

所述对所述相关信息中的数值型准标识符属性添加随机扰动包括:确定扰动范围[‑γ ,γ];对所述矩阵C中的数值型准标识符属性添加均匀分布在[‑γ,γ]中的随机数,其中γ的值取1;

所述对所述相关信息中的分类型准标识符属性进行K‑匿名处理包括:步骤1),利用KACA算法对所述相关信息中的分类型准标识符属性做匿名化处理,基于矩阵C生成初始等价类X={x1,x2,x3,…,xn},其中,X为等价类集合,x1,x2,x3,…,xn为等价类,每个等价类中的各个元组的准标识符的值相等;步骤2),选取元组个数小于K的等价类xi,计算等价类xi和等价类集合X中除等价类xi以外的等价类的距离,找到距离xi最近的等价类xj;如果等价类xi和xj的共同元组的个数小于K,将等价类xi和xj合并为一类,并在等价类集合X中删除等价类xj,如果等价类xi和xj的共同元组的个数大于或等于K,在xj中选取距离xi最近的K‑|xi|个元组构成等价类xj1,将等价类xi和xj1合并为一类,并在等价类集合X中删除等价类xj1;步骤

3),循环执行上述的步骤2)若干次,直到等价类集合X中不存在元组个数小于K的等价类,使每个元组都至少和等价类中的K‑1条记录的准标识符一致;步骤4),对等价类集合X中的每个等价类进行泛化处理,所述相关信息包括人口统计信息、治疗信息以及药物信息,所述人口统计信息包括所述目标对象的年龄、性别、邮编以及地址,所述目标对象的年龄、性别、邮编为数值型准标识符属性,所述目标对象的地址为分类型准标识符属性。

2.根据权利要求1所述的药物推荐方法,其特征在于,所述方法还包括:

在对所述矩阵C中的分类型准标识符属性做匿名化处理之后,对满足k匿名的矩阵C的中的分类型准标识符属性进行One‑hot编码,形成特征矩阵E。

3.根据权利要求2所述的药物推荐方法,其特征在于,所述方法还包括:

训练具有差分隐私保护功能的基于梯度提升决策树算法的模型,所述训练具有差分隐私保护功能的基于梯度提升决策树算法的模型包括:将所述特征矩阵E输入至模型中,其中,准标识符属性和患者病症属性作为模型的特征,药物名称作为模型的预测目标;

利用残差更新迭代求强学习器;

基于拉普拉斯机制对得到的强学习器进行差分隐私处理。

4.一种实施如权利要求1所述方法的药物推荐装置,其特征在于,包括:

获取单元,用于获取目标对象的相关信息;

隐私保护预处理单元,用于对所述相关信息进行隐私保护预处理;

药物推荐单元,用于基于已进行隐私保护预处理的所述相关信息以及基于梯度提升决策树算法的模型来生成针对所述目标对象的药物推荐信息。

5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑3任一项所述药物推荐方法的步骤。

6.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1‑3任一项所述药物推荐方法的步骤。