利索能及
我要发布
收藏
专利号: 2024104697206
申请人: 中南大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-05-17
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于数据仓库的医疗数据整合系统,其特征在于,包括:数据获取模块,用于获取目标患者的个人源信息数据、患者数据、患者病历数据和药物实验数据;

数据集成模块,所述数据集成模块的输入端与所述数据获取模块的输出端连接,所述数据集成模块中集成有多头注意力模型;

所述数据集成模块用于通过词嵌入方法将所述目标患者的个人源信息数据、患者数据、患者病历数据和药物实验数据进行转换,生成向量矩阵;将所述向量矩阵输入所述多头注意力模型进行并行特征提取并利用定义的自适应权重调节因子对所述多头注意力模型的注意力权重进行动态调整,得到特征矩阵;通过门控机制对所述特征矩阵进行特征融合并结合外部知识库提供的语义信息,得到所述目标患者的数据视图,所述数据视图用于表征所有数据的特征;

数据安全模块,所述数据安全模块的输入端与所述数据集成模块的输出端连接,用于通过改进的差分隐私方法对所述目标患者的数据视图进行隐私保护处理,得到加密后的数据视图;

数据仓库模块,所述数据仓库模块的输入端与所述数据安全模块的输出端连接,用于将加密后的数据视图进行聚合处理,得到聚合后的数据视图并储存;

数据统计模块,所述数据统计模块的输入端与所述数据仓库模块的输出端连接,用于构建每个看诊医生与所述目标患者的医患知识图谱,并基于所述医患知识图谱为所述目标患者分配看诊医生;

构建每个看诊医生与所述目标患者的医患知识图谱,包括:利用知识图谱嵌入模型将收集的每个看诊医生的个人信息数据、每个看诊医生所看诊的患者个人信息数据、所述目标患者的个人源信息数据以及患者数量转化为低维向量;

从所述每个看诊医生的个人信息数据和每个看诊医生所看诊的患者个人信息数据中提取头实体的嵌入向量;

从所述目标患者的个人源信息数据中提取尾实体的嵌入向量;

利用所述知识图谱嵌入模型提取所述头实体和所述尾实体之间的关系嵌入向量;

将所述头实体的嵌入向量、所述尾实体的嵌入向量以及所述关系嵌入向量进行结合,构建医患知识图谱;

基于所述医患知识图谱为所述目标患者分配看诊医生,包括:通过图嵌入方法将所述医患知识图谱中的头实体、尾实体以及关系映射到低维向量空间;

针对每个所述看诊医生和每个所述目标患者,通过所述头实体的嵌入向量和所述尾实体的嵌入向量计算余弦相似度,并根据所述余弦相似度计算所述看诊医生与所述目标患者在所述低维向量空间中的匹配分值;

基于所述匹配分值对所有看诊医生进行排序,将所述匹配分值最高的看诊医生分配给所述目标患者。

2.根据权利要求1所述的基于数据仓库的医疗数据整合系统,其特征在于,还包括数据处理模块;

所述数据处理模块的输入端与所述数据获取模块的输出端连接,所述数据处理模块的输出端与所述数据集成模块的输入端连接;

将所述目标患者的个人源信息数据中的缺失值作填充处理,得到填充后的个人源信息数据;

将所述填充后的个人源信息数据中的异常值和重复值进行删除,并对删除异常值和重复值后的个人源信息数据进行标准化处理,得到标准的个人源信息数据。

3.根据权利要求2所述的基于数据仓库的医疗数据整合系统,其特征在于,还包括信息反馈模块;

所述信息反馈模块的输出端与所述数据仓库模块的输入端连接,用于将获取的所述目标患者的就诊情况,发送至所述数据仓库模块进行存储。

4.根据权利要求3所述的基于数据仓库的医疗数据整合系统,其特征在于,所述改进的差分隐私方法包括:步骤1,定义质量函数 ,

其中 表示数据库,表示查询响应, 表示数据库与查询响应的特征函数, 表示特征函数的注意力权重系数, 表示正则项,表示正则化参数, 表示预期的查询响应;

步骤2,定义所述质量函数的敏感度为 ,

和 分别表示任意的相邻数据库;

步骤3,给定数据库 、质量函数 、敏感度 和隐私参数 ,通过指数机制选择一个查询响应 ,使得查询响应 的选择概率正比于 ;

步骤4,计算每个查询响应 的概率 和所有查询响应

的归一化概率 ,并通过所述归一化概率 选择一个查询响应 。

5.根据权利要求4所述的基于数据仓库的医疗数据整合系统,其特征在于,所述利用定义的自适应权重调节因子对所述多头注意力模型的注意力权重进行动态调整的表达式为:其中, 分别表示查询项矩阵Query、键项矩阵Key和值项矩阵Value,表示转置矩阵, 表示自适应权重调节因子。

6.根据权利要求5所述的基于数据仓库的医疗数据整合系统,其特征在于,所述余弦相似度的表达式为:其中, 和 分别表示目标患者 和看诊医生 的嵌入向量, 和 分别表示目标患者 的嵌入向量的模长和看诊医生 的嵌入向量的模长, 表示向量点积。