利索能及
我要发布
收藏
专利号: 2020100707446
申请人: 山东师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于实例和特征共享级联的疾病预测系统,其特征是,包括:

待预测数据集获取模块,其被配置为:获取待预测患者的所有疾病特征;

待预测数据集预测模块,其被配置为:将待预测患者的所有疾病特征,输入到已经训练好的基于特征和实例迁移的平衡概率分布模型中,输出待预测患者所患疾病是否为慢性阻塞性肺疾病。

2.如权利要求1所述的系统,其特征是,已经训练好的基于特征和实例迁移的平衡概率分布模型的训练模块,包括:训练集获取单元,其被配置为:获取第一数据集和第二数据集;所述第一数据集为慢性阻塞性肺疾病的前期疾病数据集;所述第二数据集为已患和未患慢性阻塞性肺疾病的疾病数据集;所述第二数据集为小样本数据集;

基于特征和实例迁移的平衡概率分布模型构建单元,用于构建基于特征和实例迁移的平衡概率分布模型,所构建的基于特征和实例迁移的平衡概率分布模型,包括:依次串联的实例共享级联单元、特征共享级联单元和特征共享级联优化单元;

实例共享级联单元,其被配置为:从第一数据集中筛选出统计次数最多的N种疾病名称;

特征共享级联单元,其被配置为:筛选出第一数据集与第二数据集疾病特征距离最近的M种疾病特征;

特征共享级联优化单元,其被配置为:根据N种疾病名称和M种疾病特征,计算第一数据集与第二数据集之间的平衡概率分布值;

预测单元,其被配置为:根据平衡概率分布值与设定阈值的比较,输出第二数据集中待预测疾病是否为慢性阻塞性肺疾病;

验证单元,其被配置为:将预测单元的预测结果和预测单元的当前待预测疾病对应的特征均输入到弹性网络中,弹性网络输出损失函数值,如果损失函数值达到最小值,则表示基于特征和实例迁移的平衡概率分布模型训练结束;否则,继续对基于特征和实例迁移的平衡概率分布模型进行训练。

3.如权利要求2所述的系统,其特征是,所述训练集获取单元之后,所述基于特征和实例迁移的平衡概率分布模型构建单元之前,还包括:预处理单元,所述预处理单元,用于对第一数据集和第二数据集均进行预处理。

4.如权利要求3所述的系统,其特征是,所述预处理单元包括:

数据转换子单元,用于将文字数据转换为数字数据;

数据筛选子单元,用于将噪声数据剔除,噪声数据是指与待预测疾病数据不相关的数据;

数据填充子单元,用于对缺失数据进行填充;对筛选出的重要生理指标的缺失值进行填充。

5.如权利要求2所述的系统,其特征是,实例共享级联单元,其被配置为:将的第一数据集中疾病名称相同的患者记录进行统计,按照统计结果从多到少进行排序,排序靠前的N种疾病被赋予高权重;最后得到高权重对应的N种疾病名称。

6.如权利要求2所述的系统,其特征是,所述特征共享级联单元,其被配置为:对第一数据集和第二数据集的疾病特征均映射到同一个特征空间中,计算特征之间的距离,如果第一数据集的疾病特征a与第二数据集的疾病特征b距离小于设定阈值,则表示两个特征相似,对第一数据集的疾病特征a赋予设定的高权重;否则,对第一数据集的疾病特征a赋予设定的低权重;最后得到赋予权重后的若干个疾病特征;

利用近似马尔科夫毯算法对赋予权重后的所有疾病特征进行过滤,剔除不相关特征和冗余特征,得到过滤后的M种特征。

7.如权利要求2所述的系统,其特征是,特征共享级联优化单元,其被配置为:计算第一数据集中N种疾病名称的每种疾病名称c的M种特征,与第二数据集中的M种特征的边缘概率分布和条件概率分布;对边缘概率分布和条件概率分布进行加权求和,得到平衡概率分布值。

8.如权利要求2所述的系统,其特征是,所述预测单元,其被配置为:

如果平衡概率分布值大于设定阈值,则表示疾病名称c对应的疾病,是慢性阻塞性肺疾病;如果平衡概率分布值小于等于设定阈值,则表示疾病名称c对应的疾病,不是慢性阻塞性肺疾病;

所述对第一数据集和第二数据集的疾病特征均映射到同一个特征空间中,是利用多维标度法将特征映射到同一个特征空间。

9.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1所述系统中各个模块的功能。

10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1所述系统中各个模块的功能。