1.基于迁移学习的慢性阻塞性肺疾病预测系统,其特征是,包括:获取模块,其被配置为:获取慢性阻塞性肺疾病数据和待预测的A疾病数据,对慢性阻塞性肺疾病和待预测A疾病数据均进行预处理;
所述对慢性阻塞性肺疾病和待预测A疾病数据均进行预处理;具体包括:数据转换单元,用于将文字数据转换为数字数据;
数据筛选单元,用于将噪声数据剔除;
数据填充单元,用于对缺失数据进行填充;
数据归一化单元,用于对数据进行归一化处理;
提取模块,其被配置为:从预处理后的待预测疾病数据中提取待预测A疾病的若干个特征;从预处理后的慢性阻塞性肺疾病数据中提取慢性阻塞性肺疾病数据的若干个特征;
相似度计算模块,其被配置为:计算待预测A疾病的所有特征与慢性阻塞性肺疾病数据的所有特征之间的相似度,对相似度高的待预测A疾病的特征赋予高权重,对相似度低的待预测A疾病的特征赋予低权重;
预测模块,其被配置为:将赋予权重后的待预测A疾病的特征进行加权融合,得到融合后的待预测A疾病的特征;将融合后的待预测A疾病的特征输入到预训练的基于迁移学习的弹性网络中,输出待预测A疾病是否会发展为慢性阻塞性肺疾病;
所述预训练的基于迁移学习的弹性网络的训练过程,包括:
模型构建单元,其被配置为:构建自适应弹性网络;
训练集构建单元,其被配置为:构建训练集,所述训练集包括:已确认发展为慢性阻塞性肺疾病的若干患者的A疾病数据M、已确认未发展为慢性阻塞性肺疾病的若干患者的A疾病数据N、和已确认为慢性阻塞性肺疾病的若干患者的疾病数据P;
训练单元,其被配置为:
从已确认发展为慢性阻塞性肺疾病的若干患者的A疾病数据M中提取出特征集合m;
从已确认未发展为慢性阻塞性肺疾病的若干患者的A疾病数据N中提取出特征集合n;
从已确认为慢性阻塞性肺疾病的若干患者的所有疾病数据P中提取出特征集合p;
计算特征集合m与特征集合p的相似度,将相似度高的疾病数据M特征赋予高权重,将相似度低的疾病数据M特征赋予低权重;对疾病数据M的特征进行加权求和,得到融合特征m';
将融合特征m'和会发展为慢性阻塞性肺疾病标签“‑1”,作为负样本;
计算特征集合n与特征集合p的相似度,将相似度高的疾病数据N特征赋予高权重,将相似度低的疾病数据N特征赋予低权重;对疾病数据N的特征进行加权求和,得到融合特征n';
将融合特征n'和未发展为慢性阻塞性肺疾病标签“+1”,作为正样本;
将正样本和负样本,输入到自适应弹性网络中,对自适应弹性网络进行训练,当损失函数达到最小值时,停止训练,得到训练好的自适应弹性网络,训练好的自适应弹性网络即为预训练的基于迁移学习的弹性网络。
2.如权利要求1所述的系统,其特征是,所述待预测A疾病数据,包括:支气管炎、肺气肿或哮喘疾病数据中的一种或多种。
3.如权利要求1所述的系统,其特征是,所述从预处理后的待预测A疾病数据中提取待预测疾病的若干个特征;采用过滤式特征选择算法来进行特征提取。
4.如权利要求3所述的系统,其特征是,采用过滤式特征选择算法来进行特征提取,包括:对特征进行相关性分析,对相似度高的任意两个特征随机选择一种保留,删除另外一种;
对特征进行冗余性分析,提取出与A疾病相关性高于设定阈值的特征,以马尔科夫毯算法删除冗余特征。
5.如权利要求1所述的系统,其特征是,所述计算待预测A疾病的所有特征与慢性阻塞性肺疾病数据的所有特征之间的相似度,其中相似度是指欧式距离或余弦距离。
6.如权利要求1所述的系统,其特征是,所述将正样本和负样本,输入到自适应弹性网络中,对自适应弹性网络进行训练,是基于坐标下降法对自适应弹性网络进行训练和优化;
所述坐标下降法在迭代循环中使用不同的坐标方向,在当前点处沿一个方向优化来获取最小值。
7.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1所述系统中各个模块的功能。
8.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1所述系统中各个模块的功能。