利索能及
我要发布
收藏
专利号: 202310681068X
申请人: 广州大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度自编码器的疾病相关miRNAs预测方法,其特征在于,包括:S1.从TCGA数据库中获取样本的miRNAs表达谱数据,对获取的miRNAs表达谱数据分别进行标准化处理;所述样本包括疾病样本和正常样本;

S2.利用矩阵分解方法,对标准化处理后的miRNAs表达谱数据中的零值进行填充,使用填充后的miRNAs表达谱数据训练深度自编码器模型;

S3.基于所述深度自编码器模型训练反向编码器,根据所述反向编码器获得疾病样本的miRNA表达谱数据与疾病相关性大小,得到与疾病相关性高的miRNA。

2.根据权利要求1所述的方法,其特征在于,所述疾病样本中包括至少一种疾病样本,每个样本包括多个miRNA表达谱;

所述对获取的miRNAs表达谱数据分别进行标准化处理具体为:将所述疾病样本和正常样本的miRNA数据映射到0到1之间,具体方法如下:其中,其中x表示某个样本中某个miRNA的表达值,xmin表示某个样本中miRNA的最小表达值,xmax表示某个样本中miRNA的最大表达值,xn表示标准化后的miRNA的表达值),将表达值映射到0到1之间;

根据疾病样本中的疾病种类数量,与正常样本共同构建一个样本种类×样本数量的表达矩阵。

3.根据权利要求2所述的方法,其特征在于,所述利用矩阵分解方法,对标准化处理后的miRNAs表达谱数据中的零值进行填充具体方法为:将所述表达矩阵进行分解,得到第一表达矩阵和第二表达矩阵;

将所述第一表达矩阵和第二表达矩阵相乘,实现矩阵中零值填充;

根据预设的学习率和训练次数循环上述步骤。

4.根据权利要求3所述的方法,其特征在于,所述矩阵分解的学习率为0.000002,训练次数为5000次。

5.根据权利要求1所述的方法,其特征在于,所述训练深度自编码器模型使用优化器ADAM,学习率为1.0×10‑4,损失函数为:其中,n表示miRNAs特征的总个数,xi表示miRNAi的表达量, 表示miRNAi的预测表达量。

6.根据权利要求1所述的方法,其特征在于,所述基于所述深度自编码器模型训练反向编码器具体方法为:选取miRNA表达谱数据中样本量较大的疾病样本作为数据集,每一个疾病样本对应一个表型;

将数据集中疾病样本对应的表型数据作为输入,miRNA表达谱数据作为输出,训练反向编码器。将反向编码器与原始编码器的剩余部分拼接,得到最终的打分模型。

7.根据权利要求1所述的方法,其特征在于,所述根据所述反向编码器获得疾病样本的miRNA表达谱数据与疾病相关性大小,得到与疾病相关性高的miRNA具体方法为:将包含每种疾病样本的表型方阵分别输入到所述打分模型中,每种疾病样本的表型方阵分别得到一列打分向量数据;

对所有得到的打分向量数据从大到小排序,分值越大,排名越靠前的miRNAs则为与输入层对应的疾病密切相关的miRNAs。

8.一种基于深度自编码器的疾病相关miRNAs预测系统,其特征在于,包括:数据处理模块:用于从TCGA数据库中获取样本的miRNAs表达谱数据,对获取的miRNAs表达谱数据分别进行标准化处理;所述样本包括疾病样本和正常样本;

模型训练模块:用于利用矩阵分解方法,对标准化处理后的miRNAs表达谱数据中的零值进行填充,使用填充后的miRNAs表达谱数据训练深度自编码器模型;

相关性预测模块:用于基于所述深度自编码器模型训练反向编码器,根据所述反向编码器获得疾病样本的miRNA表达谱数据与疾病相关性大小,得到与疾病相关性高的miRNA。

9.一种电子设备,其特征在于,包括:

处理器;以及,

被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现如权利要求1至7任一项所述的基于深度自编码器的疾病相关miRNAs预测方法的步骤。

10.一种存储介质,其特征在于,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现如权利要求1至7任一项所述的基于深度自编码器的疾病相关miRNAs预测方法的步骤。