利索能及
我要发布
收藏
专利号: 2024116384077
申请人: 刘国荣
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种单细胞测序的数据分类方法,其特征在于,包括以下步骤:步骤S1:获取原始基因表达矩阵;对原始基因表达矩阵进行基因数据预处理,得到预处理基因表达矩阵;根据预处理基因表达矩阵进行细胞拓扑图构建,得到细胞拓扑图;

步骤S2:根据细胞拓扑图以及预处理基因表达矩阵进行细胞分裂速率计算,并进行RNA速率计算,得到细胞分裂速率数据以及RNA速率数据;根据细胞分裂速率数据以及RNA速率数据对细胞拓扑图进行节点速率添加,得到增强细胞拓扑图;根据增强细胞拓扑图进行节点权重调整,并进行边权重调整,得到分裂速率调整权重以及RNA速率调整边权重;根据增强细胞拓扑图、分裂速率调整权重以及RNA速率调整边权重进行动态轨迹推断,得到动态轨迹图;

步骤S3:对动态轨迹图进行模糊聚类分析,并进行隶属度矩阵构建,得到细胞隶属度矩阵;

步骤S4:根据细胞隶属度矩阵以及预处理基因表达矩阵进行聚类概率分布计算,并进行基因排序,得到基因熵排序数据;根据细胞隶属度矩阵以及预处理基因表达矩阵进行模块信息熵计算,得到模块信息熵排序数据;根据基因熵排序数据以及模块信息熵排序数据进行特征基因筛选,得到特征基因列表;

步骤S5:根据特征基因列表进行细胞状态注释,得到细胞状态注释结果,以实现单细胞测序的数据分类作业。

2.根据权利要求1所述的单细胞测序的数据分类方法,其特征在于,步骤S1包括以下步骤:步骤S11:获取原始基因表达矩阵;对原始基因表达矩阵进行基因数据预处理,得到预处理基因表达矩阵;

步骤S12:对预处理基因表达矩阵中细胞间的距离进行高维空间距离计算,得到高维空间距离数据;

步骤S13:根据高维空间距离数据进行滤波器选择,得到滤波器函数;根据高维空间距离数据对滤波器函数的值域进行多个重叠区间划分,得到区间划分数据;

步骤S14:根据区间划分数据对预处理基因表达矩阵进行局部聚类,得到局部聚类结果;

步骤S15:根据局部聚类结果进行细胞拓扑图构建,得到细胞拓扑图。

3.根据权利要求1所述的单细胞测序的数据分类方法,其特征在于,步骤S2包括以下步骤:步骤S21:根据细胞拓扑图以及预处理基因表达矩阵进行细胞分裂速率计算,得到细胞分裂速率数据;利用预处理基因表达矩阵进行每个细胞的RNA速率计算,得到RNA速率数据;

步骤S22:根据细胞分裂速率数据以及RNA速率数据对细胞拓扑图进行节点属性添加,得到增强细胞拓扑图;

步骤S23:根据增强细胞拓扑图进行节点权重初始化,得到初始节点权重;

步骤S24:根据增强细胞拓扑图对初始节点权重进行基于细胞分裂速率的节点权重调整,得到分裂速率调整权重;根据增强细胞拓扑图进行基于RNA速率的边权重调整,得到RNA速率调整边权重;

步骤S25:根据增强细胞拓扑图对分裂速率调整权重以及RNA速率调整边权重进行节点权重以及边权重整合,得到整合权重;

步骤S26:根据增强细胞拓扑图以及整合权重进行最优路径算法应用,得到最优路径数据;

步骤S27:根据最优路径数据对增强细胞拓扑图进行动态轨迹图构建,得到动态轨迹图。

4.根据权利要求3所述的单细胞测序的数据分类方法,其特征在于,步骤S21包括以下步骤:步骤S211:对预处理基因表达矩阵进行细胞周期相关基因表达矩阵提取,得到周期基因表达矩阵;

步骤S212:根据周期基因表达矩阵进行单细胞周期评分,得到单细胞周期评分;

步骤S213:根据单细胞周期评分进行细胞周期阶段划分,得到细胞周期阶段;

步骤S214:根据细胞拓扑图以及细胞周期阶段进行细胞分裂速率计算,得到细胞分裂速率;

步骤S215:对预处理基因表达矩阵进行剪接前后mRNA矩阵构建,得到剪接前后mRNA矩阵;

步骤S216:根据剪接前后mRNA矩阵进行RNA速率推断,得到RNA速率矩阵;对RNA速率矩阵进行速率平滑与降噪,得到RNA速率数据。

5.根据权利要求3所述的单细胞测序的数据分类方法,其特征在于,步骤S24包括以下步骤:步骤S241:对增强细胞拓扑图进行节点平均分裂速率提取,得到节点平均分裂速率;根据节点平均分裂速率进行最小分裂速率设置,得到最小分裂速率;

步骤S242:根据节点平均分裂速率以及最小分裂速率对初始节点权重进行节点权重调整,得到分裂速率调整权重;

步骤S243:对增强细胞拓扑图进行节点平均RNA速率向量提取,得到节点平均RNA速率向量;根据节点平均RNA速率向量对增强细胞拓扑图进行边RNA速率差异计算,得到边RNA速率差异数据;

步骤S244:根据边RNA速率差异数据进行最小RNA速率差异设置,得到最小RNA速率差异数据;

步骤S245:根据边RNA速率差异数据对增强细胞拓扑图进行边的方向性权重调整因子计算,得到方向性权重调整因子;

步骤S246:根据最小RNA速率差异数据以及方向性权重调整因子对边RNA速率差异数据进行边权重调整,得到RNA速率调整边权重。

6.根据权利要求1所述的单细胞测序的数据分类方法,其特征在于,步骤S3包括以下步骤:步骤S31:对动态轨迹图进行特征矩阵转换,得到轨迹特征矩阵;

步骤S32:对轨迹特征矩阵进行聚类数量确定,得到聚类数量数据;

步骤S33:根据轨迹特征矩阵以及聚类数量数据进行模糊C均值聚类,得到模糊聚类结果;

步骤S34:根据模糊聚类结果进行隶属度矩阵构建,得到细胞隶属度矩阵。

7.根据权利要求1所述的单细胞测序的数据分类方法,其特征在于,步骤S4包括以下步骤:步骤S41:根据细胞隶属度矩阵对预处理基因表达矩阵进行基因表达矩阵按聚类分组,得到基因表达分组列表;

步骤S42:根据基因表达分组列表进行聚类概率分布计算,并进行基因排序,得到基因熵排序数据;

步骤S43:根据预处理基因表达矩阵进行共表达测量方法选择,得到共表达测量方法和参数;

步骤S44:利用共表达测量方法和参数对预处理基因表达矩阵进行基因间共表达值计算,得到基因共表达矩阵;

步骤S45:根据基因共表达矩阵进行共表达网络构建,得到基因共表达网络;对基因共表达网络进行网络模块识别,得到网络模块;

步骤S46:根据细胞隶属度矩阵以及预处理基因表达矩阵对网络模块进行模块信息熵计算,得到模块信息熵排序数据;

步骤S47:根据基因熵排序数据以及模块信息熵排序数据进行特征基因筛选,得到特征基因列表。

8.根据权利要求7所述的单细胞测序的数据分类方法,其特征在于,步骤S42包括以下步骤:步骤S421:根据基因表达分组列表进行核函数确定,得到核函数;根据基因表达分组列表以及核函数进行带宽确定,得到带宽参数;

步骤S422:根据核函数以及带宽参数对基因表达分组列表进行核密度估计,得到基因聚类概率密度;对基因聚类概率密度进行概率密度归一化,得到基因聚类概率分布数据;

步骤S423:根据基因聚类概率分布数据进行基因信息熵计算,得到基因信息熵;

步骤S424:根据细胞隶属度矩阵对基因信息熵进行信息熵权重调整,得到加权基因信息熵;

步骤S425:根据加权基因信息熵进行基因熵排序,得到基因熵排序数据。

9.根据权利要求1所述的单细胞测序的数据分类方法,其特征在于,步骤S5包括以下步骤:步骤S51:根据特征基因列表以及预设的细胞标记基因数据库进行训练数据准备,得到训练数据集;

步骤S52:利用训练数据集进行多标签分类模型训练,得到多标签分类模型;

步骤S53:对多标签分类模型进行模型评估与优化,得到优化多标签分类模型;

步骤S54:根据预处理基因表达矩阵以及特征基因列表,利用优化多标签分类模型进行细胞状态预测,得到细胞状态预测结果;

步骤S55:根据细胞状态预测结果进行细胞状态注释结果生成,得到细胞状态注释结果。

10.一种单细胞测序的数据分类系统,其特征在于,用于执行如权利要求1所述的单细胞测序的数据分类方法,该单细胞测序的数据分类系统包括:流形嵌入模块,用于通过获取原始基因表达矩阵;对原始基因表达矩阵进行基因数据预处理,得到预处理基因表达矩阵;根据预处理基因表达矩阵进行细胞拓扑图构建,得到细胞拓扑图;

动态轨迹推断模块,用于根据细胞拓扑图以及预处理基因表达矩阵进行细胞分裂速率计算,并进行RNA速率计算,得到RNA速率数据;根据细胞分裂速率数据以及RNA速率数据对细胞拓扑图进行节点速率添加,得到增强细胞拓扑图;根据增强细胞拓扑图进行节点权重调整,并进行边权重调整,得到分裂速率调整权重以及RNA速率调整边权重;根据增强细胞拓扑图、分裂速率调整权重以及RNA速率调整边权重进行动态轨迹推断,得到动态轨迹图;

模糊聚类模块,用于对动态轨迹图进行模糊聚类分析,并进行隶属度矩阵构建,得到细胞隶属度矩阵;

特征基因筛选模块,用于根据细胞隶属度矩阵以及预处理基因表达矩阵进行聚类概率分布计算,并进行基因排序,得到基因熵排序数据;根据细胞隶属度矩阵以及预处理基因表达矩阵进行模块信息熵计算,得到模块信息熵排序数据;根据基因熵排序数据以及模块信息熵排序数据进行特征基因筛选,得到特征基因列表;

细胞状态注释模块,用于根据特征基因列表进行细胞状态注释,得到细胞状态注释结果,以实现单细胞测序的数据分类作业。