利索能及
我要发布
收藏
专利号: 2021108115094
申请人: 浙江理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述深度神经网络框架预测蛋白质磷酸化的方法包括以下步骤:(1)搭建集成深度神经网络框架:由ACNet和多尺度CapsNet两种网络集成得到深度神将网络框架;首先对蛋白质序列进行特征表示、融合特征包括位置特异性计分矩阵PSSM、氨基酸的理化性质、RECM转换矩阵和RECM构成特征,然后使用ACNet对融合特征进行提取;所述的ACNet包含3×3、3×1和1×3的三个卷积核的非对称卷积块;所述非对称卷积块输出求和,然后将结果输入到之后的网络结构中继续进行训练;所述多尺度CapsNet使用两个不同大小的卷积核m×m和n×n得到两个PrimaryCaps层;所述PrimaryCaps层融合后通过动态路由机制生成的结果,将其输入到DigitCaps中,得到最终的预测结果;

(2)数据集的选取:磷酸化数据集PhosphoData1训练集、多个独立测试集;

(3)使用信息增益方法优化过的融合特征作为网络输入特征;首先对四个特征的所有向量进行打分,挑选出得分较高即重要的特征向量重新组成一个有序的新特征;信息增益通过信息熵对特征进行打分;

(4)使用步骤(1)搭建的集成深度神经网络框架在数据集上预测模型;

(5)模型参数设置;

(6)将待测蛋白质序列输入模型,预测出该蛋白是否有磷酸化位点及其位置。

2.根据权利要求1所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述磷酸化数据集PhosphoData1训练集中筛选的5000个样本;多个独立测试集分别为PhosphoData1的测试集、Phospho.ELM、PhosphoData2的测试集和PhosphoData3。

3.根据权利要求2所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述的训练集和测试集中蛋白质残基长度为27,且任何两种蛋白质残基的相似性都小于

50%。

4.根据权利要求1所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述位置特异性计分矩阵PSSM是通过HHblits程序在uniprot_sprot database搜索同源序列,然后构建出多序列比对MSA,最后计算得出。

5.根据权利要求1所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述氨基酸理化性质包括疏水性、亲水性、侧链分子量、极性、侧链质量、侧链体积、曲线形状指数、残基可及表面、信息熵以及表面区域溶解能力。

6.根据权利要求1‑5任意一项所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述RECM转换矩阵采用氨基酸成对能量矩阵RECM表示。

7.根据权利要求5任意一项所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述RECM构成特征是通过对RECM转换矩阵先按氨基酸分组,然后再按行求和产生的。