利索能及
我要发布
收藏
专利号: 2021106641131
申请人: 浙江理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度神经网络框架的蛋白质残基接触图预测方法,其特征在于,所述预测方法包括以下步骤:

(1)搭建集成深度神经网络框架:由1DResNet、2DDilatedSe‑ResNet和2DDenseNet三种网络集成得到集成深度神经网络框架;

(2)数据集的选取:将PDB25的子集作为训练集,将ASP12、CASP13、CAMEO和mems400作为测试集;

(3)使用一维特征和二维特征作为网络的输入特征;

(4)使用步骤(1)搭建的集成深度神经网络框架在数据集上学习预测模型;

(5)模型参数设置:

(6)将待测蛋白质序列输入模型,得到该蛋白质序列的残基接触图。

2.根据权利要求1所述的蛋白质残基接触图预测方法,其特征在于,所述的训练集和测试集中任何两种蛋白质的序列同一性都小于25%,并且将满足以下条件之一的蛋白质从序列排除:(Ⅰ)序列长度小于26或大于700;(Ⅱ)分辨率低于 (Ⅲ)具有多个蛋白质链组成的结构域。

3.根据权利要求1所述的蛋白质残基接触图预测方法,其特征在于,所述的一维特征包括位置特异性计分矩阵(PSSM)、位置特异性频率矩阵(PSFM)、3态的蛋白质二级结构(SS3)、

3态的溶剂可及性(ACC)和氨基酸理化性质特征(CP)。

4.根据权利要求1所述的蛋白质残基接触图预测方法,其特征在于,所述的二维特征包括直接协同进化信息,MSA矩阵以及成对电势。

5.根据权利要求3所述的蛋白质残基接触图预测方法,其特征在于,所述的位置特异性计分矩阵(PSSM)和位置特异性频率矩阵(PSFM)是通过HHblits程序在uniprot_sprot database搜索同源序列,然后构建出多序列比对(MSA),最后计算得出。

6.根据权利要求3所述的蛋白质残基接触图预测方法,其特征在于,所述的3态的蛋白质二级结构(SS3)和3态的溶剂可及性(ACC)分别来自于Bi‑LSTM和DSPRED。

7.根据权利要求3所述的蛋白质残基接触图预测方法,其特征在于,所述的氨基酸理化性质(CP)包括疏水性,Grapn形状指数,极化率,范德华规范化体积,无规卷曲Ca化学位移,局部电效应,PK(RCOOH)和Information measure for loop。

8.根据权利要求4所述的蛋白质残基接触图预测方法,其特征在于,所述的直接协同进化信息来自于CCMPred、MSA信息矩阵和成对电势。

9.根据权利要求1所述的蛋白质残基接触图预测方法,其特征在于,所述的

2DDilatedSe‑ResNet和2DDenseNet网络是由一系列dilatedse‑residualblock组成,优选地,所述的2DDilatedSe‑ResNet和2DDenseNet网络由两层卷积层和SE模块构成,卷积层之间为批处理归一化层和ReLU激活,第二次卷积采用空洞率为2的膨胀卷积。

10.根据权利要求1所述的蛋白质残基接触图预测方法,其特征在于,所述的DenseNet网络结构主要由DenseBlock和Transition组成。