1.一种基于渐进式神经网络预测蛋白质与配体结合自由能的方法,其特征在于:包括如下步骤:步骤1:建立数据库服务器、结构信息处理服务器和神经网络训练服务器,数据库服务器、结构信息处理服务器和神经网络训练服务器均通过互联网相互通信;
基于PDB数据库与PDBbind数据库中的晶体结构数据,经过数据预处理,在本地数据库服务器中建立PDBLig数据库,用于存储蛋白质与配体分子的pdb文件;
步骤2:在结构信息处理服务器中建立指纹计算模块和一维张量模块;
结构信息处理服务器从PDBLig数据库中获取蛋白质与配体分子的pdb文件;
步骤3:指纹计算模块解析pdb文件中的数据,得到以配体分子为中心获取蛋白质结合口袋内4.5埃距离内的氨基酸分子;
步骤4:指纹计算模块分别对配体分子和结合口袋内的氨基酸进行扩展连通性指纹计算;
步骤5:指纹计算模块将配体分子与结合口袋内的氨基酸进行SPLIF指纹计算;
步骤6:一维张量模块查找蛋白质与配体分子之间的盐桥与氢键数目;
步骤7:根据步骤4到步骤5所得出的结果,将蛋白质与配体的结构信息转变成一维张量;
步骤8:神经网络训练服务器将PDBLig数据库中的Refined和General的子集按照8:1:1的比例拆分为训练集、验证集和测试集;
步骤9:在神经网络训练服务器中建立渐进式神经网络,利用训练集对渐进式神经网络进行训练;
步骤10:利用验证集对训练后的渐进式神经网络进行验证,直到得到预设的预测效果;
步骤11:设置并优化一组超参数,并利用这组超参数对测试集进行预测;
步骤12:计算结合自由能与分子对接结果的比较皮尔森相关系数;
步骤13:神经网络训练服务器构建分子对接计算与训练渐进式神经网络对测试子集中的蛋白质与配体分子结构的预测的自由能结果的接受者操作特性曲线。
2.如权利要求1所述的一种基于渐进式神经网络预测蛋白质与配体结合自由能的方法,其特征在于:在执行步骤3时,所述pdb文件中包括蛋白质‑配体复合结构的数据。
3.如权利要求1所述的一种基于渐进式神经网络预测蛋白质与配体结合自由能的方法,其特征在于:在执行步骤11时,采用网格方法确定渐进式神经网络超参数的范围。
4.如权利要求1所述的一种基于渐进式神经网络预测蛋白质与配体结合自由能的方法,其特征在于:在执行步骤9时,利用网格搜索优化学习率、迭代次数、批次大小和激活函数隐含层数据参数对神经网络进行训练。
5.如权利要求1所述的一种基于渐进式神经网络预测蛋白质与配体结合自由能的方法,其特征在于:在执行步骤12时,通过阿雷尼乌斯公式将结合自由能转变为结合常数:其中,logKa为结合常数,ΔG为结合自由能,kB为玻尔兹曼常数,T为绝对温度。