利索能及
我要发布
收藏
专利号: 2022107078088
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:包括如下步骤:步骤1)采集催化裂化汽油历史数据,传输至后台服务器,对历史数据进行预处理,降低冗余度和复杂度;

步骤2)对预处理后的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标,评估筛选合理性;

步骤3)构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;

步骤4)构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。

2.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤1中,采集催化裂化汽油历史数据,传输至后台服务器,对数据进行预处理,具体步骤如下:首先,进行数据清晰与修复,设定超过20个缺失值的数据为失去修复价值的数据列,通过对样本数据进行分析,建立数据清洗模型,如式(1)所示:其中,Find(Ti)是缺失值超过20个的列号,Vj是第j个数据列;利用建立的数据剔除模型对原始数据完成数据剔除工作;

然后,针对缺失少于20个数值的数据进行修复,利用数据清洗模型对需要数据修复的数据点位进行查询,确定缺失值的位置后,对缺失的数据进行修复,对空值处的数据采用前后两个小时的平均值来代替,如式(2)所示:其中,Repair(i,j)表示对空值(i,j)处的数据进行修复;

接着,对原始数据的操作范围进行提取,采用最大‑最小的限幅方法剔除一部分不在此范围内的数据;剔除超范围数值后,继续对样本数据采用拉依达准则进行坏值剔除,拉依达准则假设一组被测的数据只含有随机误差,通过贝塞尔公式计算得到标准差,若某个测量值xb的剩余误差vb(1<=b<=n),满足|vb|=|xb‑x|>3σ,则认为xb是含有粗大误差值的坏值,应予剔除,贝塞尔公式如式(3)所示:以辛烷值数据测定的时间点为基准时间,取其前2个小时的操作变量数据的平均值作为对应辛烷值的操作变量数据,计算出所需的操作变量数据。

3.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤2中,对预处理完的数据进行特征降维,依据信息熵进行数据的第一轮筛选,具体步骤如下:

3‑1信息熵是信息论中最重要的概念,其数值越大就代表其包含的信息量越大,求解方法如式(4)所示:其中,i表示第i个样本,j表示第j个操作变量,Hj表示第j个操作变量的信息熵,p(Xi,j)表示第j个操作变量中第i个样本的数值在操作变量中出现的概率,以所有信息熵的平均值为阈值,对信息熵过低的变量进行删除;

3‑2一轮筛选结束后,继续依据MIC进行二轮筛选,MIC是信息论里一种有用的信息度量,其实质是对蒙特卡洛法近似计算出的互信息归一化的结果,首先计算两个序列的互信息I(x:y),如式(5)所示:其中p(x,y)是联合概率密度函数,p(x)p(y)为边缘概率密度函数;

采用类似于蒙特卡洛法的方案将序列x,y构成的散点图网格化,通过网格化后的散点分布估计其联合概率分布,估计的公式为:MIC及对近似的互信息I(X:Y)的最大值归一化公式为:

式中X,Y分别表示散点图网格化后x方向与y方向划分的段数,|x||y|即整体的网格数,B为超参数其数值应设定为数据总量的0.6次方。

4.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤3中,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测,模型结构包含输入层、隐藏层和输出层,每一层由若干个神经元组成,任意相邻的两层之间均为全连接层,具体步骤如下:

4‑1采用自编码器添加稀疏性限制以此抑制过拟合的方法,对隐藏层进行稀疏性限制,在误差函数中加入KL散度作为额外的惩罚因子来限制隐藏层神经元的平均活跃度,设优化后的误差函数为ρ为稀疏系数,通常情况下为一个接近于0的值, 为训练集中隐藏层输出值的平均函数,ypred为模型输出的预测值,ytrue为真实值,目标函数即为两者误差最小;

4‑2设输入层变量矩阵为X,输入层到隐藏层之间的权重矩阵为W1、偏置矩阵为b1,隐藏层到输出层之间的权重矩阵为W2、偏置矩阵为b2,则隐藏层的输出hidden=tanh(X·W1+b1),输出层为:output=tanh(Hidden·W2+b2);

4‑3在经过一次前向计算时,得到一次输出值output,模型中输出值即为预测的辛烷值,将输出值ypred与辛烷值的实际值ytrue进行比较,确定误差;

4‑4调整模型参数,重复训练直到得到模型最优解;

2

4‑5使用RMSE(均方根误差)、MAE(平均绝对误差)、R(决定系数)、MAPE(平均绝对百分比误差)作为评价指标测试模型训练效果。

5.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤4中,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化,具体步骤如下:

5‑1根据硫含量将预处理后的原始数据划分为正样本和负样本,通过对预处理后的样本数据进行分析,以硫含量不大于5ug/g为划分依据,对原始的样本数据进行样本集划分,样本标记公式为:通过遍历操作,划分出正样本和负样本集,考虑到正负样本之间数量不平衡,会对后续实验结果产生影响,采用cross entropy(CE)loss的改进版,实现对正、负样本数目不平衡的调整,公式为:γ

FL(pt)=‑∝t(1‑pt) log(pt)    (12)

5‑2搭建CGAN神经网络,将正、负样本结合条件变量输入判别器进行训练,具体步骤如下:

5‑2‑1搭建基于条件生成对抗网络(CGAN)的样本生成模型框架,CGAN是在GAN基础上做的一种改进,通过对原始的GAN的生成器和判别器的输入量添加额外的条件信息,实现条件生成模型;

5‑2‑2确定生成器和判别器网络结构,使用传统的全连接神经网络结构作为生成器和判别器的网络结构;

5‑2‑3确定损失函数,原始的GAN的损失函数为:

minG maxD V(D,G)=Ea~pdata(a)[2ogD(a)]+Ez~pdata(z)[log(1‑D(G(z)))]    (13)CGAN在添加额外信息后需要和a与z进行合并,作为G和D的输入,因此构建的CGAN损失函数公式为:minG maxD V(D,G)=Ea~pdata(a)[logD(a|b)]+Ez~pdata(z)[log(1‑D(G(z|b)))]    (14)

5‑2‑4组合辛烷值损失预测模型,通过辛烷值损失预测模型,寻找损失降幅大于规定值的样本对应的主要变量优化后的操作条件;

5‑3将条件变量输入生成器生成操作变量,并利用判别器进行生成器的训练,利用训练好的CGAN神经网络输出每个样本的操作变量,使用正样本集和负样本集对判别器网络的进行训练,使用公式γ

FL(pt)=‑∝t(1‑pt) log(pt)    (15)

对损失值进行调整,降低数据偏向性,将训练好的判别器模型参数放入CGAN网络中,输入为原料性质、产品性质、待生吸附剂性质、再生吸附剂性质筛选后的变量,训练完CGAN网络后,利用CGAN网络生成器对条件变量的操作变量进行生成;

5‑4利用步骤3)建立的辛烷值损失预测模型预测每个样本的操作变量相应的损失值,并计算辛烷值(RON)损失降幅大于规定值的样本对应的主要变量优化后的操作条件。