利索能及
我要发布
收藏
专利号: 2023110367548
申请人: 西安石油大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于水体透射光谱的水质污染物预测方法,其特征在于,包括以下步骤;

S1:配置测量溶液:测量具有不同硝酸盐浓度以及不同BOD浓度的样品,获得总样本量;

S2:原始透射光谱数据采集:使用光谱仪对S1中总样本量内污染物标准溶液进行扫描,获得原始透射光谱数据;

S3:光谱数据预处理:对S2中的原始透射光谱数据进行预处理操作;

S4:主成分个数选择:对预处理后的光谱数据进行数据降维,选择主成分个数;

S5:建立浓度预测模型:

对光谱预处理和核主成分分析后的光谱数据,使用改进的粒子群优化算法对进行BP神经网络模型训练时所需的权重和偏置组合进行寻优;采用改进的BP神经网络模型作为水体中亚硝酸盐和BOD浓度预测模型,该BP神经网络模型为单隐层神经网络;

所述改进的粒子群优化算法包括:

将粒子群算法中的个体学习因子c1、社会学习因子c2以及惯性权重ω从固定的常数变为根据粒子的适应度值和所有粒子平均适应度值之间的差距大小自适应的对自身大小进行调节更新,在不同的情况下选择增强粒子的全局搜索能力或加快粒子的收敛速度,使粒子群优化算法在寻找最佳参数组合的时候更加稳定和高效;ω、c1和c2的更新公式如式(4)、式(5)、式(6)、式(7)所示;

其中,ωmax、ωmin、 和 表示惯性权重ω、个体学习因子c1和社会学习因子c2的最大值和最小值,fi表示当前粒子的函数适应值,fmin表示粒子群体中最小的函数适应值,相当于此时粒子群中的全局最优粒子,favg表示粒子群中的所有粒子的平均函数适应值,k1、k2和k3为0~1范围内的随机数;

在对粒子群算法中每个粒子进行速度的更新时,首先根据整个粒子群中的最小函数适应度值、平均函数适应度值和当前粒子适应度值之间的关系进行自适应学习因子和惯性权重的更新,之后通过计算粒子群的多样性值并根据该值对粒子的分散程度进行判断,在不同的分散程度下选择对粒子速度进行不同的更新,以避免出现局部最优解的情况;其中,式(8)为粒子群多样性值大小的计算公式,式(9)为对应不同情况下粒子的速度更新公式;

其中N为种群中的粒子个数,d为搜索空间的对角线长度,代表搜索区域的大小, 为所有粒子的平均位置;

其中dhigh为多样性值上界,dlow为多样性值下界,r1、r2为0~1范围内的随机数;

采用改进的BP神经网络模型包括:

通过使用自适应学习因子和惯性权重更新公式以及粒子多样性引导策略优化下的粒子群算法对BP神经网络模型的权重和偏置组合进行寻优后,使用输出的最优值作为BP神经网络初始时的权重和偏置值来进行浓度预测模型的训练;将该策略引入BP神经网络模型中,使学习率根据当前时刻损失函数变化值和上一时刻损失函数变化值的大小程度动态的对自身进行更新,学习率动态更新公式如式(11)、式(12)所示;

r=r·(1.5‑sigmoid(ft‑ft‑1))    (11)其中,r为学习率,ft‑ft‑1表示t时刻与上一时刻损失函数的变化值;

S6:浓度预测模型验证:将亚硝酸盐和BOD浓度数据分别导入已建立的预测模型中,验证模型的稳定性和预测性能;

S7:利用构建的改进粒子群优化算法下BP神经网络模型预测溶液样品中的亚硝酸盐和BOD浓度大小。

2.根据权利要求1所述的基于水体透射光谱的水质污染物预测方法,其特征在于,所述S1中,所述亚硝酸盐浓度为0.02,0.04,0.06,0.08,0.10,0.12,0.14,0.16,0.18和0.20mg·‑1 ‑1L ,所述BOD浓度为0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9和1mg·L 的标准溶液。

3.根据权利要求1所述的基于水体透射光谱的水质污染物预测方法,其特征在于,所述S2中,在总样本量内,使用微型光纤光谱仪对配制的溶液进行光谱数据的采集,重复扫描每个样品多次,光谱仪狭缝为10、25、50、100和200μm,选择10μm作为狭缝值,扫描光谱范围为

181.1~1002.4nm,并使用白板校正将扫描的得到的光谱数据转化为对应的光谱透射率值;

白板校正计算公式如(1)式所示:

MC=M0/Mw     (1)

其中M0为原始投射光谱数据;Mw为白板数据。

4.根据权利要求1所述的基于水体透射光谱的水质污染物预测方法,其特征在于,所述S3中,首先,对采集到的光谱数据进行最大最小归一化操作,然后对归一化后的数据进行均值中心化处理,以消除数据的偏差;

将原始透射光谱数据统一到同一的维度和中心点的位置上;

其中,所述的最大最小归一化的计算如(2)式所示:

其中x′表示单个数据在进行最大最小归一化后的取值,x为该数据的原始取值,xmin表示数据所在列的最小值,xmax表示该数据所在列的最大值;

均值中心化的计算如(3)式所示:

x″′表示单个数据在进行均值中心化后的取值,xr为该数据的原始取值,xmean表示数据所在列的平均值,xmean表示数据所在列的平均值,xstd表示该数据所在列的标准差。

5.根据权利要求1所述的基于水体透射光谱的水质污染物预测方法,其特征在于,所述S4中,使用核主成分分析(KPCA)的方法来实现数据降维,所述KPCA方法包括如下步骤:(1)数据准备:选择使用进行最大最小归一化和均值中心化两种操作后的透射光谱数据进行KPCA操作;

(2)核函数选择:选择线性核函数在原始特征空间中进行内积计算,将原始的透射光谱数据映射到更高维的特征空间;

(3)KPCA计算:使用核函数对透射光谱数据进行KPCA计算;KPCA将数据映射到了更高维空间,并计算协方差矩阵的特征向量即主成分的个数;

(4)特征值分析:通过特征值的大小来计算主成分的方差影响率,以确定哪些主成分包含了最具有信息量的特征;

(5)主成分选择:根据设定的阈值或方差影响率的大小,选择主成分个数。

6.根据权利要求1所述的基于水体透射光谱的水质污染物预测方法,其特征在于,所述S5中还包括:以均方误差(MSE)作为损失函数来评估使用自适应学习因子和惯性权重更新公式结合粒子多样性引导策略下改进的粒子群优化算法,对BP神经网络中权重和偏置组合输出结果的优劣程度,其中BP神经网络的权重和偏置组合是指神经网络中每个神经元连接的权重和偏置参数的集合,在BP神经网络中,神经元之间的连接由权重来表示,每个连接都有一个对应的权重,用于调整输入信号的重要性;偏置是神经元的一个额外参数,用于调整神经元的激活阈值,通过调整偏置的值,改变神经元的激活状态和输出;MSE的计算公式如式(10)所示;

其中yi表示亚硝酸盐和BOD浓度的真实值, 表示使用粒子群算法当前输出的最优权重和偏置组合进行BP神经网络浓度预测生成的预测值;

采用BP神经网络模型作为水体中亚硝酸盐和BOD浓度预测模型;使用留一法交叉验证2

训练单隐层神经网络,构建BP‑ANN模型,使用预测数据的决定系数(R)、均方根误差(RMSE)2

和平均绝对误差(MAE)值判断BP神经网络模型对样本预测能力的评估性能;其中R 、RMSE、MAE的计算公式如式(13)、式(14)、式(15)所示;

其中yi表示真实值, 表示预测值, 表示真实观测值的平均值,SSR为回归平方和,SSE为残差平方和;SST为总离差平方和;

其中n表示样本数量,yi表示真实值, 表示预测值;

其中n表示样本数量,yi表示真实值, 表示预测值。