利索能及
我要发布
收藏
专利号: 2025102286656
申请人: 山东科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度高斯混合模型的污水处理工业过程异常监测方法,其特征在于,包括如下步骤:步骤1、采集城市污水处理过程中产生的工业过程变量数据,构建原始数据集;

步骤2、设计基于自编码器和核主成分分析的特征提取策略,获取低维特征表示;具体过程为:步骤2.1、构建包含编码器和解码器的自编码器神经网络,设计基于自编码器神经网络的特征提取策略,获取压缩特征和重构误差特征;具体过程为:步骤2.1.1、由编码器部分对数据进行逐层压缩,得到压缩特征:zc=h(X;θe)  (1);

h=α(wX+b)  (2);

其中,zc为压缩特征;h为编码函数;θe为编码器部分神经网络层参数;α为激活函数;w和b分别为编码函数的权重和偏置;

步骤2.1.2、压缩特征进入解码器部分进行数据拓展,得到形状与原始数据集完全相同T的重构数据集X′=[x1′,x2′,…,x′N], x′N为重构数据集中第N个样本;整个过程为样本数据的重构过程:X′=g(zc;θd) (3);

g=α(w′zc+b′) (4);

其中,g为解码函数;θd为解码器部分神经网络层参数;w′和b′分别为解码函数的权重和偏置;

步骤2.1.3、计算原始数据与重构数据之间的重构误差,公式为:2

F(xi,xi′)=‖xi‑xi′‖(5);

其中,F(xi,xi′)为xi与xi′之间的重构误差;xi为原始数据集中第i个样本;xi′为重构数据集中第i个样本;

步骤2.1.4、将重构误差作为重构误差特征;重构误差特征由两部分组成,分别为相对欧氏距离和余弦相似度,具体如下:T T

zr=[z1,z2]=[zr1,zr2,…,zrN] (6);

其中,zr为重构误差特征;z1为相对欧氏距离;z2为余弦相似度;zrN为第N个样本的重构误差特征;f1(·)为相对欧氏距离计算函数;f2(·)为余弦相似度计算函数;‖·‖2为二范数计算符号;

步骤2.2、设计基于核主成分分析的特征提取策略,获取核主成分分析特征;具体过程为:步骤2.2.1、通过高斯核函数计算出输入样本数据两两之间的核矩阵;

其中,Kij为核矩阵K中第i行第j列的元素值, 为高斯核函数;xi、xj分别为原始数据集中第i个样本、第j个样本,第i个样本对应第i行,第j个样本对应第j列;

exp(·)为以e为底的指数函数;γ是高斯核函数的参数;

步骤2.2.2、对核矩阵进行中心化,得到中心化矩阵:Kc=K‑1NK‑K1N+1NK1N  (10);

其中, 为中心化矩阵; 为全1向量,计算公式为:其中,eN为N×1的全1列向量;

步骤2.2.3、对中心化矩阵进行特征值求解,得到特征值以及对应特征向量,并对特征向量进行正则化处理:Kcμl=λlμl,l=1,2,…,N  (12);

其中,λl为第l个特征值;μl为第l个特征值对应的特征向量;μ′l为正则化后的第l个特征值对应的特征向量;

步骤2.2.4、选取最大的前d个特征值对应的特征向量组成降维矩阵,根据降维矩阵得到降维后的特征:Xk=Kcμ′  (14);

其中, 为降维后的特征; 为降维矩阵;

步骤2.2.5、将降维后的特征作为核主成分分析特征:T T

zk=Xk=[Xk1,Xk2,…,XkN]=[zk1,zk2,…,zkN]  (15);

其中,zk为核主成分分析特征;XkN为第N个样本降维后的特征;zkN为第N个样本的核主成分分析特征;

步骤2.3、将压缩特征、重构误差特征、核主成分分析特征共同组成N个样本数据的低维特征表示;公式为:其中,Z为低维特征表示;zcN为第N个样本的压缩特征;ZN为第N个样本的低维特征表示;

步骤3、构建深度高斯混合模型进行污水处理工业过程的异常监测;

深度高斯混合模型模型包括高斯混合模型和深度学习估计网络,高斯混合模型用来实现异常监测,深度学习估计网络用于求解高斯混合模型中的参数;具体过程如下:步骤3.1、高斯混合模型为:

其中,P(y|ψ)为给定模型参数ψ下输入数据y的概率密度函数,为第 个子高斯分布的混合

概率, 为子高斯分布总个数; 为第 个子高斯分布的概率密度函数,第 个子高斯分布的模型参数 分别为第 个子高斯分布的均值、协方差,具体表示为:

步骤3.2、高斯混合模型中的参数包括各个子高斯分布的混合概率、均值以及协方差矩阵,设计基于神经网络的参数估计策略来求解参数,具体表示为:L=MLN(z;θm)  (19);

其中,L是低维特征表示z经过由θm参数化的多层神经网络的输出;θm为深度学习估计网络的参数;MLN(·)为多层神经网络; 是隶属度预测;softmax(·)为softmax层;

步骤3.3、混合概率、均值、协方差的计算公式为:其中, 为第i个样本属于第 个子高斯分布的隶属度预测;zi为第i个样本的低维特征表示;

步骤3.4、计算似然函数值:

其中,E(·)为似然函数值; 为协方差的逆矩阵;

步骤3.5、将重构误差和高斯混合模型的似然函数结合起来设计联合损失函数,实现特征提取和异常监测模型的优化调整,构造如下:其中,J为联合损失函数;λ1、λ2分别是在训练过程中控制E(zi)、P(∑)权重的两个超参数;P(∑)为一个防止协方差矩阵∑不可逆的惩罚项,公式为:其中,H是低维特征表示的维数; 为第 个子高斯分布的协方差矩阵中第 个对角元素;

步骤3.6、将联合损失函数作为目标函数,通过梯度下降算法反向传播,同时最小化重构误差以及高斯混合模型中的似然函数值,公式为:其中, 为联合损失函数J的梯度;θ为整个模型中用到的参数,包括θe、θd、θm;η为学习率;θ′为梯度下降算法更新后的参数;在参数得到更新后,自编码器神经网络层以及深度学习估计网络会再次提取特征,同时高斯混合模型的参数也会变化,实现特征提取和模型确定的动态优化调整;

步骤4、设计基于阈值的异常监测策略,基于构建的深度高斯混合模型得到阈值评价指标,进而判断当前时刻是否发生异常现象。

2.根据权利要求1所述基于深度高斯混合模型的污水处理工业过程异常监测方法,其特征在于,所述步骤1中,工业过程变量数据包括部分处理池以及出水池的活性异养菌浓度、活性自养菌浓度、溶解氮浓度、硝态氮浓度、溶解氧浓度、碱度、挥发性悬浮固体占总悬T浮固体的比例;构建的原始数据集X=[x1,x2,…,xN], 其中,xN为原始数据集中第N个样本;N是样本总个数;D是过程变量的维数;T为转置符号。

3.根据权利要求2所述基于深度高斯混合模型的污水处理工业过程异常监测方法,其特征在于,所述步骤4的具体过程为:步骤4.1、将原始数据集划分为训练集、测试集和验证集;

步骤4.2、采用训练集对深度高斯混合模型进行训练,训练后得到训练数据所属的高斯混合模型的概率密度函数;

步骤4.3、采用验证集在训练后的深度高斯混合模型上计算得到所有验证样本的似然函数值,对所有验证样本的似然函数值进行排序,预先已知验证集中异常样本比例,将排序中与异常样本比例值相同位置处的似然函数值设定为阈值;

步骤4.4、采用测试集在训练后的深度高斯混合模型上计算得到似然函数值,进而与阈值对比判断是否有异常现象发生;

步骤4.5、计算当前污水处理过程中样本数据的似然函数值,若似然函数值大于设定的阈值时,则判定发生了异常,否则,无异常现象发生。