利索能及
我要发布
收藏
专利号: 2020100274859
申请人: 电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种分布式光纤振动信号特征提取与识别方法,其特征在于,包括以下步骤:步骤1:利用分布式光纤振动传感系统采集振动源的时空矩阵信号,抽取空间列信号并划分短时信号单元,打上事件类型标签,构建光缆振动事件数据集;

步骤2:基于光缆振动事件数据集构建改进的mCNN模型,并对其进行训练和调优,调优过程中对改进的mCNN模型提取的特征进行特征评估,直到改进的mCNN模型迭代达到最优;

步骤3:利用最优mCNN模型并行提取多尺度下所有短时信号单元的时间结构特征矢量,按短时信号单元的时间顺序重组为短时特征序列,构建振动事件数据的时间结构特征序列集;

步骤4:基于时间结构特征序列集训练各类振动事件的HMM模型,挖掘时间结构特征序列间的时序关系,构建线下振动事件HMM模型库,作为振动源识别的分类器,实现振动源分类识别。

2.根据权利要求1所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,还包括步骤5:进行在线测试:将某一振动事件的时空矩阵信号的列信号输入已经保存的最优mCNN模型,得到时间结构特征矢量并对其进行重组,重组为时间结构特征序列,再输入已构建的线下振动事件HMM模型库,依次比较在各事件模型下的概率输出,将最大概率对应的事件类型作为分类结果,输出振动源类别。

3.根据权利要求1所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,所述步骤1具体包括以下步骤:步骤1.1:利用分布式光纤振动传感系统采集在振动事件发生时各空间点的信号,构成时空矩阵,列信号为单个空间点的时间信号,抽取列信号作为振动事件的信号样本,所述信号样本为一条长时信号,信号维度为1×u,u表示长时信号的数据点数,由信号时长和采样频率决定;

步骤1.2:将固定时间长度的信号作为一个短时信号单元,一条信号样本可划分为L个短时信号单元,短时信号单元的信号维度为1×v,v表示短时信号单元的数据点数,由短时信号单元的时间长度决定;

步骤1.3:按事件类型设标签后,根据步骤1.1和步骤1.2,构建得到不同类型的光缆振动事件数据集。

4.根据权利要求1所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,所述步骤2具体包括以下步骤:步骤2.1:将光缆振动事件数据集划分为训练集与测试集,在训练集上构建改进的mCNN模型并对其进行训练,所述训练包括依次进行模型参数初始化和网络前向传播;

步骤2.2:对模型进行调优,所述调优包括根据步骤2.1训练过程中改进的mCNN模型输出的后验概率计算损失函数,根据损失函数计算参数梯度,采用梯度下降法更新模型参数θ,并进行迭代,所述模型参数θ包括矩阵权重W和偏置b;

步骤2.3:在步骤2.2的模型迭代过程中,在测试集上进行测试,计算分类准确率,并进行特征评估,选择分类准确率和特征评估结果最好的模型作为最优mCNN模型,所述特征评估以正确预测类别的后验概率和错误预测类别的后验概率之间的欧氏距离进行评估。

5.根据权利要求4所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,所述步骤2.1具体包括以下步骤:步骤2.1.1:将光缆振动事件数据集划分为训练集与测试集,在训练集上构建改进的mCNN模型,所述改进的mCNN模型逐层交叉学习振动信号的多尺度特征,每层多尺度卷积层的最后都对不同尺度的特征进行一次融合,将融合后得到的特征作为下一层的输入,在深层对于浅层提取的每种尺度的特征再次进行多尺度提取;

步骤2.1.2:对步骤2.1.1中改进的mCNN模型采用Xavier方法进行参数初始化,参数初始化的分布范围为:式中,nin为输入参数个数,nout为输出参数个数;

步骤2.1.3:设改进的mCNN模型中卷积层的第k尺度输入训练数据xi为:第k尺度的第j个卷积核初始化后第K个通道的矩阵权重 其中,Kout为输出特征通道数;

对训练数据xi进行网络前向传播,所述网络前向传播包括:对每层卷积层依次进行卷积操作、池化操作、Relu激活操作和特征融合操作;

其中,对单尺度进行卷积操作的公式为:

式中,m为卷积核大小,p为边界填充,S为步长;

按上述公式对训练数据进行单尺度卷积操作后的输出为:

根据单尺度卷积操作公式得到多尺度的卷积核并行进行卷积操作的公式为:对多尺度的卷积核并行进行卷积操作后的输出进行池化操作的公式为:式中,s为步长;

按上述公式进行池化操作后的输出为:

对上述输出进行Relu激活操作的公式为:

最后,进行特征融合操作后的输出为:

经过多层多尺度卷积层后,最终输出一个二维数组的多尺度特征,将其转换为一维数组H=[h1,h2…hT];

步骤2.1.4:设一条样本信号的前验概率矩阵为:

y=[y0,y1,y2,y3],

将一维数组H输入全连接层后得到当前样本被预测类别的后验概率矩阵:p=[p0,p1,p2,p3]。

6.根据权利要求4所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,所述步骤2.2具体包括以下步骤:步骤2.2.1:根据后验概率矩阵计算交叉熵损失函数E:式中,x表示训练样本,N表示样本的总数;

步骤2.2.2:根据损失函数E计算目标函数梯度gt:

步骤2.2.3:根据梯度下降法更新mCNN模型的矩阵权重W,梯度的一阶矩估计为:mt=u*mt-1+(1-u)*gt,

二阶矩估计为:

式中,u、v∈[0,1),分别为梯度一阶矩、二阶矩的指数衰减率;

设第t次迭代时,

则mCNN模型的模型参数θ为:

式中,α为学习率,ε为非常小的数,防止除以零。

7.根据权利要求4所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,所述步骤2.3具体包括以下步骤:步骤2.3.1:在步骤2.2的模型迭代过程中,在光缆振动事件数据集中的测试集上进行测试,计算分类准确率的公式为:式中,Ntest为测试集样本总数,ntest为正确分类样本数;

步骤2.3.2:以正确预测类别的后验概率和错误预测类别的后验概率之间的欧氏距离进行评估,所述欧式距离的计算公式为:式中, 为第j条测试样本正确被预测为i类的后验概率, 为第j条测试样本错误被预测为m类的后验概率;

步骤2.3.3:选择同时满足步骤2.3.1的分类准确率最高,步骤2.3.2的特征评估结果最好的对应的模型作为最优mCNN模型。

8.根据权利要求5所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,所述步骤3具体包括以下步骤:步骤3.1:将光缆振动事件信号数据集输入保存的最优mCNN模型,并将步骤2.1.3得到的一维数组H=[h1,h2…hT]作为时间结构特征矢量,该特征矢量是由该模型自动提取的挖掘不同细节信息的多种特征组成,将其表示为不同特征种类的形式:式中,F为一条信号样本的特征矢量,L为一条信号样本包含的短时信号单元个数,c表示不同尺度细节信息的特征种类, 表示第c种特征的第L个短时信号单元的特征矢量;

步骤3.2:将特征矢量F按振动信号中短时信号单元的时间顺序进行时序重组,得到重组的与L个短时信号单元对应的特征序列:即,

至此完成原始数据到时间结构特征序列的转换,得到一条信号样本的短时特征序列;

步骤3.3:将光缆振动事件数据集的全部样本根据步骤3.1和3.2进行特征提取,打上标签,构建振动事件数据的时间结构特征序列集。

9.根据权利要求1所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,所述步骤4具体包括以下步骤:步骤4.1:将时间结构特征序列集划分为HMM的训练集与测试集,在训练集上构建HMM模型并进行训练,挖掘时间结构特征序列间的时序关系,训练出不同振动事件的HMM模型,构建线下振动事件HMM模型库,所述训练包括构建特征矢量序列集、初始化HMM模型的参数和迭代更新;

步骤4.2:在测试集上,采用维特比算法计算每条测试数据在线下振动事件HMM模型库中各模型下的贝叶斯后验概率,以输出概率最大的模型所对应的事件标签作为该测试信号的事件类型,实现振动信号的识别和分类。

10.根据权利要求9所述的一种分布式光纤振动信号特征提取与识别方法,其特征在于,所述步骤4.1具体包括以下步骤:步骤4.1.1:将时间结构特征序列集划分为HMM的训练集与测试集,以训练集作为HMM模型的观测序列输入,构建HMM模型;

步骤4.1.2:HMM模型的观测序列集O包含N组信号的时间结构特征序列:O=[O(1),O(2),......,O(N)],

式中,观测序列集O的维度为N×L×D,其中,L为时间结构特征序列的短时信号单元数,对应原单个空间点的时间信号包含的短时信号单元个数,D为每个短时信号单元提取的特征矢量维数,N为特征矢量序列的样本个数,则第n组特征矢量序列为:式中,Ot表示特征矢量序列集中第t个短时信号单元的特征矢量,1≤t≤L;

步骤4.1.3:设HMM模型为:

λ=(π,A,B),

式中,π、A、B均为模型参数,π为初始概率分布矢量,π=(π1,π2,…,πN),πi=P(qt=θi),1≤i≤N;

A为状态转移概率矩阵,A=(aij)N×N,aij=P(qt+1=θj|qt=θi),1≤i,j≤N,其中,N表示模型中Markov链的状态数目,N个状态为θ1,θ2,…,θN,t时刻马尔科夫链所处的状态为qt,qt∈(θ1,θ2,…,θN);

B为观测值概率矩阵,B=(bj(o)),

用GMM模型描述B为:

其中,bj(o)表示第j个状态下,产生特征矢量O的概率,M为高斯元的个数,bjl为状态j下第l个高斯密度函数,μ为均值矩阵,σ为协方差矩阵,W为高斯分量权值系数矩阵,wjl表示第j个状态下第l个混合高斯元的权值系数,μjl表示第j个状态下第l个混合高斯元的均值矢量,σjl表示第j个状态下第l个混合高斯元的协方差矩阵,|σjl|表示协方差矩阵的行列式值,D为特征矢量的维数,H为长时信号所经历的隐状态个数;

对HMM模型的各个参数进行初始化,对π和A进行随机初始化,对B采用GMM模型来估计HMM模型中每个状态产生某一特征矢量的概率,并采用K-Means算法对GMM模型进行参数估计,通过K-Means算法将每类事件的多组特征矢量序列中的每个特征矢量分配到H个隐状态下,对每个状态下的特征矢量再进行一次K-Means聚类,K-Means聚类的聚类中心数为GMM模型的混合高斯元个数M,按下列公式对权值系数wjl、均值矢量μjl和协方差矩阵σjl进行初始化:完成HMM模型的参数初始化;

步骤4.1.4:根据步骤4.1.2的特征矢量序列集O,假设各特征矢量序列相互独立,则所有特征矢量序列的联合概率分布为:用K条相互独立的特征矢量序列基于Baum-Welch算法对HMM模型的各个参数进行重估,重估公式为:式中, 为过渡概率, 表示第k组特

征矢量序列在t时刻处于状态i,在t+1时刻处于状态j的概率,其中, 为前向变量,表示第k组观测矢量序列在t时刻,状态为θi,前t秒内观测值为o1,o2,…,ot的概率, 为后向变量,表示第k组观测矢量序列在t时刻,状态为

θi,从t+1秒到L秒内观测值为ot+1,ot+2,…,oL的概率;

表示给定模型λ和O(k),在t时刻处于状态qi的概率;

表示某个特征矢量序列在t时

刻处于状态j时对于第l个混合高斯元的输出概率,G和N为GMM模型;

根据上述重估公式用训练集所有特征矢量序列更新HMM模型各个参数一遍为训练过程的一次迭代,当前后两次迭代过程的联合概率P(O'|λ)误差小于设置的收敛误差时,停止迭代,完成HMM模型训练;

步骤4.1.5:根据步骤4.1.2至步骤4.1.4,利用不同振动事件的时间结构特征序列集的训练集分别对HMM模型进行训练,得到不同振动事件的HMM模型,将各模型参数保存,完成线下振动事件HMM模型库的构建;

所述步骤4.2具体包括以下步骤:

步骤4.2.1:在测试集上,采用下列公式对测试数据在线下振动事件HMM模型库的HMM模型下的贝叶斯后验概率进行初始化操作:再采用下列公式进行递归操作:

*

从而得到贝叶斯后验概率P:

式中,δt(i)为t时刻沿一条路径q1,q2,…,qt产生o1,o2,…,ot的最大概率,δt(i)=maxP(q1,…,qt,qt=θi,o1,…,ot|λ),其中,qt=θi表示在时刻t状态为θi, 为在时刻t状态为θi 的 所 有路 径q 1 ,q2 ,… ,q t中 概 率 最大 的 路径 的 第 t- 1 个节 点 ,递归完成后,t=L,P*对应当前特征矢量序列在给定模型参数下的最大输出概率;

步骤4.2.2:采用步骤4.2.1的方法,根据模型库中各HMM模型参数λi和当前特征矢量序列O,计算各模型下对该特征矢量序列的预测概率Pi*=P(O|λi);

步骤4.2.3:选择步骤4.2.2的所有预测概率中最大的预测概率所对应的模型事件标签,作为当前测试信号的事件类型,实现振动信号的识别和分类。