1.一种基于改进模型迁移学习的微震事件识别方法,其特征在于:其步骤为:步骤1)时间序列数据的预处理:把源域和目标域时间序列数据转化为图像,并对目标域进行选取有效时间序列数据操作;
步骤2)CNN特征提取过程:通过卷积层、池化层和全连接层的特征提取,得到每层对应的权重w和偏置值b;
步骤3)LSTM特征提取过程:添加注意力机制评估,使得数据对应权值改变,通过LSTM的输入门、忘记门、内部记忆单元和输出门进行时间序列数据的特征提取;
步骤4)源域特征及时间序列特征迁移:大样本源域特征对卷积层、池化层和第一层全连接层的迁移,图像所对应原始时间序列数据通过LSTM循环神经网络处理后进行第二层全连接层的特征迁移;
4.1)对源域数据的特征迁移学习:源域数据为大地震数据集,目标数据为小微震数据s s t t集,地震领域与矿山微震领域相似;源域数据集定义为(x ,y),目标数据集定义为(x ,y),其中x和y分别为数据和相应的标签;用步骤2)方法,得到每层的权重w和偏置b,把得到的特征迁移到第一层全连接层和之前的卷积、池化层,把源域的特征迁移到模型中去;
4.2)对时间序列数据的特征迁移学习:步骤1)中的时间序列数据经过步骤3)的LSTM的特征提取之后,连接一层全连接层,得到相应的特征;此时每个LSTM中的时间序列数据与CNN中的图像数据一一对应,把LSTM中的第一层全连接层的特征迁移到CNN的第二层全连接层,保持节点数目保持不变;通过对时间序列数据的特征迁移学习,综合考虑图像数据和时间序列数据的特征;
步骤5)微震分类器生成与识别:通过数据标签与特征的对应关系,训练模型生成分类器,最终实现微震事件的识别;
5.1)微震分类器生成:分类器的生成主要包括以下过程:
5.1.1)模型的构建:构建微震分类器的模型结构,依次包括输入层、卷积层1、池化层1、卷积层2、池化层2、全连接层123和输出分类层;
5.1.2)参数特征迁移:参数特征迁移包括两个部分的特征迁移:第一个是基于CNN的源域特征迁移,迁移卷积层1、池化层1、卷积层2、池化层2和全连接层1的参数,迁移的是大数据样本地震的特征;第二个是基于LSTM的时序特征迁移,迁移LSTM的全连接层参数到CNN的全连接层2,迁移的是微震时间序列数据的时序特征;
t t
5.1.3)模型的训练:用目标域的微震图像数据集(x ,y)作为训练集,运用前向传播与反向传播算法对模型进行反复训练,固定模型中迁移层的参数,主要训练第三层全连接层的参数;
5.1.4)生成分类器:经过上一步模型的训练之后模型表现出良好的分类能力,那么此时的模型就作为最终的微震事件识别模型,并保存为EQfinder.h5模型;
5.2)微震事件识别:
5.2.1)模型加载:加载训练并测试好的T‑SimCNN的EQfinder.h5模型;
5.2.2)数据初始化:首先将待识别的微震数据图像转化为100*100像素大小的图像,再把图像转化为numpy数组的形式,作为微震事件识别的数据形式;
5.2.3)概率函数设置:把事件和噪声这两种类别的数据概率的值,设置为百分制的格式;
5.2.4)概率输出:对应于概率设置函数的格式,运用predict()函数输出对应微震数据类别的概率;
5.2.5)事件识别:输出概率值较高的波形类别,如果微震事件的概率大于噪声的概率,该波形类别为事件数据,运用微震事件识别模型实现了微震事件的识别。
2.根据权利要求1所述的一种基于改进模型迁移学习的微震事件识别方法,其特征在于:所述的步骤1)中,具体步骤为:
1.1)时间序列数据转化为图像:利用MATLAB对源域和目标域时间序列数据的xyz三分量数值求平均值,画出微震数据图像;
1.2)选取有效时间序列数据:
1.2.1)长短时窗法选取:设定两个时窗,一个较长的叫长时窗,一个较短的叫短时窗,二者合为一个大的滑动窗口,该滑动窗口在时间序列的起始点进行滑动,每次滑动点数K,每次滑动后按照如下公式计算:阈值T=短时窗内点幅值之和average/长时窗内点幅值之和average,当阈值T大于经验值时,认为长时窗与短时窗接壤的点为P波到时点,该时间序列数据就为有效时间序列数据;
1.2.2)时间序列数据对齐:从原始震源事件文件中读取的原始时间序列记录长度并不一致,需对原始时间序列的长度作对齐操作,对于不足设定长度采样点的时间序列,在原观测时间序列数据前补0,使其整段时间序列长度统一。
3.根据权利要求1所述的一种基于改进模型迁移学习的微震事件识别方法,其特征在于:所述的步骤2)中,具体步骤为:
2.1)卷积层特征提取:在离散的三维彩色原始数据图像空间中,图像和卷积核分别定义为(H,W,C)和(k1,k2,c)的三维张量,其中H、W、C分别表示图像的长度、宽度和通道数,c表示通道数对应卷积核个数;m、n为空间坐标,分别表示第c个图像通道上第m行和第n列的像素点;当一个卷积核在彩色图像I上滑动运算时,多维张量的卷积运算可以表示为:其中Km,n,c表示第c个图像通道坐标为mn的卷积核的值大小,Ii+m,j+n,c表示第c个图像中i+m和j+n所对应的区域大小;
当一个卷积核 在彩色图像上滑动到Im,n位置上,卷积层 的特征图可以表示为:p,q
其中u、v表示图像所滑动的横纵坐标步长,p、q表示卷积核中所对应的横纵坐标,b 为输出特征图所对应的偏置值,σ为ReLU激活函数;
2.2)池化层特征提取:使用最大池化函数 进行池化,p、q、m、n表示所选定池化的区域;
2.3)全连接层特征提取:全连接层中的每个神经元与其前一层的所有神经元进行全连接;全连接层可以整合卷积层和池化层中具有类别区分性的局部信息,并负责对特征进行进一步的降维和提纯;用l表示全连接层的个数,每层有n个神经元,激活后全连接层的计算过程如公式如下:其中σ为激活函数, 表示激活后的全连接层的值, 表示下标为ij的全连接层权重的大小, 表示该层全连接层的值, 表示对应层的偏置值。
4.根据权利要求1所述的一种基于改进模型迁移学习的微震事件识别方法,其特征在于:所述的步骤3)中,具体步骤为:
3.1)注意力机制评估:由微震事件时间序列数据特点得出P波到时之后的特征相对明显,因此引入注意力机制进行权值评估;
3.1.1)运用softmax()函数归一化计算权重的大小,使有用时间序列数据信息权值变大,无用时间序列数据信息权值变小;
3.1.2)计算权值与原始时间序列数据的值得到注意力机制评估后的值,作为LSTM的输入,使有用时间序列数据信息增大;
3.2)LSTM特征提取:LSTM由忘记门、输入门、内部记忆单元和输出门来控制细胞状态,通过这些门控功能来进行信息传递,提取时间序列数据的特征,公式如下:遗忘门ft=σ(Wf·[ht‑1,xt]+bf)
输入门it=σ(Wi·[ht‑1,xt]+bi)
内部记忆单元
输出门ot=σ(Wo·[ht‑1,xt]+bo)
ht=ot*tanh(Ct)
其中xt为时间序列数据的输入,ht为时间序列数据的输出,W和b分别为权重和偏置值,σ表示sigmoid()激活函数,tanh表示tanh()激活函数;经过LSTM对时间序列数据的处理之后,输入到全连接层。