1.一种基于残差去噪卷积网络与移不变稀疏编码的可控源电磁数据去噪方法,其特征在于,包括以下步骤:步骤1:通过移不变稀疏编码(SISC)对实测可控源电磁数据进行信噪分离,得到高质量数据以及实测噪声;将实测噪声乘以不同的倍数,得到一系列不同幅度的噪声,分别添加到高质量数据中,得到一系列存在不同强度实测噪声的含噪信号;为提高样本的多样性,通过数值模拟生成一部分不同类型、不同信噪比的仿真噪声,添加到移不变稀疏编码提取的高质量数据中,得到一系列存在不同强度仿真噪声的含噪信号;将上述含噪信号与高质量信号配对、分段,构建可控源电磁数据样本库;
步骤2:搭建残差去噪卷积网络,把所得样本库输入残差去噪卷积网络进行训练得到针对可控源电磁数据去噪的网络模型;
步骤3:把待处理的可控源电磁含噪电磁数据输入训练好的去噪模型中进行降噪得到初步去噪结果;
步骤4:利用移不变稀疏编码对步骤3得到的去噪结果再次进行信噪分离,得到最终去噪后的信号。
2.根据权利要求1所述的基于残差去噪卷积网络与移不变稀疏编码的可控源电磁数据去噪方法,其特征在于,所述可控源电磁数据为一维周期性信号,其采样率为1200Hz;
根据数据特点把每段数据周期长度设定为1200个采样点,使得每段周期数据尺寸为1×1200。
3.根据权利要求1所述的基于残差去噪卷积网络与移不变稀疏编码的可控源电磁数据去噪方法,其特征在于,残差去噪卷积网络的样本库制作流程为:将SISC分离出来的高质量数据复制120次,编为1‑120号,在1‑30号数据中分别加入1‑30dB高斯白噪声;在31‑60号数据中分别加入1‑30dB高斯白噪声后,再分别随机加入不同幅度的脉冲噪声;在61‑90号数据中分别加入1‑30dB高斯白噪声后,再分别随机加入不同幅度的方波噪声;在91‑120号数据中分别加入1‑30倍SISC分离出的实际噪声;最终得到120对含有不同类型、不同幅度噪声的样本。
4.根据权利要求1所述的基于残差去噪卷积网络与移不变稀疏编码的可控源电磁数据去噪方法,其特征在于,残差去噪卷积网络中存在两种残差模块;
第一种恒等残差模块表示为:
xl+1=xl+F(xl,Wl), (1)式中,xl是残差块输入,xl+1是残差块输出,F(xl,Wl)是残差部分;
恒等残差块负责保证输入数据与输出数据前后尺寸一样;
第二种卷积残差模块表示为:
xl+1=h(xl)+F(xl,Wl), (2)式中,h(xl)=W'lx。W'l是1×1卷积操作,xl是残差块输入,xl+1是残差块输出,F(xl,Wl)是残差部分;
卷积残差模块负责通过一个卷积层来升维或降采样,从而保证输入数据与输出数据的形状大小一致。
5.根据权利要求1所述的基于残差去噪卷积网络与移不变稀疏编码的可控源电磁数据去噪方法,其特征在于,所述残差去噪卷积网络由输入层、隐藏层和输出层构成,其隐藏层包含若干个卷积层、批处理归一化、修正线性单元和残差模块;
所述输入层形状是:样本长度乘以通道数,即n×1;
所述隐藏层由卷积层1、卷积层2‑17、卷积层18、卷积层19、恒等残差块20、恒等残差块
21、卷积残差块22、恒等残差块23、卷积残差块24、恒等残差块25、卷积残差块26、恒等残差块27、平均池化层28共计二十八部分按顺序构成。所述隐藏层:卷积层1为:1个尺寸为3×1的卷积核和“Relu”激活函数;
卷积层2‑17为:每层都是64个尺寸为3×1的卷积核、批归一化层(BN)和“Relu”激活函数,重复16层;
卷积层18为:64个尺寸为3×1的卷积核;
卷积层19为:2个尺寸为3×1的卷积核、批归一化层(BN)和“Relu”激活函数。
恒等残差块20为:64个尺寸为3×1的卷积核、批归一化层(BN)、“Relu”激活函数和求和函数;
恒等残差块21为:64个尺寸为3×1的卷积核、批归一化层(BN)、“Relu”激活函数和求和函数;
卷积残差块22为:128个尺寸为3×1的卷积核步长为2的一维卷积、128个尺寸为1×1的卷积核步长为2的一维逐点卷积、批归一化层(BN)、“Relu”激活函数和求和函数;
恒等残差块23为:128个尺寸为3×1的卷积核、批归一化层(BN)、“Relu”激活函数和求和函数;
卷积残差块24为:256个尺寸为3×1的卷积核步长为2的一维卷积、256个尺寸为1×1的卷积核步长为2的一维逐点卷积、批归一化层(BN)、“Relu”激活函数和求和函数;
恒等残差块25为:256个尺寸为3×1的卷积核、批归一化层(BN)、“Relu”激活函数和求和函数;
卷积残差块26为:512个尺寸为3×1的卷积核步长为2的一维卷积、512个尺寸为1×1的卷积核步长为2的一维逐点卷积、批归一化层(BN)、“Relu”激活函数和求和函数;
恒等残差块27为:512个尺寸为3×1的卷积核、批归一化层(BN)、“Relu”激活函数和求和函数;
平均池化层28为:一个卷积核为3、步长为1的平均值筛选;
所述输出层:一个Dropout层、一个全连接层和求和函数;
在训练过程中输入数据的通道数会规律性递增,但在训练结束后通过全连接层改变通道数,使得输出数据大小与输入数据统一。
6.根据权利要求1所述的基于残差去噪卷积网络与移不变稀疏编码的可控源电磁数据去噪方法,其特征在于,使用移不变稀疏编码处理前,先将经过初步处理信号X分成K段,在采样率为1200Hz,每段时长为1分钟的情况下,每段所占采样点数为72000,即X=[x1,x2,…,T Txk],xk=[x1,x2,…,xN],N=72000,SISC将xk表示为基与系数的卷积之和:p
式中“*”表示卷积,编码系数向量sm,k∈R是稀疏的,即表示只有少量非零系数,ε为高斯白噪声,Q
式中||·||F表示l范数,β为一个约束,用于平衡重构误差与稀疏度,dm通常需要归一化,即 移不变稀疏编码基本流程如下:输入:初步处理信号X,特征原子的种类α,特征原子的宽度W=[W1,W2,…Wα],特征原子‑6总数L即稀疏度,最大迭代次数z,收敛目标e<10 ;
初始化:对D、s随机赋予初值;
循环执行z次以下内容:
{
系数求解,
字典更新,
}
当达到最大循环次数或达到收敛目标时停止循环;
输出:过完备字典D以及重构信号 即为提取到的有效信号。
7.根据权利要求6所述的基于残差去噪卷积网络与移不变稀疏编码的可控源电磁数据去噪方法,其特征在于,设gi,u为特征原子di平移u点补零后的原子,其长度与xk相同,且||Lgi,u||=1,最大循环次数Lmax,第L次循环后的残差为r ,第L次循环后已选原子集合ψL,则系数求解步骤如下:0
1)参数初始化,r=xk, L=1;
2)选出与当前残差最匹配的一个原子gi,u,它满足:
3)更新已选原子集合,
L
4)根据最小二乘法计算投影系数 残差r=xk‑sLψL,重构信号
5)判断L是否已经达到最大值Lmax,若没有,L=L+1,并转到步骤2)循环执行;否则,输出重构信号。
8.根据权利要求6所述的基于残差去噪卷积网络与移不变稀疏编码的可控源电磁数据去噪方法,其特征在于,所述移不变稀疏编码,字典更新通过以下步骤实现:保持系数不变,仅对基进行更新,该优化函数可以简化为:式中矩阵Ei,k表示第k个信号除去第i个基外的所有误差;将对第i个基的更新转化为求解关于di的方程组,由于di*si,k=si,k*di,首先仅分析只有第k个信号时的优化问题,相当于求解下式的解:将上述公式左边矩阵视为系数si,k的一种特殊的Toeplitz矩阵,则上式可以写作Toep(si,k)·di=Ei,k;由于系数si,k是稀疏的,矩阵Toep(si,k)中的许多行为0向量,这些0向量对结果没有影响,将这些行从矩阵Toep(si,k)中剔除,同时将向量Ei中的对应行剔除,表示为当同时考虑K个信号时,优化函数ψ(θ)可以表示为:T ‑1 T T Q×Q
将上式简写为S·di=E,根据最小二乘法可得di=(SS) (SE),矩阵(S S)∈R ,一般情况下Q<<N,因此最后就转化为求解一个小规模的线性方程组的解;这一求解过程通过Cholesky分解直接求取最优值,按照随机的顺序依次对每个基进行更新,能够求取基在本轮循环中的最优解,然后依次对基di标准化处理 即可得到完整的字典D。