1.一种基于深度学习的模式预报产品降尺度方法,其特征在于,包括以下步骤:
S1、选择数值模式和目标区域,并采集目标区域的辅助数据、低分辨率数值模式预报数据、高分辨率观测数据,并对数据进行预处理,构成降尺度数据集,将降尺度数据集划分为训练集、验证集和测试集,其中,训练集和验证集用于训练阶段,测试集用于测试;
S2、搭建基于改进卷积神经网络的深度学习模型,包括辅助信息处理部分、特征提取部分和降尺度部分,辅助信息处理部分包括第一至第五卷积和激活模块,以及第一至第三卷积模块,特征提取部分包括第六至第十五卷积和激活模块、第一至第七批标准化模块、第一至第三残差注意力模块以及第一至第四组合模块,降尺度部分包括第十六至第十八卷积和激活模块、第四卷积模块、第八批标准化模块、第一和第二最近邻插值模块以及第五和第六组合模块;
输入辅助数据依次经过第一至第四卷积和激活模块后,得到的第一特征图一路经第一卷积模块的卷积处理后得到第一跳跃连接特征图,另一路经第五卷积和激活模块处理后,得到的第二特征图一路经过第二卷积模块的卷积处理后得到第二跳跃连接特征图,另一路经过第三卷积模块的卷积处理后,得到接入特征提取部分的特征图;
低分辨率数值模式预报数据经特征提取部分的第六卷积和激活模块处理后,输入第一组合模块,与辅助信息处理部分的接入特征提取部分的特征图组合得到第一组合特征图;
第一组合特征图经第七卷积和激活模块处理后,一路输出作为第三跳跃连接特征图跳跃连接接入第四组合模块;另一路依次经过第八卷积和激活模块、第一批标准化模块后,一路输出作为第四跳跃连接特征图跳跃连接接入第三组合模块,另一路依次经过第九卷积和激活模块、第二批标准化模块后,一路输出作为第五跳跃连接特征图跳跃连接接入第二组合模块,另一路依次经过第十卷积和激活模块、第三批标准化模块、第十一卷积和激活模块、第四批标准化模块、第十二卷积和激活模块后输入第二组合模块,与第五跳跃连接特征图组合得到第二组合特征图;第二组合特征图依次经过第五批标准化模块、第一残差注意力模块、第十三卷积和激活模块后输入第三组合模块,与第四跳跃连接特征图组合得到第三组合特征图;第三组合特征图依次经第六批标准化模块、第二残差注意力模块、第十四卷积和激活模块后输入第四组合模块,与第三跳跃连接特征图组合得到第四组合特征图;第四组合特征图依次经第七批标准化模块、第三残差注意力模块、第十五卷积和激活模块后,得到第四特征图;
第四特征图经降尺度部分的第一最近邻插值模块后输入第五组合模块,与辅助信息处理部分的第二跳跃连接特征图组合,得到第五组合特征图;第五组合特征图依次经第八批标准化模块、第十六卷积和激活模块、第二最近邻插值模块后输入第六组合模块,与辅助信息处理部分的第一跳跃连接特征图组合,得到第六组合特征图;第六组合特征图依次经第十七卷积和激活模块、第十八卷积和激活模块、第四卷积模块处理后,得到模型输出;
S3、采用训练集和验证集随机分批次对步骤S2搭建的基于改进卷积神经网络的深度学习模型进行训练,得到训练好的降尺度误差最小的基于改进卷积神经网络的深度学习模型,然后用测试集对训练好的模型进行测试;
S4、基于所需时间的低分辨率预报数据生成高分辨率降尺度预报产品;
收集与步骤S1中相同目标区域但不同时间的低分辨率预报数据,与步骤S1中相同的辅助数据,共同组成输入变量输入步骤S3中训练好的基于改进卷积神经网络的深度学习模型中得到所需时间的高分辨降尺度预报产品。
2.根据权利要求1所述的一种基于深度学习的模式预报产品降尺度方法,其特征在于,步骤S1中高分辨率观测数据的分辨率与目标分辨率相同;辅助数据为高分辨率地面高程数据。
3.根据权利要求1所述的一种基于深度学习的模式预报产品降尺度方法,其特征在于,步骤S1中数据预处理包括:
首先,对辅助数据、低分辨率数值模式预报数据、高分辨率观测数据进行标准化处理,标准化公式为:
其中,M为待标准化的辅助数据、低分辨率数值模式预报数据或高分辨率观测数据矩阵,Mstd为标准化后的结果,mean(M)表示M的平均值,std(M)表示M的标准差;
然后,对标准化后的低分辨率数值模式预报数据与辅助数据中的海洋部分赋空值,再分别对标准化后的辅助数据、低分辨率数值模式预报数据、高分辨率观测数据用最近邻插值在海洋区域进行填充。
4.根据权利要求1所述的一种基于深度学习的模式预报产品降尺度方法,其特征在于,步骤S2中第一至第十八卷积和激活模块中的激活函数为:ReLU(xi)=max(0,xi)
其中,xi为特征图的元素;
第一至第八批标准化模块中的批标准化公式为:
其中,γ、β为可训练参数,∈为一定值,X为特征图矩阵,E[X]为特征图矩阵X的均值,Var[X]为特征图矩阵X的方差。
5.根据权利要求1所述的一种基于深度学习的模式预报产品降尺度方法,其特征在于,步骤S2中降尺度部分的最近邻插值进行上采样的公式为:其中,dstX、dstY分别为放大后特征图的格点横纵坐标,dstWidth、dstHeight分别为放大后特征图的长与宽,srcX、srcY分别为原特征图的格点横纵坐标,srcWidth、srcHeight分别为原特征图的长与宽。
6.根据权利要求1所述的一种基于深度学习的模式预报产品降尺度方法,其特征在于,步骤S2中第一至第三残差注意力模块为融合了非局地注意力机制的Res2net模块,具体为:输入特征图依次做卷积、批标准化运算并激活后,得到第一次激活的特征图,一路与后续特征图相加;另一路在通道维度上平均分为四份分别进行操作:第一份特征图不做处理,待后续与其他几份特征图组合;第二份特征图做同大小卷积、批标准化运算并激活,得到第二份特征图的结果;第二份特征图的结果一路待后续与其他几份特征图组合,另一路与第三份特征图组合,对组合后的特征图做同大小卷积运算、批标准化并激活,得到第三份特征图的结果;第四份特征图与第三份特征图的结果组合,最终得到第四份特征图的结果;最后将第一至第四份特征图的结果在通道维度上组合,之后对这组特征图做卷积运算、批标准化并激活,得到组合四份特征图后的第二次激活的特征图;
组合四份特征图后第二次激活的特征图一路与后续特征图相加,另三路分别做三个同大小卷积运算,得到三组通道数为原来一半的特征图,之后分别改变三组特征图的矩阵形状,将三维矩阵转变为二维矩阵,改变后的三组特征图的矩阵分别为列数为通道数的第一矩阵、行数为通道数的第二矩阵、列数为通道数的第三矩阵;之后第一矩阵与第二矩阵做矩阵乘法得到注意力权重矩阵,将注意力权重矩阵用Softmax激活函数激活后与第三矩阵做矩阵乘法,改变得到特征图的矩阵形状与组合四份特征图后第二次激活的特征图的矩阵形状相同,进行一次卷积运算后与组合四份特征图后第二次激活的特征图相加,然后进行卷积运算后与第一次激活的特征图相加,最终得到残差注意力模块的输出。
7.根据权利要求1所述的一种基于深度学习的模式预报产品降尺度方法,其特征在于,步骤S3中基于改进卷积神经网络的深度学习模型的训练方法为监督学习,根据损失函数得到高分辨率观测数据与低分辨率预报数据的差异,然后通过梯度下降更新模型参数,损失函数为:’
其中,N为数据格点总数,i为格点位置,yi为观测数据i格点的数值,yi 为模型结果i格点的数值。
8.一种基于深度学习的模式预报产品降尺度系统,其特征在于,包括:
数据采集及处理模块,用于采集目标区域的地面高程数据、低分辨率数值模式预报数据、高分辨率观测数据,并对数据进行预处理,构成降尺度数据集,将降尺度数据集划分为训练集、验证集和测试集,其中,训练集和验证集用于训练阶段,测试集用于测试;
模型搭建模块,用于搭建基于改进卷积神经网络的深度学习模型,包括辅助信息处理部分、特征提取部分和降尺度部分,辅助信息处理部分包括第一至第五卷积和激活模块,以及第一至第三卷积模块,特征提取部分包括第六至第十五卷积和激活模块、第一至第七批标准化模块、第一至第三残差注意力模块以及第一至第四组合模块,降尺度部分包括第十六至第十八卷积和激活模块、第四卷积模块、第八批标准化模块、第一和第二最近邻插值模块以及第五和第六组合模块;输入辅助数据依次经过第一至第四卷积和激活模块后,得到的第一特征图一路经第一卷积模块的卷积处理后得到第一跳跃连接特征图,另一路经第五卷积和激活模块处理后,得到的第二特征图一路经过第二卷积模块的卷积处理后得到第二跳跃连接特征图,另一路经过第三卷积模块的卷积处理后,得到接入特征提取部分的特征图;低分辨率数值模式预报数据经特征提取部分的第六卷积和激活模块处理后,输入第一组合模块,与辅助信息处理部分接入特征提取部分的特征图组合得到第一组合特征图;第一组合特征图经第七卷积和激活模块处理后,一路输出作为第三跳跃连接特征图跳跃连接接入第四组合模块;另一路依次经过第八卷积和激活模块、第一批标准化模块后,一路输出作为第四跳跃连接特征图跳跃连接接入第三组合模块,另一路依次经过第九卷积和激活模块、第二批标准化模块后,一路输出作为第五跳跃连接特征图跳跃连接接入第二组合模块,另一路依次经过第十卷积和激活模块、第三批标准化模块、第十一卷积和激活模块、第四批标准化模块、第十二卷积和激活模块后输入第二组合模块,与第五跳跃连接特征图组合得到第二组合特征图;第二组合特征图依次经过第五批标准化模块、第一残差注意力模块、第十三卷积和激活模块后输入第三组合模块,与第四跳跃连接特征图组合得到第三组合特征图;第三组合特征图依次经第六批标准化模块、第二残差注意力模块、第十四卷积和激活模块后输入第四组合模块,与第三跳跃连接特征图组合得到第四组合特征图;第四组合特征图依次经第七批标准化模块、第三残差注意力模块、第十五卷积和激活模块后,得到第四特征图;第四特征图经降尺度部分的第一最近邻插值模块后输入第五组合模块,与辅助信息处理部分的第二跳跃连接特征图组合,得到第五组合特征图;第五组合特征图依次经第八批标准化模块、第十六卷积和激活模块、第二最近邻插值模块后输入第六组合模块,与辅助信息处理部分的第一跳跃连接特征图组合,得到第六组合特征图;第六组合特征图依次经第十七卷积和激活模块、第十八卷积和激活模块、第四卷积模块处理后,得到模型输出;
模型训练模块,用于采用训练集和验证集随机分批次对搭建的基于改进卷积神经网络的深度学习模型进行训练,得到训练好的基于改进卷积神经网络的深度学习模型,并采用测试集进行测试;
预报模块,用于采集与S1中相同目标区域的高分辨率地面高程数据,与S1中相同目标区域但不同时间低分辨率预报数据,共同组成输入变量输入训练好的深度学习模型中得到目标时间高分辨降尺度预报产品。
9.一种装置设备,其特征在于,包括存储器和处理器,其中:
存储器,用于存储能够在处理器上运行的计算机程序;
处理器,用于在运行所述计算机程序时,执行如权利要求1‑7任一项所述一种基于深度学习的模式预报产品降尺度方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被至少一个处理器执行时实现如权利要求1‑7任一项所述一种基于深度学习的模式预报产品降尺度方法的步骤。