1.一种基于X波段双偏振雷达数据的龙卷风识别及其路径预测方法,其特征在于:包括以下步骤:步骤1)使用X波段雷达基数据构建龙卷风识别深度学习数据集:首先以龙卷风为中心,在气象雷达基数据的两个最低仰角上6种基本数据中截取龙卷周围固定大小的数据块(W,H),组合上述12个数据块为一个正样本,样本形状为(12,W,H),再对每个观测量分别进行归一化处理,负样本截取不包含龙卷的随机天气过程中的数据;
步骤2)构造龙卷风识别深度学习模型:
以 U‑Net 模型为基础框架,编码器‑解码器结构提取特征并恢复空间分辨率;在此基础上,结合改进后的CBAM模块、CoordConv2D卷积、空间位置编码,通过跳跃连接构建TD‑block模块,替换原本Unet中的编码模块,并且在Unet的跳跃连接中加入CBAM模块,构建弱监督式轻量化的龙卷风识别模型TD‑Unet,用于专门识别龙卷风;龙卷识别弱监督学习的具体方式是,模型通过是否存在龙卷风的标签进行训练,不标注龙卷风的具体位置、形状或大小,使模型能够自主学习龙卷特征并得到龙卷风发生的位置;
步骤3)将步骤1)中得到的数据集按4:1比例划分为训练集和测试集,并将训练集输入构建的TD‑Unet模型进行训练;对训练完毕的模型在测试集上采用二分类混淆矩阵对TD‑Unet模型进行性能评估,得到客观评价指标;
步骤4)从识别结果中提取龙卷坐标,并将多个时间步识别到的坐标转化为龙卷坐标序列;剔除识别结果中存在的误报的情况,在多龙卷的情况下将不同龙卷的坐标相隔分别预测,合并相邻坐标点,以得到当前龙卷风涡旋中心的坐标;多个时间步的识别结果坐标组成历史龙卷坐标序列;
步骤5)龙卷风路径预测:
将龙卷风路径预测问题归类为二维质点运动预测问题,根据上一步过滤后并归属到多个不同龙卷过程的龙卷坐标序列分别作为龙卷风路径预测算法的输入,得到未来10步龙卷风的路径走向;
龙卷风路径预测算法具体算法为:
利用粒子滤波算法Particle Filtering解决龙卷风运动预测的非线性问题,并改进其中的状态转移方程,根据龙卷风的历史运动状态,得出当前时刻的速度与加速度,将速度和加速度作为状态转移方程的参量,得到自定义的龙卷风动态模型;基于过去带有噪声的观测点运动轨迹,根据自定义的龙卷风动态模型来估计非线性系统动态变化的状态,经过多次迭代得到未来多时刻的状态从而达到未来多时刻的路径预测。
2.根据权利要求1所述的基于X波段双偏振雷达数据的龙卷风识别及其路径预测方法,其特征在于:步骤1中正、负样本的数量比例为1:1;然后对正负样本创建索引文件并进行标记,数据块内有发生龙卷则将这一样本标记为1,没有则标记为0;最后按4:1比例划分为训练集和测试集,训练集和测试集中的正负样本比也为1:1。
3.根据权利要求1所述的基于X波段双偏振雷达数据的龙卷风识别及其路径预测方法,其特征在于:步骤2中构建TD‑Unet深度学习模型具体步骤如下:步骤2.1)改进CBAM注意力模块,突出数据的关键特征;
具体方式是针对龙卷风雷达数据特征,优化CBAM中的空间注意力模块得到iCBAM模块;
模块中的通道注意力机制能够突出不同观测量的关键特征,提升信息提取能力;空间注意力机制使得模型能够聚焦于观测量中最大值附近的特征,调整各个空间位置的特征重要性,使得模型能够聚焦于龙卷风发生区域的关键信息;有效增强了对龙卷风涡旋中心的识别效果;
,
,
,其中sigmod表示sigmod激活函数,MLP代表全连接层,AvgPool和MaxPool分别代表平均池化层和最大池化层, 代表窗口宽高为23乘23的卷积操作, 为通道注意力特征提取过程, 为空间注意力机制提取过程 为通道注意力特征提取过程;
步骤2.2)结合 iCBAM 模块与CoordConv2D卷积,改进Unet左部编码模块为TD‑block卷积模块,增强特征提取与空间信息;
具体方式是编码块中结合了iCBAM模块,先通过CoordConv2D卷积,再通过残差连接对龙卷特征进行提取;位置编码根据雷达站距离计算得到:, ,
其中, 表示第0层位置编码各个格点数值的计算, 表示第1层位置编码的计算, 和 表示雷达站点坐标, 表示雷达扫描最远距离,为比例系数使得计算结果处于合理的范围内;
为增强空间位置信息,使用CoordConv2D 卷积模块将数据特征信息和位置编码信息结合在一起;通过两个支路分别处理数据信息和位置编码信息;数据特征信息通过最大池化操作MaxPool进行降维,突出数据的关键特征;位置编码信息则通过平均池化操作AvgPool降维,减少位置编码信息的损失;
TD‑block卷积模块具体特征提取过程如下: ,, ,其中, 表示TD‑block
的输入特征图, 表示输入位置编码, 表示输出特征图, 表示激活函数, 表示位置坐标卷积, 表示iCBAM特征提取过程;
步骤2.3)改进U‑Net解码部分的数据传递机制,减少冗余信息及噪声传递;U‑Net 模型通过跳跃连接将编码器处理后的数据直接传递给解码器,在跳跃连接中加入CBAM注意力模块来增强特征的选择性传递,使得解码器在处理来自编码器的特征时,能够自动关注到最重要的部分;在每一层跳跃连接中,通过计算加权系数来动态调整不同位置特征的贡献;在解码部分,数据特征信息通过上采样将编码后的特征图恢复到原始分辨率,还原地理坐标与数据间对应关系;而解码阶段的位置编码则直接通过左部编码器的跳跃连接传递。
4.根据权利要求1所述的基于X波段双偏振雷达数据的龙卷风识别及其路径预测方法,其特征在于:步骤4具体步骤为:步骤4.1)首先对识别结果连通块进行过滤,误报点的形状相较于命中点的形状及大小都较小,根据连通块的形状大小,过滤误报点;
步骤4.2)其次以每个格点识别结果作为权重,计算整个连通块的加权坐标,作为该连通块所代表龙卷的坐标; ;其中,表示连通块中第 个格点的权重, 和 分别代表第 个格点的纬度和经度, 和分别代表整个连通块加权后的纬度和经度坐标;
步骤4.3)由于存在多龙卷的情况,需要将多个时间步上识别到的龙卷坐标归属为多个龙卷过程,来得到多个龙卷的坐标序列;
具体算法流程为:遍历所有从单个基数据文件中识别到的龙卷坐标,当前没有记录龙卷过程时,则创建龙卷过程并在该龙卷过程中加入该坐标,并标记该龙卷过程,被标记的龙卷过程在此次归属过程中不再添加新的坐标,在下次归属过程前全部取消标记;当存在龙卷过程时,则计算该坐标与所有龙卷过程最后一个坐标的距离,如果最近距离小于一个阈值,则选择距离最近的龙卷过程,将该坐标加入该龙卷过程,并标记该龙卷过程;如果最近距离大于一个阈值,则创建新的龙卷过程并在该龙卷过程中加入该坐标,并标记该龙卷过程;至此,单个时次的龙卷归属过程结束,得到多个龙卷过程坐标序列;
整个过程表示为:
初始化: ,无龙卷过程;
对每个坐标 遍历:
如果 为空: 创建新龙卷过程,并标记; 添加新过程到集合;
如果 不 为空 : 且 未 被标 记 ;
选择最小距离;
如果 : 距离最近的龙卷过程,将 加入 , 并标记 ;
如果 : 创建新龙卷过程,并标记;
添加新过程到集合;取消所有龙卷过程的标记,以准备下一时次的坐标归属。
5.根据权利要求1所述的基于X波段双偏振雷达数据的龙卷风识别及其路径预测方法,其特征在于:步骤5的算法具体为:步骤5.1)粒子滤波算法Particle Filtering基本步骤为:初始化:在开始粒子滤波算法之前,需要对系统状态进行初始化;使用先验概率分布来初始化粒子的状态;
预测:对于每个粒子,需要根据系统的动态模型来预测其下一时刻的状态;这个过程可以表示为: ,其中 表示第 个粒子在时刻 的预测状态, 表示系统的动态模型即状态转移方程, 表示控制输入量 ;
状态更新:根据观测值 和每个粒子预测的状态 来更新粒子的权重;
对于每个粒子,需要根据观测数据来更新其状态;这个过程可以表示为:计算每个粒子与实际观测值的匹配程度: ,这里
是粒子 的观测概率;
然后,归一化所有粒子的权重,使得总权重和为 1: ,其中, 为归一化后的粒子权重;
重采样:通过权重大小,对粒子进行重采样,去掉权重较小的粒子,保留对结果有显著贡献的粒子;重采样的过程可以表示为: ,其中, 表示重采样后的时刻 第个粒子状态;
状态预测:通过重采样后的粒子状态,得出系统状态的估计;这个过程可以表示为:,其中, 表示时刻 的系统状态估计;重复以上过程,以得到未来多步状态预测;
步骤5.2)具体的龙卷路径预测系统的状态转移方程为:,其中加入了控制输入量速度 、加速度
,具体表示粒子在时刻 的二维矢量速度和加速度;
具体计算如下:速度表达式如下:
, ;
速度的计算以最邻近坐标差、首尾坐标差的均值以及上一时刻速度加权和得到;
加速度的计算表达式如下: , ;
以历史加速的均值来作为当前时刻的加速度,通过加速度的引入,模型能够捕捉到龙卷风路径变化的加速或减速趋势;
步骤5.3)根据状态预测后的粒子位置计算路径预测概率场:主要元素:
粒子位置:粒子的状态是通过一组位置表示的,记为 ,其中 是第个粒子的经度, 是其纬度;
高斯核函数:用于描述每个粒子对某一位置的影响;使用高斯核函数来计算粒子对某一位置的贡献;高斯核函数的一般形式为: ,其中 是计算的目标位置(经纬度);是粒子的当前位置;是带宽参数,控制高斯核的扩展程度;
概率场计算:对于每个网格上的位置,计算所有粒子对该位置的贡献,并将它们累加起来;共同形成一个概率场;
有N个粒子 以及要计算概率场的网格位置 ,那么在每个网格点的概率值 可以通过以下步骤计算:概率场的公式描述:计算每个粒子的贡献:每个粒子 对网格点 的贡献是基于高斯核函数:,这里, 是第 个粒子对位置 的贡献, 是通过高斯核计算的权重;
总概率场:对于所有网格点 ,计算它们的概率值: ,即网格点 的概率值是所有粒子 对它的贡献的总和;
归一化概率场: 对每个网格点的概率值进行归一化,使得数值在原本分布的基础上,值域在0到1之间; ;随着迭代次数的增加,逐步增大高斯核函数的带宽。