1.一种基于多模态数据的城市洪涝快速制图方法,其特征在于,所述方法包括以下步骤:S1:数据预处理,将获取的降雨站数据生成水深栅格文件作为模型输入,筛选社交媒体数据并生成洪水淹没点数据;
S2:构建数据集,根据生成的洪涝淹没点数据以及随机生成的负样本数据,构建训练集、验证集和测试集;基于遥感影像提取水体范围;
S3:生成权重,根据空间因素和数据源因素生成总体权重,用于后续洪涝淹没概率模型的计算;
S4:洪涝淹没概率制图,定义洪涝淹没概率制图模型,通过模型预训练与微调,得到洪涝淹没概率图;
S5:洪涝淹没范围制图,基于洪涝淹没概率图,通过自适应边缘检测算法确定自适应阈值,并通过融合模块得到洪涝淹没范围图,并对制图结果进行精度评价;
其中,所述S3包括以下步骤:
S31:空间因素权重定义,空间因素权重的计算方式如下:
式中,n为洪涝淹没点个数,deni是指密度函数在一定范围内与核函数进行卷积得到的值,对于点i,dpi是从洪涝淹没点p到点i的欧氏距离,z由AdamW优化器优化;
S32:数据源因素权重定义,数据源因素权重基于不同洪涝淹没点的置信水平得到,权重的赋值依赖于使用偏好信息主观加权法对数据源的可靠性评价,不同数据来源类型不同,雨量站、官方报告、腾讯救援数据、微博网民数据的权重分别为4、3.5、3、1.5;
S33:总体权重定义,总体权重用于消除不同洪涝淹没点在空间关系和数据来源上的差异,总体权重计算基于以下两个假设:(1)某一地区洪涝淹没点密度越大,该地区越容易被洪水淹没;(2)洪涝淹没点数据来源越权威,洪涝淹没点权重越大,具体的计算方式如下:式中,wp为总体权重,wp_swf和wp_st分别表示空间因素权重和数据源因素权重,n为洪涝淹没点个数,c和d为空间因素和数据源两个权重因子影响的调整参数,为了减弱数据源因素对总权重的影响,避免不同数据源之间存在过多差异,将c和d分别设为1和0.5;
其中,所述S4包括以下步骤:
S41:洪涝淹没概率制图模型定义,为了更好地描述洪涝概率制图模型,将洪涝淹没点P进行以下定义:(1)i点离P点越近,i点被淹没的概率越大;(2)海拔相对于P点越低,被淹没的概率越大;(3)在距离P点一定距离内存在被P点影响的概率;(4)P点周围洪涝淹没点越多,淹没范围越大;因此,洪涝淹没概率的计算公式如下:式中,n和M分别为洪涝淹没点个数和区域内栅格像元个数;hwp是洪涝淹没点的水深;hp和hi分别为洪涝淹没点p和点i的高程;dpi为洪涝淹没点p到点i的欧氏距离;a和b是由AdamW优化器优化的参数,wp为总体权重;
S42:洪涝淹没概率制图模型预训练,预训练通过使用小样本数据即总数据集数量的
30%,进行快速训练,以获得洪涝淹没概率制图模型的初始参数;
S43:洪涝淹没概率制图模型微调,根据预训练模型的参数,通过使用所有样本数据进行训练,以获得洪涝淹没概率制图模型的最优参数并进行制图。
2.根据权利要求1所述的一种基于多模态数据的城市洪涝快速制图方法,其特征在于,所述S1包括以下步骤:S11:降雨数据预处理,将降雨站点的实测逐时水深资料通过克里金插值生成水深栅格文件,用于后续模型输入;
S12:社交媒体数据预处理。
3.根据权利要求1所述的一种基于多模态数据的城市洪涝快速制图方法,其特征在于,所述S2包括以下步骤:S21:洪涝淹没点及负样本数据集构建;
S22:洪涝淹没范围提取,使用DeeplabV3+网络结构从遥感影像中提取洪涝淹没范围。
4.根据权利要求1所述的一种基于多模态数据的城市洪涝快速制图方法,其特征在于,所述S5包括以下步骤:S51:自适应边缘检测算法定义,提取淹没范围的自适应边缘检测算法是通过生成的洪水概率图局部区域的离群值聚集来定义的,该区域被认为是本研究的初始淹没区域,自适应边缘检测算法定义了一个高斯窗口G和一个自适应阈值T,S52:高斯窗口定义,高斯窗口的计算方式如下:
式中,G(x,y)为窗口内各位置的高斯权重,x和y表示图像像素的空间坐标,对应于它们各自的行号和列号;σ是两个维度x和y的标准差,具体计算方式如下:σ=0.3×((blocksize‑1)×0.5‑1)+0.8 (5)式中,blocksize为高斯窗口的大小;
S53:自适应阈值定义,自适应阈值用于在洪涝淹没概率图中划分洪涝与非洪涝区域,具体计算方式如下:式中,M分别为区域内栅格像元个数,xk和yk分别表示区域内不同像元的空间坐标,T(x,y)为一个像元的阈值,G(xk,yk)为邻域内每个像元的高斯权重,I(xk,yk)为邻域内每个像元的像素值;
S54:融合模块定义,利用融合模块对从遥感影像中提取的洪涝淹没范围和根据自适应阈值在洪涝淹没概率图中提取的洪涝淹没范围进行融合,从而得到最终的洪涝淹没范围并制图,具体计算方式如下:IA=e*GFIA+f*KIA (7)
式中,IA为最终的洪涝淹没范围;GFIA为从遥感影像中提取的洪涝淹没范围;KIA为由洪涝淹没概率制图模型和自适应阈值确定的洪涝淹没范围;e和f分别为权重因子,分别为2和1;
S55:洪涝淹没范围制图精度评价,采用总体精度、F1‑score和平均绝对误差来评价洪涝淹没范围制图性能。
5.根据权利要求1所述的一种基于多模态数据的城市洪涝快速制图方法,其特征在于,S12社交媒体数据预处理,包括以下步骤:S121:建立一个停用词列表,停用词用来过滤掉大量不相关的关键字,使用哈尔滨工业大学的停用词列表过滤掉与洪水无关的关键词;
S122:建立洪涝字典,通过jieba python库的中文分词方法和停止词列表,得到与洪涝相关的关键词,通过字典来选择与洪涝主题相关的每一条信息,S123:建立筛选机制,筛选机制包括通配符“社区”、“道路”和其他带有地名的指标,用于获取带有地名和地址的信息;
S124:提取带有地理位置信息的社交媒体数据,根据S123中建立的筛选机制,筛选出带有地理位置信息的社交媒体数据,用于后续洪涝淹没点的提取。
6.根据权利要求1所述的一种基于多模态数据的城市洪涝快速制图方法,其特征在于,S21洪涝淹没点及负样本数据集构建,包括以下步骤:S211:投影转换,根据筛选出的带有地理位置信息的社交媒体数据,使用高德API将社交媒体中的地理位置信息转化为经纬度坐标;
S212:数据集构建,根据生成的洪涝淹没点位,在研究区域内随机生成等量的负样本数据;然后,利用相应位置的DEM和水深栅格数据,得到洪涝淹没点的高程和水深属性值;最后,将洪涝淹没点数据和负样本数据随机分为三个数据集:训练数据、验证数据、测试数据。