1.基于大数据的地理测绘数据处理方法,其特征在于,所述地理测绘数据处理方法包括以下步骤:基于Hadoop和Spark建立大数据处理平台,实时采集地理测绘数据,基于大数据处理平台对采集到的原始数据进行智能格式转换、自适应坐标系统一和动态噪声过滤预处理,得到预处理测绘数据;
将预处理后的多源数据输入基于改进ConvNeXt架构的共享主干网络中,将共享主干网络与私有分支网络相结合,提取数据的共享特征和私有特征;
利用空间注意力机制和通道注意力机制将所述共享特征和私有特征进行融合,生成自适应加权的融合特征图;
将所述融合特征图输入Transformer编码器识别环境状态,输出地理信息识别结果;
所述将预处理后的多源数据输入基于改进ConvNeXt架构的共享主干网络中,将共享主干网络与私有分支网络相结合,提取数据的共享特征和私有特征,包括:将原始ConvNeXt的卷积残差块替换为深度卷积,将ReLU激活函数替换为GELU激活函数,在每个卷积层后新增LayerNorm归一化层,得到共享主干网络;
将预处理测绘数据输入改进共享主干网络,以最小化特征重构误差为目标,利用Adam优化器进行训练;
所述将预处理后的多源数据输入基于改进ConvNeXt架构的共享主干网络中,将共享主干网络与私有分支网络相结合,提取数据的共享特征和私有特征,包括:对不同类型的测绘数据,设计3类私有分支网络,包括影像数据私有分支,点云数据私有分支和矢量数据私有分支;
将遥感影像输入共享主干到影像私有分支,LiDAR点云输入共享主干到点云私有分支,网络前向传播过程中,共享主干输出共享特征,私有分支输出私有特征;
所述利用空间注意力机制和通道注意力机制将所述共享特征和私有特征进行融合,生成自适应加权的融合特征图,包括:获取共享特征和私有特征,通过卷积操作将两类特征的空间维度统一,对统一维度后的特征图执行全局平均池,得到空间注意力增强特征;
对空间注意力增强特征执行全局最大池化和全局平均池化,将两个结果拼接后输入层全连接层,生成通道权重向量;
将通道权重向量与空间注意力增强特征逐通道相乘,生成自适应加权的融合特征图;
所述将所述融合特征图输入Transformer编码器识别环境状态,输出地理信息识别结果,包括:将融合特征图输入Transformer编码器,执行前向传播得到地理信息识别结果,通过阈值判断进行筛选,输出地理信息识别结果。
2.如权利要求1所述的基于大数据的地理测绘数据处理方法,其特征在于,所述基于Hadoop和Spark建立大数据处理平台,实时采集地理测绘数据,基于大数据处理平台对采集到的原始数据进行智能格式转换、自适应坐标系统一和动态噪声过滤预处理,得到预处理测绘数据,包括:基于Hadoop生态系统部署核心组件,包括HDFS分布式文件系统、YARN资源调度框架,集成Spark框架部署SparkCore基础计算引擎、SparkStreaming实时数据处理模块和SparkSQL结构化数据查询模块,建立大数据处理平台;
实时采集地理测绘数据,至少包括点云数据、影像流数据、遥感卫星影像数据;
通过SparkSQL读取地理测绘数据的文件信息,识别数据格式生成数据格式标签并对不同格式数据执行适配转换。
3.如权利要求1所述的基于大数据的地理测绘数据处理方法,其特征在于,所述基于Hadoop和Spark建立大数据处理平台,实时采集地理测绘数据,基于大数据处理平台对采集到的原始数据进行智能格式转换、自适应坐标系统一和动态噪声过滤预处理,得到预处理测绘数据,包括:提取地理测绘数据的元数据信息,识别当前坐标系类型,基于测绘行业标准,建立常见坐标系间的转换映射表;
利用Proj4地理投影库对不同坐标系的数据执行批量转换,转换过程中实时计算转换误差,若误差超阈值则调整转换参数;
通过SparkCore对预处理数据进行统计分析,识别噪声类型,利用K近邻滤波算法对噪声数据进行降噪,得到预处理测绘数据。
4.基于大数据的地理测绘数据处理系统,用于执行如权利要求1所述的基于大数据的地理测绘数据处理方法,其特征在于,所述地理测绘数据处理系统包括以下模块:测绘数据采集模块,用于基于Hadoop和Spark建立大数据处理平台,实时采集地理测绘数据,基于大数据处理平台对采集到的原始数据进行智能格式转换、自适应坐标系统一和动态噪声过滤预处理,得到预处理测绘数据;
数据特征提取模块,用于将预处理后的多源数据输入基于改进ConvNeXt架构的共享主干网络中,将共享主干网络与私有分支网络相结合,提取数据的共享特征和私有特征;
数据特征融合模块,用于利用空间注意力机制和通道注意力机制将所述共享特征和私有特征进行融合,生成自适应加权的融合特征图;
测绘数据识别模块,用于将所述融合特征图输入Transformer编码器识别环境状态,输出地理信息识别结果。
5.如权利要求4所述的基于大数据的地理测绘数据处理系统,其特征在于,所述数据特征融合模块包括以下子模块:卷积子模块,用于获取共享特征和私有特征,通过卷积操作将两类特征的空间维度统一,对统一维度后的特征图执行全局平均池,得到空间注意力增强特征;
生成子模块,用于对空间注意力增强特征执行全局最大池化和全局平均池化,将两个结果拼接后输入层全连接层,生成通道权重向量;
相乘子模块,用于将通道权重向量与空间注意力增强特征逐通道相乘,生成自适应加权的融合特征图。
6.如权利要求4所述的基于大数据的地理测绘数据处理系统,其特征在于,所述数据特征融合模块包括以下子模块:输出子模块,用于将融合特征图输入Transformer编码器,执行前向传播得到地理信息识别结果,通过阈值判断进行筛选,输出地理信息识别结果。