利索能及
我要发布
收藏
专利号: 2022116492354
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多种注意力语义分割的土地利用分类方法,其特征在于,包括如下步骤:

S1.设计基于多种注意力模块和特征增强层的土地利用模型:引入多种计算力计算模块的土地利用分类模型SCU‑net,所述土地利用分类模型SCU‑net是基于U‑net的网络上进行改进,能够对下采样得到的局部特征图进行上下文信息的融合与全局特征的提取,对于上采样的特征图进行特征增强用于土地利用分类,改进模型包括多种注意力结构的SC模块和特征增强层;

S2.对公开数据集进行处理,建立自己的模型数据集;

S3.利用数据集验证和对比模型的方法:对S1提出的土地利用模型进行对比实验,用于验证改进模型的准确性;

对于S1中的基于多种注意力语义分割的土地利用分类模型SCU‑net,具体包括:

S11.基础框架U‑net模型的构建:

首先对遥感图像进行7*7卷积核大小、步长为2的卷积,再进行最大池化操作,之后进入数目分别为3、4、6、3的Bottleneck结构;Bottleneck具体为由一个1*1卷积,3*3卷积和1*1卷积顺序构成的残差结构;

S12.包含多种注意力结构的SC模块构建:

所述包含多种注意力结构的SC模块的作用是结合CNN和Transformer两种不同方式的注意力计算来加强特征图对于局部和全局特征信息的采集,获取不同土地利用类型之间的联系;

S13.上采样及特征增强层的处理:

将Swin Transformer Blocks和CBAM得到的特征图进行堆叠后进行卷积调整通道数由

4096变为2048,之后进行上采样卷积使特征图大小每次还原两倍,通道数逐次变为512,

256,128,随后进入特征增强层进行特征进一步加强;

特征增强层的输入有两个,一个是上采样得到的特征图,它经过了SC模块的特征提取,其中融合了深层的语义信息与全局的有效特征,二是只进行了一次下采样处理的64通道特征图,它可以弥补图像在特征提取过程中的信息损失,对较少的土地利用类型进行特征补充以免被忽略;在特征增强层中会给两个特征图分别乘上可学习参数X1,X2,计算公式如下,其中a1和a2为自生成参数,b为常数:将两者相加后分别进行普通卷积、深度可分离卷积和自适应池化;深度可分离卷积相比普通卷积减少了计算量;通过三个分支的特征深化操作,使得分类出的有效土地利用类型得到改善,减少相似特征对分类带来的扰动,提高总体土地分类精度。

2.根据权利要求1所述的方法,其特征在于,所述包含多种注意力结构的SC模块包括两个重要组成部分:Swin Tranformer Blocks和Convolutional BlockAttention Module;

Swin Tranformer Blocks由两个连续的block组成,输入特征图经过Embeddedpatches先进行1*1的分块处理,随后沿着通道方向展平;之后经过W‑MSA模块,之后经过LayerNorm操作后进入Window Multi‑head Self‑Attention,即W‑MSA层,W‑MSA会将特征图分割成不重叠的多个窗口,然后对每个窗口内部各自进行自注意力的计算;如果给定特征图大小为H*W*C,分割窗口大小为M,则窗口多头自注意力计算复杂度为:

2 2

Ω(W‑MSA)=4HWC+2MHWC                     (1)CBAM由两部分构成:Channel Attention Module和Spatial Attention Module;输入的Feature map经过两个并行的MaxPool层和AvgPool层、Share MLP模块、求和和sigmoid激活操作最终获得通道注意力特征F’;通道注意力计算过程如式(2)和(3)所示:MC(F)=σ(MLP(AvgPool(F)))+MLP(MaxPool(F))           ( 2)与CAM不同,SAM对输入的特征图F’分别进行最大池化和平均池化之后,将两个结果进行了concatenation操作,再经过sigmoid激活得到融合了空间注意力与通道注意力的特征图F’‘;具体计算过程如式(4)和(5)所示:Ms(F)=σ(f7*7([AvgPool(F’);MaxPool(F’)]))             (4)

3.根据权利要求1所述的方法,其特征在于,S2具体为:将图片裁剪为512*512大小的图像制作数据集。

4.根据权利要求3所述的方法,其特征在于,S2中所采用的数据集为GID数据集,为了便于送入模型进行训练,将图像都裁剪为512*512大小,总共6个土地利用类型,分别为背景、森林、草地、农田、水体和建筑物,颜色分别标注为黑色、靛色、绿色、黄色、蓝色和红色;采用交叉熵损失函数进行训练。

5.根据权利要求1所述的方法,其特征在于,S3中所采用的对比模型为U‑net,PSPNet,Segnet,Deeplabv3+,所有设定相同,batchsize均设定为4,均采用交叉熵损失函数进行训练。

6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现如权利要求1~5中任一项所述的基于多种注意力语义分割的土地利用分类方法中的步骤。

7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~5中任一项所述的基于多种注意力语义分割的土地利用分类方法中的步骤。