利索能及
我要发布
收藏
专利号: 2024105719946
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-01-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.融合过滤多尺度高分辨率遥感冰川提取方法,其特征在于,包括以下步骤:

步骤1,获取高分辨率遥感图像数据,对高分辨率遥感图像数据进行预处理,得到冰川数据集和对应标签数据,将冰川数据集按比例分为训练集、验证集与测试集;

步骤2,构建高分辨率遥感冰川提取模型,将训练集与验证集输入模型进行训练验证,得到训练好的遥感冰川提取模型;

步骤3,将测试集中的测试图片输入步骤2得到的模型中进行遥感图冰川识别,提高模型的准确性;

步骤2中,所述高分辨率遥感冰川提取模型为Glacier‑Unet模型,模型采用编码、解码结构,包括左半边和右半边;

其中,左半边为编码器部分,右半边为解码部分;左半边划分为五个尺度,每个尺度包含两个输出通道数相同、卷积核大小3*3卷积层,紧跟着一个整流线性修正单元ReLU和一个步长为2的最大池化;通过逐比例的卷积采样细化特征图,从特征映射的上下文中提取并保留不同尺度的特征信息,每次下采样特征图通道数量增加一倍,最后通过卷积层将编码部分跳跃链接至解码部分,完成收缩路径;

右半边的解码器根据编码部分特征构造分割图,逐步恢复遥感图像的高层特征;解码部分中的每一层都包含特征映射的上采样,通过2*2卷积上采样将特征图通道数减半,与编码部分相对应维度的特征图进行特征融合,紧跟两个3*3卷积,每个卷积后面都有个整流线性修正单元ReLU;跳跃链接即从编码直接连接至解码部分的设计,将编码器的输出与上采样操作的输出串联到解码器,并将级联后的特征映射到下一层;

步骤2中,在跳跃链接处设置有位置注意力模块和通道注意力模块,用于调整特征权重,重点学习冰川特征;

步骤2中,在位置注意力模块中,将一个局部特征 输入卷积层,分别生成三个新的特征映射图B,C和D,其中 表示C1×H×W维的实数空间,其中C1表示通道数,H表示图像的高度,W表示图像的宽度;其次,将三个特征映射图B,C和D重构成C1×N维的实数空间 从而得到三个特征映射图B,C和D的特征矩阵B1、C1、D1;其中N=H×W为像素数;将特征矩阵B1和特征矩阵C1进行矩阵乘法并且使用softmax层计算空间特征注意映射S∈N×N,用Sji表示位置i对位置j的影响;在空间特征注意映射S的转置矩阵和特征矩阵D1之间进行矩阵乘法,将生成的特征映射图重构成 格式,将重构的特征映射图乘以尺度参数α与出入特征图进行求和运算,最终生成特征图 其中尺度参数α初始为0;最终得到包含位置信息的特征图E是所有位置特征和原始特征的加权和;

Sji和Ej计算公式为:

其中exp(Bi·Cj)表示特征矩阵B1和C1的融合操作,Aj表示输入的j位置局部特征图;Bi表示i位置特征矩阵B1的矩阵图;Cj表示j位置特征矩阵C1的矩阵图;Di表示重构后的i位置特征矩阵D1的矩阵图;Ej表示最终得到的j位置的特征图,j取值为1~N,且j不等于i。

2.根据权利要求1所述的方法,其特征在于,步骤1中,所述对高分辨率遥感图像数据进行预处理,具体包括:选择对遥感图像进行剪切放大,采用重复率为0.1的滑动切割方式,将原始大尺寸冰川遥感tiff影像切割成512*512尺寸的tiff影像图,然后将tiff影像图转换为JPEG格式,合并成一个RGB图像;

对RGB图像进行随机水平翻转和随机垂直翻转,添加随机噪声和随机模糊,以及随机扭曲,并删除不包含冰川目标的图像。

3.根据权利要求2所述的方法,其特征在于,步骤2中,采用并联方式连接位置注意力模块和通道注意力模块,组成并联双通道注意力模块P‑DAM;所述位置注意力模块和通道注意力模块分别采用跳跃连接的方式将输出与输入特征图逐元素相乘;

在跳跃链接处构建门控多尺度过滤层G‑MsFL,为模型提供不同尺度的提取和特征融合方式捕捉细微冰川,门控机制有效过滤无用特征信息;并联双通道注意力模块P‑DAM将冰川边界的上下文信息进行编码作为特征图的局部特征;

在跳跃链接处编码器部分下采样的特征信息首先通过门控多尺度过滤层G‑MsFL进行特征过滤,过滤后的特征图分别输入位置卷积块和通道卷积快,对输入特征图进行通道上的线性变换、改变特征图通道数和通道维度,对应输入位置注意力模块和通道注意力模块。

4.根据权利要求3所述的方法,其特征在于,步骤2中,在通道注意力模块中,直接对局部特征 进行重构 先将特征矩阵C1和D1的转置进行矩阵乘法,再应用softmax层得到通道关注映射 用xji表示第i个通道对第j个通道的影响;在通道关注映射x和特征矩阵B1之间执行矩阵乘法运算,再乘以尺度系数β将结果重构成格式;最后与输入A进行融合相加运算得到输出 逐渐从0开始学习权重,每个通道的最终特征是所有重构通道特征与原始特征加权总和:其中,Pj表示第j通道特征图,Ai表示局部i通道的特征图,j取值为1~C1,且j不等于i。

5.根据权利要求4所述的方法,其特征在于,步骤2中,所述门控多尺度过滤层G‑MsFL用于:对编码器下采样跳跃连接至解码器部分的特征输入X进行1*1普通卷积操作,然后通过Sigmoid激活函数生成归一化后的门控张量X1,门控张量X1在0到1之间的范围内,用于动态调整后续膨胀卷积层输出的权重;接着,对输入X分别通过膨胀率[2,4,8,16]膨胀卷积层,对每个生成的多尺度过滤特征图应用批量归一化操作生成四种特征图{X2,X3,X4,X5};随后,将门控张量X1分别与特征输入X和多尺度的四种特征图{X2,X3,X4,X5}逐元素相乘得{X11,X12,X13,X14,X15},最后将{X11,X12,X13,X14,X15}加权融合完成门控多尺度过滤。

6.根据权利要求5所述的方法,其特征在于,步骤2中,所述将训练集与验证集输入模型进行训练验证,包括:采用冻结训练方法加快模型训练速度,训练轮数epochs设置为300,批处理尺寸batchsize设置为8;模型使用Adam优化器对学习率进行优化,最大学习率设置为‑3 ‑3

10 ,最小学习率为10 *0.01;模型使用权重衰减策略防止过拟合,权重衰减值设置为5*10‑4

7.根据权利要求6所述的方法,其特征在于,步骤3还包括:采用kappa系数、像素准确率pixel accuracy、平均交并比MIoU评价模型准确性:其中n为混淆矩阵的总列数,即样本类别总数;Xmm为混淆矩阵第m行m列的样本个数,即正确分类的样本个数;Xm和X+m分别为第m行的样本总数和第m列的样本总数;Num为用于精度评估的样本总数;TP表示测试样本中目标能被正确预测的概率;TN表示测试样本中非目标被准确预测成非目标的概率;FP表示测试样本中非目标被准确预测成目标的概率;FN表示测试样本中目标被准确预测成非目标的概率。