利索能及
我要发布
收藏
专利号: 2022100305818
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-13
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于通道‑空间注意力和DeeplabV3plus的遥感影像语义分割方法,其特征在于,包括以下步骤:S1.样本采集与掩膜标注:采集遥感影像样本,得到原始遥感影像数据集及其对的地物类别掩膜数据集并将其按照7:2:1的比例划分为训练集、验证集和测试集;

S2.边缘检测算法强化纹理特征:根据所述的原始遥感影像训练数据集和验证数据集,在数据集通道构件中利用Opencv中的Canny边缘检测算子对其进行地物纹理提取,强化遥感地物类别的纹理特征;

S3.训练改进的DeeplabV3plus语义分割模型:采用经过强化纹理特征处理的数据集作为改进的DeeplabV3plus语义分割算法模型中的输入进行训练,即可得到训练后的DeeplabV3plus语义分割算法模型;

所述步骤S3具体为:

S31:构建基于通道‑空间注意力和DeeplabV3plus的遥感影像语义分割网络;

S32:将变换后的遥感影像训练数据集和验证数据集输入改进的DeeplabV3plus语义分割网络模型中,前向传播获得语义分割网络模型输出的所述变换后的遥感影像样本地物类型的形状信息;

S33.利用Focal Loss函数,将损失值按照平均化误差进行反向传播,调整所述改进DeeplabV3plus语义分割网络模型的权重,其损失函数计算公式如下γ

FL=‑(1‑pt) log(pt)         (6);

上式中,FL表示损失值,log(pt)表示模型交叉熵损失函数的结果,γ表示常数,γ=2;

S34.利用样本相似度损失函数Dice Loss函数以减少正负样本不平衡问题,将损失值按照平均化误差进行反向传播调整所述改进DeeplabV3plus语义分割网络模型的权重,得到训练后的DeeplabV3plus语义分割网络模型其损失函数计算公式如下:上式中,ti表示目标值,yi表示预测值,ε表示平滑系数,ε=1e‑5;

S4.对遥感影像进行语义分割:将遥感影像测试集数据作为训练后的DeeplabV3plus模型的输入,获取各遥感影像的语义分割结果,并计算其准确率和交并比。

2.根据权利要求1所述的一种基于通道‑空间注意力和DeeplabV3plus的遥感影像语义分割方法,其特征在于,所述步骤S1具体的:S11.采集遥感影像样本;

首先在地理空间数据云和开放网络地图接口获取城市遥感影像;对于获得的城市遥感影像进行大气校正和地理配准后得到遥感影像样本,具体过程为:

1)大气校正,在遥感影像处理软件中对城市遥感影像进行大气校正,减小云和雾对城市遥感影像清晰度的影响;

2)地理配准,在ArcGIS软件中将数据转换为相应的地理坐标系,并进行几何校正;

S12.标记遥感影像样本中的各地物类型,并进行遥感地物类型的掩膜提取;地物类型选择为建筑、水体、植被、裸地、道路;以1‑5五个阿拉伯数字对建筑、水体、植被、裸地、道路地物类型进行标注并进行掩膜提取;利用labelme工具,绘制各地物类型的形状;若遥感影像存在建筑物,则编码为1,并提取出建筑物的形状;若遥感影像存在水体,则编码为2,并提取出水体的形状;若遥感影像存在植被,则编码为3,并提取出植被的形状;若遥感影像存在裸地,则编码为4,并提取出裸地的形状;若遥感影像存在道路,则编码为5,并提取出道路的形状;得到5个地物类型的原始影像数据集以及掩膜数据集;

S13.按照7:2:1的比例划分为训练集、验证集和测试集。

3.根据权利要求1所述的一种基于通道‑空间注意力和DeeplabV3plus的遥感影像语义分割方法,其特征在于,所述步骤S2的具体步骤为:S21:将所述原始遥感影像训练数据集和验证数据集的遥感影像的尺寸统一变换为M*M像素;

S22:Canny算法采用Python‑Opencv中的Canny模块,参数threshold1=100,参数threshold2=200;

S23:对变换后的影像进行扭曲变换得到强化、变换后的遥感影像训练数据集和验证数据集。

4.根据权利要求3所述的一种基于通道‑空间注意力和DeeplabV3plus的遥感影像语义分割方法,其特征在于,所述步骤S22中Canny算法的边缘提取过程如下:S221:对原始图像进行灰度化;

S222:对图像进行高斯滤波,其中高斯滤波器公式如下:

上式中,h(x,y)表示(x,y)处的像元值,σ表示方差,k表示把滤波器维度;

S223:利用一阶偏导的有限积分计算梯度的幅值和方向,采用Sobel算子进行梯度幅值的计算,其公式如下:Sx=(a2+2a3+a4)‑(a0+2a7+a6)     (4);

Sy=(a0+2a1+a2)‑(a6+2a5+a4)      (5);

上式中,Sx表示X方向卷积核模板,Sy表示Y方向卷积核模板,K表示待处理点的领域点标记矩阵,G[i,j]表示[i,j]处像元的幅值;

S224:对梯度幅值进行非极大值抑制;

S225:双阈值算法检测和连接边缘。