利索能及
我要发布
收藏
专利号: 2019106145350
申请人: 武汉科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于尺度注意力网络的遥感图像场景分类方法,其特征在于,包括:步骤S1:将场景数据集按预设比例划分为训练集和测试集;

步骤S2:对场景数据集中的图像进行预处理;

步骤S3:将预处理后的数据集输入到注意力模块中进行显著性检测,产生注意力图;

步骤S4:利用预训练模型初始化尺度注意力网络的参数,并采用训练集和注意力图微调尺度注意力网络,保存训练好的尺度注意力网络;

步骤S5:采用微调后的尺度注意力网络对待分类图像场景的类别进行预测,获得预测结果,将其作为分类结果;

其中,步骤S3具体包括:

步骤S3.1:将进行预处理后的图像输入到注意力模块,执行超像素分割,超像素表示为{si},i=1,...N;

步骤S3.2:从图像中提取注意力特征:包括颜色特征,纹理特征,方向特征和梯度特征;

步骤S3.3:根据一维熵筛选注意力特征,得到m个最优特征,表示为{Fk},k=1,...m;其中,一维熵由以下公式计算:式(3)中PI表示灰度值为I的像素的比例;

步骤S3.4:基于全局区域对比度和空间关系计算每一个超像素si的显著性分数Sal(si),生成初始注意力图,表示为S0,超像素si的显著性分数由以下公式计算:其中,c(si)由以下公式计算:

dis(si,sj)由以下公式计算:

上式中,

c(si)为超像素(xi,yi)与图像中心坐标(x′,y′)之间的距离,[1 a b]表示CIELAB颜色空间像素的三个颜色分量,si,sj分别表示第i,j个超像素,

(xi,yi),(xj,yj)分别表示超像素si,sj的空间坐标,Z为相邻超像素的空间距离,

β为固定常数,取值范围[1,40],

dis(si,sj)表示超像素之间的颜色-空间加权距离;

步骤S3.5:使用最大类间方差(Otsu)阈值将注意力图Sk-1,k≥1分割为显著和非显著区域,即图像的前景种子(FS)和背景种子(BS);

步骤S3.6:基于注意力图的前景种子和背景种子重新计算每一个超像素si的显著性分数Sal′(si),生成优化后的注意力图Sk,k≥1,超像素的显著性分数由以下公式计算:其中,前景种子的显著性分数计算公式为:背景种子的显著性分数计算公式为:

上式中,SalFS(·)和SalBS(·)分别表示前景和背景的显著性分数;

步骤S3.7:计算优化后的注意力图Sk的损失函数L(k),并重复步骤S3.5和S3.6,最小化L(k)的值,得到对应的最优注意力图Sk;其中,损失函数值由以下公式计算:L(k)=L1(k)+L2(k)(9)其中,L1(k)由以下公式计算:

L1(k)=(Sk-Sk-1)2                          (10)L2(k)由以下公式计算:

其中,k≥1,si,sj∈Sk,1≤i,j≤j。

2.如权利要求1所述的方法,其特征在于,步骤S2具体包括:步骤S2.1:将数据集中图像的尺寸缩放至网络要求的输入大小;

步骤S2.2:采用公式(1)对缩放后的图像I进行归一化处理:式(1)中u,std分别表示图像I的均值和标准差。

3.如权利要求1所述的方法,其特征在于,步骤S4具体包括:步骤S4.1:采用预训练模型初始化尺度注意力网络参数;

步骤S4.2:设置卷积神经网络超参数;

步骤S4.3:采用训练集和对应的注意力图,对尺度注意力网络进行多次训练,保存训练好的尺度注意力网络。

4.如权利要求1所述的方法,其特征在于,步骤S5具体包括:步骤S5.1:对待分类图像场景进行预处理,包括调整大小和归一化,得到预处理后的图像;

步骤S5.2:将预处理后的图像输入到注意力模块中进行处理,得到注意力图S;

步骤S5.3:调整预处理后的图像的大小到不同尺度,得到多尺度图像{I′k},k=1...n;

步骤S5.4:采用步骤S4得到的最优模型初始化尺度注意力网络参数;

步骤S5.5:将I′k,k=1...n输入到尺度注意力网络中提取特征{Fk},k=1...n,同时在特征提取过程中使用注意力图S与卷积层2_x、卷积层3_x、卷积层4_x、卷积层5_x输出的特征Fki作乘积,公式如下:式(1 2)中Fki表示第k种尺度第i层特征,S表示输入图像I对应注意力图,R(·)表示将图像调整到与Fki同样大小;

步骤S5.6:对多尺度特征{Fk},k=1...n使用平均池化,然后串联,得到最终的融合特征F;

步骤S5.7:使用全连接层和SoftMax分类器预测融合特征F的类别。

5.如权利要求1所述的方法,其特征在于,上述步骤S3.1所述的注意力模块包括以下部分:超像素分割、注意力特征提取、计算初始注意力图、注意力图优化和最终注意力图生成。