1.一种双流Swin Transformer的遥感场景分类方法,其特征在于,包含以下步骤:H×W×C
S1:处理原始遥感影像X∈R ,其中H、W、C分别是图像的高度、宽度和通道数,将图像进行灰度处理,生成单通道灰度图G;
S2:通过可导的Sobel算子,将生成横轴和纵轴的边缘图像Gx和Gy,与灰度图G在通道维度连接,形成一张三通道的边缘图像T(i)=Concat(G, Gx, Gy),其中Concat代表串联连接;
S3:将原始遥感图像T和边缘图像T(i)划分为图像块,其中n指的一张图像的图像块数目,T={x1, x2… xn},
T(i)={x1, x2… xn};
S4:将原始图像块和边缘图像块分别送入两流的Swin Transformer去分别提取特征,两流的Transformer均具有相同结构,并且它们之间的参数各自单独学习,Swin Transformer对边缘图像提取的特征较为特殊,既含有原始的影像信息,又含有边缘的强调信息;
S5:经过Swin Transformer提取的原始特征和边缘特征分别为F1和F2,经过以下形式进行融合:F’=FC(Concat(F1,F2))
其中Concat代表串联连接,FC代表全连接,F’代表融合特征;
S6:将融合特征F’送入softmax分类器,进行最终的预测。
2.根据权利要求1所述的一种具有可导Sobel算子的双流Swin Transformer遥感场景分类方法,其特征在于,所述步骤S2采用了可导的Sobel算子,将算子置入卷积核中,通过卷积操作完成边缘提取,卷积核能够在网络的反向传播过程中更新参数,以实现Sobel算子值的自适应学习。
3.根据权利要求1所述的一种具有可导Sobel算子的双流Swin Transformer遥感场景分类方法,其特征在于,所述步骤S5融合特征的同时,也对损失函数进行了重新设计,引入了辅助损失函数,通过权重系数λ控制两个损失函数的平衡,公式为:L=λLF+(1‑λ)LF1
其中LF和LF1分别是特征F’和F1的交叉熵损失函数,L是最终的损失函数。