1.一种网络构建方法,其特征在于,所述方法包括:
利用骨干网络、条形池化语义增强模块SPSEM和门控融合模块GFM,构建编码器模块;
利用6个上下文指导模块CGM,构建解码器模块;
将编码器模块的输出端与解码器模块的输入端连接,将解码器模块的输出端与拼接运算层的输入端连接,将拼接运算层的输出端与卷积层的输入端连接,将卷积层的输出端与上采样层的输入端连接,构成初始语义分割模型;
利用样本数据训练初始语义分割模型,得到目标语义分割模型。
2.根据权利要求1所述的网络构建方法,其特征在于,利用骨干网络、条形池化语义增强模块SPSEM和门控融合模块GFM,构建编码器模块,包括:骨干网络包括四个阶段,第一阶段输出端与第一门控融合模块GFM1的输入端连接,第二阶段输出端与第二门控融合模块GFM2的输入端连接,第三阶段输出端与第三门控融合模块GFM3的输入端连接,第四阶段输出端与SPSEM的输入端连接。
3.根据权利要求2所述的网络构建方法,其特征在于,利用6个上下文指导模块CGM,构建解码器模块,包括:第一上下文指导模块CGM1的输入端分别连接SPSEM的输出端和GFM3的输出端,第二上下文指导模块CGM2的输入端分别连接CGM1的输出端和GFM2的输出端,第三上下文指导模块CGM3的输入端分别连接CGM2的输出端和GFM1的输出端,第四上下文指导模块CGM4的输入端分别连接CGM2的输出端和CGM3的输出端,第五上下文指导模块CGM5的输入端分别连接CGM1的输出端和CGM3的输出端,第六上下文指导模块CGM6的输入端分别连接CGM3的输出端和SPSEM的输出端。
4.根据权利要求3所述的网络构建方法,其特征在于,将解码器模块的输出端与拼接运算层的输入端连接,包括:将CGM3的输出端、CGM4的输出端、CGM5的输出端以及CGM6的输出端分别连接拼接运算层的输入端。
5.根据权利要求1所述的网络构建方法,其特征在于,条形池化语义增强模块SPSEM包含五个并行分支,第一分支由 卷积构成,第二分支由 卷积和 膨胀卷积构成,第三分支由 卷积和 膨胀卷积构成,第四分支由 卷积和 膨胀卷积构成,第五分支由条形池化层构成,将五个并行分支的输出端分别连接第一拼接层的输入端,第一拼接层的输出端连接 的卷积层输入端;
门控融合模块GFM由信息发送端和信息接收端构成,信息发送端包括门控模块Gate、全局平均池化GAP层和Sigmoid函数层,信息接收端包括门控模块Gate、取反模块、全局平均池化GAP层和Sigmoid函数层,将信息发送端的输出端连接信息接收端的输入端;
上下文指导模块CGM包含两个并行分支,第一分支由 卷积和 卷积构成,第二分支由 卷积和上采样UP构成,将两个并行分支的输出端分别连接融合运算的输入端。
6.根据权利要求5所述的网络构建方法,其特征在于,信息发送端包括门控模块Gate、全局平均池化GAP层和Sigmoid函数层,包括:第一特征连接第一门控模块Gate1的输入端,第一门控模块Gate1的输出端和第一特征分别连接第一乘法运算的输入端,第二特征连接第二门控模块Gate2的输入端,第二门控模块Gate2的输出端和第二特征分别连接第二乘法运算的输入端,第三特征连接第三门控模块Gate3的输入端,第三门控模块Gate3的输出端和第三特征分别连接第三乘法运算的输入端,第一乘法运算的输出端、第二乘法运算的输出端及第三乘法运算的输出端分别连接第一融合运算的输入端,第一融入运算的输出端依次连接全局平均池化GAP层和Sigmoid函数层,Sigmoid函数层的输出端和第一融合运算的输出端分别连接第四乘法运算的输入端;
信息接收端包括门控模块Gate、取反模块、全局平均池化GAP层和Sigmoid函数层,包括:第四特征连接第四门控模块Gate4的输入端,第四门控模块Gate4的输出端和第四特征分别连接第五乘法运算的输入端,第四门控模块Gate4的输出端连接取反模块的输入端,取反模块的输出端和第四乘法运算的输出端分别连接第六乘法运算的输入端,第五乘法运算的输出端、第六乘法运算的输出端以及第四特征分别连接第二融合运算的输入端,第二融合运算的输出端依次连接全局平均池化GAP层和Sigmoid函数层,Sigmoid函数层的输出端和第二融合运算的输出端分别连接第七乘法运算的输入端;其中取反模块用于将第四门控模块Gate4的输出I进行1‑I运算。
7.一种城市场景实时语义分割方法,其特征在于,应用于权利要求1‑6中任一所述的网络构建方法所构建的目标语义分割模型,所述城市场景实时语义分割方法包括:获取城市场景数据集并进行数据预处理,将预处理后的图像数据输入至目标语义分割模型,获取目标语义分割模型的输出,得到城市场景语义分割结果。
8.根据权利要求7所述的城市场景实时语义分割方法,其特征在于,将城市场景数据集进行数据预处理,包括:将数据集中的图片以及其对应标签进行缩放、左右反转、随机裁剪和随机旋转,得到第一图像。
9.根据权利要求8所述的城市场景实时语义分割方法,其特征在于,将预处理后的图像数据输入至目标语义分割模型,包括:将第一图像输入至骨干网络,利用骨干网络的第一阶段得到特征X1,利用骨干网络的第二阶段得到特征X2,利用骨干网络的第三阶段得到特征X3,利用骨干网络的第四阶段得到特征X4;
将特征X2、X3和X4输入至GFM1的信息发送端,得到特征F1,再将特征X1和特征F1输入至GFM1的信息接收端,得到特征F5;
’ ’
将特征X1、X3和X4输入至GFM2的信息发送端,得到特征F1,再将特征X2和特征F 1输入至’GFM2的信息接收端,得到特征F5;
’’ ’’
将特征X1、X2和X4输入至GFM3的信息发送端,得到特征F 1,再将特征X3和特征F 1输入至’’GFM3的信息接收端,得到特征F 5;
将特征X4输入至SPSEM,得到特征S。
10.根据权利要求9所述的城市场景实时语义分割方法,其特征在于,将预处理后的图像数据输入至目标语义分割模型,还包括:’’
利用CGM1对特征S和特征F 5进行整合上采样,得到特征C1;
’
利用CGM2对特征C1和特征F5进行整合上采样,得到特征C2;
利用CGM3对特征C2和特征F5进行整合上采样,得到特征C3;
利用CGM4对特征C2和特征C3进行整合上采样,得到特征C4;
利用CGM5对特征C1和特征C3进行整合上采样,得到特征C5;
利用CGM6对特征C3和特征S进行整合上采样,得到特征C6;
将特征C3、特征C4、特征C5和特征C6进行拼接,得到特征C7;
利用卷积层将特征C7的通道数处理成分割类别数,再利用双线性插值上采样至原始输入图像的尺寸大小,得到最终的语义分割结果。