买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种网络构建方法及城市场景实时语义分割方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种网络构建方法及城市场景实时语义分割方法

￥31200

专利号： 202310293401X

申请人：南京信息工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-24

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种城市场景实时语义分割方法，其特征在于，应用于目标语义分割模型，所述城市场景实时语义分割方法包括：获取城市场景数据集并进行数据预处理，将预处理后的图像数据输入至目标语义分割模型，获取目标语义分割模型的输出，得到城市场景语义分割结果；

目标语义分割模型建立过程包括：

利用骨干网络、条形池化语义增强模块SPSEM和门控融合模块GFM，构建编码器模块；

利用6个上下文指导模块CGM，构建解码器模块；

将编码器模块的输出端与解码器模块的输入端连接，将解码器模块的输出端与拼接运算层的输入端连接，将拼接运算层的输出端与卷积层的输入端连接，将卷积层的输出端与上采样层的输入端连接，构成初始语义分割模型；

利用样本数据训练初始语义分割模型，得到目标语义分割模型；

其中，利用骨干网络、条形池化语义增强模块SPSEM和门控融合模块GFM，构建编码器模块，包括：骨干网络包括四个阶段，第一阶段输出端与第一门控融合模块GFM1的输入端连接，第二阶段输出端与第二门控融合模块GFM2的输入端连接，第三阶段输出端与第三门控融合模块GFM3的输入端连接，第四阶段输出端与SPSEM的输入端连接；

利用6个上下文指导模块CGM，构建解码器模块，包括：

第一上下文指导模块CGM1的输入端分别连接SPSEM的输出端和GFM3的输出端，第二上下文指导模块CGM2的输入端分别连接CGM1的输出端和GFM2的输出端，第三上下文指导模块CGM3的输入端分别连接CGM2的输出端和GFM1的输出端，第四上下文指导模块CGM4的输入端分别连接CGM2的输出端和CGM3的输出端，第五上下文指导模块CGM5的输入端分别连接CGM1的输出端和CGM3的输出端，第六上下文指导模块CGM6的输入端分别连接CGM3的输出端和SPSEM的输出端；

将解码器模块的输出端与拼接运算层的输入端连接，包括：

将CGM3的输出端、CGM4的输出端、CGM5的输出端以及CGM6的输出端分别连接拼接运算层的输入端。

2.根据权利要求1所述的城市场景实时语义分割方法，其特征在于，条形池化语义增强模块SPSEM包含五个并行分支，第一分支由1×1卷积构成，第二分支由3×3卷积和3×3膨胀卷积构成，第三分支由3×3卷积和3×3膨胀卷积构成，第四分支由3×3卷积和3×3膨胀卷积构成，第五分支由条形池化层构成，将五个并行分支的输出端分别连接第一拼接层的输入端，第一拼接层的输出端连接1×1的卷积层输入端；

门控融合模块GFM由信息发送端和信息接收端构成，信息发送端包括门控模块Gate、全局平均池化GAP层和Sigmoid函数层，信息接收端包括门控模块Gate、取反模块、全局平均池化GAP层和Sigmoid函数层，将信息发送端的输出端连接信息接收端的输入端；

上下文指导模块CGM包含两个并行分支，第一分支由1×1卷积和3×3卷积构成，第二分支由1×1卷积和上采样UP构成，将两个并行分支的输出端分别连接融合运算的输入端。

3.根据权利要求2所述的城市场景实时语义分割方法，其特征在于，信息发送端包括门控模块Gate、全局平均池化GAP层和Sigmoid函数层，具体包括：第一特征连接第一门控模块Gate1的输入端，第一门控模块Gate1的输出端和第一特征分别连接第一乘法运算的输入端，第二特征连接第二门控模块Gate2的输入端，第二门控模块Gate2的输出端和第二特征分别连接第二乘法运算的输入端，第三特征连接第三门控模块Gate3的输入端，第三门控模块Gate3的输出端和第三特征分别连接第三乘法运算的输入端，第一乘法运算的输出端、第二乘法运算的输出端及第三乘法运算的输出端分别连接第一融合运算的输入端，第一融入运算的输出端依次连接全局平均池化GAP层和Sigmoid函数层，Sigmoid函数层的输出端和第一融合运算的输出端分别连接第四乘法运算的输入端；

信息接收端包括门控模块Gate、取反模块、全局平均池化GAP层和Sigmoid函数层，具体包括：第四特征连接第四门控模块Gate4的输入端，第四门控模块Gate4的输出端和第四特征分别连接第五乘法运算的输入端，第四门控模块Gate4的输出端连接取反模块的输入端，取反模块的输出端和第四乘法运算的输出端分别连接第六乘法运算的输入端，第五乘法运算的输出端、第六乘法运算的输出端以及第四特征分别连接第二融合运算的输入端，第二融合运算的输出端依次连接全局平均池化GAP层和Sigmoid函数层，Sigmoid函数层的输出端和第二融合运算的输出端分别连接第七乘法运算的输入端；其中取反模块用于将第四门控模块Gate4的输出I进行1‑I运算。

4.根据权利要求1所述的城市场景实时语义分割方法，其特征在于，将城市场景数据集进行数据预处理，包括：将数据集中的图片以及其对应标签进行缩放、左右反转、随机裁剪和随机旋转，得到第一图像。

5.根据权利要求4所述的城市场景实时语义分割方法，其特征在于，将预处理后的图像数据输入至目标语义分割模型，包括：将第一图像输入至骨干网络，利用骨干网络的第一阶段得到特征X1，利用骨干网络的第二阶段得到特征X2，利用骨干网络的第三阶段得到特征X3，利用骨干网络的第四阶段得到特征X4；

将特征X2、X3和X4输入至GFM1的信息发送端，得到特征F1，再将特征X1和特征F1输入至GFM1的信息接收端，得到特征F5；

’ ’

将特征X1、X3和X4输入至GFM2的信息发送端，得到特征F1，再将特征X2和特征F 1输入至’GFM2的信息接收端，得到特征F5；

将特征X1、X2和X4输入至GFM3的信息发送端，得到特征F”1，再将特征X3和特征F”1输入至GFM3的信息接收端，得到特征F”5；

将特征X4输入至SPSEM，得到特征S。

6.根据权利要求5所述的城市场景实时语义分割方法，其特征在于，将预处理后的图像数据输入至目标语义分割模型，还包括：利用CGM1对特征S和特征F”5进行整合上采样，得到特征C1；

’

利用CGM2对特征C1和特征F5进行整合上采样，得到特征C2；

利用CGM3对特征C2和特征F5进行整合上采样，得到特征C3；

利用CGM4对特征C2和特征C3进行整合上采样，得到特征C4；