利索能及
我要发布
收藏
专利号: 2022115506167
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种采用改进的轻量级卷积神经网络的公共交通识别方法,其特征在于,包括以下步骤:一、获取大型公共数据集ImageNet 2012,其中包含了公共交通领域存在的绝大部分类别数据图像,并进行图像预处理;

二、改进轻量级卷积神经网络的步骤;

S1,具体包括:在卷积神经网络结构中引入轻量化通道注意力模块,采用重参数化对通道注意力模块进行参数转换,得到一个深度卷积单元;

S2、将网络结构中的ReLU激活函数进行替换,采用Swish激活函数;

S3、设计通道混洗卷积核,将输入特征图在特征通道顺序上进行反置得到反置特征图,将反置特征图与输入特征图进行元素相加操作,得到一个特征通道之间信息混合的输出特征图;

S4、设置初始通道混合系数,分别赋值到输入特征图和反置特征图,并参与到模型训练过程中,训练完成后得到模型自适应的混合系数,达到输入特征图和反置特征图的自适应混合状态;

三、将预处理后的交通图像输入改进轻量级卷积神经网络中,得到公共交通识别结果;

所述步骤S1中采用重参数化对通道注意力模块进行参数转换过程具体如下:S1‑1、在模型训练阶段,将SA‑Net混洗注意力网络的通道注意力结构中的Sigmoid操作进行裁剪,采用一组可训练的权重系数Sigmoid weight来代替;

S1‑2、在模型推理阶段,将全局均值池化操作等效成一个尺寸同输入特征图大小的深度卷积核,等效后的卷积参数值均为 其中H为输入特征图的高度,W为输入特征图的宽度;

S1‑3、在模型推理阶段,将其他可训练的通道权重系数与由全局均值池化等效的卷积核参数进行相乘及相加数学运算,得到重参数化后的通道权重系数卷积核;

所述步骤S4中使输入特征图和反置特征图进行自适应混合过程具体如下:S4‑1、在模型训练阶段,设置两组尺寸维度为C*1*1的混合系数,其中将输入特征图V的混合系数初始化为1.0,将反置特征图U的混合系数初始化为0.0,并将两组混合系数加入到模型的训练过程中,经过模型训练完毕后,将会获得最终的混合系数α和β;

S4‑2、通过重参数化,将模型训练完成后的混合系数α和β与S3所述的正、反序混洗卷积核进行参数融合,融合运算规则如下:其中αi为输入特征图第i个通道上的混合系数值;βi为反置特征图第i个通道上的混合系数值;oc_i为重参数化后,第c个混合卷积核的第i个通道上的参数值。

2.根据权利要求1所述的一种采用改进的轻量级卷积神经网络的公共交通识别方法,其特征在于,所述步骤一、获取大型公共数据集ImageNet 2012,其中包含了公共交通领域存在的绝大部分类别数据图像,并进行图像预处理,具体包括:从ImageNet官网下载ILSVRC2012图像检测数据集,其中包含了1000个物体分类,训练集包含约120万张图片,验证集包含5万张图片;在1000个物体类别中,包含了客车、自行车、轿车、卡车、摩托车、救护车、消防车、火车、校车、公交车、警车、行人、交通信号灯、交通标识牌等绝大部分公共交通领域内存在的物体种类;

对数据集中的图像进行预处理过程包括以下步骤:

步骤1:将原图像进行随机裁剪,然后将裁剪后的图像缩放为224*224尺寸的图像;

步骤2:对缩放后的图像进行图像增强,修改图像的亮度、对比度和饱和度,其中亮度、对比度和饱和度的调整范围均设置为原图的0.6‑1.4;

步骤3:对图像增强后的图像以0.5的概率进行随机水平翻转;

步骤4:对随机翻转后的图像进行归一化操作,将图像的像素值从0‑255的范围,除以

255,映射到0‑1。

3.根据权利要求1所述的一种采用改进的轻量级卷积神经网络的公共交通识别方法,其特征在于,所述步骤S2中Swish激活函数关系式如下:其中x为输入特征图信息参数,f(x)为输入特征图信息参数经过非线性映射过后的输出特征图信息参数。

4.根据权利要求1所述的一种采用改进的轻量级卷积神经网络的公共交通识别方法,其特征在于,所述步骤S3设计通道混洗卷积核,将输入特征图在特征通道顺序上进行反置得到反置特征图,将反置特征图与输入特征图进行元素相加操作,得到一个特征通道之间信息混合的输出特征图,具体包括:S3‑1、分别设计C个尺寸维度为C*1*1的正序卷积核,以及C个尺寸维度为C*1*1的反序卷积核,每个卷积核的参数设置规则如下:其中C为输入特征图的通道数;wc_i为第c个正序卷积核的第i个通道上的参数值;w′c_i为第c个反序卷积核的第i个通道上的参数值;i为每个卷积核的通道序号,i=0,1,…,C‑1;

c为每个卷积核的编号,c=0,1,…,C‑1;

S3‑2、将输入特征图和S3‑1所述的反序卷积核进行卷积运算操作,其运算规则如下:其中vi为输入特征图第i个特征通道上的特征值;uc为第c个反序卷积核与输入特征图进行卷积运算之后得到的特征通道信息;经过所述卷积运算后,就会得到一个反置特征图U,其特征通道顺序与输入特征图V刚好相反。

5.根据权利要求4所述的一种采用改进的轻量级卷积神经网络的公共交通识别方法,其特征在于,所述步骤三、将预处理后的交通图像输入改进轻量级卷积神经网络中,得到公共交通识别结果,具体包括以下步骤:步骤1:采用ubuntu20.04操作系统,RTX3060显卡作为模型训练环境;

步骤2:选择1.0x倍率大小的模型宽度进行训练,训练过程持续300000个迭代,每个迭代进行一个批次的图像训练,每批次的图像数量为256张,并采用随机抽图的方式;

步骤3:模型初始学习率设置为0.5,采用SGD优化器,动量参数设置为0.9,学习率衰减‑5值设置为4e ,以线性递减的方式将学习率从0.5降低到0;

步骤4:每隔10000个迭代进行一次模型验证,先将验证集的图像进行尺寸缩放,统一缩放到256*256尺寸大小,然后在图片的中间区域进行裁剪,裁剪尺寸为224*224;每次验证都将计算模型在验证集上的top1和top5分类检测错误率,越低即越好,经过300000个迭代后,获取训练模型最终的top1和top5分类检测错误率。