利索能及
我要发布
收藏
专利号: 2018103607014
申请人: 浙江工商大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-07
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多尺度循环注意力网络的交通标识符检测方法,其特征在于,该方法包括以下步骤:(1)构建交通标识符检测模型:所述交通标识符检测模型由用于图像特征提取的卷积神经网络特征提取模型和用于提高小目标检测精度的多尺度循环注意力网络模型复合而成;

所述卷积神经网络特征提取模型的构建方法如下:

使用深层残差网络提取原始图像的初始特征并输入编解码器;

编解码器的编码器部分实现下采样、解码器部分实现上采样,通过上、下采样得到不同尺度的特征图Xk,通过残差学习得到每个尺度下的特征;

所述多尺度循环注意力网络模型构建方法如下:

使用通道数为1、卷积核为1×1的卷积层,对该尺度下的特征进行卷积操作,得到每个尺度的初始注意力图;

通过卷积操作分别获得当前尺度初始注意力图 的上采样注意力图 和下采样注意力图 下标k为尺度标号;将下采样注意力图 初始注意力图 和上采样注意力图 进行级联,使用通道数为1、卷积核为1×1的卷积层对级联结果进行卷积操作,获得新的当前尺度的非标准化注意力图 将非标准化注意力图 归一化到0-1之间,得到标准化注意力图 循环上述操作,在每次循环开始时,将上一轮循环得到的标准化注意力图作为该轮循环的初始注意力图 直到获得的注意力图目标区域与原始图像目标区域的误差小于设定门限,再将每个尺度的最终注意力图的通道数扩张到该尺度下的卷积特征大小,再与该卷积特征进行Hadamard乘积得到该尺度的环境上下文特征,将所有尺度的环境上下文特征加和,从而得到该原始图像的环境上下文特征c;

建立原始图像的环境上下文特征与感兴趣目标外接框的映射关系;

(2)得到检测结果:利用训练样本对所述的交通标识符检测模型进行训练,得到训练好的交通标识符检测模型;测试时将待检测的图像输入训练好的交通标识符检测模型中,得到检测结果。

2.如权利要求1所述的基于多尺度循环注意力网络的交通标识符检测方法,其特征在于,所述卷积神经网络特征提取模型的基础网络采用经改进的Resnet-101网络:将conv5_x阶段删除,并将conv4_x阶段的步长由2修改为1。

3.如权利要求1所述的基于多尺度循环注意力网络的交通标识符检测方法,其特征在于,所述卷积神经网络特征提取模型的编解码器采用端到端End-to-End学习模式。

4.如权利要求1所述的基于多尺度循环注意力网络的交通标识符检测方法,其特征在于,所述非标准化注意力图 标准化注意力图 环境上下文特征c的公式分别为:其中,f为基于后融合(late-fusion)的特征融合函数,Xk表示第k个特征图;将 的通道数扩张到Xk的通道数,得到张量 ⊙为Hadamard乘积。

5.如权利要求4所述的基于多尺度循环注意力网络的交通标识符检测方法,其特征在于,采用最新的融合方式, 可以表示为如下和的形式:或者可以表示为级联形式:

其中 和 分别为实现注意力图上采样和下采样的网络参数,上采样通过半像素卷积或反卷积实现,下采样通过步长为2的卷积实现,Concate为级联操作,Wk将级联结果返回成通道数为1的注意力图。

6.如权利要求1所述的基于多尺度循环注意力网络的交通标识符检测方法,其特征在于,所述卷积神经网络特征提取模型采用编解码器模型以及残差网络的跳跃连接的想法,以加强特征;同时添加额外的反卷积层,以连续增加特征图的分辨率。

7.如权利要求1所述的基于多尺度循环注意力网络的交通标识符检测方法,其特征在于,对交通标识符检测模型进行训练的过程为:先在ILSVRCCLS-LOC数据集上进行预训练,卷积神经网络的权重和偏置服从标准差为

0.01的高斯分布,初始化网络;

之后采用Tsinghua-Tencent 100K和German Traffic Sign Detection Benchmark数据集对多尺度循环注意力网络模型进行微调。

8.如权利要求1所述的基于多尺度循环注意力网络的交通标识符检测方法,其特征在于,所述交通标识符检测模型训练阶段采用GPU进行计算。