利索能及
我要发布
收藏
专利号: 2022111793374
申请人: 淮阴工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于LG‑CenterNet模型的复杂道路场景目标检测方法,其特征在于,包括以下步骤:

(1)对复杂道路场景的图像进行处理,获取到含有多种类别的道路目标图像,对图像中的道路目标进行类别和位置标记,构建出复杂的道路场景数据集并进行预处理;

(2)构建目标检测LG‑CenterNet模型,并将上述的道路目标数据集通过LG‑CenterNet模型进行训练得到模型S;所述LG‑CenterNet模型包括Backbone模块、层级引导注意力模块、Scales Encoder模块、反卷积模块、特征增强模块和Centerpoints预测模块;

(3)使用训练好的模型S对复杂道路目标通过Center points预测模块以热力图的形式进行目标定位、边框大小划分和类别预测,并将得到的结果在视频或者图像上进行显示输入相应的效果;

所述步骤(2)实现过程如下:

(21)LG‑CenterNet模型中提出新的MresneIt50作为Backbone模块,MresneIt50由多个残差块组成,其中将4个残差模块提取到的特征图记为E1,通道数为512;将6个残差块提取到的特征图记为E2,通道数为1024;将3个通道数提取到的特征图记为E3,通道数为2048;

(22)将Backbone提取到的特征图E1、E2、E3输入到层级引导注意力模块中,其主要的结构包括两个分支:全局池化分支和层级引导分支,将通道数为512的特征图E1输入到全局池化分支,通过全局最大池化层和上采样层操作获得EC1;将通道数为512、1024、2048的特征图E1、E2、E3输入到层级引导分支中,通过一系列的平均池化和卷积操作并配合上采样得到EC2;将EC1和EC2使用add进行特征联合获得EC3,从而减少计算参数;

(23)将提取到的EC3输入到Scales Encoder模块,进行一系列的卷积和残差模块运算后得到EC4;

(24)将提取到的EC4输入到反卷积模块,反卷积模块由3个deconv组组成,通过每次deconv组的卷积运算将特征图尺寸不断放大,同时通道数不断降低,得到尺度为128×128×64的特征图记为EC5;

(25)将特征图EC5输入到特征增强模块进行卷积运算得到尺度大小为128×128×64特征图EC6,P‑FEM由3×3的Poly‑Scale Convolution、批标准化、ReLU激活函数和Sigmoid激活函数构成,主要是为了提高特征图中的局部信息的相关性,增强其对特征的表达能力。

2.根据权利要求1所述的一种基于LG‑CenterNet模型的复杂道路场景目标检测方法,其特征在于,步骤(1)所述的构建出复杂的道路场景数据集并进行预处理是通过将像素不一和复杂道路场景的图像进行归一化处理,将图像的大小归一化为512×512像素大小,再通过批标准化、ReLU激活函数和最大池化操作得到分布均匀的特征目标样本。

3.根据权利要求1所述的一种基于LG‑CenterNet模型的复杂道路场景目标检测方法,其特征在于,所述步骤(3)实现过程如下:Centerpoints预测模块通过对训练好的模型S对输入的图片进行分类预测,将原始图像生成尺度与EC6大小一致的heatmap图,随后通过分别计算热力图的损失值记为Lh,目标长宽的损失值记为Ls和中心点偏移量的损失值记为Lf来确定目标的位置和大小并生成最后的分类定位的heatmap;其中总体的网络损失为:Ld=Lk+λsLs+λfLf

其中λs=0.1,λf=1;对于输入图片大小为512×215的图像来说其通过该网络生成的特征图为H×W×C,则Lk、Ls和Lf计算公式分别为:其中,AHWC为图像中目标标注的真实值,A'HWC为图像的预测值,α和β分别为2和4,N为图像中关键点的个数,s'pk为预测尺寸,sk为真实尺寸,p为图像中目标的中心点位置。

4.一种基于LG‑CenterNet模型的复杂道路场景目标检测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被加载至处理器时实现根据权利要求1‑3任一项所述的基于LG‑CenterNet模型的复杂道路场景目标检测方法。