1.一种基于级联SSD和单目深度估计的前向车辆距离检测方法,其特征在于,包括以下步骤:S1、获取前向车辆训练样本和深度估计数据集;
S2、搭建骨干网络;
S3、搭建目标检测网络;
S4、搭建深度估计子网络;
S5、基于级联SSD网络和单目深度估计前向车辆距离检测网络的训练;
S6、基于K‑means聚类特征点的选取和距离检测。
2.根据权利要求1所述的基于级联SSD和单目深度估计的前向车辆距离检测方法,其特征在于,所述S1包括以下步骤:S11、下载KITTI数据集,所述KITTI数据集中包含车辆训练图片、标注文件、每张图片对应的相机和雷达标定参数和点云文件;
S12、对KITTI数据集进行数据清洗,筛选出标注有误的图片并剔除;
S13、采用K‑means聚类选择出合适的锚框个数和高宽比;
S14、统计KITTI数据集的深度信息,为后续优化深度估计模型做准备;
S15、随机将KITTI数据集的80%作为训练集,20%作为测试集。
3.根据权利要求2所述的基于级联SSD和单目深度估计的前向车辆距离检测方法,其特征在于,所述S2包括以下步骤:S21、选取VGG‑16作为特征提取的骨干网络的基础,并在此基础上进行修改;
S22、将训练图片下采样至Conv4‑3分辨率大小,再通过3个3×3卷积层,获得图片目标细节的低级别特征图δ0;接着将fc7层特征上采样至Conv4‑3分辨率大小,获得特征图δ1,然后将Conv5‑3通过反卷积上采样后获得特征图δ2,最后将δ0、δ1、δ2三个特征图与Conv4‑3进行通道维度的特征融合,实现特征增强,得到融合后的特征图ψ0;
S23、将ψ0作为串联ASPP的输入,ASPP的空洞率分别设置为2和3,再将通过每个ASPP后的特征层ψ1、ψ2提取出来,将ψ0、ψ1、ψ2在通道上叠加,并使得其和原始Conv4‑3通道数目一致,得到特征图ψ。
4.根据权利要求3所述的基于级联SSD和单目深度估计的前向车辆距离检测方法,其特征在于,所述S3包括以下步骤:S31、将目标检测子网络采用SSD网络为基础进行改进,首先将检测网络中的锚框个数和尺寸更改为S13中的得到的尺寸;
S32、在S23中得到的特征图ψ基础上,额外添加3组卷积层,每组卷积层由1个步长为2的
1×1卷积和1个3×3卷积组成,共用4个尺度的特征图构建特征金字塔,作为目标检测网络的初检网络,用来分类背景和前景;
S33、在初检网络的基础上,对每个尺度的特征图采用可变形卷积,以缓解锚框机制造成的特征不对齐问题。
5.根据权利要求4所述的基于级联SSD和单目深度估计的前向车辆距离检测方法,其特征在于,所述S4包括以下步骤:S41、在S23中得到的特征图ψ基础上,通过额外的3层卷积层,每组卷积层由1个步长为2的1×1卷积和1个3×3卷积组成,得到特征层σ0;
S42、在特征层σ0的基础上,通过恒等映射与反卷积层进行上采样,将反卷积图像大小变为原图的1/4大小。
6.根据权利要求5所述的基于级联SSD和单目深度估计的前向车辆距离检测方法,其特征在于,所述S5包括以下步骤:S51、设计总体损失函数,包括目标检测损失函数、单目估计网络损失函数和感知损失函数;
S52、将网络输入图片大小设置为300*300,初始学习率设置为0.003,学习率调整为多项式衰减,batch‑size设置为16;
S53、将模型训练先迭代50万次,然后抑制深度估计网络分支,将目标检测分支迭代15万次后,再对整个网络迭代20万次。
7.根据权利要求6所述的基于级联SSD和单目深度估计的前向车辆距离检测方法,其特征在于,所述S6包括以下步骤:S61、以原始图像作为输入,通过训练好的模型,得到图像中的车辆检测置信度和检测框以及该图像的单目深度图像;
S62、得到检测框的坐标(x1,y1,x2,y2),中心点坐标表示为:以此中心点横向坐标来划分车辆为上下两个部分,下部分包含了车尾或者车头的大部分信息,也是车车之间距离最近点的所在,以此作为深度估计聚类集合;
S63、采用K‑means聚类算法,对S62得到的集合进行聚类,主要聚类为前景和背景两类,最后采用前景簇聚类中心点作为测距特征点并输出距离信息。