利索能及
我要发布
收藏
专利号: 2023106745587
申请人: 盐城工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于数据增强和特征融合的改进SSD目标检测方法,其特征在于,包括如下步骤:S1、基于SSD算法的输入要求对数据集进行适应性处理;并且在每个训练批次中随机选择一部分图像进行数据增强,生成增强后的训练样本;

S2、对SSD模型改进:

将VGG16模型替换为ResNet‑50模型;

将卷积层替换为三路融合卷积;

加入一条自深向浅的递归反向路径将深层语义信息传回浅层进行特征融合;

S3、将训练样本输入至改进后的SSD模型中进行迭代训练:S4、使用训练好的改进后的SSD模型对数据集中的测试集进行目标检测;

在步骤S2中,三路融合卷积配置成通过对输入特征进行最大池化路、膨胀卷积路和普通卷积路操作,实现对特征的多尺度提取和信息融合;

将最大池化路、膨胀卷积路和普通卷积路的输出特征图按通道维度进行拼接,形成新的特征图。

2.根据权利要求1所述的一种基于数据增强和特征融合的改进SSD目标检测方法,其特征在于:在步骤S1中,将VOC数据集中的图像和标注文件加载到内存中,并以适应SSD算法的输入要求对图像进行处理;以及对标注文件进行解析获取相应信息。

3.根据权利要求1所述的一种基于数据增强和特征融合的改进SSD目标检测方法,其特征在于:在步骤S1中,数据增强手段包括Mosaic、MixUp和CopyPaste,其中,在训练的最后几十次关掉数据增强手段。

4.根据权利要求1所述的一种基于数据增强和特征融合的改进SSD目标检测方法,其特征在于:在步骤S2中,VGG16模型替换为ResNet‑50模型,具体为:将VGG16的模型架构替换为ResNet‑50的模型架构;

根据ResNet‑50的预训练权重,对网络中的参数进行初始化;

调整输入数据的尺寸,使其适配ResNet‑50模型的输入要求;

通过卷积和池化层提取图像特征,通过全连接层和Softmax层进行分类。

5.根据权利要求1所述的一种基于数据增强和特征融合的改进SSD目标检测方法,其特征在于:在步骤S2中,通过反卷积和权重相加融合不同尺度的特征图。

6.根据权利要求1所述的一种基于数据增强和特征融合的改进SSD目标检测方法,其特征在于:在步骤S3中,训练过程中,使用损失函数计算目标分类和回归的损失,并进行梯度反向传播和参数更新;直到模型收敛或达到预定的训练轮数。

7.根据权利要求1所述的一种基于数据增强和特征融合的改进SSD目标检测方法,其特征在于:在步骤S4中,基于改进后的SSD模型输出的目标框和类别信息进行评估,评估计算指标包括检测精度、召回率和平均精度。