利索能及
我要发布
收藏
专利号: 2022104498186
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度学习的目标检测方法,其特征在于:包括以下步骤:S1、创建训练集,初始化训练:包括模型初始化、初次训练和锚框优化,包括:S11、模型初始化:

使用moco‑v2模型先随机初始化,输入最初始图像,数据集可以为Pascal VOC、COCO,学习率定为0.05,迭代10000次,锚框初步定为25个位置、纵横比、规模的矩形框;

初次训练的损失函数为:

其中q为一个查询表示,k+为key样本的正样本,τ是一个温度超参数,N为样本数;

S12、优化锚,保存检测成功图片:

根据数据集中输入图片的groud‑truth值,将其中Iou值大于0.5的锚框保留,舍弃其余的锚框;

S13、提取目标:

将这些检测成功的图像的groud‑truth中候选框的目标全部裁剪出来;

S2、目标嵌入,重构训练集:包括图像增强和目标嵌入重组,训练模型,计算损失函数,更新模型的参数包括以下步骤:S21、图像增强:

S211、将裁剪出来的目标先进行一个翻转;

S212、进行色彩随机抖动,将每一个色彩信道中随机增加一个值;

S213、平均分为4或9等分,每一部分称为一个part,每一个part随机旋转10°到30°位置打乱;

S214、使用编码器将每个部分的特征提取出来,再整合为一个,再将其合成为新的图像,称为重构图像;

S22、目标嵌入重组:将检测出的原始图像候选框的目标称为原始图像,和重构图像组合到一起,成为组合目标集,原始图像称为l,重构图像称为p;

S3、训练模型,计算损失函数,更新模型的参数:包括对模型重新训练,计算损失函数,进行深度学习;

S4、重复S3。

2.根据权利要求1所述的一种基于深度学习的目标检测方法,其特征在于:所述S12中,Iou指的是两个区域重叠的部分除以两个区域的集合部分得出的结果Overlap代表重叠区域,Union代表两个区域的并集区域。

3.根据权利要求1所述的一种基于深度学习的目标检测方法,其特征在于:S3中,将组合目标集的图像进行对比学习,所述图像包括原始图像和原始图像,原始图像和重构图像,重构图像和重构图像。

4.根据权利要求3所述的一种基于深度学习的目标检测方法,其特征在于:所述目标嵌入的对比损失函数包括以下四种:原始图像和原始图像: 原始图像和重构图像:重构图像和重构

图像: ;

其中,符号 代表着对图像取特征。