利索能及
我要发布
收藏
专利号: 202210839178X
申请人: 成都东方天呈智能科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度级联有监督学习的老鼠目标检测方法,其特征在于,包括以下步骤:步骤S1,设计深度级联有监督学习的老鼠目标检测的网络模型,所述网络模型由主干部分神经网络和多个粗选多分支模块构成;所述网络模型的网络结构采用级联结构,在每个粗选多分支模块中都设置有两种损失函数,一种是分类识别损失函数,另外一种是定位回归损失函数;

主干部分神经网络采用设计的网络结构搭建具有层次性的主干部分神经网络结构;

所述主干部分神经网络从前至后由卷积层、批归一化层和激活函数层组成;

所述主干部分神经网络利用卷积层的特性层层构建出不同尺度的特征图,尺度依次递减;

每个粗选多分支模块添加在两种尺度之间,采用级联的结构逐步提升候选区域建议集合的质量;

所述粗选多分支模块分为两个分支,共两个输入,分别为高层次特征和低层次特征;

所述粗选多分支模块从前至后由卷积层、批归一化层、激活函数层、全连接层、特征上采样层、特征下采样层、重置图生成层、全局平均池化层、特征相乘层、特征相加层以及多头变形自注意力模块构成;

所述粗选多分支模块用于生成粗候选建议区域集合,所述粗选多分支模块利用重置图生成层生成重置图,并使用全局平均池化层、卷积层、激活函数层生成全局注意力图;

步骤S2,将包含老鼠目标的图像数据和标注信息数据根据数据格式分为网络模型的训练集和测试集;

步骤S3,利用边界框标注信息在包含老鼠目标的图像数据样本中裁剪出对应区域,然后使用canny算子计算出标注边缘检测图;

步骤S4,根据主干部分神经网络初步提取精加工的深度特征信息,通过粗选多分支模块对所述特征信息进行细化增强,并粗生成候选建议区域进行三次分类识别和定位回归,所述分类识别和定位回归包括第一次分类识别和定位回归、第二次分类识别和定位回归以及第三次分类识别和定位回归,最后使用网络模型进行第四次分类识别和定位回归;

步骤S5,预设相关超参数,随着网络模型的不断迭代训练更新权重参数,直至迭代次数等于最大迭代次数后停止训练,最后在真实场景下的监控视频测试最优网络模型。

2.根据权利要求1所述的一种基于深度级联有监督学习的老鼠目标检测方法,其特征在于,所述重置图包括:所述重置图的生成层由上一级的粗候选建议区域集合与特征上下采样分支结合计算得到的;在特征图上对粗候选建议区域对应的区域进行目标边缘粗生成,通过优化计算预测边缘图与所述标注边缘检测图之间的误差指导模型生成粗边缘检测图,然后对除区域之外的特征统一用常数表示,最后得到重置图。

3.根据权利要求2所述的一种基于深度级联有监督学习的老鼠目标检测方法,其特征在于,所述步骤S4中粗生成候选建议区域进行三次分类识别和定位回归的过程包括:将所述重置图与所述全局注意力图结合指导网络模型学习,并使用分类识别损失函数和定位回归损失函数指导图像样本进行分类识别和定位回归;

依次进行三次分类识别和定位回归,分别输出粗选候选建议区域集合。

4.根据权利要求1所述的一种基于深度级联有监督学习的老鼠目标检测方法,其特征在于,所述步骤S1中的分类识别损失函数和定位回归损失函数包括:所述分类识别损失函数采用交叉熵损失函数,所述定位回归损失函数采用平滑L1损失函数。

5.根据权利要求1所述的一种基于深度级联有监督学习的老鼠目标检测方法,其特征在于,所述步骤S3中的边界框标注信息为包含老鼠的图像上人工标注的边界框。

6.根据权利要求1所述的一种基于深度级联有监督学习的老鼠目标检测方法,其特征在于,所述步骤S5中的相关超参数包括最大迭代次数、学习率和衰减率。