利索能及
我要发布
收藏
专利号: 2019104256791
申请人: 重庆大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-22
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于级联超分辨率网络与改进Faster R-CNN的隧道行人目标检测方法,其特征在于:步骤S1:训练超分辨率网络,得到SRCNN超分辨率网络模型;

步骤S2:获取隧道行人训练样本并对行人进行标注;

步骤S3:根据上一步标注信息得到训练样本中隧道行人的尺寸大小和长宽比例;然后采用K-Means聚类算法对上述步骤得到的行人尺寸大小和长宽比例进行聚类,得到最终适合隧道行人目标的锚边框尺寸比例;

步骤S4:训练Faster R-CNN网络,获取训练好的模型;

步骤S5:采用训练好的SRCNN模型和Faster R-CNN模型对隧道行人目标进行检测,得到检测结果。

2.根据权利要求1所述的基于级联超分辨率网络与改进Faster R-CNN的隧道行人目标检测方法,其特征在于:所述步骤S1具体包括以下子步骤:步骤S11:获取原始低分辨率图像,采用插值算法将低分辨率图像放大,得到超分辨率网络的训练样本;

步骤S12:构建SRCNN超分辨率网络,根据训练样本对超分辨率网络进行训练,得到SRCNN超分辨率网络模型。

3.根据权利要求1所述的基于级联超分辨率网络与改进Faster R-CNN的隧道行人目标检测方法,其特征在于:所述步骤S2中,是从隧道视频中抽取图像帧,组成训练样本,然后采用标注工具对图片中的行人进行标注。

4.根据权利要求1所述的基于级联超分辨率网络与改进Faster R-CNN的隧道行人目标检测方法,其特征在于:所述步骤S4中包括以下步骤:步骤S41:制作VOC格式数据集;

步骤S42:搭建训练网络;

步骤S43:对模型进行预训练;

步骤S44:使用步骤S43获取的预训练模型在训练样本上进行训练,得到最终训练好的Faster R-CNN模型。

5.根据权利要求1所述的基于级联超分辨率网络与改进Faster R-CNN的隧道行人目标检测方法,其特征在于:所述步骤S5包括以下子步骤:步骤S51:将待检测图片输入训练好的SRCNN超分辨率网络,得到分辨率放大的图片;

步骤S52:将上一步放大后的图片输入训练好的Faster R-CNN网络模型进行检测,得到最终的检测结果。

6.基于级联超分辨率网络与改进Faster R-CNN的隧道行人目标检测装置,其特征在于,包括:超分辨率网络训练模块:采用算法将低分辨率图像放大,得到超分辨率网络的训练样本并根据训练样本对超分辨率网络进行训练,得到SRCNN超分辨率网络模型。

行人训练样本获取模块:用于从隧道视频中抽取图像帧,组成训练样本,然后采用标注工具对图片中的行人进行标注;

Faster R-CNN网络训练模块:首先获取预训练模型,并在训练样本上继续对预训练模型进行训练,得到最终训练好的检测模型;

检测模块:采用超分辨率网络训练模块和Faster R-CNN网络训练模块得到的训练好的模型对隧道行人目标进行检测,得到检测结果。

7.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-5任一项所述的方法。

8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1-5任一项所述的方法。