利索能及
我要发布
收藏
专利号: 2016105294689
申请人: 中国科学院深圳先进技术研究院
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种城市场景垃圾检测方法,其特征在于,包括如下步骤:

S10:选定VOC数据集作为垃圾检测的基础数据集,收集城市影像并挑选出含有无序丢弃垃圾的城市影像作为候选集,按照VOC数据集定义的格式对候选集中城市影像含有无序丢弃垃圾的区域进行标注,将标注后的城市影像与VOC数据集中已有数据进行融合;

S20:在融合后的VOC数据集基础上,搭建垃圾检测的深度学习平台,在搭建的深度学习平台上,获取深度学习平台提供的进行垃圾检测的预训练模型并对预训练模型进行适应性先验参数设置;

S30:采用预训练模型对新获取城市影像进行垃圾检测,检测新获取城市影像是否存在垃圾及垃圾存在区域,给出检测结果;

所述步骤S10具体为:收集城市影像,挑选出含有无序丢弃垃圾的城市影像作为候选集,按照VOC数据集定义的格式,采用矩形选择框对候选集中城市影像含有无序丢弃垃圾的区域进行标注,标注完成后,将标注后的城市影像随机的划分为训练集、验证集和测试集,并分别将新获取的训练集、验证集和测试集同VOC数据集中已有的训练集、验证集和测试集进行融合;

所述步骤S20具体为:使用网格搜索的方法在融合后的VOC数据集上验证不同先验参数对城市影像的检测精度;选择0.001作为初始学习率,0.0005作为权值衰减量,0.9作为冲量,并从每张城市影像中挑选出N个候选区域作为子集,进行损失的反向传播从而更新预训练模型权值;

所述步骤S30具体包括:

对新获取的城市影像进行预处理,具体包括对新获取城市影像进行裁剪、缩放,和/或进行均值提取处理;

将预处理之后的城市影像输入深度学习的神经网络,得到对城市影像中候选区域的分类和位置的回归以得出检测结果。

2.根据权利要求1所述的城市场景垃圾检测方法,其特征在于,所述步骤S20具体为:

选择Caffe深度学习框架进行深度学习平台的实现,使用Model Zoo中的ZF模型作为垃圾检测任务的预训练模型。

3.一种城市场景垃圾检测系统,其特征在于,包括:

数据融合模块,选定VOC数据集作为垃圾检测的基础数据集,收集城市影像并挑选出含有无序丢弃垃圾的城市影像作为候选集,按照VOC数据集定义的格式对候选集中城市影像含有无序丢弃垃圾的区域进行标注,将标注后的城市影像与VOC数据集中已有数据进行融合;

深度学习平台搭建模块,在融合后的VOC数据集基础上,搭建垃圾检测的深度学习平台,在搭建的深度学习平台上,获取深度学习平台提供的进行垃圾检测的预训练模型并对预训练模型进行适应性先验参数设置;

城市影像垃圾检测模块,采用预训练模型对新获取城市影像进行垃圾检测,检测新获取城市影像是否存在垃圾及垃圾存在区域,给出检测结果;

所述深度学习平台搭建模块使用网格搜索的方法在融合后的VOC数据集上验证不同先验参数对城市影像的检测精度;选择0.001作为初始学习率,0.0005作为权值衰减量,0.9作为冲量,并从每张城市影像中挑选出N个候选区域作为子集,进行损失的反向传播从而更新预训练模型权值;

所述数据融合模块收集城市影像,挑选出含有无序丢弃垃圾的城市影像作为候选集,按照VOC数据集定义的格式,采用矩形选择框对候选集中城市影像含有无序丢弃垃圾的区域进行标注,标注完成后,将标注后的城市影像随机的划分为训练集、验证集和测试集,并分别将新获取的训练集、验证集和测试集同VOC数据集中已有的训练集、验证集和测试集进行融合;

所述城市影像垃圾检测模块对新获取的城市影像进行预处理,具体包括对新获取城市影像进行裁剪、缩放,和/或进行均值提取处理;将预处理之后的城市影像输入深度学习的神经网络,得到对城市影像中候选区域的分类和位置的回归以得出检测结果。

4.根据权利要求3所述的城市场景垃圾检测系统,其特征在于,所述深度学习平台搭建模块选择Caffe深度学习框架进行深度学习平台的实现,使用ModelZoo中的ZF模型作为垃圾检测任务的预训练模型。