利索能及
我要发布
收藏
专利号: 2017101263718
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-01-15
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于卷积特征和空间视觉词袋模型的场景识别方法,其特征在于,包括:

对原始数据库中的数据进行扩增,生成第一场景图像,所述第一场景图像包括多个与原数据相似、标签不变的训练数据;

根据所述第一场景图像构建卷积神经网络模型;

将所述第一场景图像和待分类图像分别输入到构建好的卷积神经网络模型,分别得到第一场景图像的图像卷积特征和待分类图像的图像卷积特征;

根据得到的图像卷积特征用空间视觉词袋模型生成特征编码词典,所述得到的图像卷积特征为第一场景图像的图像卷积特征和待分类图像的图像卷积特征;

根据所述特征编码词典分别获取所述第一场景图像的最终直方图信息和待分类图像的最终直方图信息;

根据预设的分类器、第一场景图像的最终直方图信息和待分类图像的最终直方图信息对待分类图像分类,首先对用户给定的样本场景图像构建其词袋模型,并和待分类图像数据库中的词袋直方图逐一进行相似性匹配,再结合特定的分类器,根据图像间特征差异的大小对待分类图像库进行排序,将落在预设的阈值范围内的图像队列作为和用户给定的样本景图像类似的场景分类结果,包括:提取待分类图像的SIFT特征;根据待分类图像的SIFT特征和图像卷积特征采用预设的分类器对待分类图像进行分类,SIFT特征是从图像的原始像素出发得到的,图像卷积特征是通过卷积网络模型层数的增加,得到的不断抽象,最终通过实验加权融合进行分类得到的;

对低层次的SIFT特征词袋分类结果和卷积特征词袋分类结构进行融合,并且调节权值,得到最终分类结果。

2.根据权利要求1所述的基于卷积特征和空间视觉词袋模型的场景识别方法,其特征在于:根据所述第一场景图像构建卷积神经网络模型之前,还包括:对第一场景图像预处理;所述预处理包括降噪和增强对比度。

3.根据权利要求2所述的基于卷积特征和空间视觉词袋模型的场景识别方法,其特征在于:所述对第一场景图像预处理,包括对第一场景图像采用拉普拉斯滤波算法来降低光照影响,降低光照情况下拍摄图像噪声,以及对第一场景图像采用直方图均衡化增加灰度值的动态范围,增强图像整体对比度。

4.根据权利要求1所述的基于卷积特征和空间视觉词袋模型的场景识别方法,其特征在于:所述对原始数据库中的数据进行扩增,生成第一场景图像包括:对原始数据库中的数据使用仿射变换、水平翻转和弹性裁切的随机组合来进行扩增,生成多个与原数据相似、标签不变的训练数据作为第一场景图像。

5.根据权利要求1所述基于卷积特征和空间视觉词袋模型的场景识别方法,其特征在于:所述根据所述特征编码词典分别获取所述第一场景图像的最终直方图信息和待分类图像的最终直方图信息,包括:将得到的图像卷积特征图像当做提取的局部特征并利用空间视觉词袋模型,计算特征点与码书中视觉单词之间的距离集合,采取软分配编码进行特征编码,形成第一场景图像和待分类图像的直方图矢量;所述特征点指局部特征,所述码书为所述特征编码词典。

6.一种基于卷积特征和空间视觉词袋模型的场景识别装置,其特征在于,包括:

扩增模块,用于对原始数据库中的数据进行扩增,生成第一场景图像,所述第一场景图像包括多个与原数据相似、标签不变的训练数据;

卷积神经网络模型构建模块,用于根据所述第一场景图像构建卷积神经网络模型;

卷积特征获取模块,用于将所述第一场景图像和待分类图像分别输入到构建好的卷积神经网络模型,分别得到第一场景图像的图像卷积特征和待分类图像的图像卷积特征;

词典生成模块,用于根据得到的图像卷积特征用空间视觉词袋模型生成特征编码词典,所述得到的图像卷积特征为第一场景图像的图像卷积特征和待分类图像的图像卷积特征;

直方图信息获取模块,用于根据所述特征编码词典分别获取所述第一场景图像的最终直方图信息和待分类图像的最终直方图信息;

分类模块,用于根据预设的分类器、第一场景图像的最终直方图信息和待分类图像的最终直方图信息对待分类图像分类;用于首先对用户给定的样本场景图像构建其词袋模型,并和待分类图像数据库中的词袋直方图逐一进行相似性匹配,再结合特定的分类器,根据图像间特征差异的大小对待分类图像库进行排序,将落在预设的阈值范围内的图像队列作为和用户给定的样本景图像类似的场景分类结果;

所述分类模块包括:

SIFT特征提取单元,用于提取待分类图像的SIFT特征;

分类单元,用于根据待分类图像的SIFT特征和图像卷积特征采用预设的分类器对待分类图像进行分类,SIFT特征是从图像的原始像素出发得到的,图像卷积特征是通过卷积网络模型层数的增加,得到的不断抽象,最终通过实验加权融合进行分类得到的;

所述分类模块还用于对低层次的SIFT特征词袋分类结果和卷积特征词袋分类结构进行融合,并且调节权值,得到最终分类结果。

7.根据权利要求6所述的基于卷积特征和空间视觉词袋模型的场景识别装置,其特征在于,还包括:第一预处理模块,用于对第一场景图像预处理;所述预处理包括降噪和增强对比度。

8.根据权利要求6所述的基于卷积特征和空间视觉词袋模型的场景识别装置,其特征在于,还包括:第二预处理模块,用于对待分类图像预处理;所述预处理包括降噪和增强对比度。