利索能及
我要发布
收藏
专利号: 2016104387775
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种影像分类方法,其特征在于,所述方法包括:

将待分类的原始影像输入训练好的卷积神经网络得到一融合特征;其中,所述卷积神经网络包括依次相连的对所述影像至少进行卷积处理的多个特征提取处理级,所述原始影像为所述多个特征提取处理级中第一个特征提取处理级的输入,部分特征提取处理级之间还分别连接一个步长不为1的中间池化层;所述卷积神经网络还包括分别对所述原始影像以及每个步长不为1的所述中间池化层输出的输出特征至少进行卷积处理的多个特征保留处理级;所述卷积神经网络将所述多个特征保留处理级分别输出的多个输出特征以及所述多个特征提取处理级最终输出的最终输出特征的尺寸调节为与所述原始影像的尺寸一致,对尺寸调节后的所述多个输出特征以及最终输出特征进行特征融合得到所述融合特征;

根据训练好的特征与类别之间的对应关系,确定所述融合特征所对应的所述原始影像所属的类别。

2.根据权利要求1所述的方法,其特征在于,所述多个特征提取处理级的至少部分特征提取处理级包括顺次连接的卷积层、归一化处理层和非线性变换处理层。

3.根据权利要求1所述的方法,其特征在于,所述多个特征保留处理级中的每一个包括顺次连接的卷积层、归一化处理层、非线性变换处理层、丢弃层、卷积层、归一化处理层、非线性变换处理层和卷积层。

4.根据权利要求1所述的方法,其特征在于,所述对尺寸调节后的所述多个输出特征以及最终输出特征进行特征融合得到所述融合特征包括:对尺寸调节后的所述多个输出特征的对应位置的特征值相加得到第一影像特征;

将所述第一影像特征与尺寸调节后的最终输出特征的对应位置的特征值相加得到所述融合特征。

5.根据权利要求1所述的方法,其特征在于,所述多个特征提取处理级包括7-14个特征提取处理级。

6.根据权利要求1所述的方法,其特征在于,所述多个特征保留处理级包括2-7个特征保留处理级。

7.根据权利要求1所述的方法,其特征在于,所述中间池化层的卷积核大小为3×3。

8.根据权利要求1或2所述的方法,其特征在于,所述多个特征提取处理级中的卷积层的步长均为1。

9.一种影像分类系统,其特征在于,所述系统包括:

融合特征获取模块,用于将待分类的原始影像输入训练好的卷积神经网络得到一融合特征;其中,所述卷积神经网络包括依次相连的对所述影像至少进行卷积处理的多个特征提取处理级,所述原始影像为所述多个特征提取处理级中第一个特征提取处理级的输入,部分特征提取处理级之间还分别连接一个步长不为1的中间池化层;所述卷积神经网络还包括分别对所述原始影像以及每个步长不为1的所述中间池化层输出的输出特征至少进行卷积处理的多个特征保留处理级;所述卷积神经网络将所述多个特征保留处理级分别输出的多个输出特征以及所述多个特征提取处理级最终输出的最终输出特征的尺寸调节为与所述原始影像的尺寸一致,对尺寸调节后的所述多个输出特征以及最终输出特征进行特征融合得到所述融合特征;

分类模块,用于根据训练好的特征与类别之间的对应关系,确定所述融合特征所对应的所述原始影像所属的类别。

10.根据权利要求9所述的系统,其特征在于,所述多个特征提取处理级的至少部分特征提取处理级包括顺次连接的卷积层、归一化处理层和非线性变换处理层。

11.根据权利要求9所述的系统,其特征在于,所述多个特征保留处理级中的每一个包括顺次连接的卷积层、归一化处理层、非线性变换处理层、丢弃层、卷积层、归一化处理层、非线性变换处理层和卷积层。

12.根据权利要求9所述的系统,其特征在于,所述对尺寸调节后的所述多个输出特征以及最终输出特征进行特征融合得到所述融合特征包括:对尺寸调节后的所述多个输出特征的对应位置的特征值相加得到第一影像特征;

将所述第一影像特征与尺寸调节后的最终输出特征的对应位置的特征值相加得到所述融合特征。

13.根据权利要求9所述的系统,其特征在于,所述多个特征提取处理级包括7-14个特征提取处理级。

14.根据权利要求9所述的系统,其特征在于,所述多个特征保留处理级包括2-7个特征保留处理级。

15.根据权利要求9所述的系统,其特征在于,所述中间池化层的卷积核大小为3×3。

16.根据权利要求9或10所述的系统,其特征在于,所述多个特征提取处理级中的卷积层的步长均为1。