利索能及
我要发布
收藏
专利号: 2018105001850
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图像识别方法,其特征在于,所述方法包括:

获取待识别图像;

采用神经网络模型中的卷积层对所述待识别图像进行特征提取,得到特征图;

对第一卷积层集合中的卷积层输出的特征图对应的通道中选取的第一通道集合进行实例归一化IN处理;对第二卷积层集合中的卷积层输出的特征图对应的通道中选取的第二通道集合进行批归一化BN处理,得到所述待识别图像的识别结果;其中,所述第一卷积层集合和所述第二卷积层集合是从所述神经网络模型的卷积层中选取的,所述第一通道集合和所述第二通道集合包含的通道不同;

输出所述待识别图像的识别结果。

2.根据权利要求1所述的方法,其特征在于,所述神经网络模型的训练过程,包括:从所述神经网络的卷积层中确定第一卷积层集合和所述第二卷积层集合;

对所述第一卷积层集合中的每一卷积层输出的特征图进行IN处理;

对所述第二卷积层集合中的每一卷积层输出的特征图进行BN处理。

3.根据权利要求2中所述的方法,其特征在于,所述第一卷积层集合和所述第二卷积层集合组成的集合为所述神经网络的所有卷积层中的全部或部分。

4.根据权利要求2中所述的方法,其特征在于,所述第一卷积层集合与所述第二卷积层集合不具有交集,或者,所述第一卷积层集合与所述第二卷积层集合具有交集;或者,所述第二卷积层集合为所述第一卷积层集合的子集合。

5.根据权利要求2中所述的方法,其特征在于,所述对所述第一卷积层集合中的每一卷积层输出的特征图进行IN处理,包括:从所述第一卷积层集合中的每一所述卷积层输出的特征图对应的通道中确定第一通道集合;

对所述第一通道集合进行IN处理。

6.根据权利要求2中所述的方法,其特征在于,所述对所述第二卷积层集合中的每一卷积层输出的特征图进行BN处理,包括:从所述第二卷积层集合中的每一所述卷积层输出的特征图对应的通道中确定第二通道集合;

对所述第二通道集合进行BN处理。

7.根据权利要求2至6任一项中所述的方法,其特征在于,所述第一通道集合为所述第一卷积层集合中的每一所述卷积层输出的特征图对应的所有通道的全部或部分;所述第二通道集合为所述第二卷积层集合中的每一所述卷积层输出的特征图对应的所有通道的全部或部分。

8.根据权利要求2至6任一项中所述的方法,其特征在于,所述第一卷积层集合中不包括所述神经网络中的最后一层卷积层。

9.根据权利要求2至6任一项中所述的方法,其特征在于,所述神经网络至少包括两个块,且每一块的最后一层输出的特征图对应的通道数与上一块的最后一层输出的特征图对应的通道数相同,所述方法还包括:对所述神经网络的两个块对应的特征图进行求和,得到输出结果;

对所述输出结果进行IN处理。

10.一种图像识别装置,其特征在于,所述装置包括:第一获取模块、第一处理模块和第一输出模块,其中:第一获取模块,用于获取待识别图像;

第一处理模块,用于采用神经网络模型中的卷积层对所述待识别图像进行特征提取,得到特征图;

对第一卷积层集合中的卷积层输出的特征图对应的通道中选取的第一通道集合进行实例归一化IN处理;对第二卷积层集合中的卷积层输出的特征图对应的通道中选取的第二通道集合进行批归一化BN处理,得到所述待识别图像的识别结果;其中,所述第一卷积层集合和所述第二卷积层集合是从所述神经网络模型的卷积层中选取的,所述第一通道集合和所述第二通道集合包含的通道不同;

第一输出模块,用于输出所述待识别图像的识别结果。

11.根据权利要求10所述的装置,其特征在于,所述装置还包括:第二处理模块,用于对所述神经网络中卷积层输出的特征图进行IN和BN处理,得到所述神经网络模型。

12.根据权利要求11所述的装置,其特征在于,所述第二处理模块,包括:第一确定模块,用于从所述神经网络的卷积层中确定第一卷积层集合和所述第二卷积层集合;

第一子处理模块,用于对所述第一卷积层集合中的每一卷积层输出的特征图进行IN处理;

第二子处理模块,用于对所述第二卷积层集合中的每一卷积层输出的特征图进行BN处理。

13.根据权利要求12所述的装置,其特征在于,所述第一卷积层集合和所述第二卷积层集合组成的集合为所述神经网络的所有卷积层中的全部或部分。

14.根据权利要求12所述的装置,其特征在于,所述第一卷积层集合与所述第二卷积层集合不具有交集,或者,所述第一卷积层集合与所述第二卷积层集合具有交集;或者,所述第二卷积层集合为所述第一卷积层集合的子集合。

15.根据权利要求12所述的装置,其特征在于,所述第一子处理模块包括:第一子确定模块,用于从所述第一卷积层集合中的每一所述卷积层输出的特征图对应的通道中确定第一通道集合;

第三子处理模块,用于对所述第一通道集合进行IN处理。

16.根据权利要求12所述的装置,其特征在于,所述第二子处理模块,包括:第二子确定单元,用于从每一所述卷积层输出的特征图对应的通道中确定第二通道集合;

第四子处理模块,用于对所述第二通道集合进行BN处理。

17.根据权利要求12至16任一项中所述的装置,其特征在于,所述第一通道集合为所述第一卷积层集合中的每一所述卷积层输出的特征图对应的所有通道的全部或部分;所述第二通道集合为所述第二卷积层集合中的每一所述卷积层输出的特征图对应的所有通道的全部或部分。

18.根据权利要求12至16任一项中所述的装置,所述神经网络至少包括两个块,且每一块的最后一层输出的特征图对应的通道数与上一块的最后一层输出的特征图对应的通道数相同,其特征在于,所述装置还包括:第二处理模块,用于对所述神经网络的两个块对应的特征图进行求和,得到输出结果,对所述输出结果进行IN处理。

19.根据权利要求12至16任一项中所述的装置,其特征在于,所述第一卷积层集合中不包括所述神经网络中的最后一层卷积层。

20.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令被执行后,能够实现权利要求1至9任一项所述的方法步骤。

21.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时可实现权利要求1至9任一项所述的方法步骤。