利索能及
我要发布
收藏
专利号: 2020113609507
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图像数据处理方法,其特征在于,包括:

接收待处理图像数据;

对于预先训练的图像数据处理网络的任一单元block,通过特征提取模块对输入数据进行特征提取,以得到第一特征信息;其中,对于首个block,输入数据为所述待处理图像数据,对于非首个block,输入数据为上一block的输出特征;对于所述预先训练的图像数据处理网络的任一单元block,每个block包含多个批归一化BN模块,每个批归一化BN模块对应不同应用场景数据分布的特征;

基于所述第一特征信息与该block包括的各批归一化BN模块的均值的距离,确定与所述第一特征信息匹配的目标BN模块;

通过所述目标BN模块对所述第一特征信息进行归一化处理,得到所述待处理图像数据的第二特征信息;

通过所述预先训练的图像数据处理网络的处理模块对所述预先训练的图像数据处理网络的最后一个block输出的第二特征信息进行图像数据处理,并输出图像数据处理结果。

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征信息与该block包括的各BN模块的均值的距离,确定与所述第一特征信息匹配的目标BN模块,包括:确定所述第一特征信息的特征均值;

基于所述特征均值,与该block包括的各BN模块的均值,分别确定所述特征均值与各BN模块的均值的距离,并将最小距离关联的BN模块确定为所述目标BN模块。

3.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征信息与该block包括的各BN模块的均值的距离,确定与所述第一特征信息匹配的目标BN模块,包括:确定所述第一特征信息不同通道间的关系矩阵的均值;

基于该均值,与该block包括的各BN模块的均值,分别确定该均值与各BN模块的均值的距离,并将最小距离关联的BN模块确定为所述目标BN模块。

4.根据权利要求1‑3任一项所述的方法,其特征在于,对图像数据处理网络的训练包括:通过所述图像数据处理网络的特征提取模块,对批量输入的训练样本进行特征提取,以得到所述训练样本的第三特征信息;

对所述第三特征信息进行分组,以得到多组第三特征信息;不同组的第三特征信息的数据分布不一致,同一组的第三特征信息的数据分布一致;

将不同组的第三特征信息输入到所述图像数据处理网络的不同BN模块中进行归一化处理,以得到所述训练样本的第四特征信息;其中,对于所述图像数据处理网络的任一block,不同组的第三特征信息输入到不同的BN模块,同一组的第三特征信息输入到同一BN模块;

将所述图像数据处理网络的最后一个block中各BN模块输出的第四特征信息合并后输入到处理模块进行图像数据处理。

5.根据权利要求4所述的方法,其特征在于,所述对所述第三特征信息进行分组,以得到多组第三特征信息,包括:基于所述第三特征信息归属的训练样本,以及,不同数据分布的所述训练样本的输入顺序,确定不同数据分布的训练样本的第三特征信息;

将不同数据分布的训练样本的第三特征信息划分为不同组;同一组的训练样本的第三特征信息的数据分布一致;

所述将不同组的第三特征信息输入到所述图像数据处理网络的不同BN模块中进行归一化处理,包括:基于各组的第三特征信息对应的数据分布,将各组的第三特征信息,输入到匹配的BN模块进行归一化处理;不同的BN模块对应不同的数据分布。

6.根据权利要求5所述的方法,其特征在于,所述将不同组的第三特征信息输入到所述图像数据处理网络的不同BN模块中进行归一化处理,包括:对于任一组第三特征信息,将该组第三特征信息输入到对应的BN模块,通过该BN模块确定输入的第三特征信息的均值和方差,并基于该第三特征信息的均值和方差,与该BN模块保存的均值和方差进行滑动平均处理,并保存处理后的均值和方差;

通过该BN模块基于该第三特征信息的均值和方差对输入的第三特征信息进行归一化处理。

7.根据权利要求6所述的方法,其特征在于,所述基于该第三特征信息的均值和方差,与该BN模块保存的均值和方差进行滑动平均处理,包括:基于该第三特征信息的均值和方差的第一权重,以及该BN模块保存的均值和方差的第二权重,对该第三特征信息的均值和方差,与该BN模块保存的均值和方差进行加权平均处理;其中,第一权重小于第二权重,第一权重与第二权重的和为1。

8.一种图像数据处理装置,其特征在于,包括:

接收单元,用于接收待处理图像数据;

特征提取单元,用于对于预先训练的图像数据处理网络的任一单元block,通过特征提取模块对输入数据进行特征提取,以得到第一特征信息;其中,对于首个block,输入数据为所述待处理图像数据,对于非首个block,输入数据为上一block的输出特征;对于所述预先训练的图像数据处理网络的任一单元block,每个block包含多个批归一化BN模块,每个批归一化BN模块对应不同应用场景数据分布的特征;

确定单元,用于基于所述第一特征信息与该block包括的各批归一化BN模块的均值的距离,确定与所述第一特征信息匹配的目标BN模块;

归一化处理单元,用于通过所述目标BN模块对所述第一特征信息进行归一化处理,得到所述待处理图像数据的第二特征信息;

处理单元,用于通过所述预先训练的图像数据处理网络的处理模块对所述预先训练的图像数据处理网络的最后一个block输出的第二特征信息进行图像数据处理,并输出图像数据处理结果。

9.根据权利要求8所述的装置,其特征在于,所述确定单元基于所述第一特征信息与该block包括的各BN模块的均值的距离,确定与所述第一特征信息匹配的目标BN模块,包括:确定所述第一特征信息的特征均值;

基于所述特征均值,与该block包括的各BN模块的均值,分别确定所述特征均值与各BN模块的均值的距离,并将最小距离关联的BN模块确定为所述目标BN模块。

10.根据权利要求8所述的装置,其特征在于,所述确定单元基于所述第一特征信息与该block包括的各BN模块的均值的距离,确定与所述第一特征信息匹配的目标BN模块,包括:确定所述第一特征信息不同通道间的关系矩阵的均值;

基于该均值,与该block包括的各BN模块的均值,分别确定该均值与各BN模块的均值的距离,并将最小距离关联的BN模块确定为所述目标BN模块。

11.根据权利要求8‑10任一项所述的装置,其特征在于,所述装置还包括:训练单元,用于通过以下方式对图像数据处理网络进行训练:

通过所述图像数据处理网络的特征提取模块,对批量输入的训练样本进行特征提取,以得到所述训练样本的第三特征信息;

对所述第三特征信息进行分组,以得到多组第三特征信息;不同组的第三特征信息的数据分布不一致,同一组的第三特征信息的数据分布一致;

将不同组的第三特征信息输入到所述图像数据处理网络的不同BN模块中进行归一化处理,以得到所述训练样本的第四特征信息;其中,对于所述图像数据处理网络的任一block,不同组的第三特征信息输入到不同的BN模块,同一组的第三特征信息输入到同一BN模块;

将所述图像数据处理网络的最后一个block中各BN模块输出的第四特征信息合并后输入到处理模块进行图像数据处理。

12.根据权利要求11所述的装置,其特征在于,所述训练单元对所述第三特征信息进行分组,以得到多组第三特征信息,包括:基于所述第三特征信息归属的训练样本,以及,不同数据分布的所述训练样本的输入顺序,确定不同数据分布的训练样本的第三特征信息;

将不同数据分布的训练样本的第三特征信息划分为不同组;同一组的训练样本的第三特征信息的数据分布一致;

所述训练单元将不同组的第三特征信息输入到所述图像数据处理网络的不同BN模块中进行归一化处理,包括:基于各组的第三特征信息对应的数据分布,将各组的第三特征信息,输入到匹配的BN模块进行归一化处理;不同的BN模块对应不同的数据分布。