1.一种数据处理方法,其特征在于,包括:获取基于神经网络的至少一个输入图像得到的待处理数据;
确定对所述待处理数据的加速卷积操作对应的多个待处理任务与多个线程块之间的映射关系,将所述多个待处理任务中的DIG个输入变换任务映射到所述多个线程块中的前DIG个连续线程块,将所述多个待处理任务中包含的n1个输入变换任务和m1个乘法任务映射到所述前DIG个连续线程块的后续DGO个连续线程块,将所述多个待处理任务中包含的还未分配的n2个输入变换任务、m2个乘法任务和p1个输出变换任务映射到所述后续DGO个连续线程块的后续线程块,将所述多个待处理任务中包含的还未分配的m3个乘法任务和p2个输出变换任务映射到剩余的连续线程块,其中,所述多个待处理任务包括SI个输入变换任务,SG和乘法任务以及SO个输出变换任务,所述n1:m1满足SI:SG,所述n2:m2:p1满足SI:SG:SO,所述乘法任务依赖于所述输入变换任务,所述输出变换任务依赖于所述乘法任务,将所述多个待处理任务中的第一任务和依赖于所述第一任务的第二任务分别映射到第一线程块和第二线程块,其中,所述第一线程块对应的执行顺序早于所述第二线程块并且所述第一线程块与所述第二线程块之间的间隔高于第一阈值;
基于所述映射关系,对所述多个待处理任务进行内核融合处理,得到内核融合结果;
利用所述多个线程块执行所述内核融合结果。
2.根据权利要求1所述的方法,其特征在于,所述第一阈值对应的时间间隔大于或等于执行所述第一任务所需的时间。
3.根据权利要求2所述的方法,其特征在于,所述确定对所述待处理数据的加速卷积操作对应的多个待处理任务与多个线程块之间的映射关系包括:确定将所述多个待处理任务中存在数据重用关系的多个任务映射至间隔小于第二阈值的多个线程块。
4.根据权利要求3所述的方法,其特征在于,所述将所述多个待处理任务中的DIG个输入变换任务映射到所述多个线程块中的前DIG个连续线程块之前,所述方法还包括:确定将所述多个待处理任务中包含的NF个卷积核变换任务映射到所述多个线程块中的前NF个连续线程块;
将所述DIG个输入变换任务映射到所述多个线程块中的前DIG个连续线程块包括:将所述DIG个输入变换任务映射到所述多个线程块中的前NF个连续线程块的后续DIG个连续线程块。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述将所述多个待处理任务中的DIG个输入变换任务映射到所述多个线程块中的前DIG个连续线程块之前,所述方法还包括:
确定将所述多个待处理任务中包含的NF个卷积核变换任务映射到所述多个线程块中的前NF个连续线程块;
将所述DIG个输入变换任务映射到所述多个线程块中的前DIG个连续线程块包括:将所述DIG个输入变换任务映射到所述多个线程块中的前NF个连续线程块的后续DIG个连续线程块。
6.根据权利要求4所述的方法,其特征在于,所述n1个输入变换任务存在数据重用关系,所述m1个乘法任务存在数据重用关系。
7.根据权利要求1至4中任一项所述的方法,其特征在于,所述n1个输入变换任务存在数据重用关系,所述m1个乘法任务存在数据重用关系。
8.根据权利要求6所述的方法,其特征在于,所述利用所述多个线程块执行所述内核融合结果之前,所述方法还包括:
确定使用相同的内存区域存储所述多个待处理任务中对应于所述待处理数据的不同输入向量的多个不同类型的任务;
为所述多个不同类型的任务之间建立任务依赖关系。
9.根据权利要求1至4、权利要求6中任一项所述的方法,其特征在于,所述利用所述多个线程块执行所述内核融合结果之前,所述方法还包括:确定使用相同的内存区域存储所述多个待处理任务中对应于所述待处理数据的不同输入向量的多个不同类型的任务;
为所述多个不同类型的任务之间建立任务依赖关系。
10.根据权利要求8所述的方法,其特征在于,所述利用所述多个线程块执行所述内核融合结果,包括:
基于所述多个待处理任务中的第三任务对至少一个第四任务的依赖关系以及至少一个所述第四任务的执行状态,调度所述第三任务,其中,所述第三任务依赖于所述第四任务。
11.根据权利要求1至4、权利要求6或8中任一项所述的方法,其特征在于,所述利用所述多个线程块执行所述内核融合结果,包括:基于所述多个待处理任务中的第三任务对至少一个第四任务的依赖关系以及至少一个所述第四任务的执行状态,调度所述第三任务,其中,所述第三任务依赖于所述第四任务。
12.根据权利要求10所述的方法,其特征在于,所述基于所述多个待处理任务中的第三任务对至少一个第四任务的依赖关系以及至少一个所述第四任务的执行状态,调度所述第三任务,包括:
基于所述至少一个第四任务中每个第四任务当前的执行状态,确定所述第三任务的当前未完成依赖任务的数量;
响应于所述第三任务的当前未完成依赖任务数量更新为0,调用线程块执行所述第三任务。
13.根据权利要求12所述的方法,其特征在于,所述待处理数据格式是数量高度宽度通道NHWC格式,所述方法还包括:执行所述输入变换任务的线程块,其中,不同通道的待处理数据对应所述线程块中的不同线程。
14.根据权利要求1至4、权利要求6、8、10或12中任一项所述的方法,其特征在于,所述待处理数据格式是数量高度宽度通道NHWC格式,所述方法还包括:执行所述输入变换任务的线程块,其中,不同通道的待处理数据对应所述线程块中的不同线程。
15.一种数据处理装置,其特征在于,包括:获取单元,所述获取单元用于获取基于神经网络的至少一个输入图像得到的待处理数据;
确定单元,所述确定单元用于确定对所述待处理数据的加速卷积操作对应的多个待处理任务与多个线程块之间的映射关系,将所述多个待处理任务中的DIG个输入变换任务映射到所述多个线程块中的前DIG个连续线程块,将所述多个待处理任务中包含的n1个输入变换任务和m1个乘法任务映射到所述前DIG个连续线程块的后续DGO个连续线程块,将所述多个待处理任务中包含的还未分配的n2个输入变换任务、m2个乘法任务和p1个输出变换任务映射到所述后续DGO个连续线程块的后续线程块,将所述多个待处理任务中包含的还未分配的m3个乘法任务和p2个输出变换任务映射到剩余的连续线程块,其中,所述多个待处理任务包括SI个输入变换任务,SG和乘法任务以及SO个输出变换任务,所述n1:m1满足SI:SG,所述n2:m2:p1满足SI:SG:SO,所述乘法任务依赖于所述输入变换任务,所述输出变换任务依赖于所述乘法任务,将所述多个待处理任务中的第一任务和依赖于所述第一任务的第二任务分别映射到第一线程块和第二线程块,其中,所述第一线程块对应的执行顺序早于所述第二线程块并且所述第一线程块与所述第二线程块之间的间隔高于第一阈值;
处理单元,所述处理单元用于基于所述映射关系,对所述多个待处理任务进行内核融合处理,得到内核融合结果;
执行单元,所述执行单元用于利用所述多个线程块执行所述内核融合结果。
16.根据权利要求15所述的装置,其特征在于,所述第一阈值对应的时间间隔大于或等于执行所述第一任务所需的时间。
17.根据权利要求16所述的装置,其特征在于,所述确定单元用于:确定将所述多个待处理任务中存在数据重用关系的多个任务映射至间隔小于第二阈值的多个线程块。
18.根据权利要求17所述的装置,其特征在于,所述确定单元用于:确定将所述多个待处理任务中包含的NF个卷积核变换任务映射到所述多个线程块中的前NF个连续线程块;
确定将所述DIG个输入变换任务映射到所述多个线程块中的前NF个连续线程块的后续DIG个连续线程块。
19.根据权利要求15至17中任一项所述的装置,其特征在于,所述确定单元用于:确定将所述多个待处理任务中包含的NF个卷积核变换任务映射到所述多个线程块中的前NF个连续线程块;
确定将所述DIG个输入变换任务映射到所述多个线程块中的前NF个连续线程块的后续DIG个连续线程块。
20.根据权利要求18所述的装置,其特征在于,所述n1个输入变换任务存在数据重用关系,所述m1个乘法任务存在数据重用关系。
21.根据权利要求15至18中任一项所述的装置,其特征在于,所述n1个输入变换任务存在数据重用关系,所述m1个乘法任务存在数据重用关系。
22.根据权利要求20所述的装置,其特征在于,所述装置还包括建立单元,所述建立单元用于在所述利用所述多个线程块执行所述内核融合结果之前,确定使用相同的内存区域存储所述多个待处理任务中对应于所述待处理数据的不同输入向量的多个不同类型的任务;
为所述多个不同类型的任务之间建立任务依赖关系。
23.根据权利要求15至18、权利要求20中任一项所述的装置,其特征在于,所述装置还包括建立单元,所述建立单元用于在所述利用所述多个线程块执行所述内核融合结果之前,
确定使用相同的内存区域存储所述多个待处理任务中对应于所述待处理数据的不同输入向量的多个不同类型的任务;
为所述多个不同类型的任务之间建立任务依赖关系。
24.根据权利要求22所述的装置,其特征在于,所述执行单元还用于:基于所述多个待处理任务中的第三任务对至少一个第四任务的依赖关系以及至少一个所述第四任务的执行状态,调度所述第三任务,其中,所述第三任务依赖于所述第四任务。
25.根据权利要求15至18、权利要求20或22中任一项所述的装置,其特征在于,所述执行单元还用于:
基于所述多个待处理任务中的第三任务对至少一个第四任务的依赖关系以及至少一个所述第四任务的执行状态,调度所述第三任务,其中,所述第三任务依赖于所述第四任务。
26.根据权利要求24所述的装置,其特征在于,所述执行单元用于:基于所述至少一个第四任务中每个第四任务当前的执行状态,确定所述第三任务的当前未完成依赖任务的数量;
响应于所述第三任务的当前未完成依赖任务数量更新为0,调用线程块执行所述第三任务。
27.根据权利要求26所述的装置,其特征在于,所述待处理数据格式是数量高度宽度通道NHWC格式,所述执行单元中执行所述输入变换任务的线程块,其中,不同通道的待处理数据对应所述线程块中的不同线程。
28.根据权利要求15至18、权利要求20、22、24或26中任一项所述的装置,其特征在于,所述待处理数据格式是数量高度宽度通道NHWC格式,所述执行单元中执行所述输入变换任务的线程块,其中,不同通道的待处理数据对应所述线程块中的不同线程。
29.一种电子设备,其特征在于,包括处理器和存储器,其中,所述存储器用于存储计算机程序指令,所述处理器被配置用于调用所述计算机程序指令,执行权利要求1至14中任一权利要求所述的方法。
30.一种计算机可读存储介质,用于存储计算机可读取的指令,其特征在于,所述指令被执行时执行权利要求1至14中任一权利要求所述的方法。