1.一种网络训练方法,其特征在于,包括:将第x个训练样本集输入第x‑1次训练后的跟踪网络,得到第x次跟踪结果,x为大于或等于1的正整数,所述第x个训练样本集中包括从多个样本视频中采样的至少一个图像对;
根据所述第x次跟踪结果,确定所述多个样本视频对应的目标采样概率;
根据所述目标采样概率对所述多个样本视频进行采样,构建第x+1个训练样本集,所述第x+1个训练样本集中包括从所述多个样本视频中采样的至少一个图像对;
根据所述第x次跟踪结果,调整所述第x‑1次训练后的跟踪网络的网络参数,得到第x次训练后的跟踪网络,所述第x+1个训练样本集用于对所述第x次训练后的跟踪网络进行训练。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第x次跟踪结果,确定所述多个样本视频对应的目标采样概率,包括:根据所述第x次跟踪结果,确定所述多个样本视频中第i个样本视频的跟踪难度,所述第i个样本视频的跟踪难度用于指示所述第x‑1次训练后的跟踪网络对所述第i个样本视频中的目标对象的跟踪难易程度,i为大于或等于1,且小于或等于M的正整数,M为所述多个样本视频的总数量;
根据所述第i个样本视频的视频长度和所述第i个样本视频的跟踪难度,确定所述第i个样本视频对应的所述目标采样概率,进而得到所述多个样本视频对应的目标采样概率,所述第i个样本视频的视频长度用于指示所述第i个样本视频中包括的图像总数量。
3.根据权利要求2所述的方法,其特征在于,所述第x次跟踪结果中包括所述第x‑1次训练后的跟踪网络对所述第x个训练样本集中包括的从所述第i个样本视频中采样的至少一个图像对的分类预测概率;
所述根据所述第x次跟踪结果,确定所述多个样本视频中第i个样本视频的跟踪难度,包括:
根据所述分类预测概率,确定所述至少一个图像对的香农信息熵;
根据所述至少一个图像对的香农信息熵,确定所述第i个样本视频的跟踪难度。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述第i个样本视频的视频长度和所述第i个样本视频的跟踪难度,确定所述第i个样本视频对应的所述目标采样概率,包括:
根据所述第i个样本视频的视频长度,确定所述第i个样本视频对应的初始采样概率;
根据所述第i个样本视频对应的初始采样概率和所述第i个样本视频的跟踪难度,确定所述第i个样本视频对应的所述目标采样概率。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第i个样本视频对应的初始采样概率和所述第i个样本视频的跟踪难度,确定所述第i个样本视频对应的所述目标采样概率,包括:
根据各所述样本视频的跟踪难度,确定所述多个样本视频对应的直方图分布和拟合高斯分布;
根据所述第i个样本视频的跟踪难度、所述直方图分布和所述拟合高斯分布,确定所述第i个样本视频对应的概率调整比例;
根据所述第i个样本视频对应的概率调整比例,调整所述第i个样本视频对应的初始采样概率,得到所述第i个样本视频对应的所述目标采样概率。
6.根据权利要求5所述的方法,其特征在于,所述直方图分布的峰值对应第一跟踪难度,所述拟合高斯分布的峰值对应第二跟踪难度;
所述根据所述第i个样本视频的跟踪难度、所述直方图分布和所述拟合高斯分布,确定所述第i个样本视频对应的概率调整比例,包括:确定所述直方图分布和所述拟合高斯分布之间的第一交点和第二交点,所述第一交点对应第三跟踪难度,所述第二交点对应第四跟踪难度,所述第一交点为距离所述直方图分布的峰值最邻近的交点,且所述第三跟踪难度小于所述第一跟踪难度,所述第二交点为距离所述拟合高斯分布的峰值最邻近的交点,且所述第四跟踪难度大于所述第二跟踪难度;
在所述第i个样本视频的跟踪难度位于所述第三跟踪难度和所述第四跟踪难度之间的情况下,将所述第i个样本视频的跟踪难度在所述拟合高斯分布的取值gi,与所述第i个样本视频的跟踪难度在所述直方图分布中的取值oi的取值比例gi/oi,确定为所述第i个样本视频对应的概率调整比例。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:在所述第i个样本视频的跟踪难度位于所述第三跟踪难度和所述第四跟踪难度之外的情况下,将所述第i个样本视频对应的概率调整比例确定为1。
8.根据权利要求1至7中任意一项所述的方法,其特征在于,所述根据所述目标采样概率对所述多个样本视频进行采样,构建第x+1个训练样本集,包括:针对所述多个样本视频中的第i个样本视频,根据预设采样总次数和所述第i个样本视频对应的所述目标采样概率,确定所述第i个样本视频对应的采样次数N,N为大于或等于1的正整数;
确定所述第i个样本视频中的多个图像对,以及确定所述多个图像对中不同图像对之间的空间距离;
对所述第i个样本视频执行N次图像对采样操作,采样得到用于构建所述第x+1个训练样本集的N个图像对,所述N次图像对采样操作中第j次图像对采样操作得到的图像对是所述多个图像对的未被采样的图像对中,且与所述第j‑1次图像对采样操作得到的图像对之间的空间距离最大的图像对,j为大于或等于2且小于或等于N的正整数。
9.根据权利要求8所述的方法,其特征在于,所述确定所述多个图像对中不同图像对之间的空间距离,包括:
根据所述第i个视频的所述视频长度,将所述第i个视频平均划分为多个图像区域;
确定所述多个图像区域构成的多个区域对,以及确定所述多个区域对中不同区域对之间的空间距离;
针对所述多个区域对中的任意两个区域对,将所述两个区域对之间的空间距离,确定为所述两个区域对中包括的图像对之间的空间距离。
10.根据权利要求9所述的方法,其特征在于,所述对所述第i个样本视频执行N次图像对采样操作,采样得到用于构建所述第x+1个训练样本集的N个图像对,包括:对所述多个区域对执行N次区域对采样操作,采样得到N个区域对,所述N次区域对采样操作中的第j次区域对采样操作得到的区域对是所述多个区域对的未被采样的区域对中,且与所述第j‑1次区域对采样操作得到的区域对之间的空间距离最大的区域对,j为大于或等于2且小于或等于N的正整数;
分别对所述N个区域对执行图像对采样操作,得到所述N个图像对,针对所述N个区域对中的任一区域对,对所述区域对执行的图像对采样操作为从构成所述区域对的两个图像区域中分别采样一个图像。
11.一种目标跟踪方法,其特征在于,包括:通过跟踪网络对待跟踪视频中的目标对象进行跟踪,得到所述目标对象的跟踪结果,所述跟踪网络为采用权利要求1至10中任意一项所述的网络训练方法训练得到的。
12.一种网络训练装置,其特征在于,包括:第一确定模块,用于将第x个训练样本集输入第x‑1次训练后的跟踪网络,得到第x次跟踪结果,x为大于或等于1的正整数,所述第x个训练样本集中包括从多个样本视频中采样的至少一个图像对;
第二确定模块,用于根据所述第x次跟踪结果,确定所述多个样本视频对应的目标采样概率;
采样模块,用于根据所述目标采样概率对所述多个样本视频进行采样,构建第x+1个训练样本集,所述第x+1个训练样本集中包括从所述多个样本视频中采样的至少一个图像对;
训练模块,用于根据所述第x次跟踪结果,调整所述第x‑1次训练后的跟踪网络的网络参数,得到第x次训练后的跟踪网络,所述第x+1个训练样本集用于对所述第x次训练后的跟踪网络进行训练。
13.一种目标跟踪装置,其特征在于,包括:跟踪模块,用于通过跟踪网络对待跟踪视频中的目标对象进行跟踪,得到所述目标对象的跟踪结果,所述跟踪网络为采用权利要求1至10中任意一项所述的网络训练方法训练得到的。
14.一种电子设备,其特征在于,包括:处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至11中任意一项所述的方法。
15.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至11中任意一项所述的方法。