1.一种无监督学习行人重识别方法,其特征在于,包括:
获取行人图像作为训练集的样本;
构建可靠样本挖掘行人重识别模型的特征提取网络,以及构建可靠样本挖掘行人重识别模型的存储字典,存储字典用于存储每个样本的特征向量和去噪后的伪标签;可靠样本挖掘行人重识别模型的训练过程具体为:利用可靠样本挖掘策略对伪标签进行去噪,具体为:在每个epoch训练开启前,提取存储字典中的特征向量对训练集进行两次不同邻域半径下的聚类为每个样本生成第一伪标签和第二伪标签,根据两个伪标签计算每个样本的伪标签可靠度,设定伪标签可靠度阈值,为伪标签可靠度小于伪标签可靠度阈值的样本重新赋予全局唯一的伪标签以进行伪标签去噪;
采用簇心对比损失函数对每个batch进行训练,并利用损失函数对特征提取网络的网络参数进行更新;
采取二重动量更新策略对存储字典中的特征进行更新,具体为:在完成每个batch的训练后,利用局部动量更新因子对该batch中的样本在存储字典中的特征向量进行局部更新,通过循环执行网络参数更新和局部更新完成一个epoch的训练,在一个epoch的训练完成后,保存当前重识别模型的特征提取网络的网络参数,利用全局动量更新因子对存储字典中的所有特征向量进行全局更新,在所有epoch的训练完成后,输出精度最优的可靠样本挖掘行人重识别模型;
基于精度最优的可靠样本挖掘行人重识别模型进行行人重识别。
2.根据权利要求1所述的方法,其特征在于,在将训练集输入所述重识别模型中进行训练之前,还包括步骤:对训练集中的行人图像进行数据增强处理,增强处理包括随机反转、随机裁剪和随机擦除。
3.根据权利要求1所述的方法,其特征在于,提取存储字典中的特征向量对训练集进行两次不同邻域半径下的聚类为每个样本生成第一伪标签和第二伪标签,根据两个伪标签计算每个样本的伪标签可靠度,设定伪标签可靠度阈值,为可靠度阈值小于设定阈值的样本重新赋予全局唯一的伪标签以进行伪标签去噪,包括:计算所有特征向量之间的杰卡德距离;
利用DBSCAN聚类算法以杰卡德距离作为聚类参数对无标签的样本进行聚类,得到第一邻域半径对应的第一伪标签和第二邻域半径对应的第二伪标签;
根据样本在第一邻域半径和第二邻域半径下聚类所属类别集合的交并比值计算伪标签可靠度;
对所有伪标签可靠度的得分排序,选取固定比例所对应的值作为可靠度阈值,若伪标签可靠度大于可靠度阈值,则保留大邻域半径对应的伪标签,反之则为对应样本赋予全局唯一伪标签;
将保留和修改后的伪标签写入存储字典中。
4.根据权利要求3所述的方法,其特征在于,根据样本在第一邻域半径和第二邻域半径下聚类所属类别集合的交并比值计算伪标签可靠度的计算式为:ci为样本xi在第一邻域半径下的伪标签, 表示第一邻域半
径下伪标签ci的样本集合,cj为样本xi在第二邻域半径下的伪标签, 表示第二邻域半径下伪标签cj的样本集合。
5.根据权利要求1所述的方法,其特征在于,在完成每个batch的训练后,利用局部动量更新因子对该batch中的样本在存储字典中的特征向量进行局部更新,通过循环执行网络参数更新和局部更新完成一个epoch的训练,包括:利用局部动量更新因子对每个batch中所有样本的特征向量对存储字典进行局部更新,更新方式如下式:其中,Μ[xi]代表存储字典中样本xi对应的特
b×d
征向量,μ为局部动量更新因子, 代表当前batch中样本xi的特征向量,B 为当前batch的样本集合,b表示batch的大小,d代表特征向量的维度;
循环执行上述步骤,直至完成一个epoch对应batch的训练。
6.根据权利要求1所述的方法,其特征在于,在一个epoch的训练完成后,保存当前重识别模型的特征提取网络的网络参数,利用全局动量更新因子对存储字典中的所有特征向量进行全局更新,在所有epoch的训练完成后,输出识别精度最优的重识别模型,包括:通过当前重识别模型的特征提取网络提取训练集中所有样本的特征向量;
通过全局动量更新因子对当前存储字典中所有样本的特征向量和当前重识别模型提取训练集中所有样本的特征向量进行全局更新,得到全局更新后的特征向量,并将全局更新后的特征向量写入存储字典;
基于全局更新后的特征向量,依次执行生成双伪标签、伪标签可靠度的计算、伪标签去噪、网络参数更新和局部更新,在完成所有epoch的训练后,得到多个重识别模型的特征提取网络的网络参数,从多个重识别模型中筛选出识别精度最优的重识别模型。
7.根据权利要求6所述的方法,其特征在于,对特征向量进行全局更新的计算式如下:其中,α表示全局动量更新因子, 表示当前重识别模
型提取训练集中样本xi的特征向量, 表示当前存储字典中样本xi的特征向量,xi表示训练集中的第i张行人图像,X代表训练集。
8.一种无监督学习行人重识别装置,其特征在于,包括:
数据获取模块,用于获取行人图像作为训练集的样本;
模型构建模块,用于构建可靠样本挖掘行人重识别模型的特征提取网络,以及构建可靠样本挖掘行人重识别模型的存储字典,存储字典用于存储每个样本的特征向量和去噪后的伪标签;可靠样本挖掘行人重识别模型的训练过程具体为:标签去噪模块,用于利用可靠样本挖掘策略对伪标签进行去噪,具体为:在每个epoch训练开启前,提取存储字典中的特征向量对训练集进行两次不同邻域半径下的聚类为每个样本生成第一伪标签和第二伪标签,根据两个伪标签计算每个样本的伪标签可靠度,设定伪标签可靠度阈值,为伪标签可靠度小于伪标签可靠度阈值的样本重新赋予全局唯一的伪标签以进行伪标签去噪;
网络参数更新模块,用于采用簇心对比损失函数对每个batch进行训练,并利用损失函数对特征提取网络的网络参数进行更新;
二重动量更新模块,用于采取二重动量更新策略对存储字典中的特征进行更新,具体为:在完成每个batch的训练后,利用局部动量更新因子对该batch中的样本在存储字典中的特征向量进行局部更新,通过循环执行网络参数更新和局部更新完成一个epoch的训练,在一个epoch的训练完成后,保存当前重识别模型的特征提取网络的网络参数,利用全局动量更新因子对存储字典中的所有特征向量进行全局更新,在所有epoch的训练完成后,输出精度最优的可靠样本挖掘行人重识别模型;
识别模块,用于基于精度最优的可靠样本挖掘行人重识别模型进行行人重识别。
9.一种电子设备,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任意一项所述的一种无监督学习行人重识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的一种无监督学习行人重识别方法的步骤。