利索能及
我要发布
收藏
专利号: 2019112561724
申请人: 电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-17
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于TOIM损失函数的行人重识别方法,其特征在于,包括以下步骤:

S1、准备数据集,数据集中每个不同身份的行人具有不同ID;

S2、利用pytorch框架搭建基于ResNet‑50模型的网络模型;

S3、将数据集中训练集的图片输入至网络模型中进行训练;

S4、将数据集中测试集的图片输入至训练好的网络模型中,识别行人身份;

所述步骤S3的训练过程为:

(1)、利用交叉熵损失函数对网络模型进行预训练;

(2)、预设每个ID对应生成一个用于存储该ID所对应行人在不同摄像头下的512维特征信息的存储表,然后将训练集中的图片输入到经步骤(1)训练好的网络模型中,利用网络模型的输出结果初始化所有ID的存储表;

(3)、结合步骤(2)中的存储表对经步骤(1)训练好的网络模型进行再训练。

2.根据权利要求1所述的基于TOIM损失函数的行人重识别方法,其特征在于:所述步骤S1中,所述的数据集为数据集Duke、数据集Market‑1501、数据集UESTC‑PR中的一种,当数据集为数据集UESTC‑PR时,其准备过程为:将若干摄像头架设在UESTC‑PR中的路灯顶端,由摄像头俯视采集行人图片,采集的行人图片为至少三个摄像头在同一场景下拍摄的图像的集合,采集完后得到数据集UESTC‑PR,然后对数据集UESTC‑PR中每个不同身份的行人标定不同ID,并划分为训练集和测试集。

3.根据权利要求1所述的基于TOIM损失函数的行人重识别方法,其特征在于:所述步骤S2中,所述的网络模型依次包括卷积层、块结构、平均池化层和全连接层,其中,块结构的数量为4个,每个块结构分别包含3,4,6,3个残差单元。

4.根据权利要求1所述的基于TOIM损失函数的行人重识别方法,其特征在于:所述步骤S2中,所述的网络模型搭建后,使用AdaDelta优化器进行初始化,初始学习率设置为0.001,批处理图片数量设置为M,M为15—30。

5.根据权利要求1所述的基于TOIM损失函数的行人重识别方法,其特征在于:所述步骤S2中,所述的网络模型中图片的输入维度为M*3*256*128,M代表批处理图片数量,3代表通道数,256*128为图片大小;图片的输出维度为M*512,512代表每张图片中行人的512维特征信息。

6.根据权利要求1所述的基于TOIM损失函数的行人重识别方法,其特征在于:所述步骤D D×C(2)中,每个ID的特征用f∈R来表示,D代表行人的特征维度信息,每个存储表用V∈R 表示,C代表数据制作过程中所采用的摄像头的数量。

7.根据权利要求6所述的基于TOIM损失函数的行人重识别方法,其特征在于:所述步骤(3)中采用批次迭代训练方式进行再训练,具体过程如下:A、从所有存储表中选择N个anchor样本作为第一批次训练样本(N=M),将该批次中N个anchor样本所对应的ID和摄像头信息存储至预设的更新表中,更新表的长度为U(U>N);然后从所有存储表中为每个anchor样本挑选对应的positive样本和negative样本,得到N个均包含anchor样本、positive样本和negative样本的三元样本组,将三元样本组输入至网络模型中,计算每个三元样本组中样本间的欧氏距离,并根据得到的欧氏距离计算出该批次中N个样本的损失值,再利用损失值进行反向传播更新存储表;

B、将剩余样本分成多个批次,每批次同样包括N个anchor样本,采用队列更新的方式将每批次中N个anchor样本所对应的ID和摄像头信息存储至更新表中,然后从所有存储表中为每个anchor样本挑选对应的positive样本,从更新表中为每个anchor样本挑选对应的negative样本,得到N个均包含anchor样本、positive样本和negative样本的三元样本组,将三元样本组输入至网络模型中,计算每个三元样本组中样本间的欧氏距离,并根据得到的欧氏距离计算出每批次N个样本的损失值,再利用损失值进行反向传播更新存储表;

C、重复步骤A和步骤B,直至所有训练样本完成13个epoch,训练完成。

8.根据权利要求7所述的基于TOIM损失函数的行人重识别方法,其特征在于:所述步骤A和步骤B中,损失值的计算方法为:i

式中,LTOIM表示损失值,d()表示两个样本之间的欧氏距离,fa 表示ID为i的anchor样i本,fp表示ID为i,但是距离与anchor样本最大的positive样本, 表示ID与anchor样本的ID不同,但是距离与anchor样本最小的negative样本。

9.根据权利要求7所述的基于TOIM损失函数的行人重识别方法,其特征在于:所述步骤B和步骤C中,利用公式vp‑c←γvp‑c+(1‑γ)f更新存储表,式中p表示ID为p,c表示该ID在c摄像头下,γ∈[0,1]。