1.一种基于维度融合注意力的行人重识别方法,其特征在于,包括以下步骤:步骤1、数据集准备,对于给定的数据集,要划分为训练集和测试集,测试集又分为查询图片和待查询图片,训练集和测试集数据比例为1:1;
步骤2、基于维度融合注意力的行人重识别网络构建;
步骤2.1、使用Resnet50作为网络的基本骨架,在网络的每个瓶颈块的第二个批归一化处理后插入DFA;
步骤2.2、DFA模块,其分为三个步骤,分别为池化准备阶段、维度融合交互阶段和特征注意阶段,三个阶段中上一个阶段为下一个阶段做准备;
步骤2.3、第一阶段是对特征图做维度变换,处理成第二阶段维度融合的形状,其计算过程如式(1):Xr=Cat(Per(PoolH(X)),Per(PoolW(X))) (1)其中,PoolH(·)表示对H维度做池化操作,PoolW(·)表示对W维度做池化操作,所述池化操作为对张量的最大池化和平均池化操作,Cat(·)表示张量拼接操作,Per(·)表示张量旋转操作,该部分输入张量X形状为C×H×W,输出张量Xr形状为4×C×(H+W);
步骤2.4、第二阶段的任务是进行维度交互,首先使用一个滑动窗口的方式将第一阶段的输出转化为2维张量,再使用大小为49的超大一维卷积核进行维度交互,最后使用flod操作将其还原成三维张量即可,其计算过程如式(2)所示:Xf=Flod(Conv49(Unflod(Xr))) (2)其中Unflod(·)表示维度融合操作,Conv49(·)表示大小为49的一维卷积核,Flod(·)为Unflod(·)的逆操作;
步骤2.5、第三阶段的任务是将上各阶段的特征图转换为注意图,与常规注意力机制相同,使用Sigmoid函数作为激活函数来激活有效特征,再与原始特征相乘即可得到注意特征;
步骤2.6、在网络最后引入了ECA注意力机制,卷积核大小为5的ECA注意力,所用ECA注意力即为最基本的ECA注意力机制;
步骤3、将训练数据依次输入网络,得到行人特征,将得到的行人特征输入损失函数,通过Adam优化器对网络参数进行限制,所述损失函数为交叉熵损失、加权正则化的三元组损失和中心损失联合构成的损失函数;
步骤4、测试阶段,在新的数据集中,将训练好的模型进行应用,将上面训练好的行人重识别模型部署到景区的视频监控系统中。
2.根据权利要求1所述的基于维度融合注意力的行人重识别方法,其特征在于,所述步骤3的损失函数包括:交叉熵损失:
其中,yi,k代表第i张图像的身份是否为k,N表示数据集中行人总类别数,pi,k表示第i张图像的身份是为k的概率;
加权正则化的三元组损失:
式中i为每个批中的锚点图像,Pi表示正样本集,Ni表示负样本集, 和 分别为锚点图像与正样本图像和负样本图像间的距离;
中心损失:
式中,fi表示第i个样本经过深度网络后提取得到的特征,yi表示第i个样本的标签,cyi表示第yi个类别对应的高维特征中心,B表示批次大小;
最后的总损失为:
L=Lcls+Lwrt+Lcenter。
3.根据权利要求1所述的基于维度融合注意力的行人重识别方法,其特征在于,所述步骤4具体包括以下步骤:步骤4.1、测试阶段将测试集所有图像特征全都通过训练好的网络提取出来,然后依次计算每张查询图像和所有待查询图像的欧氏距离;
步骤4.2、对于每张查询图像,其相对所有待查询图像均有欧氏距离,对所有欧氏距离进行快速排序,排序结果越靠前的欧式距离所对应的待查询图片与查询图片越相似;
步骤4.3、多次查询行人图像后,评估系统的准确率,使用mAP、Rank‑1和Rank‑10指标评价。