利索能及
我要发布
收藏
专利号: 2021101024198
申请人: 上海眼控科技股份有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2025-07-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种确定身体部位语义图的方法,其特征在于,包括:提取同一行人的若干张图像中每张图像的全局特征图;

对全部所述全局特征图中所有像素进行聚类,得到若干个与身体部位相关的类别,包括:根据像素的激活值和/或置信度对像素对所有像素进行第一聚类,得到前景像素;根据像素间的相似度,对所述前景像素进行第二聚类,得到若干个与身体部位相关的类别;

在根据激活值进行第一聚类时,将全局特征图Mg中每个像素位置Mg(x,y)上的激活值定义为||Mg(x,y)||2,采用如下公式对每个像素的激活值进行归一化处理:其中,a(x,y)为归一化处理后的像素的激活值,max(i,j)||Mg(x,y)||2为所有像素的激活值的最大值,(i,j)为Mg中像素的坐标;

将激活值小于划分阈值的像素确定为第一聚类时的背景像素;

在进行第二聚类时,采用如下公式对每个像素的位置进行归一化处理:其中,D(x,y)为归一化处理后的像素的位置,Mg(x,y)为全局特征图Mg中像素的位置,||Mg(x,y)||2为Mg(x,y)上的激活值;

当存在遮挡时,被遮挡位置的像素被划分为第二聚类时的背景像素;

对于每个所述像素,根据所述像素所属类别,在所述像素所属的全局特征图中所述像素所在位置处生成相应的类别标签,将得到的每张像素位置带有类别标签的全局特征图分别确定为所述全局特征图映射的身体部位语义图。

2.一种行人重识别模型的训练方法,其特征在于,包括:采用如权利要求1所述的方法,确定样本图像的身体部位语义图;

利用确定的所述样本图像的身体部位语义图,训练所述行人重识别模型。

3.根据权利要求2所述的方法,其特征在于,利用所述样本图像的身体部位语义图,训练所述行人重识别模型,包括:根据所述样本图像的身体部位语义图和全局特征图,得到所述样本图像的各身体部位特征图;

利用得到的所述样本图像的各身体部位特征图,计算损失函数值,并基于计算得到的所述损失函数值迭代更新所述行人重识别模型的参数,直至达到迭代终止条件。

4.一种基于无监督的行人重识别方法,其特征在于,包括:利用根据权利要求2或3所述方法训练得到的行人重识别模型,获取查询图像和候选图像的各身体部位特征图;

利用获取的所述查询图像和候选图像的各身体部位特征图,计算所述查询图像与每个所述候选图像的距离;

根据计算得到的所述查询图像与每个候选图像的距离,对所述候选图像进行排序,将排序结果作为重识别结果进行输出。

5.根据权利要求4所述的方法,其特征在于,计算所述查询图像与每个候选图像的距离,包括:利用两图像的各身体部位特征图计算两图像的各身体部位特征距离,利用两图像的全局特征图计算两图像的全局特征距离,计算两图像的前景特征距离;

根据两图像中各身体部位是否可见以及计算得到的所述各身体部位特征距离、全局特征距离和前景特征距离,计算两图像的距离。

6.一种确定身体部位语义图的设备,其特征在于,包括:提取模块,用于提取同一行人的若干张图像中每张图像的全局特征图;

聚类模块,用于对全部所述全局特征图中所有像素进行聚类,得到若干个与身体部位相关的类别,包括:根据像素的激活值和/或置信度对像素对所有像素进行第一聚类,得到前景像素;根据像素间的相似度,对所述前景像素进行第二聚类,得到若干个与身体部位相关的类别;

在根据激活值进行第一聚类时,将全局特征图Mg中每个像素位置Mg(x,y)上的激活值定义为||Mg(x,y)||2,采用如下公式对每个像素的激活值进行归一化处理:其中,a(x,y)为归一化处理后的像素的激活值,max(i,j)||Mg(x,y)||2为所有像素的激活值的最大值,(i,j)为Mg中像素的坐标;

将激活值小于划分阈值的像素确定为第一聚类时的背景像素;

在进行第二聚类时,采用如下公式对每个像素的位置进行归一化处理:其中,D(x,y)为归一化处理后的像素的位置,Mg(x,y)为全局特征图Mg中像素的位置,||Mg(x,y)||2为Mg(x,y)上的激活值;

当存在遮挡时,被遮挡位置的像素被划分为第二聚类时的背景像素;

确定模块,用于对于每个所述像素,根据所述像素所属类别,在所述像素所属的全局特征图中所述像素所在位置处生成相应的类别标签,将得到的每张像素位置带有类别标签的全局特征图分别确定为所述全局特征图映射的身体部位语义图。

7.一种行人重识别模型的训练设备,其特征在于,包括:处理模块,用于采用如权利要求1所述的方法,确定样本图像的身体部位语义图;

训练模块,用于利用确定的所述样本图像的身体部位语义图,训练所述行人重识别模型。

8.一种基于无监督的行人重识别设备,其特征在于,包括:获取模块,用于利用根据权利要求2或3所述方法训练得到的行人重识别模型,获取查询图像和候选图像的各身体部位特征图;

计算模块,用于利用获取的所述查询图像和候选图像的各身体部位特征图,计算所述查询图像与每个所述候选图像的距离;

输出模块,用于根据计算得到的所述查询图像与每个候选图像的距离,对所述候选图像进行排序,将排序结果作为重识别结果进行输出。

9.一种计算机设备,其特征在于,包括:

存储器;

处理器;以及

计算机程序;

其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1所述的确定身体部位语义图的方法,或者如权利要求2或3所述的行人重识别模型的训练方法,或者如权利要求4或5所述的基于无监督的行人重识别方法。

10.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质其上存储有计算机程序;

所述计算机程序被处理器执行以实现如权利要求1所述的确定身体部位语义图的方法,或者如权利要求2或3所述的行人重识别模型的训练方法,或者如权利要求4或5所述的基于无监督的行人重识别方法。