利索能及
我要发布
收藏
专利号: 2024112891674
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种联合YOLOv8模型的行人重识别方法,其特征在于,依赖联合YOLOv8s模型的行人重识别装置实现,包括以下步骤:(1)利用联合YOLOv8s模型的行人重识别装置获取行人数据并存储为查询集;其中,联合YOLOv8s模型的行人重识别装置包括:无线摄像头组模块、主控模块、PC端、二维转角模块;无线摄像头组模块、主控模块、PC端、二维转角模块通过无线信号进行通讯;无线摄像头组模块获取实时视频流并通过主控模块传输给PC端;PC端利用YOLOv8s多尺度精准化行人类别检测模型将特定行人动态坐标返回给主控模块;主控模块进行PID运算,控制二维转角模块打角,二维转向追踪特定行人并上传到PC端,存储到查询集中;

(2)构建基于YOLOv8s多尺度精准化行人类别检测模型,包括:YOLOv8s模型和多尺度精准化行人类别检测模块;YOLOv8s模型将处理过的图像通过串联的形式传递给多尺度精准化行人类别检测模块;YOLOv8s模型处理过程具体如下:YOLOv8s对输入的视频帧进行目标检测,在检测结果中,只对类别为“person”即行人的检测框进行进一步处理;对每个检测到的“person”对象,提取出相应的检测框坐标 (Xmin, Ymin, Xmax, Ymax);利用坐标在原始图像上裁剪出行人图像,然后对图像进行尺寸调整;将裁剪并处理好的行人图像和查询集共同输入到多尺度精准化行人类别检测模块中进行特征提取,并将特征传递给检测头进行目标预测;多尺度精准化行人类别检测模块具体如下:用于提取行人图像特征,对特定行人ID进行检索,主干网络为ResNet50;其中,将基础学习率函数替换为阶段式学习率调度器,通过与热身函数相结合,在训练过程中使用多项式衰减进行学习率衰减,在后续阶段切换到余弦退火以平滑调整学习率;在ResNet50模块第3层后增加自适应表征联合注意力模块,包括:空间变换器注意块STAB和挤压和激励注意块SEAB;在ResNet50后进行调用损失函数部分,添加正则化中心损失;

(3)使用相机感知行人重识别方法计算YOLOv8s模型输出的图像与查询集中的行人图像的相似性;若相似,更新查询集;若不相似,则存储到查询集中;其中,相机感知行人重识别方法具体如下:首先,采用欧式距离得到所有行人图片的原始距离矩阵;其次,根据K‑最近邻算法的重叠来测量行人图片之间的距离,将行人图片的邻近行人图片集编码设为加权单位向量,并将邻近行人图片集比较问题转换为纯向量计算;具体公式如下:设样本 ,序列公式为:

其中, 代表样本 在排序后,训练集中第 个最近邻的样本;

则利用样本 和序列 表示K‑最近邻集 公式如下:

其中,为与样本 距离最近的训练样本数量,  表示从序列 中提取出从第1个元素到第 个元素,含第 个元素的子序列;

K相互近邻集 表示为:

其中, 为约束后的距离最近的训练样本数量;

K相互近邻集的判定如下:

约束条件如下:

其中, 表示集合中的样本数量;

样本 的稳定相互近邻集被编码为:

其中,是N维单位向量,如果 在 的最近邻集内,则 是根据 和 之间的原始距离计算得出的,否则即为0,公式如下:;

其中, 为 和 之间的原始距离;考虑到相似的样本共享相似的特征和邻居,采用LQE对 的 个最近邻居的加权相互近邻集编码向量进行平均,生成加权扩展向量:;

其中,代表 的相互近邻集编码向量, 为 和 在强匹配下的距离最近的训练样本数量,最终 和 之间优化的Jaccard距离,通过矢量化重叠计算的公式为:;

其中, 和 是向量形式的交集和并集运算。