买专利、卖专利、专利购买、专利交易、专利出售、高企申报-目标跟踪方法、装置和计算机可读存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

目标跟踪方法、装置和计算机可读存储介质

￥9000

专利号： 2018112855297

申请人：杭州海康威视数字技术股份有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2025-08-18

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种目标跟踪方法，其特征在于，所述方法包括：

获取需要进行目标跟踪的视频；

通过目标识别模型，确定所述视频的每帧视频图像中的检测框的位置，以及确定每个检测框内的目标的类别和图像特征，所述目标识别模型是使用目标检测数据集和检索数据集对神经网络模型进行训练得到，所述目标检测数据集中的每个目标检测数据标记有检测框位置及对应的目标类别，所述检索数据集中的每个检索数据标记有目标标识；

根据所述视频的每帧视频图像中的检测框的位置和每个检测框内的目标的类别和图像特征，对所述视频中包含的目标进行跟踪。

2.如权利要求1所述的方法，其特征在于，

所述目标识别模型是交替使用所述目标检测数据集和所述检索数据集对所述神经网络模型进行训练得到；或者，所述目标识别模型是同时使用所述目标检测数据集和所述检索数据集对所述神经网络模型进行训练得到。

3.如权利要求2所述的方法，其特征在于，

当所述目标识别模型是交替使用所述目标检测数据集和所述检索数据集对所述神经网络模型进行训练得到时，所述目标识别模型是根据第一神经网络模型中的参数的梯度值，对所述第一神经网络模型中的参数进行更新后得到，所述第一神经网络模型中的参数的梯度值是根据所述检索数据集确定得到，所述第一神经网络模型是根据所述神经网络模型中的参数的梯度值，对所述神经网络模型中的参数进行更新后得到，所述神经网络模型中的参数的梯度值是根据所述目标检测数据集确定得到；或者，当所述目标识别模型是交替使用所述目标检测数据集和所述检索数据集对所述神经网络模型进行训练得到时，所述目标识别模型是根据第二神经网络模型中的参数的梯度值，对所述第二神经网络模型中的参数进行更新后得到，所述第二神经网络模型中的参数的梯度值是根据所述目标检测数据集确定得到，所述第二神经网络模型是根据所述神经网络模型中的参数的梯度值，对所述神经网络模型中的参数进行更新后得到，所述神经网络模型中的参数的梯度值是根据所述检索数据集确定得到。

4.如权利要求2所述的方法，其特征在于，

当所述目标识别模型是同时使用所述目标检测数据集和所述检索数据集对所述神经网络模型进行训练得到时，所述目标识别模型是根据所述神经网络模型中的参数的平均梯度值，对所述神经网络模型中的参数进行更新后得到，所述神经网络模型中的参数的平均梯度值是对所述神经网络模型中的参数的第一梯度值和第二梯度值进行平均后得到，所述神经网络模型中的参数的第一梯度值是根据所述目标检测数据集确定得到，所述神经网络模型中的参数的第二梯度值是根据所述检索数据集确定得到。

5.如权利要求1-4任一所述的方法，其特征在于，所述获取需要进行目标跟踪的视频之后，还包括：获取所述视频的每帧视频图像中每个检测框内的目标的跟踪特征；

相应地，所述根据所述视频的每帧视频图像中的检测框的位置和每个检测框内的目标的类别和图像特征，对所述视频中包含的目标进行跟踪，包括：根据所述视频的每帧视频图像中的检测框的位置和每个检测框内的目标的类别、图像特征和跟踪特征，对所述视频中包含的目标进行跟踪。

6.如权利要求5所述的方法，其特征在于，所述根据所述视频的每帧视频图像中的检测框的位置和每个检测框内的目标的类别、图像特征和跟踪特征，对所述视频中包含的目标进行跟踪，包括：根据所述视频的前n帧视频图像中每帧视频图像中的检测框的位置和每个检测框内的目标的类别、图像特征和跟踪特征，确定跟踪目标集和所述跟踪目标集中每个跟踪目标的跟踪片段和跟踪信息，所述n为大于或等于2的整数；

令i＝n，根据所述视频的第i+1帧视频图像中的检测框的位置和每个检测框内的目标的类别、图像特征、跟踪特征和所述跟踪目标集中每个跟踪目标的跟踪信息，将所述第i+1帧视频图像中包含的目标与所述跟踪目标集中的每个跟踪目标进行匹配；

如果所述第i+1帧视频图像中包含的指定目标与所述跟踪目标集中的指定跟踪目标匹配成功，则将所述第i+1帧视频图像添加到所述指定跟踪目标的跟踪片段中，并根据所述指定目标所在的检测框的位置、所述指定目标的类别、图像特征和跟踪特征，更新所述指定跟踪目标的跟踪信息，所述指定目标为所述第i+1帧视频图像中包含的任意一个目标，所述指定跟踪目标为所述跟踪目标集中的任意一个跟踪目标；

如果所述第i+1帧视频图像中包含的指定目标与所述跟踪目标集中所有的跟踪目标均未匹配成功，则将所述指定目标添加到所述跟踪目标集中；将所述第i+1帧视频图像确定为所述指定目标的跟踪片段，并根据所述指定目标所在的检测框的位置、所述指定目标的类别、图像特征和跟踪特征，生成所述指定目标的跟踪信息；

令i＝i+1，返回所述根据所述视频的第i+1帧视频图像中的检测框的位置和每个检测框内的目标的类别、图像特征、跟踪特征和所述跟踪目标集中每个跟踪目标的跟踪信息，将所述第i+1帧视频图像中包含的目标与所述跟踪目标集中的每个跟踪目标进行匹配的步骤。

7.一种目标跟踪装置，其特征在于，所述装置包括：

第一获取模块，用于获取需要进行目标跟踪的视频；

确定模块，用于通过目标识别模型，确定所述视频的每帧视频图像中的检测框的位置，以及确定每个检测框内的目标的类别和图像特征，所述目标识别模型是使用目标检测数据集和检索数据集对神经网络模型进行训练得到，所述目标检测数据集中的每个目标检测数据标记有检测框位置及对应的目标类别，所述检索数据集中的每个检索数据标记有目标标识；

跟踪模块，用于根据所述视频的每帧视频图像中的检测框的位置和每个检测框内的目标的类别和图像特征，对所述视频中包含的目标进行跟踪。

8.如权利要求7所述的装置，其特征在于，

9.如权利要求8所述的装置，其特征在于，

10.如权利要求8所述的装置，其特征在于，

11.如权利要求7-10任一所述的装置，其特征在于，所述装置还包括：

第二获取模块，用于获取所述视频的每帧视频图像中每个检测框内的目标的跟踪特征；

相应地，所述跟踪模块包括：

跟踪单元，用于根据所述视频的每帧视频图像中的检测框的位置和每个检测框内的目标的类别、图像特征和跟踪特征，对所述视频中包含的目标进行跟踪。

12.如权利要求11所述的装置，其特征在于，所述跟踪单元用于：

根据所述视频的前n帧视频图像中每帧视频图像中的检测框的位置和每个检测框内的目标的类别、图像特征和跟踪特征，确定跟踪目标集和所述跟踪目标集中每个跟踪目标的跟踪片段和跟踪信息，所述n为大于或等于2的整数；

13.一种目标跟踪装置，其特征在于，所述装置包括：

处理器；