利索能及
我要发布
收藏
专利号: 2016110131179
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-13
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种目标对象检测方法,其特征在于,包括如下步骤:在视频图像序列的当前帧确定至少一个待检测的感兴趣区域,每个所述感兴趣区域至少部分包含至少一个目标对象的信息;

分别提取所述当前帧的感兴趣区域中的目标对象的特征;

根据所述目标对象的特征对所述当前帧的各个感兴趣区域进行预测,得到预测结果;

根据所述当前帧的各个感兴趣区域的预测结果确定后续帧待检测的感兴趣区域。

2.如权利要求1所述的目标对象检测方法,其特征在于,所述预测结果包括:所述感兴趣区域包含目标对象的概率和所述目标对象的预测位置。

3.如权利要求1或2所述的目标对象检测方法,其特征在于,所述根据所述当前帧的各个感兴趣区域的预测结果确定后续帧待检测的感兴趣区域,包括:将所述当前帧的所述目标对象的预测位置作为所述后续帧的待检测的感兴趣区域。

4.如权利要求1-3任一所述的目标对象检测方法,其特征在于,所述根据所述当前帧的各个感兴趣区域的预测结果确定后续帧待检测的感兴趣区域包括:获取所述当前帧的感兴趣区域中目标对象在区域的边界位置;

对目标对象所在区域对应的所述边界位置进行加权得到与所述当前帧的感兴趣区域对应的后续帧的目标对象区域的边界位置。

5.一种目标对象检测装置,其特征在于,包括:

第一感兴趣模块,用于在视频图像序列的当前帧确定至少一个待检测的感兴趣区域,每个所述感兴趣区域至少部分包含至少一个目标对象的信息;

特征提取模块,用于分别提取所述当前帧的感兴趣区域中的目标对象的特征;

预测模块,用于根据所述目标对象的特征对所述当前帧的各个感兴趣区域进行预测,得到预测结果;

第二感兴趣模块,用于根据所述当前帧的各个感兴趣区域的预测结果确定后续帧待检测的感兴趣区域。

6.如权利要求5所述的目标对象检测装置,其特征在于,所述预测结果包括:所述感兴趣区域包含目标对象的概率和所述目标对象的预测位置。

7.如权利要求5或6所述的目标对象检测装置,其特征在于,所述第二感兴趣模块用于将所述当前帧的所述目标对象的预测位置作为所述后续帧的待检测的感兴趣区域。

8.如权利要求5-7任意一项所述的目标对象检测装置,其特征在于,所述第二感兴趣模块包括:位置获取单元,用于获取所述当前帧的感兴趣区域中目标对象在区域的边界位置;

位置生成单元,用于对目标对象所在区域对应的所述边界位置进行加权得到与所述感兴趣区域对应的后续帧的目标对象区域的边界位置。

9.一种目标对象检测系统,其特征在于,包括:

图像获取装置,用于获取待检测视频图像的视频图像序列数据;

处理器,用于接收所述待检测视频图像的视频图像序列数据,用于执行如权利要求1-4任意一项所述方法中的操作;

存储器,用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求

1-4任一项所述方法对应的操作。

10.一种用于目标对象检测的神经网络结构,其特征在于,包括:级联的多层神经网络,各层神经网络用于接收视频图像序列中的一帧图像数据,用于对所述图像数据生成多个感兴趣区域,并对所述多个感兴趣区域进行目标对象检测得到预测结果,所述预测结果包括所述目标对象的位置;

本层神经网络的预测结果作为下一层神经网络的输入,所述下一层神经网络根据所述本层神经网络的预测结果对所述下一层神经网络接收的图像数据生成多个感兴趣区域,并进行目标对象检测得到预测结果。