利索能及
我要发布
收藏
专利号: 2017105661733
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种目标分类方法,其特征在于,包括:

针对待检测目标,根据一帧包含所述待检测目标的视频帧,对所述待检测目标进行目标分类,得到所述待检测目标对应的目标类型;

当对所述待检测目标进行目标分类时,记录所述待检测目标的分类次数和分类时间,所述分类次数为对所述待检测目标进行目标分类的总次数;

当所述待检测目标对应的目标类型不为预设类型时,判断所述待检测目标是否满足第一预设条件,其中,所述第一预设条件包括:所述待检测目标的分类次数小于第一预设值,且所记录的所述待检测目标最后的分类时间与当前时间的时间间隔大于第二预设值;

当所述待检测目标满足第一预设条件时,获取所述视频帧之后的另一帧包含所述待检测目标的视频帧。

2.根据权利要求1所述的方法,其特征在于,所述针对待检测目标,根据一帧包含所述待检测目标的视频帧,对所述待检测目标进行目标分类的步骤,包括:针对待检测目标,从包含所述待检测目标的视频帧中,获取仅含有所述待检测目标的区域图像;

根据所述仅含有所述待检测目标的区域图像,对所述待检测目标进行目标分类。

3.根据权利要求1所述的方法,其特征在于,在所述针对待检测目标,根据一帧包含所述待检测目标的视频帧,对所述待检测目标进行目标分类,得到所述各待检测目标对应的目标类型的步骤之前,所述方法包括:确定进入监控场景中预设区域的一个或多个第一目标,并根据第一目标确定一个或多个待检测目标;

针对每个待检测目标,获取至少第一帧数的包含该待检测目标的第一视频图像,并对所获取的第一视频图像进行筛选,确定出一帧包含该待检测目标的视频帧。

4.根据权利要求3所述的方法,其特征在于,所述确定进入监控场景中预设区域的一个或多个第一目标包括:获取至少第二帧数的所述监控场景的第二视频图像,所述第二帧数大于或等于所述第一帧数;

提取所述第二视频图像中的每一个目标;

针对每个目标,在第二视频图像中确定出包含该目标的第三视频图像,并获取每一个目标在所述第三视频图像中的位置信息;

根据该目标在所述第三视频图像中的位置信息,确定该目标是否为进入监控场景中预设区域的第一目标。

5.根据权利要求3所述的方法,其特征在于,所述根据第一目标确定一个或多个待检测目标包括:针对每个第一目标,对每一个所述第一目标按第二预设条件进行筛选,其中,所述第二预设条件包括:在第一帧数的包含该第一目标的视频图像中该第一目标的宽度均大于第三预设阈值,且该第一目标的高度均大于第四预设阈值;

当所述第一目标满足第二预设条件时,将所述第一目标作为待检测目标;

所述针对每个待检测目标,获取至少第一帧数的包含该待检测目标的第一视频图像,并对所获取的第一视频图像进行筛选,确定出一帧包含该待检测目标的视频帧的步骤包括:针对每个待检测目标,获取至少第一帧数的包含该待检测目标的第一视频图像,从该第一帧数的第一视频图像中选择该待检测目标的目标面积最大的一帧视频帧作为该待检测目标对应的第一视频帧,并将该第一视频帧作为包含该待检测目标的视频帧。

6.根据权利要求5所述的方法,其特征在于,当确定出多个待检测目标时,所述针对每个待检测目标,获取至少第一帧数的包含该待检测目标的第一视频图像,从该第一帧数的第一视频图像中选择该待检测目标的目标面积最大的一帧视频帧作为该待检测目标对应的第一视频帧,并将该第一视频帧作为包含该待检测目标的视频帧的步骤包括:针对每个待检测目标,获取至少第一帧数的包含该待检测目标的第一视频图像,从该第一视频图像中选择该待检测目标的目标面积最大的一帧视频帧作为该待检测目标对应的第一视频帧;

在各待检测目标对应的第一视频帧中选择出待检测目标的目标面积最大的第一视频帧,作为最优视频帧;

将所述最优视频帧作为包含待检测目标的视频帧。

7.根据权利要求6所述的方法,其特征在于,在各待检测目标对应的第一视频帧中选择出待检测目标的目标面积最大的第一视频帧,作为最优视频帧的步骤包括:当存在多个待检测目标对应的第一视频帧中待检测目标的目标面积相同时,计算该多个待检测目标在第一帧数的第一视频图像中的目标面积的方差,选择方差最小的待检测目标所对应的第一视频帧,作为最优视频帧。

8.根据权利要求1所述的方法,其特征在于,在所述当所述待检测目标满足第一预设条件时,获取在所述视频帧之后的另一帧包含所述待检测目标的视频帧的步骤之后,所述方法还包括:针对待检测目标,根据所述另一帧包含所述待检测目标的视频帧,再次对对所述待检测目标进行目标分类,得到所述各待检测目标对应的目标类型。

9.根据权利要求1至8中任一项所述的方法,其特征在于,所述针对待检测目标,根据一帧包含所述待检测目标的视频帧,对所述待检测目标进行目标分类,得到所述待检测目标对应的目标类型的步骤包括:通过预先训练得到的目标卷积神经网络,对一帧包含所述待检测目标的视频帧进行目标分类,得到所述待检测目标对应的目标类型和置信度,所述目标卷积神经网络为预先根据包含目标的样本图像,以及各样本图像对应的目标类型训练得到的。

10.根据权利要求9所述的方法,其特征在于,在所述通过预先训练得到的目标卷积神经网络,对一帧包含所述待检测目标的视频帧进行目标分类,得到所述待检测目标对应的目标类型和置信度步骤之后,所述方法还包括:当所述待检测目标的目标类型为预设类型,且所述置信度大于或等于对应所述预设类型的预设阈值时,针对该待检测目标进行报警。

11.根据权利要求10所述的方法,其特征在于,所述针对该待检测目标进行报警的步骤包括:获取所述监控场景的当前视频图像,并提取所述当前视频图像中的每一个目标;

判断所述每一个目标中是否存在该待检测目标;如果存在,针对该待检测目标进行报警。

12.一种目标分类装置,其特征在于,包括:

第一分类模块,用于针对待检测目标,根据一帧包含所述待检测目标的视频帧,对所述待检测目标进行目标分类,得到所述待检测目标对应的目标类型;

记录模块,用于当对所述待检测目标进行目标分类时,记录所述待检测目标的分类次数和分类时间,所述分类次数为对所述待检测目标进行目标分类的总次数;

判断模块,用于当所述待检测目标对应的目标类型不为预设类型时,判断所述待检测目标是否满足第一预设条件,其中,所述第一预设条件包括:所述待检测目标的分类次数小于第一预设值,且所记录的所述待检测目标最后的分类时间与当前时间的时间间隔大于第二预设值;

获取模块,用于当当所述待检测目标满足第一预设条件时,获取所述视频帧之后的另一帧包含所述待检测目标的视频帧。

13.根据权利要求12所述的装置,其特征在于,所述第一分类模块包括:图像获取子模块,用于针对各待检测目标,从包含所述待检测目标的视频帧中,获取仅含有所述待检测目标的区域图像;

目标分类子模块,用于根据所述仅含有所述待检测目标的区域图像,对所述待检测目标进行目标分类。

14.根据权利要求13所述的装置,其特征在于,所述装置还包括:

检测模块,用于确定进入监控场景中预设区域的一个或多个第一目标,并根据第一目标确定一个或多个待检测目标;

筛选模块,用于针对每个待检测目标,获取至少第一帧数的包含该待检测目标的第一视频图像,并对所获取的第一视频图像进行筛选,确定出一帧包含该待检测目标的视频帧。

15.根据权利要求12所述的装置,其特征在于,所述检测模块,具体用于:获取至少第二帧数的所述监控场景的第二视频图像,所述第二帧数大于或等于所述第一帧数;提取所述第二视频图像中的每一个目标;针对每个目标,在第二视频图像中确定出包含该目标的第三视频图像,并获取每一个目标在所述第三视频图像中的位置信息;根据该目标在所述第三视频图像中的位置信息,确定该目标是否为进入监控场景中预设区域的第一目标。

16.根据权利要求14所述的装置,其特征在于,所述检测模块,具体用于:针对每个第一目标,对每一个所述第一目标按第二预设条件进行筛选,其中,所述第二预设条件包括:在第一帧数的包含该第一目标的视频图像中该第一目标的宽度均大于第三预设阈值,且该第一目标的高度均大于第四预设阈值;当所述第一目标满足第二预设条件时,将所述第一目标作为待检测目标;

所述筛选模块具体用于:

针对每个待检测目标,获取至少第一帧数的包含该待检测目标的第一视频图像,从该第一帧数的第一视频图像中选择该待检测目标的目标面积最大的一帧视频帧作为该待检测目标对应的第一视频帧,并将该第一视频帧作为包含该待检测目标的视频帧。

17.根据权利要求16所述的装置,其特征在于,当所述检测模块确定出多个待检测目标时,所述筛选模块,具体用于:针对每个待检测目标,获取至少第一帧数的包含该待检测目标的第一视频图像,从该第一视频图像中选择该待检测目标的目标面积最大的一帧视频图像作为该待检测目标对应的第一视频帧;在各待检测目标对应的第一视频帧中选择出待检测目标的目标面积最大的第一视频帧,作为最优视频帧;将所述最优视频帧作为包含待检测目标的视频帧。

18.根据权利要求17所述的装置,其特征在于,所述筛选模块,具体用于:当存在多个待检测目标对应的第一视频帧中待检测目标的目标面积相同时,计算该多个待检测目标在第一帧数的第一视频图像中的目标面积的方差,选择方差最小的待检测目标所对应的第一视频帧,作为最优视频帧。

19.根据权利要求12所述的装置,其特征在于,所述装置还包括:

第二分类模块,用于针对待检测目标,根据所述另一帧包含所述待检测目标的视频帧,再次对对所述待检测目标进行目标分类,得到所述各待检测目标对应的目标类型。

20.根据权利要求12至19中任一项所述的装置,其特征在于,所述第一分类模块,具体用于:通过预先训练得到的目标卷积神经网络,对一帧包含所述待检测目标的视频帧进行目标分类,得到所述各待检测目标对应的目标类型和置信度,所述目标卷积神经网络为预先根据包含目标的样本图像,以及各样本图像对应的目标类型训练得到的。

21.根据权利要求19所述的装置,其特征在于,所述装置还包括:

报警模块,用于当所述待检测目标的目标类型为预设类型,且所述置信度大于或等于对应所述预设类型的预设阈值时,针对该待检测目标进行报警。

22.根据权利要求21所述的装置,其特征在于,所述报警模块,具体用于:获取所述监控场景的当前视频图像,并提取所述当前视频图像中的每一个目标;判断所述每一个目标中是否存在该待检测目标;如果存在,针对该待检测目标进行报警。

23.一种目标分类系统,其特征在于,包括:

数据采集设备、图像处理设备;

所述数据采集设备与所述图像处理设备通过数据总线相连接并完成相互间的通信;

所述数据采集设备用于采集监控场景的视频图像;

所述图像处理设备通过所存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行如权利要求1至11中任一项所述的目标分类方法。

24.根据权利要求23所述的系统,其特征在于,所述图像处理设备包括存储器、至少两个处理器;

各处理器分别为独立的并行处理器,分别与所述存储器通过数据总线进行连接。