利索能及
我要发布
收藏
专利号: 2023115186888
申请人: 成都航空职业技术学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度学习的运动目标检测方法,其特征在于,包括:

S1:获取检测目标的特征图像;

S2:获取初始视频,其中,所述初始视频为待检视频集中所述检测目标在初始位置的视频;

S3:将所述初始视频对应监控的地理位置输入视频拓扑模型,得到第一视频集;

其中,所述视频拓扑模型为根据所述待检视频集对应监控的地理位置关系建立的拓扑模型,所述第一视频集为所述待检视频集中与所述初始视频对应监控的地理位置相邻的视频的集合;

S4:对所述第一视频集进行分帧处理,得到若干个对应的第一图像集;

S5:根据所述特征图像对所述检测目标进行目标检测,分别将所述第一图像集输入目标检测模型,判断第一视频是否存在所述检测目标,其中,所述第一视频为所述第一视频集的元素,当所有所述第一视频都不存在所述检测目标时产生反馈信号,所述反馈信号用于表示所述目标检测已经结束,当一个或多个所述第一视频存在所述检测目标时,将所述第一视频作为所述初始视频,重复S3‑S5;

若所述第一视频集中仅有一个视频存在所述检测目标时,则将所述视频作为初始视频;若所述第一视频集中有两个及以上视频存在所述检测目标时,则采用决策方式继续进行目标检测,所述决策方式包括通过串行和/或并行的方式对所有所述视频进行遍历,或者根据在所述视频中第一次检测到所述检测目标的时间点进行排序,取时间点最小值对应的所述视频作为所述初始视频,或者根据在所述视频中第一次检测到所述检测目标的时间点进行排序,选取时间点最大值对应的所述视频作为初始视频;

其中,将所述初始视频对应监控的地理位置输入所述视频拓扑模型,得到所述第一视频集之前,还包括:获取所述检测目标从所述初始视频消失前的最后一帧图像,得到第二图像;

其中,按照时间轴的逆向顺序获取所述第二图像;

将所述第二图像输入所述视频拓扑模型,根据所述检测目标在所述第二图像中的位置,得到所述第一视频集;

其中,所述视频拓扑模型包括结点和链路,建立方法具体如下:

采集所述待检视频集在相同时间点处截取的图像,得到第三图像集;

分别对所述第三图像集进行图像预处理,得到第四图像集;

获取所述待检视频集对应监控的地理位置;

分别对所有第四图像进行特征识别和提取,得到有效区域,其中,所述第四图像为所述第四图像集中的元素,所述有效区域为每一个所述第四图像中与其他所述第四图像表现出地理位置相邻的图像区域;

以所有待检视频为所述结点,将每一个所述有效区域与其他所述第四图像的对应关系作为所述结点之间的所述链路,得到所述视频拓扑模型;

其中,将所述第二图像输入所述视频拓扑模型之前,还包括获取所述第二图像对应的时间点,得到消失时间。

2.如权利要求1所述的一种基于深度学习的运动目标检测方法,其特征在于,分别对所有所述第四图像进行特征识别和提取,得到所述有效区域之后,所述视频拓扑模型的所述建立方法还包括根据预设重叠率建立视频组,其中,所述预设重叠率为将两个及以上的所述待检视频作为视频组建立所述结点的重叠率阈值,所述视频组的建立方法具体如下:判断所述有效区域是否属于视域重叠区域,所述视域重叠区域为两个及以上的所述待检视频之间出现视域重叠的区域,当所述有效区域属于所述视域重叠区域时,计算得到当前所述第四图像的实际重叠率,将所述实际重叠率与所述预设重叠率进行对比,当所述实际重叠率大于所述预设重叠率时,将所述两个及以上的所述待检视频作为所述视频组建立所述结点,当所述有效区域不属于所述视域重叠区域,或所述实际重叠率不大于所述预设重叠率时不建立所述视频组,分别将所述两个及以上的所述待检视频作为所述结点建立所述视频拓扑模型。

3.如权利要求2所述的一种基于深度学习的运动目标检测方法,其特征在于,获取所述检测目标的所述特征图像之后,还包括:对所述特征图像进行特征提取,得到第一向量,所述第一向量为所述检测目标在所述特征图像中的特征向量;

获取所述第一向量中每一项分量对应的第一权重,所述第一权重用于对所述分量的期望关注度进行排序,所述期望关注度越高的所述分量对应的所述第一权重越高。

4.如权利要求3所述的一种基于深度学习的运动目标检测方法,其特征在于,当一个或多个所述第一视频存在所述检测目标时,还包括对疑似目标进行人工校验,其中,所述疑似目标为根据所述第一向量在所述第一图像集中检测到可能为所述检测目标的对象,所述人工校验方法具体如下:判断所述疑似目标与所述检测目标是否一致,当所述疑似目标与所述检测目标一致时,所述第一视频集存在所述检测目标,当所述疑似目标与所述检测目标不一致时,所述第一视频集不存在所述检测目标,产生所述反馈信号。

5.如权利要求4所述的一种基于深度学习的运动目标检测方法,其特征在于,当所述疑似目标与所述检测目标一致时,还包括对所述第一向量进行特征更新,具体如下:对所述疑似目标进行所述特征向量的提取,得到第二向量;

将所述第二向量和所述第一向量进行特征融合,得到第三向量;

将所述第三向量用于作为所述第一向量输入所述目标检测模型。

6.如权利要求5所述的一种基于深度学习的运动目标检测方法,其特征在于,所述目标检测模型为SIFT目标检测模型,所述SIFT目标检测模型用于利用SIFT算法对所述检测目标与所述第一图像进行特征对比,所述目标检测模型的输入是所述特征图像和所述第一图像,输出为所述第一图像是否存在与所述第一向量对应的所述检测目标,当所述第一图像存在与所述第一向量对应的所述检测目标时,输出所述疑似目标,当所述第一图像不存在与所述第一向量对应的所述检测目标时,输出所述反馈信号。

7.一种基于深度学习的运动目标检测系统,其特征在于,包括:

特征提取模块:所述特征提取模块用于获取检测目标的特征图像;

视频采集模块;所述视频采集模块用于获取初始视频,其中,所述初始视频为待检视频集中所述检测目标在初始位置的视频;

图像处理模块:所述图像处理模块用于对第一视频集进行分帧处理,得到若干个对应的第一图像集;获取所述检测目标从所述初始视频消失前的最后一帧图像,得到第二图像;

所述图像处理模块将所述第二图像发送给数据处理模块,所述数据处理模块将所述第二图像输入视频拓扑模型,根据所述检测目标在所述第二图像中的位置,得到所述第一视频集;

其中,所述视频拓扑模型包括结点和链路,建立方法具体如下:

采集所述待检视频集在相同时间点处截取的图像,得到第三图像集;

分别对所述第三图像集进行图像预处理,得到第四图像集;

获取所述待检视频集对应监控的地理位置;

分别对所有第四图像进行特征识别和提取,得到有效区域,其中,所述第四图像为所述第四图像集中的元素,所述有效区域为每一个所述第四图像中与其他所述第四图像表现出地理位置相邻的图像区域;

以所有待检视频为所述结点,将每一个所述有效区域与其他所述第四图像的对应关系作为所述结点之间的所述链路,得到所述视频拓扑模型;

目标检测模块:所述目标检测模块用于根据所述特征图像对所述检测目标进行目标检测,分别将所述第一图像集输入目标检测模型,判断所有第一视频是否存在所述检测目标,其中,所述第一视频为所述第一视频集的元素,当所有所述第一视频都不存在所述检测目标时产生反馈信号,所述反馈信号用于表示所述目标检测已经结束,当一个或多个所述第一视频存在所述检测目标时,将所述第一视频作为所述初始视频,将所述初始视频发送给数据处理模块;

若所述第一视频集中仅有一个视频存在所述检测目标时,则将所述视频作为初始视频;若所述第一视频集中有两个及以上视频存在所述检测目标时,则采用决策方式继续进行目标检测,所述决策方式包括通过串行和/或并行的方式对所有所述视频进行遍历,或者根据在所述视频中第一次检测到所述检测目标的时间点进行排序,取时间点最小值对应的所述视频作为所述初始视频,或者根据在所述视频中第一次检测到所述检测目标的时间点进行排序,选取时间点最大值对应的所述视频作为初始视频;

数据处理模块,所述数据处理模块用于将所述初始视频对应监控的地理位置输入视频拓扑模型,得到第一视频集;

其中,所述视频拓扑模型为根据所述待检视频集对应监控的地理位置关系建立的拓扑模型,所述第一视频集为所述待检视频集中与所述初始视频对应监控的地理位置相邻的视频的集合;

其中,将所述第二图像输入所述视频拓扑模型之前,还包括获取所述第二图像对应的时间点,得到消失时间;

所述数据处理模块按照时间轴的逆向顺序获取所述第二图像。