利索能及
我要发布
收藏
专利号: 2020113650747
申请人: 上海商汤智能科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种视频检测方法,其特征在于,所述方法包括:

获取待检测视频中的多个第一视频帧,以及所述待检视频所对应的第一视频流,所述第一视频帧包括多个人脸;

获取对所述第一视频帧进行真伪检测的单帧检测结果,包括:获取所述第一视频帧中多个人脸对应的人脸检测框;根据所述人脸检测框对应的图像区域,确定相应人脸的单人检测结果;通过第二设定函数将各个人脸的单人检测结果映射为第二概率,其中,所述第二设定函数为非线性映射函数;根据各个人脸的单人检测结果以及所述第二概率,得到单帧检测结果;

获取对所述第一视频流进行真伪检测的视频流检测结果;

根据所述多个第一视频帧的单帧检测结果和所述第一视频流的视频流检测结果,确定所述待检测视频的真伪判别结果。

2.根据权利要求1所述的方法,其特征在于,所述获取待检测视频中的多个第一视频帧,包括:以设定帧数跨度对所述待检测视频进行抽帧处理,得到所述多个第一视频帧,其中,所述设定帧数跨度与所述待检测视频的帧数呈正相关。

3.根据权利要求1所述的方法,其特征在于,所述获取对所述第一视频帧进行真伪检测的单帧检测结果,包括:通过第一真伪分类网络对所述第一视频帧进行真伪检测,得到所述第一视频帧的单帧检测结果,其中,所述单帧检测结果用于表征所述第一视频帧是伪造的置信度。

4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取对所述第一视频流进行真伪检测的视频流检测结果,包括:通过第二真伪分类网络,根据所述第一视频流所包含的视频帧以及帧间关系,对所述第一视频流进行真伪检测,得到所述第一视频流的视频流检测结果,其中,所述视频流检测结果用于表征所述第一视频流是伪造的置信度。

5.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一视频帧的单帧检测结果和所述第一视频流的视频流检测结果,确定所述待检测视频的真伪判别结果,包括:对所述多个第一视频帧的单帧检测结果进行融合,得到融合结果;

根据所述融合结果和所述视频流检测结果,确定所述待检测视频的真伪判别结果。

6.根据权利要求5所述的方法,其特征在于,所述对所述多个第一视频帧的单帧检测结果进行融合,得到融合结果,包括:对所述多个第一视频帧的单帧检测结果进行分组,并获得各组的平均检测结果;

通过第一设定函数将各组的平均检测结果映射为第一概率,其中,所述设定函数为非线性映射函数;

根据各组的平均检测结果以及所述第一概率,得到融合结果。

7.根据权利要求6所述的方法,其特征在于,所述根据各组的平均检测结果以及所述第一概率,得到融合结果,包括:响应于大于第一设定阈值的第一概率的比例大于第一设定比例,根据大于所述第一设定阈值的第一概率所对应的平均检测结果得到融合结果;和/或,响应于小于第二设定阈值的第一概率的比例大于第二设定比例,根据小于所述第二设定阈值的第一概率所对应的平均检测结果得到融合结果;

其中,所述第一设定阈值大于所述第二设定阈值。

8.根据权利要求5至7任一项所述的方法,其特征在于,所述根据所述融合结果和所述视频流检测结果,确定所述待检测视频的真伪判别结果,包括:对所述融合结果和所述视频流检测结果进行加权平均,根据所得到的加权平均结果确定所述待检测视频的真伪判别结果。

9.根据权利要求1所述的方法,其特征在于,所述根据各个人脸的单人检测结果以及所述第二概率,得到单帧检测结果,包括:响应于所述第一视频帧中存在大于第三设定阈值的第二概率,获取所述第一视频帧中最大的单人检测结果作为单帧检测结果;和/或,响应于所述第一视频帧的所有第二概率大于第四设定阈值,获取所述第一视频帧中最大的单人检测结果作为单帧检测结果;和/或,响应于所述第一视频帧的所有第二概率小于第五设定阈值,获取所述第一视频帧中最小的单人检测结果作为单帧检测结果;

其中,所述第三设定阈值大于所述第四设定阈值,所述第四设定阈值大于所第五设定阈值。

10.根据权利要求3所述的方法,其特征在于,所述第一真伪分类网络包括多种结构的真伪分类网络,所述通过第一真伪分类网络对所述第一视频帧进行真伪检测,得到所述第一视频帧的单帧检测结果,包括:通过所述多种结构的真伪分类网络对所述第一视频帧进行真伪检测,获得多个子单帧检测结果;

通过第三设定函数将所述多个子单帧检测结果分别映射为第三概率,其中,所述第三设定函数为非线性映射函数;

响应于大于第六设定阈值的第三概率的比例大于第三设定比例,根据大于所述第六设定阈值的第三概率所对应的子单帧检测结果得到单帧检测结果;和/或,响应于小于第七设定阈值的第三概率的比例大于第四设定比例,根据小于所述第七设定阈值的第三概率所对应的子单帧检测结果得到单帧检测结果,其中,所述第六设定阈值大于所述第七设定阈值。

11.根据权利要求4所述的方法,其特征在于,所述第二真伪分类网络包括多种结构的真伪分类网络,所述通过第二真伪分类网络,根据所述第一视频流所包含的视频帧以及帧间关系,对所述第一视频流进行真伪检测,得到所述第一视频流的视频流检测结果,包括:通过所述多种结构的真伪分类网络,根据所述第一视频流所包含的视频帧以及帧间关系,对所述第一视频流进行真伪检测,获得多个子视频流检测结果;

通过第四设定函数将所述多个子视频流检测结果分别映射为第四概率,其中,所述第四设定函数为非线性映射函数;

响应于大于第八设定阈值的第四概率的比例大于第五设定比例,根据大于所述第八设定阈值的第四概率所对应的子视频流检测结果得到视频流检测结果;和/或,响应于小于第九设定阈值的第四概率的比例大于第六设定比例,根据小于所述第九设定阈值的第四概率所对应的子视频流检测结果得到视频流检测结果,其中,所述第八设定阈值大于所述第九设定阈值。

12.根据权利要求1所述的方法,其特征在于,所述单帧检测结果为指示所述第一视频帧中的脸部图像是否为换脸脸部图像的检测结果;所述视频流检测结果为指示所述第一视频流中的脸部图像是否为换脸脸部图像的检测结果;所述待检测视频的真伪判别结果为是否为换脸视频的判别结果。

13.一种视频检测装置,其特征在于,所述装置包括:

第一获取单元,用于获取待检测视频中的多个第一视频帧,以及所述待检视频所对应的第一视频流,所述第一视频帧包括多个人脸;

第二获取单元,用于获取对所述第一视频帧进行真伪检测的单帧检测结果,具体用于获取所述第一视频帧中多个人脸对应的人脸检测框;根据所述人脸检测框对应的图像区域,确定相应人脸的单人检测结果;通过第二设定函数将各个人脸的单人检测结果映射为第二概率,其中,所述第二设定函数为非线性映射函数;根据各个人脸的单人检测结果以及所述第二概率,得到单帧检测结果;

第三获取单元,用于获取对所述第一视频流进行真伪检测的视频流检测结果;

确定单元,用于根据所述多个第一视频帧的单帧检测结果和所述第一视频流的视频流检测结果,确定所述待检测视频的真伪判别结果。

14.一种电子设备,其特征在于,所述设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时实现权利要求1至12任一项所述的方法。

15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至12任一项所述的方法。