1.一种基于双流的Deepfakes视频检测方法,其特征在于,包括步骤:使用自适应视频帧提取方法提取视频中的人脸图像;其中,所述自适应视频帧提取方法,包括:获取序列长度、样本数量以及所述视频的视频总帧数,所述样本数量指将所述视频总帧数分成多个样本的数量,所述序列长度指从每个所述样本中提取的视频帧的数量;
将所述视频中的第一帧人脸坐标设置为最大人脸坐标;
基于所述视频总帧数和所述样本的数量,计算跳跃步长;
将视频帧索引初始化为零;
当所述视频帧索引小于所述视频总帧数时,判断所述视频帧索引与所述跳跃步长的求余结果是否大于所述序列长度;
如果所述视频帧索引与所述跳跃步长的求余结果小于所述序列长度,获取所述视频帧索引对应的视频帧中的人脸坐标;如果所述视频帧中有多个所述人脸坐标,计算每个所述人脸坐标与所述最大人脸坐标之间的欧氏距离,并将欧氏距离最小的人脸坐标作为新的最大人脸坐标,保存所述新的最大人脸坐标对应的人脸图像并对齐,使所述视频帧索引自增一,再判断所述视频帧索引是否小于所述视频总帧数;如果所述视频帧中只有一个所述人脸坐标,直接保存所述人脸坐标对应的人脸图像并对齐,使所述视频帧索引自增一,再判断所述视频帧索引是否小于所述视频总帧数;如果视频帧中没有所述人脸坐标,使所述视频帧索引自增一,再判断所述视频帧索引是否小于所述视频总帧数;
如果所述视频帧索引与所述跳跃步长的求余结果大于或等于所述序列长度,将所述视频帧索引自增一,再判断所述视频帧索引是否小于所述视频总帧数;
当所述视频帧索引大于或等于所述视频总帧数时,结束视频帧读取;
如果获得的所述人脸图像数量大于指定的所述样本的数量,删除最后多余的视频帧对应的人脸图像;
提取所述人脸图像的篡改伪影特征,对所述篡改伪影特征进行全局平均池化,获得第一特征图;
获取所述人脸图像对应的残差图像;
提取所述残差图像的篡改痕迹特征,对所述篡改痕迹特征进行全局平均池化,获得第二特征图;
融合所述第一特征图和所述第二特征图,获得融合特征图;
将所述融合特征图进行分类,获得目标检测结果。
2.根据权利要求1所述的基于双流的Deepfakes视频检测方法,其特征在于,所述提取所述人脸图像的篡改伪影特征,对所述篡改伪影特征进行全局平均池化,获得第一特征图,包括如下步骤:采用Xception提取所述人脸图像的篡改伪影特征,获得篡改伪影特征图;
将所述篡改伪影特征图进行全局平均池化,获得所述第一特征图。
3.根据权利要求1所述的基于双流的Deepfakes视频检测方法,其特征在于,所述获取所述人脸图像对应的残差图像,包括如下步骤:使用三组高通滤波器分别对所述人脸图像的三个通道进行卷积操作,获得三个卷积结果;
并将所述三个卷积结果以通道维度进行拼接,获得所述残差图像。
4.根据权利要求1所述的基于双流的Deepfakes视频检测方法,其特征在于,所述提取所述残差图像的篡改痕迹特征,对所述篡改痕迹特征进行全局平均池化,获得第二特征图,包括步骤:采用Xception提取所述残差图像的篡改痕迹特征,获得篡改痕迹特征图;
将所述篡改痕迹特征图进行全局平均池化,获得所述第二特征图。
5.根据权利要求1所述的基于双流的Deepfakes视频检测方法,其特征在于,所述融合所述第一特征图和所述第二特征图,获得融合特征图,包括步骤:采用级联的方式融合所述第一特征图和所述第二特征图,获得所述融合特征图。
6.根据权利要求1所述的基于双流的Deepfakes视频检测方法,其特征在于,所述将所述融合特征图进行分类,获得目标检测结果,包括步骤:在全连接层之前加入Dropout层;
将所述融合特征图输入至所述全连接层,获得所述目标检测结果。
7.一种基于双流的Deepfakes视频检测系统,其特征在于,包括:人脸图像提取单元,用于使用自适应视频帧提取方法提取视频中的人脸图像;其中,所述自适应视频帧提取方法,包括:获取序列长度、样本数量以及所述视频的视频总帧数,所述样本数量指将所述视频总帧数分成多个样本的数量,所述序列长度指从每个所述样本中提取的视频帧的数量;
将所述视频中的第一帧人脸坐标设置为最大人脸坐标;
基于所述视频总帧数和所述样本的数量,计算跳跃步长;
将视频帧索引初始化为零;
当所述视频帧索引小于所述视频总帧数时,判断所述视频帧索引与所述跳跃步长的求余结果是否大于所述序列长度;
如果所述视频帧索引与所述跳跃步长的求余结果小于所述序列长度,获取所述视频帧索引对应的视频帧中的人脸坐标;如果所述视频帧中有多个所述人脸坐标,计算每个所述人脸坐标与所述最大人脸坐标之间的欧氏距离,并将欧氏距离最小的人脸坐标作为新的最大人脸坐标,保存所述新的最大人脸坐标对应的人脸图像并对齐,使所述视频帧索引自增一,再判断所述视频帧索引是否小于所述视频总帧数;如果所述视频帧中只有一个所述人脸坐标,直接保存所述人脸坐标对应的人脸图像并对齐,使所述视频帧索引自增一,再判断所述视频帧索引是否小于所述视频总帧数;如果视频帧中没有所述人脸坐标,使所述视频帧索引自增一,再判断所述视频帧索引是否小于所述视频总帧数;
如果所述视频帧索引与所述跳跃步长的求余结果大于或等于所述序列长度,将所述视频帧索引自增一,再判断所述视频帧索引是否小于所述视频总帧数;
当所述视频帧索引大于或等于所述视频总帧数时,结束视频帧读取;
如果获得的所述人脸图像数量大于指定的所述样本的数量,删除最后多余的视频帧对应的人脸图像;
第一特征图提取单元,用于提取所述人脸图像的篡改伪影特征,对所述篡改伪影特征进行全局平均池化,获得第一特征图;
残差图像获取单元,用于获取所述人脸图像对应的残差图像;
第二特征图提取单元,用于提取所述残差图像的篡改痕迹特征,对所述篡改痕迹特征进行全局平均池化,获得第二特征图;
融合特征图获取单元,用于融合所述第一特征图和所述第二特征图,获得融合特征图;
目标检测结果获取单元,用于将所述融合特征图进行分类,获得目标检测结果。
8.一种基于双流的Deepfakes视频检测设备,其特征在于:包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至6任一项所述的一种基于双流的Deepfakes视频检测方法。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至6任一项所述的一种基于双流的Deepfakes视频检测方法。