1.一种利用双向交互网络定位图像篡改区域的方法,其特征在于,对于输入的原始图像,执行以下步骤:步骤1、使用主干网络进行多尺度特征提取,获得不同层次语义与细节信息的特征图;
步骤2、首先,将所得各层的特征图分别输入对应的下采样特征补偿模块和整体注意力强化模块;
所述下采样特征补偿模块对当前层特征图进行重组拼接、组归一化以及动态加权融合后,再与当前层特征图结合得到补偿特征图;所述整体注意力强化模块对当前层特征图和底层预测图进行注意力引导增强,再与当前层特征图融合得到注意力特征图;
第一层的整体注意力强化模块使用的底层预测图的获得方法为:将第一层的下采样特征补偿模块所得补偿特征图输入第二层,通过训练所得;
然后,从第二层开始,将当前层特征图与前一层补偿后的补偿特征图进行拼接,生成增强表示特征,将该增强表示特征;
步骤3、通过多级预测图和层级融合模块对特征逐层解码,生成伪造区域的定位结果。
2.根据权利要求1所述的利用双向交互网络定位图像篡改区域的方法,其特征在于,所述下采样特征补偿模块的具体执行过程为:首先,采用相位间隔采样策略对输入特征图进行重组,生成四个互补的子特征图,四个子特征图的计算公式如下:; ;
; ;
其中, 代表在 位置处的像素值, 表示四个子特征图;
接着,将子特征图 按通道拼接以及将子特征图 按通道方向拼接,并通过1×1卷积对拼接后的两个特征图降维处理;
随后,引入组归一化操作并结合可学习的卷积核对降维后的两个特征图进行增强,得到两组补偿特征;
之后,利用可学习的动态因子 对两组补偿特征进行加权融合;
最后,通过残差连接将加权融合结果与原始的输入特征图相结合,生成对应的补偿特征图。
3.根据权利要求1所述的利用双向交互网络定位图像篡改区域的方法,其特征在于,各层的整体注意力强化模块的具体处理方法为:首先,对底层的预测图进行高斯模糊处理,并对其结果进行归一化生成注意力权重图;
然后将所得注意力权重图与当前层特征图进行逐元素乘法得到增强后特征;
接着将增强后特征与原始特征相加,并通过层归一化操作对融合结果进行规范化处理,从而获得最终的输出特征;计算公式如下:;
上式中P表示底层预测图,S表示当前层特征图,LN表示层归一化, Cg表示使用高斯核并设偏置为零的卷积操作,f(·) 是一个归一化函数,用于将高斯模糊后的图像映射到 [0, 1]范围内;
其中,第四层的当前层特征图与第三层的下采样特征补偿模块的补偿特征图拼接,再经处理得到预测图P4,将预测图P4作为深层预测图作为输入到第三层的整体注意力强化模块;第一层的整体注意力强化模块处理的特征包括当前层特征图以及深层预测图P2。
4.根据权利要求1所述的利用双向交互网络定位图像篡改区域的方法,其特征在于,步骤3中层级融合模块中引入有深度可分离卷积,层级融合模块在融合过程中,输入的特征先依次经过逐点卷积和逐通道卷积,随后进行批归一化处理,然后采用GELU激活函数进行激活;接着利用分类器进行一维卷积在通道维度进行降维压缩,并通过Sigmoid激活函数输出归一化概率图,表征伪造区域的空间分布;
最后,通过焦点损失函数优化网络模型,焦点损失函数表示为:;
其中,P为预测图,G为标签,α为类别平衡因子,β为聚焦参数。