利索能及
我要发布
收藏
专利号: 2025103770209
申请人: 浙江工商大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于双分支特征融合的文档图像篡改检测方法,其特征在于,包括:获取待检测图像;

构建篡改检测与定位模型,所述篡改检测与定位模型包括细节增强模块、局部编码器、全局编码器和混合注意力模块;

将所述待检测图像输入训练好的篡改检测与定位模型,一个分支通过细节增强模块提取待检测图像的高频信息,并通过局部编码器提取高频信息中的局部特征,另一个分支则采用全局编码器提取待检测图像的全局特征,通过混合注意力模块将局部特征和全局特征进行融合,将融合结果通过解码器解码,通过解码结果定位篡改区域;

所述构建篡改检测与定位模型中,细节增强模块通过对待检测图像进行离散余弦变换系数量化与Bayar卷积的操作,提取待检测图像中高频的信息,为局部编码器做最初始的增强;局部编码器基于ConvNeXt网络改进,全局编码器采用ViT结构,混合注意力模块包括强化自注意力模块与自适应交叉注意力模块。

2.如权利要求1所述的一种基于双分支特征融合的文档图像篡改检测方法,其特征在于,所述局部编码器基于ConvNeXt网络改进,包括:基于ConvNeXt‑B设计细节分支网络块对图像进行特征提取,网络块共4层,在每层中的通道数C和块数B分别为:C=(128,256,512,1024),B=(3,3,27,3);网络每4层为一个阶段,共四个阶段,每个阶段最后输出的维度分别为128、256、512和1024。

3.如权利要求1所述的一种基于双分支特征融合的文档图像篡改检测方法,其特征在于,所述全局编码器采用ViT结构中,全局编码器构建过程包括:

1×h×w 1×h×w

将输入图像表示为X∈R ,将真实标签表示为M∈R ,其中h和w分别对应图像的高度和宽度;

3×H×W 1×H×W

将图像的高度和宽度填充到XP∈R 和MP∈R ,并将H=W=1024作为常量,将XP传递到有12层的有窗口的ViT编码器中,获得全局编码器;其中每3层保留一个完整的全局注意力块;具体表示为:其中,V表示ViT编码器,Ge表示编码特征映射。

4.如权利要求1所述的一种基于双分支特征融合的文档图像篡改检测方法,其特征在于,所述混合注意力模块Fh的具体表达式为:Fh=ESA(Ff)+ACA(Ff);

Fo=DBM(Fh);

其中,Ff为双分支主要融合特征,Fo为最终融合特征,ESA为强化自注意力块,ACA为自适应交叉注意力块,DBM为解码融合模块。

5.如权利要求1所述的一种基于双分支特征融合的文档图像篡改检测方法,其特征在于,将所述待检测图像输入训练好的篡改检测与定位模型之前,还包括:通过损失函数反向传播训练篡改检测与定位模型,获得训练好的篡改检测与定位模型。

6.一种基于双分支特征融合的文档图像篡改检测系统,其特征在于,包括:采集模块,用于获取待检测图像;

模型构建模块,用于构建篡改检测与定位模型,所述篡改检测与定位模型包括细节增强模块、局部编码器、全局编码器和混合注意力模块;

检测模块,用于将所述待检测图像输入训练好的篡改检测与定位模型,一个分支通过细节增强模块提取待检测图像的高频信息,并通过局部编码器提取高频信息中的局部特征,另一个分支则采用全局编码器提取待检测图像的全局特征,通过混合注意力模块将局部特征和全局特征进行融合,将融合结果通过解码器解码,通过解码结果定位篡改区域;

所述构建篡改检测与定位模型中,细节增强模块通过对待检测图像进行离散余弦变换系数量化与Bayar卷积的操作,提取待检测图像中高频的信息,为局部编码器做最初始的增强;局部编码器基于ConvNeXt网络改进,全局编码器采用ViT结构,混合注意力模块包括强化自注意力模块与自适应交叉注意力模块。

7.一种计算机设备,其特征在于,包括存储器及处理器,所述存储器中储存有程序,所述程序被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述一种基于双分支特征融合的文档图像篡改检测方法的步骤。

8.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的一种基于双分支特征融合的文档图像篡改检测方法的步骤。