利索能及
我要发布
收藏
专利号: 2019113496046
申请人: 芽米科技(广州)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多尺度残差生成对抗网络的单图像盲去运动模糊方法,其特征在于,包括以下步骤:

1)获取图像数据集,将其中的成对数据集拼接成形为模糊——清晰形式的图像对;

2)将训练集图像随机裁剪成256×256大小的图像补丁;

3)将标准化后的图像作为训练输入数据;

4)经过基于Pytorch开源深度学习框架设计的卷积神经网络,输出去模糊之后的图像,所述卷积神经网络包括生成器和判别器;

所述生成器包括特征提取模块、细粒度残差模块和上采样模块;

所述特征提取模块,包括一个卷积层,实例归一化,以及一个ReLU激活层,之后再经过两个卷积层,实例归一化,ReLU激活层,最终将图片提取出得到特征图;

所述细粒度残差模块,经过卷积做信息聚合得到特征通道,然后将得到的特征通道均分为4组;第1组不做任何操作保留原始信息;第2组进行一次卷积操作,获得相对高一维度的特征信息;第3组在原信息的基础上加上第2组得到的特征信息进行一次卷积操作,从而达到特征融合的效果;第4组在原信息的基础上融合第3组得到的结果再进行一次卷积操作,最后将所得到的信息连接起来作为输出结果;

上采样模块,将细粒度残差模块输出的结果进行上采样,首先通过最近邻插值法进行一次上采样到128通道,再通过一次转置卷积将残差特征图上采样到64通道,再经过一个卷积层将残差特征图恢复为三通道图像,最后通过全局连接与输入图片做叠加,去除残差信息,得到去模糊后的图片

5)根据步骤3)中的输入数据和步骤4)中的卷积神经网络,对卷积神经网络进行优化训练,训练优化的损失优化由两部分组成:对抗损失以及内容损失,训练优化的损失函数为:L=LGAN+Lcontent,LGAN为对抗损失,Lcontent为内容损失,B B

其中I 表示输入的模糊图片,G(I)表示通过生成网络G对模糊图片进行重建后输出的B重建图片,D(G(I))表示对重建图片进行概率计算,N表示样本个数;φ表示VGG‑19第七层S卷积的输出特征图,W,H分别表示特征图的宽,高,I表示标准清晰图像;

6)利用优化后的模型参数,输入现实中的具有运动模糊场景的图片进行去模糊得到相应的清晰图片。

2.根据权利要求1所述一种基于多尺度残差生成对抗网络的单图像盲去运动模糊方法,其特征在于:所述256×256大小的图像补丁作为标准输入。

3.根据权利要求1所述一种基于多尺度残差生成对抗网络的单图像盲去运动模糊方法,其特征在于:当训练生成器时,固定判别器不做修改和训练,向网络中的生成器输入模糊——清晰图像对,通过生成器对模糊图像进行去模糊,输出去模糊后的峰值信噪比与结构相似性,之后再向判别器中输入去模糊后图片或清晰图像,让判别器判别输入图像是去模糊后的图像还是清晰图像,并对损失进行更新;在训练判别器时,固定生成器不做修改和训练,二者交替训练。

4.根据权利要求1所述一种基于多尺度残差生成对抗网络的单图像盲去运动模糊方法,其特征在于:所述优化训练过程中需计算模型的输出信息与对应标签清晰图像的峰值信噪比和结构相似性以及损失优化。