利索能及
我要发布
收藏
专利号: 2023112841435
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于全局一致性与WGAN‑GP的自适应纹理增强方法,其特征在于,执行如下步骤S1‑步骤S5,构建并训练纹理增强网络,完成对输入纹理图像的增强:步骤S1:采集原始纹理图像,将原始纹理图像转换成灰度图像,经Min‑Max归一化后缩放像素到[0,1]范围,再使用传统方法进行数量扩充,获得预设数量的灰度图像;

步骤S2:构建两阶段的纹理增强网络,第一阶段基于卷积粗略预测灰度图像,第二阶段基于WGAN‑GP网络精细化灰度图像的纹理细节;纹理增强网络以步骤S1所获得的灰度图像为输入,输出纹理增强图像;

步骤S3:在纹理增强网络中加入捕获长期依赖关系的块,将全局信息融合到局部操作中,形成每个目标位置像素的详细注意力图,并且根据这些详细注意力图对当前位置像素的预测进行加权,使用全局鉴别器和局部鉴别器比较纹理增强图像与原始纹理图像;

步骤S3中向纹理增强网络的第一阶段加入两个NL块,NL块计算目标位置像素与所有其他位置像素的相似性的注意力图,然后根据相似性的大小对重要性进行加权,NL块的具体计算如下:其中,yi表示NL块在目标位置像素i的计算结果,C(x)表示归一化因子,x表示纹理增强图像处理的特征图,j表示xi所有可能关联到位置的索引,f是位置间的类同标量函数,xi为目标位置像素i的特征值,xj为可能关联位置像素j的特征值,g是位置输入信号函数,对输入的特征进行赋权,g(xj)为用于计算xj的函数;

向纹理增强网络的第二阶段加入两个GC块构成判别器,GC块的具体计算如下:

其中,Zi表示GC块在目标位置像素i的计算结果,F(.,.)表示fusion函数,x表示纹理增强图像处理的特征图,i表示目标位置像素,δ(·)表示瓶颈变换模块,Np表示全局空间,j表示xi所有可能关联到位置的索引,αj表示全局注意力池的权重,用于对上下文建模中的xj进行加权,xj为可能关联位置像素j的特征值;

步骤S4:对纹理增强网络进行训练,基于MSE距离、TV损失、MS‑SSIM损失构建损失函数,根据损失函数的结果计算纹理增强网络的评价指标;

步骤S4中对纹理增强网络的训练分为两个训练步骤,第一训练步骤只训练纹理增强网络,第二训练步骤训练纹理增强网络和对抗性网络;在第一训练步骤中,损失函数选择MSE损失和TV损失来联合约束结果的准确性,第二训练步骤涉及纹理增强网络和对抗性网络,纹理增强网络的损失函数采用 距离和MS‑SSIM损失,对抗性网络的损失函数采用带梯度惩罚的Wasserstein距离作为规范;第一训练步骤中使用的损失函数为:其中,loss_cn1表示第一训练步骤损失的值,λ1是用于分配loss_cn1两个损失函数 和权重的系数,是[0,1]之间的一个随机数, 是MSE损失, 是TV损失;

第二训练步骤中,纹理增强网络的损失函数的计算公式为:

其中,loss_cn2是第二训练步骤损失的值,λ2是用于分配loss_cn2两个损失函数 和权重的系数,是[0,1]之间的一个随机数, 是L1范数损失函数, 为多尺度结构相似性;

步骤S5:纹理增强网络的性能达到评价指标,则视为优异且训练结束,否则视为不优异,要重新调整损失函数的权重系数,重新对纹理增强网络进行训练;根据评价指标判断纹理增强网络是否优异,是则获得成功的纹理增强网络,否则更新权重系数。

2.根据权利要求1所述的基于全局一致性与WGAN‑GP的自适应纹理增强方法,其特征在于,步骤S1中数量扩充的方法为分别将各灰度图像以90°、180°、270°旋转,然后逐个翻转,以将灰度图像数量增加8倍,获得输入纹理增强网络的训练样本。

3.根据权利要求1所述的基于全局一致性与WGAN‑GP的自适应纹理增强方法,其特征在于,步骤S2中所述的两阶段的纹理增强网络,第一阶段经过下采样层卷积及池化以捕获全局特征,多个中间卷积层来处理特征图,上采样层转置卷积或最近邻插值以提高空间分辨率,得到粗略预测的纹理增强图像;第二阶段WGAN‑GP网络的函数方程如下式:其中,L是函数输出结果,E表示对应的期望值,Sr是真实样本,Pg是生成器生成分布,D(Sr)是判别器对Sr的输出,Sf是虚假样本,Pr是真实数据分布,D(Sf)是判别器对Sf的输出,λ是正则化的系数, 是真实分布和生成分布中的样本, 是对Sr的梯度,∥·∥2是 的范数。

4.根据权利要求1所述的基于全局一致性与WGAN‑GP的自适应纹理增强方法,其特征在于,步骤S4中对纹理增强网络的训练采用Adam优化器。

5.根据权利要求1所述的基于全局一致性与WGAN‑GP的自适应纹理增强方法,其特征在于,步骤S5中的评价指标包括SSIM、PSNR。