利索能及
我要发布
收藏
专利号: 2024100247328
申请人: 广州大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种水下图像增强方法,其特征在于,包括以下步骤,

获取原始水下图像及其对应的真实清晰图像,构建不同批次的配对数据,形成训练集;

基于DDPM模型,输入随机选取的所述训练集中任一批次的配对数据中的所述原始水下图像、每个时间步长下的噪声图像、以及在当前时间步长处对应的所述原始水下图像和所述噪声图像的差值,训练所述DDPM模型,输出当前时间步长下加入的噪声,作为输出值,并设计输入参数的损失函数;所述DDPM模型的主网络架构基于Unet网络,所述Unet网络的输入端还连接有用于将从所述原始水下图像中提取的底层信息无缝集成到所述Unet网络的每一层中的内容补偿模块;

当所述DDPM模型的所述输出值与均匀采样的当前时间步长下的噪声相比满足预设条件时,优化所述DDPM模型的网络参数,完成一次训练,并判断所述损失函数是否收敛;

迭代训练所述DDPM模型直至所述损失函数收敛,此时将当前的所述DDPM模型作为目标模型;

随机采样任一原始水下图像和任一高斯噪声,输入所述目标模型中,结合预设的降噪公式,预测得到上一时间步长的增强水下图像,并将上一时间步长的增强水下图像作为所述降噪公式的下一轮输入结果,迭代直至得到与采样的原始水下图像对应的真实清晰图像。

2.根据权利要求1所述的水下图像增强方法,其特征在于,所述Unet网络包括依次串联的采样不同特征维度的第一下采样层、第二下采样层、第三下采样层和第四下采样层,依次串联的采样不同特征维度的第一上采样层、第二上采样层、第三上采样层和第四上采样层,以及位于下采样层和上采样层之间的第一连接层、第二连接层和第三连接层;

所述第一连接层对所述第一下采样层和所述第二下采样层的采样结果进行拼接,得到第一拼接结果;

所述第二连接层对所述第一拼接结果和所述第三下采样层的采样结果进行拼接,得到第二拼接结果;

所述第三连接层对所述第二拼接结果和所述第四下采样层的采样结果进行拼接,得到第三拼接结果;

将所述第四下采样层的采样结果输入所述第四上采样层中;

将所述第三拼接结果输入所述第三上采样层中;

将所述第二拼接结果输入所述第二上采样层中;

将所述第一拼接结果输入所述第一上采样层中。

3.根据权利要求2所述的水下图像增强方法,其特征在于,所述内容补偿模块包括第一卷积层、第二卷积层、第三卷积层和第四卷积层;

所述第一卷积层从所述原始水下图像中提取与所述第一下采样层相同特征维度的底层信息并输入所述第一下采样层中;

所述第二卷积层从所述原始水下图像中提取与所述第二下采样层相同特征维度的底层信息并输入所述第二下采样层中;

所述第三卷积层从所述原始水下图像中提取与所述第三下采样层相同特征维度的底层信息并输入所述第三下采样层中;

所述第四卷积层从所述原始水下图像中提取与所述第四下采样层相同特征维度的底层信息并输入所述第四下采样层中。

4.根据权利要求1所述的水下图像增强方法,其特征在于,所述损失函数的表达式如下:式中, 损失函数的损失值; 表示噪声预测网络的输出

值,用于预测每一个时间步长加噪过程添加的噪声;

表示噪声预测网络的数学期望;表示添加的噪声;表示噪声图像;表示采样时间; 表示原始水下图像; 表示当前时间步长处的原始水下图像和噪声图像之间的差值。

5.根据权利要求1所述的水下图像增强方法,其特征在于,优化所述DDPM模型的网络参数时采用梯度下降法。

6.根据权利要求1所述的水下图像增强方法,其特征在于,单位时间步长下的所述DDPM模型输出上一时间步长的所述噪声图像的概率分布的表达式包括,式中, 表示每一个时间步长t的模型在给定当前时间步长的噪声图像 的前提下,上一时间步长的噪声图像 满足的概率分布, 表示原始水下图像,N表示高斯分布的分布函数, 表示高斯分布的数学期望, 表示高斯分布的标准差, 表示当前时间步长处的原始水下图像和噪声图像之间的差值。

7.根据权利要求6所述的水下图像增强方法,其特征在于,所述高斯分布的数学期望的表达式包括,式中, 表示噪声预测网络的输出值,用于预测每一个时间步长加噪

过程添加的噪声 , 从0.0001逐步增加到0.02,t从1逐一增加到1000,总共1000个 (), 的连乘。

8.根据权利要求6所述的水下图像增强方法,其特征在于,所述高斯分布的标准差的表达式包括,式中, 从0.0001逐步增加到0.02,t从1逐一增加到1000,总共1000个 (), 的连乘。

9.一种水下图像增强装置,其特征在于,包括,

数据模块,用于获取原始水下图像及其对应的真实清晰图像,构建不同批次的配对数据,形成训练集;

训练模块,用于基于DDPM模型,输入随机选取的所述训练集中任一批次的配对数据中的所述原始水下图像、每个时间步长下的噪声图像、以及在当前时间步长处对应的所述原始水下图像和所述噪声图像的差值,训练所述DDPM模型,输出当前时间步长下加入的噪声,作为输出值,并设计输入参数的损失函数;所述DDPM模型的主网络架构基于Unet网络,所述Unet网络的输入端还连接有用于将从所述原始水下图像中提取的底层信息无缝集成到所述Unet网络的每一层中的内容补偿模块判断模块,用于当所述DDPM模型的所述输出值与均匀采样的当前时间步长下的噪声相比满足预设条件时,优化所述DDPM模型的网络参数,完成一次训练,并判断所述损失函数是否收敛;

目标模型模块,用于迭代训练所述DDPM模型直至所述损失函数收敛,此时将当前的所述DDPM模型作为目标模型;

增强模块,用于随机采样任一原始水下图像和任一高斯噪声,输入所述目标模型中,结合预设的降噪公式,预测得到上一时间步长的增强水下图像,并将上一时间步长的增强水下图像作为所述降噪公式的下一轮输入结果,迭代直至得到与采样的原始水下图像对应的真实清晰图像。

10.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现权利要求1至8任意一项所述方法的步骤。

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任意一项所述方法的步骤。