利索能及
我要发布
收藏
专利号: 2020109158961
申请人: 武汉工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-17
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于全局‑局部分离注意力机制的人脸超分辨率方法,其特征在于,包括:S1:将高分辨率人脸图像下采样至目标低分辨率人脸图像;

S2:将所述目标低分辨率图像进行分块操作,分出相互重叠的图像块后,使用粗糙特征提取器提取粗糙的脸部特征图;

S3:构建局部分离注意力块,产生网络的局部注意力,增强人脸关键结构在通道层面的交互;

S4:构建分离注意力网络作为精细特征提取器,将所述粗糙的脸部特征图输入所述分离注意力网络获得精细的脸部特征图,其中,所述分离注意力网络包含若干个全局‑局部分离注意力组,每个组包含若干个所述局部分离注意力块和一个分离注意力跳跃连接,局部分离注意力块和分离注意力跳跃连接分别产生两路局部注意力并用一个全局注意力模块融合不同的局部注意力,使局部注意力跨特征组交互,实现网络的全局注意力;

S5:将得到的所述精细的脸部特征图进行上采样;

S6:将上采样后的人脸特征图重建成目标的高分辨率人脸图像。

2.根据权利要求1所述的方法,其特征在于,在步骤S2中,使用一个卷积层构建粗糙特征提取器,并使用所述粗糙特征提取器提取粗糙的脸部特征图,其中,所述粗糙的脸部特征图表示为:FCF=HCF(ILR),FCF表示所述粗糙的脸部特征图,HCF表示粗糙特征提取器操作,ILR表示输入的低分辨率人脸图像。

3.根据权利要求2所述的方法,其特征在于,步骤S3包括:将通道数为C的输入特征在通道维度分割为r个部分,则每个部分的通道数为 然后通过一个逐元素相加器将这r个部分进行融合:表示分离注意力中第一个逐元素加法器, 表示在第一次分割中第r个被分割的部分, 表示经过 后的输出;

随后通过一个自适应平均池化层,两个卷积层和一个softmax函数,然后又在通道维度被分割成r份,当前r个部分分别与第一次被分割的r个部分进行逐元素相乘,最后使用一个逐元素相加器融合相乘后的特征作为分离注意力的输出,分离注意力被表示为:表示第二个逐元素相加器,HSA表示一个分离注意力,Finput表示分离注意力的输入,表示在第二次分割中第r个被分割的部分。

4.根据权利要求3所述的方法,其特征在于,所述精细的脸部特征图为:FDF=HSIS(FCF),FDF表示所述精细的脸部特征图,HSIS表示分离注意力网络。

5.根据权利要求4所述的方法,其特征在于,对于第g个全局‑局部分离注意力组,表示为:表示第g个全局‑局部

分离注意力组, 表示第g个全局‑局部分离注意力组中的第m个分离注意力块,表示第g个全局‑局部分离注意力组中的第m‑1个分离注意力块, 表示第g个全局‑局部分离注意力组中的第1个分离注意力块,Fg表示第g个全局‑局部分离注意力组的输出,Fg‑1表示第g个全局‑局部分离注意力组的输入,HConv表示卷积层,HGAM表示一个逐元素相加器的全局注意力模块,HSA表示一个分离注意力操作;

对于分离注意力网络得到的所述精细的脸部特征图为:表示第G个全

局‑局部分离注意力组。

6.根据权利要求5所述的方法,其特征在于,上采样后的特征表示为:FUP=HUP(FDF),FUP表示上采样后的特征,HUP表示上采样操作,采用亚像素卷积实现。

7.根据权利要求6所述的方法,其特征在于,所述目标的高分辨率人脸图像表示为:ISR=HRecon(FUP),HRecon表示重建操作,采用卷积实现,ISR表示所述目标的高分辨率人脸图像。

8.根据权利要求1至7任意一项所述的方法,其特征在于,整个网络的损失函数L(θ)表示为: N表示数据集的规模,Hfull表示整个网络,和 表示数据集中第i张低分辨率人脸图像和第i张高分辨率人脸图像。

9.一种基于全局‑局部分离注意力机制的人脸超分辨率系统,其特征在于,包括:下采样模块,用于将高分辨率人脸图像下采样至目标低分辨率人脸图像;

粗糙特征提取器模块,用于在将所述目标低分辨率图像进行分块操作,分出相互重叠的图像块后,提取粗糙的脸部特征图;

精细特征提取器模块,用于构建分离注意力网络作为精细特征提取器,将所述粗糙的脸部特征图输入所述分离注意力网络获得精细的脸部特征图,其中,所述分离注意力网络包含若干个全局‑局部分离注意力组,每个组包含若干个局部分离注意力块和一个分离注意力跳跃连接,局部分离注意力块和分离注意力跳跃连接分别产生两路局部注意力并用一个全局注意力模块融合不同的局部注意力,使局部注意力跨特征组交互,实现网络的全局注意力;

上采样模块,用于将得到的所述精细的脸部特征图进行上采样;

人脸图像重建模块,用于将上采样后的人脸特征图重建成目标的高分辨率人脸图像。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的基于全局‑局部分离注意力机制的人脸超分辨率方法。