1.一种基于深度学习的字体识别方法,其特征在于,其包括:获得含有目标字体的分割图像;对所述分割图像进行含有注意力机制的超分辨率重构,得到超分辨率字体图像。
2.根据权利要求1所述的字体识别方法,其特征在于,其还包括:通过所述超分辨率字体图像、及所述分割图像和/或其放大图像进行字体识别。
3.根据权利要求2所述的字体识别方法,其特征在于,所述放大图像通过对所述分割图像的插值获得。
4.根据权利要求1所述的字体识别方法,其特征在于,所述注意力机制中使用的注意力图像为将所述分割图像进行归一化处理后取反得到的图像。
5.根据权利要求4所述的字体识别方法,其特征在于,所述归一化处理包括:将所述分割图像中每个像素的灰度值归一化至0到1的范围内。
6.根据权利要求1所述的字体识别方法,其特征在于,所述超分辨率重构包括:将所述分割图像和/或所述分割图像的放大和/或归一化处理后的图像与经其处理后获得的注意力图像进行融合,得到融合图像;对所述融合图像进行一到多次下采样特征提取,得到一到多个下采样特征图;
将所述一到多个下采样特征图分别进行注意力分配,得到其分别含注意力权重的下采样特征图;
将所述一到多个下采样特征图进行一到多次上采样提取,并与对应层的含注意力权重的特征图在通道维度进行拼接,得到一到多个上采样特征图;
将所述上采样特征图与所述注意力图像进行乘法融合,得到第一融合图像;
将所述第一融合图像与所述分割图像和/或所述分割图像的放大和/或归一化处理后的图像进行加法融合,得到第二融合图像;
将所述第二融合图像进行最终上采样提取,得到超分辨率重构图像,即所述超分辨率字体图像。
7.根据权利要求1所述的字体识别方法,其特征在于,所述分割图像的获得包括:对原始文档图像进行前景、背景分离的二值化处理,得到目标区域可识别的第一预处理图像;
对所述第一预处理图像进行增强处理,得到第二预处理图像;
对所述第二预处理图像进行目标提取和目标位置标定,得到最终预处理图像;
通过投影分割方法对所述最终预处理图像进行分割,得到所述分割图像。
8.权利要求1‑7中任一项所述的检测方法的实现系统,其特征在于,其包括超分辨率重构模块,该重构模块包括如下的重构模型:该模型包括1个特征融合单元,5个下采样单元,4个上采样单元,4个含注意力机制的跳层连接及1个最终上采样单元,其中,所述特征融合单元包括2个分别供所述分割图像和/或所述分割图像的放大和/或归一化处理后的图像、及由所述分割图像得到的注意力图像进行输入的输入层,及1个对两个输入层的图像进行融合的融合层;所述5个下采样单元分别包括依次相连的2个卷积层和1个ReLU激活层,且其中前4个下采样单元还分别包括1个与ReLU激活层相连的最大池化层;所述4个上采样单元分别包含依次相连的1个上采样层及2个卷积层;所述4个含注意力机制的跳层连接位于所述前4个下采样单元和所述4个上采样单元之间,分别与该前4个下采样单元、该4个上采样单元、及所述特征融合层中的供注意力图像输入的输入层相连,其连接操作包括:将所述注意力图调整到对应下采样单元得到的特征图的尺寸大小后与之相乘,得到带有注意力机制的特征图,并将带有注意力机制的特征图与对应的上采样层进行拼接得到不同层的特征融合图像;所述最终上采样单元包括依次相连的1个上采样层、2个卷积层、另1个上采样层和另1个卷积层,即总共包括2个上采样层和3个卷积层,其中第1个上采样层与所述4个上采样单元中的最后1个上采样单元、及所述特征融合单元中的两个输入层分别相连。
9.根据权利要求8所述的系统,其特征在于,其还包括字体识别模块,该字体识别模块包括由mobilenetv3网络形成的分类器,且其具有供所述超分辨率字体图像、及所述分割图像和/或其放大图像同时或分别进行输入的输入层。
10.一种存储介质,其存储有实现权利要求1‑7中任一项所述的识别方法的算法结构和/或其存储有权利要求8或9所述的系统的任一或全部模块。