1.一种基于图像修复的纹理背景字符识别方法,其特征在于,包括如下操作:
S1、待识别图像经若干次尺度依次减小的卷积处理、长距离特征交互处理、若干次尺度依次增大的卷积处理,得到待识别初始特征图;待识别初始特征图经若干次尺度依次减小的卷积处理、若干次基于通道注意力的残差连接处理,若干次尺度依次增大的卷积处理,得到纹理背景修复图;
长距离特征交互处理的操作为:待识别卷积图像经若干次基于固定窗口的掩码上下文信息融合处理和基于移动窗口的掩码更新上下文信息融合处理,得到长距离特征交互图,用于执行若干次尺度依次增大的卷积处理的操作;
基于固定窗口的掩码上下文信息融合处理的操作具体为:输入经基于固定窗口的掩码多头注意力处理后,与输入进行特征级联,经全连接处理和多层感知机处理,得到输出;在基于固定窗口的掩码多头注意力处理中,当前头注意力概率分布系数是基于像素总数和像素掩码值总和得到的;
S2、获取待识别图像与纹理背景修复图的差分图,得到前景字符图;根据纹理背景图中的纹理方向,对前景字符图进行纹理方向去噪处理,得到去噪字符图;去噪字符图经轮廓增强处理后,添加目标背景风格,得到待识别字符图;
纹理方向去噪处理的操作为:基于前景字符图每个像素点的归一化值和相应滤色自适应值,获取各自的滤色掩码值;基于每个像素点的滤色掩码值和纹理方向变体模板图中对应位置像素值,对纹理背景图进行滤色处理,得到去噪字符图;
S3、待识别字符图经特征提取编码处理后,转化为向量形式,得到待识别字符特征序列;待识别字符特征序列经双向长短期记忆网络处理后,合并预测序列中重复字符,删除空白标记,得到字符识别结果。
2.根据权利要求1所述的基于图像修复的纹理背景字符识别方法,其特征在于,所述S1中,基于通道注意力的残差连接处理的操作具体为:待识别初始卷积特征图或第N‑1个残差连接特征图,经卷积、批归一化、Relu激活函数、卷积、批归一化和通道注意力处理后,分别与待识别初始卷积特征图或第N‑1个残差连接特征图经融合处理,得到第N个残差连接特征图;将最后一个残差连接特征图,作为待识别残差连接特征图,用于执行若干次尺度依次增大的卷积处理的操作;
待识别初始卷积特征图是待识别初始特征图经若干次尺度依次减小的卷积处理得到的。
3.根据权利要求1所述的基于图像修复的纹理背景字符识别方法,其特征在于,在所述S1中通道注意力处理中,通道注意力权重是通过如下公式得到的:,
,
,
为第i个像素位置点对应的通道注意力权重, 为sigmoid函数, 为第i个像素位置点邻域范围内第j个像素点的初始通道注意力权重, 为第i个像素位置点邻域范围内第j个像素点的像素值,J为第i个像素点邻域范围内像素点总数, 为卷积核为K的一维卷积处理,为通道维度,为卷积核系数,为卷积核偏置, 为最近奇数函数。
4.根据权利要求1所述的基于图像修复的纹理背景字符识别方法,其特征在于,所述S1中,当前头注意力概率分布系数是通过如下公式得到的:,
为第i个头注意力概率分布系数, 为softmax函数, 为第i个头的查询向量, 为第i个头的索引向量的转置, 为输入的图像的像素点总数, 为输入的图像的像素掩码值总和,若输入的图像中当前窗口处存在无效位置, 为输入的图像对应的掩码图, 为第i个头的内容向量, 为索引向量的维度。
5.根据权利要求1所述的基于图像修复的纹理背景字符识别方法,其特征在于,所述S2中,滤色掩码值是通过如下公式得到的:当 时,第i个像素点的滤色掩码值 =1;
当 时,第i个像素点的滤色掩码值 =0;
,
,
为前景字符图中第i个像素点的归一化值, 为前景字符图中第i个像素点的滤色自适应阈值, 为前景字符图中第i个像素点的像素值, 、 分别为前景字符图中的最大像素值和最小像素值,为梯度函数。
6.根据权利要求1所述的基于图像修复的纹理背景字符识别方法,其特征在于,所述S2中,对纹理背景图进行滤色处理的操作具体为:若前景字符图第i个像素点的滤色掩码值 =1,则滤色处理通过如下公式实现:
,
若前景字符图第i个像素点的滤色掩码值 =0,则滤色处理通过如下公式实现:
,
为去噪字符图中第i个像素点的像素值, 为前景字符图中第i个像素点的像素值,为第i个像素点在纹理方向变体模板图中对应位置的像素值。
7.根据权利要求1所述的基于图像修复的纹理背景字符识别方法,其特征在于,所述S3中,特征提取编码处理的操作可通过若干次的卷积、批归一化、Relu激活函数和最大池化处理实现。
8.一种基于图像修复的纹理背景字符识别系统,用于实现根据权利要求1所述的基于图像修复的纹理背景字符识别方法,其特征在于,包括:纹理背景修复图生成模块,用于待识别图像经若干次尺度依次减小的卷积处理、长距离特征交互处理、若干次尺度依次增大的卷积处理,得到待识别初始特征图;待识别初始特征图经若干次尺度依次减小的卷积处理、若干次基于通道注意力的残差连接处理,若干次尺度依次增大的卷积处理,得到纹理背景修复图;长距离特征交互处理的操作为:待识别卷积图像经若干次基于固定窗口的掩码上下文信息融合处理和基于移动窗口的掩码更新上下文信息融合处理,得到长距离特征交互图,用于执行若干次尺度依次增大的卷积处理的操作;基于固定窗口的掩码上下文信息融合处理的操作具体为:输入经基于固定窗口的掩码多头注意力处理后,与输入进行特征级联,经全连接处理和多层感知机处理,得到输出;
在基于固定窗口的掩码多头注意力处理中,当前头注意力概率分布系数是基于像素总数和像素掩码值总和得到的;
待识别字符图生成模块,用于获取待识别图像与纹理背景修复图的差分图,得到前景字符图;根据纹理背景图中的纹理方向,对前景字符图进行纹理方向去噪处理,得到去噪字符图;去噪字符图经轮廓增强处理后,添加目标背景风格,得到待识别字符图;纹理方向去噪处理的操作为:基于前景字符图每个像素点的归一化值和相应滤色自适应值,获取各自的滤色掩码值;基于每个像素点的滤色掩码值和纹理方向变体模板图中对应位置像素值,对纹理背景图进行滤色处理,得到去噪字符图;
字符识别结果生成模块,用于待识别字符图经特征提取编码处理后,转化为向量形式,得到待识别字符特征序列;待识别字符特征序列经双向长短期记忆网络处理后,合并预测序列中重复字符,删除空白标记,得到字符识别结果。
9.一种基于图像修复的纹理背景字符识别设备,其特征在于,包括处理器和存储器,其中,所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1‑7任一项所述的基于图像修复的纹理背景字符识别方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1‑7中任一项所述的基于图像修复的纹理背景字符识别方法。