利索能及
我要发布
收藏
专利号: 2020109930270
申请人: 西南大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种弱监督文本检测方法,其特征在于,包括:

构建感受野生成器,将待检测图像输入所述感受野生成器,获取一个或多个感受野,并根据所述一个或多个感受野感知文本区域;其中,所述感受野生成器包括压缩路径和扩展路径,所述压缩路径和所述扩展路径形成对称U型结构;所述压缩路径和所述扩展路径分别包括对应数量的块;通过所述压缩路径进行降采样再通过所述扩展路径进行上采样,将压缩路径中各块得到的特征图复制到U型结构对应的扩展路径的块中进行特征图合并,所述扩展路径最后一个块连接一个卷积层;

构建感受野判别器,将所述文本区域输入所述感受野判别器,根据文本在所述文本区域的分布,获取识别结果;其中,所述感受野判别器包括卷积层、循环层和转录层,通过所述卷积层进行特征提取,获取所述文本区域的特征序列;通过所述循环层对所述特征序列进行分类,判断所述文本区域内是否包含文本,若是,则获取所述文本在所述文本区域的分布;所述转录层对所述文本在所述文本区域的分布进行回归处理,获取所述识别结果;

将所述识别结果反馈给所述感受野生成器,对所述一个或多个感受野进行校正,通过校正后的所述感受野生成器输出文本特征图。

2.根据权利要求1所述的弱监督文本检测方法,其特征在于,可将所述文本特征图输入一个或多个文本识别模型,获取所述文本特征图中的文本信息。

3.根据权利要求1所述的弱监督文本检测方法,其特征在于,采用U型全卷积网络构建所述感受野生成器。

4.根据权利要求1所述的弱监督文本检测方法,其特征在于,所述卷积层采用卷积神经网络,所述循环层采用循环神经网络,所述转录层采用CTC网络。

5.根据权利要求1所述的弱监督文本检测方法,其特征在于,还包括预先对构建的所述感受野判别器进行训练,将经过文本标注的图像数据集作为构建的所述感受野判别器的输入,获取训练后的所述感受野判别器。

6.根据权利要求1所述的弱监督文本检测方法,其特征在于,根据所述的一个或多个感受野感知文本区域,包括:将所述感受野与所述待检测图像进行叠加,提取出叠加后的图像区域作为所述文本区域。

7.根据权利要求1所述的弱监督文本检测方法,其特征在于,分别为所述循环层和所述转录层构建分类损失函数和回归损失函数,通过所述分类损失函数和所述回归损失函数计算损失值,将所述损失值作为所述识别结果反馈给所述感受野生成器。