利索能及
我要发布
收藏
专利号: 2019111832127
申请人: 上海智臻智能网络科技股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图片文字定位方法,其特征在于,所述方法包括:获取目标图片,所述目标图片中包括待识别文字;

通过将所述目标图片输入纹理提取模型中,以得到所述目标图像不同特征维度的若干个纹理特征层,所述纹理提取模型是根据历史图像中的纹理特征进行分析得到的、用以提取输入的图片中的纹理特征层的模型;

从所述若干个纹理特征层中筛选出基础纹理特征层;

将所述基础纹理特征层进行特征叠加,得到所述待识别文字的纹理特征层;

根据所述待识别文字的纹理特征层获取所述待识别文字在所述目标图片中的位置。

2.根据权利要求1所述的方法,其特征在于,每一所述基础纹理特征层包括与所述待识别文字对应的特征矩阵,所述将所述基础纹理特征层进行特征叠加,得到所述待识别文字的纹理特征层,包括:将所述基础纹理特征层按照特征矩阵的维度从大到小的顺序进行排序;

将排序后的所述基础纹理特征层通过上采样依次叠加,得到所述待识别文字的纹理特征层。

3.根据权利要求1所述的方法,其特征在于,所述根据所述待识别文字的纹理特征层获取所述待识别文字在所述目标图片中的位置,包括:对所述待识别文字的纹理特征层进行特征加深;

对加深后的所述待识别文字的纹理特征层进行分割,得到所述待识别文字在所述目标图片中的位置。

4.根据权利要求3所述的方法,其特征在于,所述对所述待识别文字的纹理特征层进行特征加深,包括:将所述待识别文字的纹理特征层通过核为3×3,通道为128的卷积层进行卷积,得到第一卷积层;

将所述第一卷积层通过核为1×1,通道为6的卷积层进行卷积。

5.根据权利要求3所述的方法,其特征在于,所述对加深后的所述待识别文字的纹理特征层进行分割,包括:利用PSE网络,对加深后的所述待识别文字的纹理特征层进行分割。

6.根据权利要求1所述的方法,其特征在于,所述将所述基础纹理特征层进行特征叠加之前,还包括:对所述基础纹理特征层进行特征加深;

所述对所述基础纹理特征层进行特征加深,包括:将所述基础纹理特征层通过核为1×1,通道为128的卷积层进行卷积。

7.根据权利要求1所述的方法,其特征在于,所述纹理提取模型为mobilenetv2网络。

8.一种图片文字定位装置,其特征在于,所述装置包括:目标图片获取模块,用于获取目标图片,所述目标图片中包括待识别文字;

特征提取模块,用于通过将所述目标图片输入纹理提取模型中,以得到所述目标图像的若干个纹理特征层,所述纹理提取模型是根据历史图像中的纹理特征进行分析得到的、用以提取输入的图片中的纹理特征层的模型;

基础纹理特征层筛选模块,用于从所述若干个纹理特征层中筛选出基础纹理特征层;

特征叠加模块,用于将所述基础纹理特征层进行特征叠加,得到所述待识别文字的纹理特征层;

定位模块,用于根据所述待识别文字的纹理特征层获取所述待识别文字在所述目标图片中的位置。

9.一种计算机设备,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至7任一项所述方法的步骤。

10.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至7任一项所述方法的步骤。