利索能及
我要发布
收藏
专利号: 2018115041021
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文字识别方法,其特征在于,包括:对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量;

根据所述语义向量,预测待检测图像中的文字序列的文字数量;

根据所述文字数量,确定与所述文字序列对应的位置向量;

根据所述位置向量和所述语义向量,识别所述文字序列。

2.根据权利要求1所述的方法,其特征在于,根据所述位置向量和所述语义向量,识别所述文字序列,包括:根据所述位置向量和所述语义向量,确定权值矩阵;

根据所述权值矩阵和所述语义向量,识别所述文字序列。

3.根据权利要求2所述的方法,其特征在于,根据所述数字序列和所述语义向量,确定权值矩阵,包括:对所述位置向量进行卷积处理,获得与所述数字序列对应的第一特征向量;

对所述语义向量进行卷积处理,获得第二特征向量;

将所述第一特征向量和所述第二特征向量相乘,获得所述权值矩阵。

4.根据权利要求2所述的方法,其特征在于,根据所述权值矩阵和所述语义向量,识别所述文字序列,包括:将所述权值矩阵与所述第二特征向量相乘,获得概率分布向量;

根据所述概率分布向量,确定所述文字序列中的文字。

5.根据权利要求1-4中任一项所述的方法,其特征在于,根据所述文字数量,确定与所述文字序列对应的位置向量,包括:根据所述文字数量,确定与所述文字序列对应的数字序列;

对所述数字序列进行词嵌入处理,获得与所述数字序列对应的位置向量。

6.根据权利要求5所述的方法,其特征在于,所述文字数量为n,所述数字序列为从1到n的正整数组成的序列。

7.根据权利要求1-6中任一项所述的方法,其特征在于,对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量,包括:对所述待检测图像进行卷积处理,获得所述待检测图像的特征图;

对所述特征图进行下采样处理,获得与所述待检测图像中的文字序列对应的语义向量。

8.一种文字识别装置,其特征在于,包括:特征提取模块,用于对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量;

预测模块,用于根据所述语义向量,预测待检测图像中的文字序列的文字数量;

确定模块,用于根据所述文字数量,确定与所述文字序列对应的位置向量;

识别模块,用于根据所述位置向量和所述语义向量,识别所述文字序列。

9.一种电子设备,其特征在于,包括:处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:执行权利要求1至7中任意一项所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。