利索能及
我要发布
收藏
专利号: 2019100819097
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种检测图像中文字信息的方法,其特征在于,所述方法包括:获取目标图像中的每个像素点的特征信息,所述特征信息包括所述像素点在多个尺度区间对应的多个概率值;其中,所述多个尺度区间是通过对整体的尺度区域划分得到的,所述多个尺度区间中的每个尺度区间的范围大小相同或不同;所述像素点在一个尺度区间对应的概率值用于表征该像素点处出现位于该尺度区间的文字的概率;

针对所述目标图像中的每个像素点,基于所述像素点的所述特征信息确定所述像素点对应的最大概率值,并将所述最大概率值对应的尺度区间作为所述像素点对应的目标尺度区间;

基于所述目标图像中的每个像素点对应的最大概率值以及目标尺度区间,确定所述目标图像中的文字的位置信息和尺度信息。

2.根据权利要求1所述的方法,其特征在于,所述基于所述目标图像中的每个像素点对应的最大概率值以及目标尺度区间,确定所述目标图像中的文字的位置信息和尺度信息,包括:

基于所述目标图像中的每个像素点对应的最大概率值,生成分数图,所述分数图中的每个点与所述目标图像中的每个像素点一一对应,所述分数图中每个点的取值为所述目标图像中对应的像素点的最大概率值,所述分数图中每个点对应的尺度区间为所述目标图像中对应的像素点对应的目标尺度区间;

基于所述分数图,确定所述目标图像中的文字的位置信息和尺度信息。

3.根据权利要求2所述的方法,其特征在于,所述基于所述分数图,确定所述目标图像中的文字的位置信息和尺度信息,包括:将所述分数图中的每个点的取值与阈值进行比较,基于比较结果生成二值图,所述二值图中的每个点与所述分数图中的每个点一一对应,所述二值图中每个点的取值基于所述分数图中的对应的点的取值与所述阈值的比较结果确定,所述二值图中每个点对应的尺度区间为所述分数图中对应的点对应的尺度区间;

从所述二值图中提取所述目标图像中的文字的位置信息,并基于所述文字的位置信息确定所述文字的尺度信息。

4.根据权利要求3所述的方法,其特征在于,所述二值图中每个点的取值基于所述分数图中的对应的点的取值与所述阈值的比较结果确定,包括:如果所述分数图中的点的取值大于所述阈值,则所述二值图中对应的点的取值为第一数值;

如果所述分数图中的点的取值小于等于所述阈值,则所述二值图中对应的点的取值为第二数值。

5.根据权利要求4所述的方法,其特征在于,所述从所述二值图中提取所述目标图像中的文字的位置信息,包括:

确定所述二值图中的一个或多个连通区域,所述连通区域是指所述二值图中取值为所述第一数值的点所形成的连续区域,获取所述连通区域对应的标注框,所述标注框覆盖所述连通区域;

基于所述标注框的位置信息,确定所述文字的位置信息。

6.根据权利要求1至5任一项所述的方法,其特征在于,所述目标图像为对原始图像进行下采样后得到的图像;或者,所述目标图像为原始图像。

7.一种检测图像中文字信息的装置,其特征在于,所述装置包括:特征提取单元,用于获取目标图像中的每个像素点的特征信息,所述特征信息包括所述像素点在多个尺度区间对应的多个概率值;其中,所述多个尺度区间是通过对整体的尺度区域划分得到的,所述多个尺度区间中的每个尺度区间的范围大小相同或不同;所述像素点在一个尺度区间对应的概率值用于表征该像素点处出现位于该尺度区间的文字的概率;

取最大值子单元,用于针对所述目标图像中的每个像素点,基于所述像素点的所述特征信息确定所述像素点对应的最大概率值,并将所述最大概率值对应的尺度区间作为所述像素点对应的目标尺度区间;

确定子单元,用于基于所述目标图像中的每个像素点对应的最大概率值以及目标尺度区间,确定所述目标图像中的文字的位置信息和尺度信息。

8.根据权利要求7所述的装置,其特征在于,所述确定子单元,用于:基于所述目标图像中的每个像素点对应的最大概率值,生成分数图,所述分数图中的每个点与所述目标图像中的每个像素点一一对应,所述分数图中每个点的取值为所述目标图像中对应的像素点的最大概率值,所述分数图中每个点对应的尺度区间为所述目标图像中对应的像素点对应的目标尺度区间;

基于所述分数图,确定所述目标图像中的文字的位置信息和尺度信息。

9.根据权利要求8所述的装置,其特征在于,所述确定子单元,用于:将所述分数图中的每个点的取值与阈值进行比较,基于比较结果生成二值图,所述二值图中的每个点与所述分数图中的每个点一一对应,所述二值图中每个点的取值基于所述分数图中的对应的点的取值与所述阈值的比较结果确定,所述二值图中每个点对应的尺度区间为所述分数图中对应的点对应的尺度区间;

从所述二值图中提取所述目标图像中的文字的位置信息,并基于所述文字的位置信息确定所述文字的尺度信息。

10.根据权利要求9所述的装置,其特征在于,所述二值图中每个点的取值基于所述分数图中的对应的点的取值与所述阈值的比较结果确定,包括:如果所述分数图中的点的取值大于所述阈值,则所述二值图中对应的点的取值为第一数值;

如果所述分数图中的点的取值小于等于所述阈值,则所述二值图中对应的点的取值为第二数值。

11.根据权利要求10所述的装置,其特征在于,所述确定子单元,用于:确定所述二值图中的一个或多个连通区域,所述连通区域是指所述二值图中取值为所述第一数值的点所形成的连续区域,获取所述连通区域对应的标注框,所述标注框覆盖所述连通区域;

基于所述标注框的位置信息,确定所述文字的位置信息。

12.根据权利要求7至11任一项所述的装置,其特征在于,所述目标图像为对原始图像进行下采样后得到的图像;或者,所述目标图像为原始图像。

13.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机可执行指令,该计算机可执行指令被执行后,能够实现权利要求1至6任一项所述的方法步骤。

14.一种存储介质,其特征在于,所述存储介质上存储有可执行指令,该可执行指令被处理器执行时实现权利要求1至6任一项所述的方法步骤。

15.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时可实现权利要求1至6任一项所述的方法步骤。