利索能及
我要发布
收藏
专利号: 2019110083357
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文档图像的区域分离方法,其特征在于,包括:对文档图像进行预处理,得到二值化图像;

对所述二值化图像进行连通区域分析得到第一连通区域集合;

获取并根据所述第一连通区域集合中各连通区域的属性特征,将所述第一连通区域集合划分为第二连通区域集合和第三连通区域集合;所述第二连通区域集合中包括非文本元素的连通区域,所述第三连通区域集合中包括文本元素的连通区域;

获取并根据所述第三连通区域集合中各连通区域的属性特征和相邻位置信息,从所述第三连通区域集合中确定文本元素的连通区域。

2.根据权利要求1所述的方法,其特征在于,每一个所述连通区域的属性特征包括每一个所述连通区域的像素数量、像素密度、宽高比,以及嵌套在每一个所述连通区域的最小外接矩形中的其他连通区域的第一数量。

3.根据权利要求1所述的方法,其特征在于,所述根据所述第一连通区域集合中各连通区域的属性特征,将所述第一连通区域集合划分为第二连通区域集合和第三连通区域集合,包括:

判断所述第一连通区域集合中各连通区域的属性特征是否满足第一非文本元素条件,将连通区域的属性特征满足第一非文本元素条件的连通区域划分到第二连通区域集合。

4.根据权利要求3所述的方法,其特征在于,所述第一非文本元素条件包括以下条件的至少一项:

连通区域的像素数量小于预设像素数量;

连通区域的像素密度小于预设像素密度;

连通区域的宽高比小于预设宽高比;

嵌套在连通区域的最小外接矩形中的其他连通区域的第一数量大于第一值。

5.根据权利要求1所述的方法,其特征在于,获取所述第三连通区域集合中各连通区域的相邻位置信息,包括:

对所述第三连通区域集合中各连通区域进行空白区域分析,确定所述第三连通区域集合中各连通区域对应的相邻连通区域;

获取所述第三连通区域集合中各连通区域对应的相邻位置信息,所述相邻位置信息包括每一个连通区域与所述每一个连通区域对应的相邻连通区域的距离,每一个连通区域的左连通区域数量以及右连通区域数量。

6.根据权利要求1所述的方法,其特征在于,所述根据所述第三连通区域集合中各连通区域的属性特征和相邻位置信息,从所述第三连通区域集合中确定文本元素的连通区域,包括:

判断所述第三连通区域集合中各连通区域的属性特征是否满足第二非文本元素条件;

判断所述第三连通区域集合中各连通区域的相邻位置信息是否满足第三非文本元素条件;

将所述第三连通区域集合中不满足所述第二非文本元素条件的连通区域,以及满足所述第二非文本元素条件但不满足所述第三非文本元素条件的连通区域确定为文本元素的连通区域。

7.根据权利要求6所述的方法,其特征在于,所述第二非文本条件包括:第一条件和第二条件;或者,

所述第一条件和第三条件;或者,所述第一条件、所述第二条件和所述第三条件;

其中,所述第一条件为Ai=max(Ω1)∩Ai>k1×median(Ω1);所述第二条件为Hi=max(Ω2)∩Hi>k2×median(Ω2);所述第三条件为Wi=max(Ω3)∩Wi>k3×median(Ω3);

式中, Ω1表示所述第三连通区域集合中各连通区域的像素数量的集合,Ω2表示所述第三连通区域集合中各连通区域的高度的集合,Ω3表示所述第三连通区域集合中各连通区域的宽度的集合,mean表示计算平均值,median表示计算中位数,Ai表示所述第三连通区域集合中第i个连通区域的像素数量,Hi表示所述第三连通区域集合中第i个连通区域的最小外接矩形的高度,Wi表示所述第三连通区域集合中第i个连通区域的最小外接矩形的宽度。

8.根据权利要求6所述的方法,其特征在于,所述第三非文本元素条件包括:每一个连通区域与所述每一个连通区域对应的相邻连通区域的距离大于或者等于预设距离;和/或

所述每一个连通区域对应的相邻连通区域的第二数量大于或者等于第二值,所述第二数量为左连通区域数量与右连通区域数量中的最大值。

9.根据权利要求1至8任一项所述的方法,其特征在于,所述方法还包括:获取与所述非文本元素的连通区域交叠的连通区域的最小外接矩形的第一像素数量;

获取对所述非文本元素的连通区域进行膨胀操作后的第二像素数量;

若所述第一像素数量大于所述第二像素数量,则将与所述非文本元素的连通区域交叠的连通区域确定为文本元素的连通区域。

10.一种文档图像的区域分离装置,其特征在于,包括:图像预处理模块,用于对文档图像进行预处理,得到二值化图像;

连通区域分析模块,用于对所述二值化图像进行连通区域分析得到第一连通区域集合;

获取模块,用于获取所述第一连通区域集合中各连通区域的属性特征;

连通区域划分模块,用于根据所述第一连通区域集合中各连通区域的属性特征,将所述第一连通区域集合划分为第二连通区域集合和第三连通区域集合;所述第二连通区域集合中包括非文本元素的连通区域,所述第三连通区域集合中包括文本元素的连通区域;

所述获取模块,还用于获取所述第三连通区域集合中各连通区域的属性特征和相邻位置信息;

连通区域划分模块,还用于根据所述第三连通区域集合中各连通区域的属性特征和相邻位置信息,从所述第三连通区域集合中确定文本元素的连通区域。

11.一种文档图像的区域分离装置,其特征在于,包括:存储器;

处理器;以及

计算机程序;

其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1至9任一项所述的方法。

12.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1至9任一项所述的方法。