1.一种文字图像骨架特征描述符获取的方法,其特征在于,包括步骤:
S1,对输入图像进行色块分割,提取色块连通域的水平向色段线和垂直向色段线及其端点,获得水平向色段线和垂直向色段线的中点;
S2,对水平向色段线和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后图像骨架线;
S3,获取正位后图像骨架线,找出正位后图像骨架线线段上最长水平线段和最长垂直线段,对正位后图像骨架线线段的笔画线型进行划分和编码;
S4,按照预设顺序对正位后图像骨架线线段的笔画线型编码进行排序,将排序后的正位后图像骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符;步骤S2中,所述对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:第一,根据步骤S1所获得的水平向色段线的中点,对水平向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的水平向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有水平向色段线的像素点遍历完成;
步骤S2中,所述对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:第一,根据步骤S1所获得的垂直向色段线的中点,对垂直向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的垂直向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有垂直向色段线的像素点遍历完成;
步骤S2中,所述对骨架点进行修正处理,获得修正后图像骨架线的方法包括:首先,测量每条主要骨架线段的线长;
然后,对主要骨架线段进行稳定主要骨架线段和非稳定主要骨架线段的分类:当主要骨架线段的线长大于或等于预设阈值时,将该主要骨架线段作为稳定主要骨架线段,否则,作为非稳定主要骨架线段;
最后,将非稳定主要骨架线段作为离散骨架点或离散骨架线段,将稳定主要骨架线段作为修正后图像骨架线;
步骤S3中,所述获取正位后图像骨架线的方法包括:
旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且为有效区域大小尺寸最小时的修正后图像骨架线状态,获取正位后图像骨架线,其中,所述的修正后图像骨架线的有效区域是指由修正后图像骨架线的内接矩形所围成的内部区域。
2.根据权利要求1所述的文字图像骨架特征描述符获取的方法,其特征在于,步骤S1包括:S101,对输入图像进行色块分割;
S102,提取色块连通域的色段线及其端点;
S103,获取水平向色段线和垂直向色段线的中点;
其中,色块连通域的色段线包括水平向色段线和垂直向色段线。
3.根据权利要求2所述的文字图像骨架特征描述符获取的方法,其特征在于,所述对输入图像进行色块分割的方法包括:提取输入图像每一像素点的颜色值,计算多色级的二值化自适应阈值,对输入图像进行色块连通域的分割,获得像素点色块连通域;
所述提取色块连通域的色段线及其端点的方法包括:
第一,将归入同一色块连通域在水平方向连续相连的像素点连线作为水平向色段线,将归入同一色块连通域在垂直方向连续相连的像素点连线作为垂直向色段线;第二,将水平向色段线中像素点x坐标值最大和最小的像素点作为水平向色段线的端点,将垂直向色段线中像素点y坐标值最大和最小的像素点作为垂直向色段线的端点。
4.根据权利要求1所述的文字图像骨架特征描述符获取的方法,其特征在于,所述找出正位后图像骨架线段上最长水平线段和最长垂直线段的方法包括:分别统计正位后图像骨架线上每正位后图像骨架线线段每一x坐标值所拥有的像素点数和每一y坐标值所拥有的像素点数,并找出正位后图像骨架线线段中拥有像素点数最多的x坐标值或y坐标值,该y坐标值所拥有的像素点所组成的线段即为最长水平线段,该x坐标值所拥有的像素点所组成的线段即为最长垂直线段;
所述对正位后图像骨架线线段的笔画线型进行划分的方法包括:
将正位后图像骨架线线段的笔画线型划分为横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段,并按预设的笔画线型划分规则确认正位后图像骨架线线段的笔画线型;
所述对正位后图像骨架线线段的笔画线型划分结果进行编码的方法包括:
将横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段采用数字、字母或符号进行表示,将该数字、字母或符号的集合作为正位后图像骨架线线段的笔画线型编码。
5.根据权利要求4所述的文字图像骨架特征描述符获取的方法,其特征在于,所述预设的笔画线型划分规则包括:
1)当正位后图像骨架线线段上最长水平线段的像素点数大于或等于预设的水平骨架线线长阈值时,该正位后图像骨架线线段确认为横骨架线线段;
2)当正位后图像骨架线线段上最长垂直线段的像素点数大于或等于预设的垂直骨架线线长阈值时,该正位后图像骨架线线段确认为竖骨架线线段;
3)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值,且该正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值,但该正位后图像骨架线线段的两端点y轴坐标值的差与该线段两端点x轴坐标值的差之比小于或等于预设坡度比阈值时,该正位后图像骨架线线段仍确认为横骨架线线段;
4)当正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值,且该正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值,但该正位后图像骨架线线段的两端点x轴坐标值的差与该线段两端点y轴坐标值的差之比小于或等于预设坡度比阈值时,该正位后图像骨架线线段仍确认为竖骨架线线段;
5)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且该正位后图像骨架线线段不确认为横骨架线线段,或正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且该正位后图像骨架线线段不确认为竖骨架线线段时,将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧的正位后图像骨架线线段确认为撇骨架线线段;
6)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且该正位后图像骨架线线段不确认为横骨架线线段,或正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且该正位后图像骨架线线段不确认为竖骨架线线段时,将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧的正位后图像骨架线线段确认为捺骨架线线段。
6.根据权利要求1所述的文字图像骨架特征描述符获取的方法,其特征在于,步骤S4中,所述预设顺序为从左往右并从上到下地进行排序。
7.一种文字图像骨架特征描述符获取装置,其特征在于,包括:
第一获取模块,用于对输入图像进行色块分割,提取色块连通域的水平向色段线和垂直向色段线及其端点,获得水平向色段线和垂直向色段线的中点;
第二获取模块,用于对水平向色段线和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后图像骨架线;
处理模块,用于获取正位后图像骨架线,找出正位后图像骨架线线段上最长水平线段和最长垂直线段,对正位后图像骨架线线段的笔画线型进行划分和编码;
生成模块,用于按照预设顺序对正位后图像骨架线线段的笔画线型编码进行排序,将排序后的正位后图像骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符;
第二获取模块包括:
第一划分单元,用于对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点;
第二划分单元,用于对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点;
修正单元,用于对骨架点进行修正处理,获得修正后图像骨架线;
所述对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:第一,根据第一获取模块所获得的水平向色段线的中点,对水平向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的水平向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有水平向色段线的像素点遍历完成;
所述对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:第一,根据第一获取模块所获得的垂直向色段线的中点,对垂直向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的垂直向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有垂直向色段线的像素点遍历完成;
所述对骨架点进行修正处理,获得修正后图像骨架线的方法包括:
首先,测量每条主要骨架线段的线长;
然后,对主要骨架线段进行稳定主要骨架线段和非稳定主要骨架线段的分类:当主要骨架线段的线长大于或等于预设阈值时,将该主要骨架线段作为稳定主要骨架线段,否则,作为非稳定主要骨架线段;
最后,将非稳定主要骨架线段作为离散骨架点或离散骨架线段,将稳定主要骨架线段作为修正后的骨架线;
处理模块包括:
第二获取单元,用于获取正位后图像骨架线;
第三获取单元,用于找出正位后图像骨架线线段上最长水平线段和最长垂直线段;第三划分单元,用于对正位后图像骨架线线段的笔画线型进行划分;
编码单元,用于对正位后图像骨架线线段的笔画线型划分结果进行编码;
所述获取正位后图像骨架线的方法包括:
旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且为有效区域大小尺寸最小时的修正后图像骨架线状态,获取正位后图像骨架线,其中,所述的修正后图像骨架线的有效区域是指由修正后图像骨架线的内接矩形所围成的内部区域。