利索能及
我要发布
收藏
专利号: 2023101160308
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种汉字字体二值化切片图像的提取方法,其特征在于,包括:获取RGB习字格书法图片,并对所获取的RGB习字格书法图片进行处理,得到灰度图片;

在灰度图片中提取最大的四边形轮廓,并将轮廓之外的区域作为噪声背景进行屏蔽处理,得到已屏蔽噪声背景的图片;

采用LSD直线检测算法在已屏蔽噪声背景的图片中分别提取水平和竖直方向上的习字格边框线条,得到水平边框线条二值化图和竖直边框线条二值化图;

利用Sobel算子提取习字格边缘线条,得到粗略的二值化习字格外框掩模图,将水平边框线条二值化图和竖直边框线条二值化图分别与粗略的二值化习字格外框掩模图进行与操作,同时设置阈值,消除习字格中的短线段,得到水平边框线条二值化优化图和竖直边框线条二值化优化图;

检测水平边框线条二值化优化图和竖直边框线条二值化优化图中相邻格子线条之间距离的比例,剔除习字格中的冗余线条,得到水平习字格线条标记图和竖直习字格线条标记图;

根据水平习字格线条标记图和竖直习字格线条标记图确定实际的习字格交叉关键点,得到各习字格的RGB切片图;

对各习字格的RGB切片图的灰度值进行K‑means聚类分析,得到汉字字体的二值化切片图像;

对所获取的RGB习字格书法图片进行的处理包括:

对所获取的RGB习字格书法图片进行均值滤波,得到预处理图片;

降低预处理图片的质量,质量降低比率v为:

v=yw/yn;

式中,yw表示预处理图片的宽度分辨率,yn表示降低质量后的预处理图片的宽度分辨率;

对降低质量的预处理图片进行对比度和锐化度的增强,得到图片g0,然后对图片g0进行突出颜色色差的灰度化处理,得到图片g1:g1(i, j)= Max(R(i,j),G(i,j),B(i,j));

对图片g1进行高斯模糊得到图片g2:

式中,(i, j)表示二维图片像素点的坐标,g1(i, j)表示像素点坐标(i, j)经过突出颜色色差的灰度化处理后的像素值,g2(i, j)表示像素点坐标(i, j)经过高斯模糊后的像素值,Max(R(i,j),G(i,j),B(i,j))表示图片g0在该点坐标中,三通道灰度值中的最大值,R(i,j)表示图片g0在该点坐标的R通道值,G(i,j)表示图片g0在该点坐标的G通道值,B(i,j)表示图片g0在该点坐标的B通道值,(u, v)表示卷积核的坐标,r表示卷积核半径,s(i+ u,j + v)表示图片g1在该坐标的像素值,f表示高斯滤波函数,f(u, v)表示卷积核的在(u, v)上的权重值;

对图片g2进行形态学的闭操作得到图片g3,然后将g1/g3的结果进行归一化,得到突出颜色色差以及降低光线明暗影响的灰度图片G0。

2.根据权利要求1所述的汉字字体二值化切片图像的提取方法,其特征在于,在灰度图片中提取最大的四边形轮廓的具体方法包括:采用LSD直线检测算法提取灰度图片中习字格线条直线图,寻找到一个最大的四边形轮廓。

3.根据权利要求1所述的汉字字体二值化切片图像的提取方法,其特征在于,获得水平边框线条二值化优化图和竖直边框线条二值化优化图的具体方法包括:计算图片g0中每个像素点的三个通道灰度值的方差:

式中,Dxij表示像素点坐标(i, j)的R、G、B三个通道灰度值的方差,Ri, j表示像素点坐标(i, j)的R通道值,Gi, j表示像素点坐标(i, j)的G通道值,Bi, j表示像素点坐标(i, j)的B通道值,mean(xij)表示像素点坐标(i, j)的R、G、B三通道值的平均值;

将Dxij归一化到0‑255范围,同时利用Sobel算子提取习字格边缘线条,得到粗略的二值化习字格外框掩模图Mask,将水平边框线条二值化图H(x,y)和竖直边框线条二值化图V(x, y)分别与Mask进行与操作,同时设置阈值,消除习字格中的短线段,初步去除干扰线段的影响,得到水平边框线条二值化优化图H0(x,y)和竖直边框线条二值化优化图V0 (x, y)。

4.根据权利要求1所述的汉字字体二值化切片图像的提取方法,其特征在于,获得各习字格的RGB切片图的具体方法包括:将水平习字格线条标记图HLine(x,y)和竖直习字格线条标记图VLine (x, y)进行与运算,得到线条交叉点标记图dot(x,y):;

依据线条交叉点标记图dot(x,y)得到每个习字格交叉点的质心Moments(x,y),其中,质心Moments(x,y)的计算公式为:,

式中,mpq表示图像的p+q阶矩,p表示x的次数,q表示y的次数,m10表示x的一阶矩,m01表示y的一阶矩,m00表示图像的零阶矩;

依据质心Moments(x,y)和质量降低比率v确定所获取的RGB习字格书法图片上实际的习字格交叉关键点坐标 :;

根据实际的习字格交叉关键点坐标 以及行的数量numH和列的数量numV,对 进行整理排序,确定每行的字数以及列数,然后进行分割,得到各习字格的RGB切片图。

5.根据权利要求3所述的汉字字体二值化切片图像的提取方法,其特征在于,所述K‑means聚类分析的具体方法包括:计算所有Dxij>阈值的像素点T(x,y)按照R、G、B三个通道的图片亮度;

选取图片亮度最大的通道进行K‑means聚类,初始聚类中心选为0、128、255,选取聚类完成的三类中聚类中心值最小的类,作为最终汉字字体的灰度值范围Range;

判断所选通道图片的灰度值Gray是否满足该灰度值范围;

如果所选通道图片的灰度值 ,则该像素点为汉字字体的某一部分,该点像素值设为0;否则,该像素值设为255,最后得到各个单字汉字字体的二值化切片图像。

6.根据权利要求5所述的汉字字体二值化切片图像的提取方法,其特征在于,所述像素点T(x,y)按照R、G、B三个通道的图片亮度Light(TR)、Light(TG)、Light(TB)的计算公式为:,

式中,R(x,y)表示图片在该点坐标的R通道值,G(x,y)表示图片在该点坐标的G通道值,B(x,y)表示图片在该点坐标的B通道值,length(T(x,y))表示像素点集合T(x,y)中的像素点个数。

7.一种汉字字体二值化切片图像的提取系统,其特征在于,包括:数据获取和处理模块,用于获取RGB习字格书法图片,并对所获取的RGB习字格书法图片进行处理,得到灰度图片;

第一提取模块,用于在灰度图片中提取最大的四边形轮廓,并将轮廓之外的区域作为噪声背景进行屏蔽处理,得到已屏蔽噪声背景的图片;

第二提取模块,用于采用LSD直线检测算法在已屏蔽噪声背景的图片中分别提取水平和竖直方向上的习字格边框线条,得到水平边框线条二值化图和竖直边框线条二值化图;

第一图片处理模块,用于利用Sobel算子提取习字格边缘线条,得到粗略的二值化习字格外框掩模图,将水平边框线条二值化图和竖直边框线条二值化图分别与粗略的二值化习字格外框掩模图进行与操作,同时设置阈值,消除习字格中的短线段,得到水平边框线条二值化优化图和竖直边框线条二值化优化图;

第二图片处理模块,用于检测水平边框线条二值化优化图和竖直边框线条二值化优化图中相邻格子线条之间距离的比例,剔除习字格中的冗余线条,得到水平习字格线条标记图和竖直习字格线条标记图;

第三图片处理模块,用于根据水平习字格线条标记图和竖直习字格线条标记图确定实际的习字格交叉关键点,得到各习字格的RGB切片图;

聚类分析模块,用于对各习字格的RGB切片图的灰度值进行K‑means聚类分析,得到汉字字体的二值化切片图像;

对所获取的RGB习字格书法图片进行的处理包括:

对所获取的RGB习字格书法图片进行均值滤波,得到预处理图片;

降低预处理图片的质量,质量降低比率v为:

v=yw/yn;

式中,yw表示预处理图片的宽度分辨率,yn表示降低质量后的预处理图片的宽度分辨率;

对降低质量的预处理图片进行对比度和锐化度的增强,得到图片g0,然后对图片g0进行突出颜色色差的灰度化处理,得到图片g1:g1(i, j)= Max(R(i,j),G(i,j),B(i,j));

对图片g1进行高斯模糊得到图片g2:

式中,(i, j)表示二维图片像素点的坐标,g1(i, j)表示像素点坐标(i, j)经过突出颜色色差的灰度化处理后的像素值,g2(i, j)表示像素点坐标(i, j)经过高斯模糊后的像素值,Max(R(i,j),G(i,j),B(i,j))表示图片g0在该点坐标中,三通道灰度值中的最大值,R(i,j)表示图片g0在该点坐标的R通道值,G(i,j)表示图片g0在该点坐标的G通道值,B(i,j)表示图片g0在该点坐标的B通道值,(u, v)表示卷积核的坐标,r表示卷积核半径,s(i+ u,j + v)表示图片g1在该坐标的像素值,f表示高斯滤波函数,f(u, v)表示卷积核的在(u, v)上的权重值;

对图片g2进行形态学的闭操作得到图片g3,然后将g1/g3的结果进行归一化,得到突出颜色色差以及降低光线明暗影响的灰度图片G0。

8.一种汉字字体二值化切片图像的提取装置,其特征在于,包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行权利要求1 6任~一项所述方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1 6任一项所述方法的步骤。

~