利索能及
我要发布
收藏
专利号: 2022113654893
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-22
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种手写汉字图像评估方法,其特征在于,包括如下步骤:获取手写汉字图像及模板汉字图像,进行去噪和二值化处理,分别得到手写汉字图像的预处理图像和模板汉字图像的预处理图像;

对手写汉字图像的预处理图像和模板汉字图像的预处理图像进行笔画类型确定处理,得到手写汉字图像的笔画类型和模板汉字图像的笔画类型;

将手写汉字图像的笔画类型与模板汉字图像的笔画类型进行比较,获得手写汉字图像的相似度值,用于评估手写汉字图像;

所述进行笔画类型确定处理,包括:

对预处理图像进行汉字骨架提取操作,得到汉字骨架图像;

提取汉字骨架图像中的骨架端点、骨架常规点、骨架分叉点、骨架拐点,及修复骨架分叉点,处理得到骨架笔画段集合;

根据组合规则,将相邻的骨架笔画段组合为一个笔画,得到拆分后的笔画;

根据八邻域方向编码规则对拆分后的笔画提取方向序列,确定笔画类型;

所述骨架拐点的计算方法如下:

以骨架点在骨架笔画段的下标作为参数,对骨架笔画段中骨架点的横坐标和纵坐标分别建立离散参数方程;

对离散参数方程进行拟合,得到骨架笔画段的连续函数;

将骨架笔画段两端进行连线,判断骨架笔画段是否与连线相交,或无相交但逼近连线;

从相交或逼近点位置寻找拐点,分别进行以下步骤;

a)计算当前骨架笔画段中所有点与两端点的距离和,记录最大值和索引;

b)判断两端点之间距离与最大值之比是否大于设定的第二阈值,大于第二阈值时利用索引和连续函数计算最大值点在当前骨架笔画段连续函数上的曲率,若曲率小于设定的第三阈值,则为弯曲笔画上的一点,若曲率大于第三阈值,则为拐点;

c)将骨架笔画段从拐点处断开,形成两个新的笔画段,新笔画段重复步骤a‑c至没有新的拐点产生。

2.根据权利要求1所述的一种手写汉字图像评估方法,其特征在于,修复骨架分叉点包括对汉字骨架图像中的伪分叉点进行去除与合并,包括如下步骤:对比每一个骨架分叉点之间的距离与设定的第一阈值的大小,若骨架分叉点之间的距离小于第一阈值,合并为同一分叉点集群;

对分叉点集群中的骨架分叉点进行平均,得到分叉点集群的质心;

使用质心代表分叉点集群中的骨架分叉点,重新连接汉字骨架图像中的骨架。

3.根据权利要求1所述的一种手写汉字图像评估方法,其特征在于,得到骨架笔画段集合包括如下步骤:根据骨架分叉点拆分汉字骨架图像中的骨架,结合骨架端点提取骨架笔画段,得到初始骨架笔画段集合;

对初始骨架笔画段集合进行筛选,去除其中的毛刺笔画段,从剩余的骨架笔画段集合中提取骨架拐点,并结合骨架端点、骨架分叉点、骨架拐点及骨架常规点,重新提取骨架笔画段,得到最终骨架笔画段集合。

4.根据权利要求1所述的一种手写汉字图像评估方法,其特征在于,所述骨架端点为八邻域中只有一个邻居为骨架点的骨架点;所述骨架常规点为八邻域中只有两块不相邻的邻域且邻居数小于四的骨架点;所述骨架分叉点为八邻域中邻域数量大于两块或邻居数不小于四的骨架点,其中一块邻域为两个或以上相邻点。

5.根据权利要求1所述的一种手写汉字图像评估方法,其特征在于,所述组合规则具体如下:将骨架端点、骨架分叉点及骨架拐点作为顶点,各顶点之间的连线作为边,建立当前手写汉字的数据结构图;

基于数据结构图的连通性,将数据结构图划分为若干连通子图,按照重心顺序遍历每一个连通子图所有度大于1的顶点;

若所述顶点为骨架分叉点,遍历与骨架分叉点相连的笔画段,计算每一个笔画段与该骨架分叉点相连的其他笔画段两两之间的角度,判断最大角度是否大于设定的角度阈值,若是合并所述笔画段,并从顶点连接的笔画段中删除所述笔画段,若否继续计算下一条笔画段;

若所述顶点为骨架拐点,根据与所述顶点相邻顶点的方位,判断所述顶点断开或连接;

当连通子图顶点的所有度均不大于1,得到拆分后的笔画。

6.根据权利要求5所述的一种手写汉字图像评估方法,其特征在于,与骨架拐点相邻的两个顶点处于<左,下>、<左,左下>,或两个顶点方向相同时,所述顶点连接,其它情况断开。

7.一种手写汉字图像评估系统,其特征在于,所述系统包括:预处理模块:用于获取手写汉字图像及模板汉字图像,进行去噪和二值化操作,分别得到预处理图像;

提取模块:用于对预处理图像进行汉字骨架提取操作,得到汉字骨架图像;并提取汉字骨架图像中的骨架端点、骨架常规点、骨架分叉点、骨架拐点,及修复骨架分叉点,处理得到骨架笔画段集合;

所述骨架拐点的计算方法如下:

以骨架点在骨架笔画段的下标作为参数,对骨架笔画段中骨架点的横坐标和纵坐标分别建立离散参数方程;

对离散参数方程进行拟合,得到骨架笔画段的连续函数;

将骨架笔画段两端进行连线,判断骨架笔画段是否与连线相交,或无相交但逼近连线;

从相交或逼近点位置寻找拐点,分别进行以下步骤;

a)计算当前骨架笔画段中所有点与两端点的距离和,记录最大值和索引;

b)判断两端点之间距离与最大值之比是否大于设定的第二阈值,大于第二阈值时利用索引和连续函数计算最大值点在当前骨架笔画段连续函数上的曲率,若曲率小于设定的第三阈值,则为弯曲笔画上的一点,若曲率大于第三阈值,则为拐点;

c)将骨架笔画段从拐点处断开,形成两个新的笔画段,新笔画段重复步骤a‑c至没有新的拐点产生;

拆分模块:根据组合规则,用于将相邻的骨架笔画段组合为一个笔画,得到拆分后的笔画;

评估模块:根据八邻域方向编码规则对拆分后的笔画提取方向序列,分别确定笔画类型;对比手写汉字图像和模板汉字图像的笔画类型相似度,评估手写汉字图像。

8.一种计算机设备,其特征在于,包括处理器及存储介质;

所述存储介质用于存储指令;

所述处理器用于根据所述指令进行操作以执行根据权利要求1‑6任一项所述方法的步骤。

9.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1‑6任一项所述方法的步骤。