利索能及
我要发布
收藏
专利号: 2018101264240
申请人: 南京晓庄学院
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种脱机手写体文本的字符切分方法,其特征在于,包括字符高度估计、字符的粗略切分和字符的精细切分;所述字符高度估计运用连通域分析法进行字符高度估计,文字高度h作为一个自适应变量,它与文本图像的字符大小直接关联;首先明确相邻像素点概念,即每个像素点含有相邻像素点的数目为八,除边缘位置,它们分别处于该像素点的左、右、上、下、左上、右上、左下和右下八个位置;接着,笔迹像素点的连通域概念,即每个连通域是由若干个笔迹有效像素点组成的序列,该连通域的高度是最上方笔迹像素点位置与最下方笔迹像素点位置之差;所述字符的粗略切分基于像素空白区域完成单字符切分、粘连多字符切分以及标记;所述字符的精细切分对于标记粘连多字符的切分需要找到字符与字符之间的真正切分点,这一切分点能准确地将他们切分;为此,粘连多字符大体上分为重叠非粘连、粘连两类;前者是指某一字符与其他字符存在垂直映射上的粘连,但是该字符笔迹像素点仍然可以通过连通域分析法得到其所有的连通域而与其他字符笔迹像素点不发生连通关系;后者是指某一字符与其他字符存在连通关系,换言之,该字符的笔迹像素点与其他字符的笔迹像素点存在重合,重合点的数量等于或大于1;所述字符高度估计具体步骤如下:(1)以文本图像的左上角和右下角为极限位置,随机选择k个位置点,

即{(x1,y1),(x2,y2),…,(xk,yk)};

(2)获取每一个随机位置点的最邻近笔迹像素点,当该位置点的像素值为1,则最邻近

像素点为自身;对第i个随机位置点(xi,yi)而言,最邻近笔迹像素点(xj,yj)应满足如下条件:

其中,DF表示一种距离度量函数; 表示文本图像第xj行第yj列的像素值,其值为1,

表示该位置存在笔迹像素;运用连通域来计算k个最邻近笔迹像素点所在的笔迹连通域高度{h1,h2,…,hk};实验结果表明,k取值范围为[20,30],字符高度处于k个连通域的平均高度与最大高度之间且偏向于后者;为此,将k个连通域的高度值按小到大排序,选择第个高度值作为字符初始高度估计值H;

所述字符的粗略切分具体包括如下步骤:

S1、获取待处理的行结构以及对应的字符重心C={c1,c2,…,cr,…,cn′},其中n′表示字符重心的总数量,r表示字符重心的下标,cr表示第r个字符重心的纵向值和横向值;

S2、笔迹起始像素点,行结构的起始点是由其第一个字符重心投影至行结构得到,并非该行结构的起始像素点,需要对其进行前向延伸H/2并结合连通域以确定笔迹起始像素点(x,y)且px,y=1;

S3、字符区域设定,字符区域是指容纳该字符笔迹像素点的最小矩形,其参数包括矩形的左上角坐标(x″,y″)、高度SH′和宽度y′‑y″;其中矩形的左上角坐标可以由笔迹起始像素点、宽度和高度三者计算得到,宽度可以由笔迹起始像素点和切分点确定,因此字符区域设定仅需计算字符所属矩形的高度;字符所属矩形的高度可以结合字符高度值和字符笔迹连通域以确定:SH′=max(x″′)‑min(x″′),s.t.{p(x″′,y″′)=1|((x″′,y″′)∈CDP&&y″≤y″′≤y′‑1)},其中CDP代表了以SH′为高度和y′‑y″为宽度的区域的笔迹像素点以及其他与该区域内笔迹连通的笔迹像素点,其整个区域的高度近似等于H;像素空白区域,从笔迹起始像素点开始,以行结构为中心、宽度为SW,高度为SH,向行结构的另一端做切片分析,若以(x′,y′)为左上角的切片区域不存在任何笔迹像素点, 则该切片被认为是像素空白区域;这一区域对应了单字符与其他字符的间隔区域、多字符与其他字符的间隔区域和其他区域三种情况之一;情况一,笔迹起始像素点到该切片的距离近似于字符高度且存在字符重心处于该区域的相对中心位置,即{cr∈[x:x+SH,y:y′‑1],y′‑y≈H|cr∈C},进入字符区域设定以完成单字符切分,其标记为“1”,设置该切片后续非空白区域的切片为新的笔迹起始像素点;情况二,笔迹起始像素点到该切片的距离远大于字符高度且多个字符重心处于该区域中,进入字符区域设定以完成多字符切分并标记以参与字符精细切分阶段,其标记为“2”,设置该切片后续非空白区域的切片为新的笔迹起始像素点,即{cr∈[x:x+SH,y:y′‑1],y′‑y>>H|cr∈C};情况三,这一区域包含的字符笔迹对应了标点符号或字符偏旁,进入字符区域设定以完成这一区域字符笔迹的切分,其标记为“3”,设置该切片后续非空白区域的切片为新的笔迹起始像素点;

所述字符的精细切分具体包括如下步骤:

S1、笔迹起始像素点,选择多字符区域的最左侧笔迹像素点的位置并设定为笔迹起始

像素点(x,y)且px,y=1;

S2、重叠非粘连字符,从多字符的一侧开始向另一侧进行切片分析,以第一个字符重心c′1为中间位置和FW为宽度,取该字符重心的另一侧的笔迹区域,其中FW=max{H/2,c′1(2)‑y}代表在字符高度除以2和笔迹起始像素点到第一个字符重心的距离两者中选最大值,c′1(2)代表邻近笔迹起始像素点的字符重心的横向值;对该区域进行连通域分析,若存在一个或多个非连通域使得笔迹起始像素点所在的字符与多字符区域的其他字符完全分离,则该字符与其他字符处于重叠关系,设定字符区域设定以完成单字符切分,其标记为“1”;重新设定笔迹起始像素点并移除该位置右侧的已切分字符的笔迹像素点,继续执行多字符切分处理,直至完成;

S3、粘连字符,以第一个字符重心c′1为中间位置和FW为宽度,取该字符重心的另一侧的笔迹区域外的邻近字符重心c′2,其中FW=min{H/2,c′1(2)‑y}代表在字符高度除以2和笔迹起始像素点到第一个字符重心的距离两者中选最小值,c′1(2)代表邻近笔迹起始像素点的字符重心的横向值;以c′1和c′2的中间位置为切片的中心,分别向两个字符重心做切片分析,计算每个切片中截穿笔迹数(αt)n'和笔迹像素点数(βt)n';其中n′代表两个字符重心的切片数,αt和βt分别代表第t个切片的截穿笔迹数和笔迹像素点数,截穿笔迹数是指切片区域穿过的不连续的字符笔迹数目,当邻近几个切片的笔迹像素点数保持较稳定,某一切片的截穿笔迹的数目小于邻近两侧的切片区域或某一侧的切片区域的截穿笔迹的数目时,则表明该切片是两个粘连字符的最佳垂直切分点,即 其中n″代表一个小于n′的随机数以约束第t个切片与近邻切片的关系,δ代表一个足够小的数以约束第t个切片的像素点数与邻近切片的像素点数保持平稳;笔迹像素点数能反应该切片处于字符的位置,即边缘位置由于存在竖直笔划,则笔迹像素点的数量会骤升;准中间位置含有多条横线,则笔迹像素点的数量呈现平稳状态;因此,结合截穿笔迹的数目和笔迹像素点的数量,选择粘连字符的最佳切分点以完成笔迹起始像素点所在字符与其他字符的切分。