1.一种脱机手写体文本识别的字符重心定位方法,其特征在于:包括如下步骤:步骤1:对待识别的脱机手写体文本图像进行预处理,预处理包括对图像进行灰度化、背景色移除和图像二值化;
步骤2:运用连通域分析法进行字符高度估计,多个离散位置的像素点进行连通域分析以获得对应文字或部首的连通区域,避免单个像素点所产生的连通区域导致高度估值偏差;
步骤3:运用信息量传播方式构造脱机手写体文本的信息量矩阵,该矩阵的局部峰值对应汉字重心位置,该矩阵的信息量低谷将汉字与汉字相互区别开来,所述信息量传播方式为信息量与距离的反比关系;
步骤4:运用信息量矩阵的局部峰值分析以完成字符重心定位,将脱机手写体文本的汉字重心定位为信息量的局部峰值位置或区域的中心。
2.根据权利要求1所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:所述步骤1中,所述脱机手写体文本图像X={xij}n×m,其中i和j代表图像的第i行j列的像素位置;xij代表对应位置像素的值,二值化处理后的像素取值为0或1;n和m代表图像的大小,即图像X包含的像素数目为n×m。
3.根据权利要求1所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:所述步骤1中,对待识别的脱机手写体文本图像预处理是为了减少噪声信息对后续识别效率的影响;通过扫描仪、照相机或手机获取彩色或灰度图像;
若获取图像为彩色图像,对所述彩色图像进行图像灰度化处理、背景色移除和图像二值化的方法完成字符与背景分离,再对图像二值化后的图像进行滤波去噪声信息处理,降低噪声信息对字符重心定位的影响;若获取图像为灰度图像,直接进行背景色移除、图像二值化和滤波去噪声信息处理。
4.根据权利要求1所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:所述步骤2中,运用连通域分析法进行字符高度估计,包括如下步骤:步骤21:直接建立文字高度h与文本图像的字符大小的关联,文字高度h作为一个自适应变量;
步骤22:建立相邻像素点,每个像素点除边缘位置外的相邻像素点的数目为八个,相邻像素点分别处于该像素点的左方、右方、上方、下方、左上方、右上方、左下方和右下方八个位置;
步骤23:建立笔迹像素点的连通域,每个连通域均是由若干个有效笔迹像素点组成的序列,该连通域的高度是最上方笔迹像素点位置与最下方笔迹像素点位置之差;
步骤24:运用连通域分析法进行文字高度估计。
5.根据权利要求4所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:所述步骤24中,运用连通域分析法进行文字高度估计,包括如下步骤:步骤241:选择五个初始像素点,即邻近文本图像中心的字符笔迹像素点的有效像素点,包括文本图像中心至左上方、右上方、左下方和右下方的四个中间位置的笔迹像素点;
步骤242:对五个初始像素点逐一进行连通域分析并得到对应笔迹连通域的高度分别为h1、h2、h3、h4和h5;
步骤243:采用如下不等式对笔迹连通域的高度值有效性评估:
|hi-hj|≤ε,1≤i,j≤5,i≠j,ε≥0 (1)其中:ε表示两个高度值之差的容错区间值,用300dpi规格扫描仪扫描A4尺寸的文本图像,ε取值为8;
步骤244:若满足所述步骤243中的不等式,则输出h1、h2、h3、h4和h5的均值作为字符高度估计值h=avg(h1,h2,h3,h4,h5),结束;若不满足所述步骤243中的不等式,则执行步骤245;
步骤245:将h1、h2、h3、h4和h5按从大到小排序,优先取最大值,判断其它四个像素点的某一相邻的连通域的高度是否满足所述步骤243中的不等式,若满足,则执行所述步骤244;反之,随机划定文本图像的一部分区域,执行所述步骤241。
6.根据权利要求1所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:所述步骤3中,运用信息量传播方式构造脱机手写体文本的信息量矩阵,包括如下步骤:步骤31:设第i行j列非零值的像素点xij含有的信息量为1个单位;
步骤32:设受像素点xij信息传播影响的最远像素点距离为k,该最远像素点收到像素点xij信息的传播量为0;
步骤33:对像素点xij构造大小为(2k+1)×(2k+1)的影响力矩阵Info(2k+1)×(2k+1),其中,Infok+1,k+1=1代表像素点xij对自身信息传播量为1个单位,对其邻近k范围内的像素点xi'j'的信息传播量为Infoi',j'=fun(disti'j'),其中disti'j'=sqrt((k+1-i')^2+(k+1-j')^2);
步骤34:设图像X中每个像素点对应的信息量矩阵为Info+n×m,大小为n×m,初始值为0;
步骤35:依次进行第i行j列非零值的像素点xij对相邻像素点的信息矩阵Info的运算,并将其与Info+n×m相加,其数学表达式为:Info+i±k,j±k=Info+i±k,j±k+Infoi,j (2)其中,Infoi,j表示2k+1行2k+1列矩阵,Info+(i±k,j±k)表示矩阵Info+的第i-k到i+k行、第j-k到j+k列的子矩阵,将该矩阵原始值与Infoi,j相加之后再覆盖其原始值。
7.根据权利要求6所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:信息传播量与距离的函数关系Info=fun(dist)采用一次函数、二次函数、指数函数或对数函数,近邻像素点的信息传播量Info与它们的距离dist成反比。
8.根据权利要求6所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:所述步骤35中,图像X边缘像素点的信息量化处理,第1行1列的像素点x1,1仅对处于其第四象限的像素点发挥作用,第n行m列的像素点xn,m仅对处于其第二象限的像素点发挥作用。
9.根据权利要求6所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:所述步骤4中,运用信息量矩阵的局部峰值分析以完成字符重心定位,包括如下步骤:步骤41:建立脱机手写体文本的字符笔画上的像素点以自身为1个单位的影响力,并逐渐较小地影响至距离为k的像素点;
步骤42:对式(2)进行求和,形成单个字符影响力的峰值区域或字符之间影响力的低谷区域。
10.根据权利要求9所述的一种脱机手写体文本识别的字符重心定位方法,其特征在于:所述步骤42中,若Info+n×m上存在坐标(i,j)的局部峰值Lmax=Info+i,j,其中,(i,j)是+ +Infon×m的第i行j列像素;或是若Infon×m上存在多个相邻像素的中心坐标位置,则坐标(i,j)即为一个字符的重心,其不等式如下:Lmax=Info+i,j>Fun_neighbor(Info+i,j) (3)其中,函数Fun_neighbor(Info+i,j)表示坐标(i,j)的相邻像素点的信息量。