买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于子网格特征自适应加权的视频图像文字识别方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于子网格特征自适应加权的视频图像文字识别方法

￥22200

专利号： 2012101243764

申请人：重庆邮电大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-01-15

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于子网格特征自适应加权的视频图像文字识别方法，其特征在于，在指定图像中确定图像文字区域；采用文字二值化将图像文字从背景中分割出来；将分割出来的图像文字区域划分成一个以单字字符为主的区域；根据字符水平投影处峰值的变化进行文本行分割，根据相邻文本区域的位置关系确定对相邻文本区域进行合并；采用种子代表像素信息，从文本区域的右上角开始进行种子搜索，种子点汇聚成种子区域，将被搜索分割开的种子区域进行组合合并，构成字符区域；对图像文字在水平和垂直方向上进行笔划密度投影H(k)和V(k)，得到弹性网格在水平与垂直方向的坐标，根据水平和垂直方向上的坐标得到网格，将大小为M×N的图像文字划分出P×Q个子网格；计算指定子网格质心位置，在指定子网格质心位置与中心子网格中心位置的夹角与指定方向的角度相差15度以内时，调用公式：计算模糊隶属度函数，采用模糊隶属度函数结合指定子网格与其8邻域子网格的笔画贡献情况获知指定子网格的弹性网格特征，将弹性网格特征与字库内的特征比较，经过特征的分级匹配，相似性最近的字符特征作为匹配结果，其中，a表示任意子网格指向指定子网格方向上的梯度幅值，b表示指定子网格指向任意子网格在对应方向上的梯度幅值。

2.根据权利要求1所述的方法，其特征在于，采用边缘的粗文字区域定位与精确文字区域定位确定图像文字区域。

3.根据权利要求1所述的方法，其特征在于，文本行分割具体包括：对视频图像中的文本区域进行水平方向投影，得到第i行的投影值，根据字符水平投影处峰值的变化进行文本行分割，水平方向投影值为0的行，则确定该行没有字符出现；水平方向投影值不为0的行，则该行可能有字符出现。

4.根据权利要求1所述的方法，其特征在于，当满足以下三个条件之一时，将相邻文本区域进行合并：条件一、若上下相邻区域的两行行高g值和大于unionHeight×0.7，或左右相邻区域有边界的包含关系；条件二、对于相邻区域，若左右距离小于相邻区域的最大宽度，并且其高度差小于unionHeight×0.5；条件三、如果有区域存在相交，其中，unionHeight为合并之后的高度。

5.根据权利要求1所述的方法，其特征在于，对种子区域进行组合合并具体为：将搜索后的种子区域扩展成矩形，对两个种子区域的矩形有重叠的进行合并；对种子区域不重叠或不相交的，若相邻两字符区域在合并之后的宽度满足max(curRti.Width,curRti+1.Width)

6.根据权利要求1所述的方法，其特征在于，计算子网格内每个像素点的梯度方向和幅值，窗口内每个像素点梯度的幅值利用高斯函数进行加权，在窗口内统计计算上、下、左、右、左上、左下、右上、右下8个方向上的图像梯度方向直方图，若某个像素点梯度方向落在

8个方向的其中一个方向上，则把对应梯度高斯加权幅值加到所在的方向上。 k

7.根据权利要求1所述的方法，其特征在于，计算子网格质心位置，对于子网格B，若k k

子网格B 质心位置临近水平左指向子网格则为B 的横笔画特征起贡献作用，若质k k

心位置临近水平右指向子网格则为B 的横笔画特征起贡献作用；对于子网格B 的竖笔画方向特征，垂直上相邻子网格和垂直下相邻子网格起贡献作用；对于子网格kB 的撇笔画方向特征，左下相邻子网格和右上相邻子网格起贡献作用；对于子网格k

B 的捺笔画方向特征，左上相邻子网格和右下相邻子网格起贡献作用。

8.根据权利要求2所述的方法，其特征在于，所述粗文字区域定位具体为：采用Sobel算子提取出灰度图像的边缘；去掉水平和垂直方向的边缘点数量大于全局阈值的边缘曲线，对边缘曲线进行水平和垂直投影确定文字区域边界。