利索能及
我要发布
收藏
专利号: 2019109770724
申请人: 卓尔智联(武汉)研究院有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-06-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文件图像分割方法,所述方法包括:

获取文件图像;

对所述文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;

记录所述垂直直方图的波谷在所述预设二维坐标系中对应的坐标信息;

识别所述坐标信息对应所述文件图像中的起始字符信息,若所述起始字符信息为目标类型信息,则保留所述坐标信息对应的分割点;

根据所述分割点将所述文件图像分割成多个区域图像,得到所述预设二维坐标系下坐标与区域图像的分割关系,所述分割关系用于将待分析图像分割为多个待分析区域图像;

采用光学字符识别技术,将所述区域图像携带的文字信息转化为文本字符;

对所述文本字符进行标注、分割以及关键词提取,得到所述区域图像对应的提取信息,所述提取信息包括坐标范围对应的类别信息和所属领域。

2.根据权利要求1所述的文件图像分割方法,其特征在于,所述获取文件图像包括:获取初始文件图像;

根据所述初始文件图像的文件数据,将所述初始文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到所述文件图像。

3.根据权利要求1所述的文件图像分割方法,其特征在于,所述对所述文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图包括:将所述文件图像转换为HSV域图像;

采用Yen算法,计算所述HSV域图像中V通道的门限值;

根据所述V通道的门限值,调整黑色像素阈值范围;

基于所述调整后的黑色像素阈值范围,得到二值化图像;

对所述二值化图像进行垂直方向投影,得到对应的垂直直方图。

4.根据权利要求1所述的文件图像分割方法,其特征在于,所述根据所述分割点将所述文件图像分割成多个区域图像之后,还包括:获取待分析文件图像;

根据所述待分析文件图像的文件数据,将所述待分析文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到分割重组后的待分析文件图像;

将所述分割重组后的待分析文件图像映射到所述预设坐标系中、并根据所述预设坐标系下的坐标与区域图像的分割关系,将所述分割重组后的待分析文件图像分割为多个待分析区域图像;

识别所述待分析区域图像的符号标记,若所述符号标记为目标符号标记类型时,则提取所述待分析区域图像的信息。

5.根据权利要求4所述的文件图像分割方法,其特征在于,提取所述待分析区域图像的信息包括:采用光学字符识别技术,将所述待分析区域图像携带的文字信息转换为文本字符;

根据所述区域图像对应的提取信息,提取出所述待分析区域图像的对应的文本字符。

6.根据权利要求4所述的文件图像分割方法,其特征在于,所述将所述分割重组后的待分析文件图像映射到所述预设坐标系中之前,还包括:对所述待分析文件图像进行字符识别或标识码识别,识别所述分割重组后的待分析文件图像的所属用户;

所述识别所述待分析区域图像的符号标记,若所述符号标记为目标符号标记类型时,则提取所述待分析区域图像的信息之后,还包括:将所述所属用户与所述待分析区域图像的信息进行绑定。

7.一种文件图像分割装置,其特征在于,所述装置包括:图像获取模块,用于获取文件图像;

图像处理模块,用于对所述文件图像进行二值化处理和预设二维坐标系下的垂直方向投影,得到对应的垂直直方图;

坐标记录模块,用于记录所述垂直直方图的波谷在所述预设二维坐标系中对应的坐标信息;

分割点确定模块,用于识别所述坐标信息对应所述文件图像中的起始字符信息,若所述起始字符信息为目标类型信息,则保留所述坐标信息对应的分割点;

图像分割模块,用于根据所述分割点将所述文件图像分割成多个区域图像,得到所述预设二维坐标系下坐标与区域图像的分割关系,所述分割关系用于将待分析图像分割为多个待分析区域图像;

信息提取模块,用于采用光学字符识别技术,将所述区域图像携带的文字信息转化为文本字符,对所述文本字符进行标注、分割以及关键词提取,得到所述区域图像对应的提取信息,所述提取信息包括坐标范围对应的类别信息和所属领域。

8.根据权利要求7所述的文件图像分割装置,其特征在于,所述图像获取模块还用于获取初始文件图像,根据所述初始文件图像的文件数据,将所述初始文件图像进行分割和垂直排列重组,以使文件中携带的内容在同一图像上显示,得到文件图像。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。