买专利、卖专利、专利购买、专利交易、专利出售、高企申报-文档图像的文档版面分析方法、装置及存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

文档图像的文档版面分析方法、装置及存储介质

￥8400

专利号： 2018111523152

申请人：杭州海康威视数字技术股份有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2025-10-25

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种文档图像的文档版面分析方法，其特征在于，所述方法包括：获取文档图像中待分析的文档版面；

提取所述文档版面中的至少一个文字区块，并对所述至少一个文字区块进行文字识别，得到所述至少一个文字区块对应的文字信息；

根据所述至少一个文字区块对应的文字信息，确定所述至少一个文字区块对应的至少一个主题信息；

根据所述至少一个主题信息，确定所述文档版面的描述信息。

2.如权利要求1所述的方法，其特征在于，所述获取文档图像中待分析的文档版面之后，还包括：对所述文档版面进行灰度处理，得到所述文档版面的灰度图像；

对所述灰度图像进行高斯模糊处理，得到所述文档版面的高斯模糊图像；

对所述高斯模糊图像进行锐化处理。

3.如权利要求1或2所述的方法，其特征在于，所述获取文档图像中待分析的文档版面之后，还包括：检测所述文档版面是否处于倾斜状态；

当检测到所述文档版面处于倾斜状态时，对所述文档版面进行倾斜矫正。

4.如权利要求3所述的方法，其特征在于，所述对所述文档版面进行倾斜矫正，包括：旋转所述文档版面，并确定所述文档版面在旋转过程中对应的多个垂直投影直方图；

根据所述多个垂直投影直方图确定所述文档版面的多个行间距；

根据所述多个行间距中的最大行间距确定所述最大行间距对应的目标垂直投影直方图；

将所述目标垂直投影直方图对应的文档版面确定为所述倾斜矫正后的文档版面。

5.如权利要求1所述的方法，其特征在于，所述提取所述文档版面中的至少一个文字区块，包括：对所述文档版面进行分块处理，得到所述文档版面包括的多个第一区块；

检测所述多个第一区块的类型；

根据所述多个第一区块的类型，从所述多个第一区块中提取类型为文字类型的至少一个文字区块。

6.如权利要求5所述的方法，其特征在于，所述对所述文档版面进行分块处理，得到所述文档版面包括的多个第一区块，包括：确定所述文档版面中的非空白区域；

对所述非空白区域进行膨胀操作处理，得到多个第二区块；

确定相邻两个所述第二区块之间的距离，并当所述距离超过预设距离时，将所述相邻两个所述第二区块合并为一个第一区块。

7.如权利要求1所述的方法，其特征在于，所述根据所述至少一个文字区块对应的文字信息，确定所述至少一个文字区块对应的至少一个主题信息，包括：根据所述文档版面的类型，确定至少一个指定提取关键词；

对于每个文字区块，根据所述至少一个指定提取关键词，从所述每个文字区块对应的文字信息中提取每个指定提取关键词对应的指定信息；

根据所述每个指定提取关键词对应的指定信息，生成所述文字区块的主题信息。

8.如权利要求1所述的方法，其特征在于，所述根据所述至少一个主题信息，确定所述文档版面的描述信息，包括：将所述至少一个主题信息组成所述文档版面的描述信息；或，根据第一预设规则将所述至少一个主题信息连接成一个语句，并将所述一个语句确定为所述文档版面的描述信息。

9.如权利要求1所述的方法，其特征在于，所述提取所述文档版面中的至少一个文字区块，并对所述至少一个文字区块进行文字识别，得到所述至少一个文字区块对应的文字信息，包括：通过第一神经网络模型提取所述文档版面中的至少一个文字区块，并通过所述第一神经网络模型对所述至少一个文字区块进行文字识别，得到所述至少一个文字区块对应的文字信息；

所述根据所述至少一个文字区块对应的文字信息，确定所述至少一个文字区块对应的至少一个主题信息，包括：根据所述至少一个文字区块对应的文字信息，通过第二神经网络模型确定所述至少一个文字区块对应的至少一个主题信息，所述第一神经网络模型和所述第二神经网络模型相同或者不同。

10.一种文档图像的文档版面分析装置，其特征在于，所述装置包括：获取模块，用于获取文档图像中待分析的文档版面；

提取模块，用于提取所述文档版面中的至少一个文字区块，并对所述至少一个文字区块进行文字识别，得到所述至少一个文字区块对应的文字信息；

第一确定模块，用于根据所述至少一个文字区块对应的文字信息，确定所述至少一个文字区块对应的至少一个主题信息；

第二确定模块，用于根据所述至少一个主题信息，确定所述文档版面的描述信息。

11.一种文档图像的文档版面分析装置，其特征在于，所述装置包括：处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行权利要求1-9所述的任一项方法的步骤。

12.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现权利要求1-9所述的任一项方法的步骤。