买专利、卖专利、专利购买、专利交易、专利出售、高企申报-表格类图像的信息识别方法、电子装置及可读存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

表格类图像的信息识别方法、电子装置及可读存储介质

面议

专利号： 2017112407879

申请人：平安科技(深圳)有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种电子装置，其特征在于，所述电子装置包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的表格类图像的信息识别系统，所述表格类图像的信息识别系统被所述处理器执行时实现如下步骤：A、在收到待处理的表格类图像后，识别所述表格类图像的表格类别，并根据预先确定的表格类别与标准模板的映射关系，确定出与所述表格类图像的表格类别对应的第一标准模板及第二标准模板；其中，所述第一标准模板中预先设置有文本行位置标注框，所述第二标准模板中预先设置有关键信息位置标注框；

B、利用预先确定的校正规则对所述表格类图像进行角度校正，使用预先训练的文本行检测模型检测出角度校正后的表格类图像上的所有文本行，并将检测出的文本行与所述第一标准模板中的文本行位置进行比对，确定所述第一标准模板到角度校正后的表格类图像的位置对应关系；

C、根据所述位置对应关系，将所述第二标准模板上的关键信息位置标注框映射到角度校正后的表格类图像上，得到角度校正后的表格类图像上的关键信息位置，并利用预先确定的字符识别模型识别出角度校正后的表格类图像上的关键信息。

2.如权利要求1所述的电子装置，其特征在于，所述预先确定的校正规则为：

预先设定一最大旋转角度max_skew及旋转次数n，从-max_skew到max_skew平均分成n份，得到一列备选的旋转角度；

以灰度图的方式读入所述表格类图像，对于每一个备选的旋转角度，将灰度图按照该备选的旋转角度大小进行旋转得到新图像矩阵，把得到的新图像矩阵每行所有像素点的像素值求均值以得到一列均值，将得到的一列均值求方差，依此计算，每一个备选的旋转角度对应一个方差值；

从所有备选的旋转角度对应的方差值中挑选出最大方差值，将该最大方差值对应的备选的旋转角度作为校正角度，并利用所述校正角度对所述表格类图像进行校正。

3.如权利要求1或2所述的电子装置，其特征在于，所述文本行检测模型为联结文本提案网络CTPN模型，该联结文本提案网络CTPN模型用于检测出角度校正后的表格类图像中文本行的位置，并用标注框标注出检测出的文本行的位置。

4.如权利要求3所述的电子装置，其特征在于，所述将检测出的文本行与所述第一标准模板中的文本行位置进行比对，确定所述第一标准模板到角度校正后的表格类图像的位置对应关系包括：D1、对所述第一标准模板中的所有标注框和检测出的表格类图像中的所有标注框分别进行分组；在分组时，若所述第一标准模板或表格类图像中两个标注框左上角的纵坐标差值的绝对值小于预设值，则将该两个标注框分为一组，以使得处于同一组的标注框都位于同一行；

D2、对分组后的每一行标注框按照行内每个标注框左上角横坐标从小到大的顺序进行标注框排序；

D3、对所有行按照每行第一个标注框左上角的纵坐标从小到大的顺序进行行排序；

D4、若所述第一标准模板中有m行标注框，则从该表格类图像的标注框行排序中选出m行标注框，让从该表格类图像中选出的m行标注框按照行号从小到大的顺序依次与所述第一标准模板中的m行标注框对应，形成m对标注框行；

D5、逐一从m对标注框行中选择配对的标注框行，在一对标注框行被选择后，若该对标注框行中第一标准模板对应的行有n个标注框，则分别从该表格类图像对应的行中取出p个标注框，直到无法选择出不同的p个标注框，其中，m、n、p为正整数，p≤n；在每次选择出p个标注框后，让该p个标注框依次与所述第一标准模板对应的行的n个标注框中的p个标注框对应，得到p对标注框；根据该P对标注框中每对标注框对应的位置框差值，并按预设规则计算得到选择的该对标注框行的位置行差值；

D6、在m对标注框行选择完毕后，得到m个位置行差值，根据m个位置行差值确定出所述第一标准模板到角度校正后的表格类图像的位置对应关系。

5.一种表格类图像的信息识别方法，其特征在于，所述表格类图像的信息识别方法包括：

在收到待处理的表格类图像后，识别所述表格类图像的表格类别，并根据预先确定的表格类别与标准模板的映射关系，确定出与所述表格类图像的表格类别对应的第一标准模板及第二标准模板；其中，所述第一标准模板中预先设置有文本行位置标注框，所述第二标准模板中预先设置有关键信息位置标注框；

利用预先确定的校正规则对所述表格类图像进行角度校正，使用预先训练的文本行检测模型检测出角度校正后的表格类图像上的所有文本行，并将检测出的文本行与所述第一标准模板中的文本行位置进行比对，确定所述第一标准模板到角度校正后的表格类图像的位置对应关系；

根据所述位置对应关系，将所述第二标准模板上的关键信息位置标注框映射到角度校正后的表格类图像上，得到角度校正后的表格类图像上的关键信息位置，并利用预先确定的字符识别模型识别出角度校正后的表格类图像上的关键信息。

6.如权利要求5所述的表格类图像的信息识别方法，其特征在于，所述识别所述表格类图像的表格类别包括：利用预先训练的表格类图像识别模型对待处理的表格类图像的表格类别进行识别，所述表格类图像识别模型为深度卷积神经网络模型，该深度卷积神经网络模型由1个输入层、

13个卷积层、5个池化层、2个全连接层、1个分类层构成，所述表格类图像的表格类别包括门诊票据、住院票据、保险收费收据和理赔出单单据。

7.如权利要求5所述的表格类图像的信息识别方法，其特征在于，所述预先确定的校正规则为：

预先设定一最大旋转角度max_skew及旋转次数n，从-max_skew到max_skew平均分成n份，得到一列备选的旋转角度；

8.如权利要求5、6或7所述的表格类图像的信息识别方法，其特征在于，所述文本行检测模型为联结文本提案网络CTPN模型，该联结文本提案网络CTPN模型用于检测出角度校正后的表格类图像中文本行的位置，并用标注框标注出检测出的文本行的位置。

9.如权利要求8所述的表格类图像的信息识别方法，其特征在于，所述将检测出的文本行与所述第一标准模板中的文本行位置进行比对，确定所述第一标准模板到角度校正后的表格类图像的位置对应关系包括：D1、对所述第一标准模板中的所有标注框和检测出的表格类图像中的所有标注框分别进行分组；在分组时，若所述第一标准模板或表格类图像中两个标注框左上角的纵坐标差值的绝对值小于预设值，则将该两个标注框分为一组，以使得处于同一组的标注框都位于同一行；

D2、对分组后的每一行标注框按照行内每个标注框左上角横坐标从小到大的顺序进行标注框排序；

D3、对所有行按照每行第一个标注框左上角的纵坐标从小到大的顺序进行行排序；

D6、在m对标注框行选择完毕后，得到m个位置行差值，根据m个位置行差值确定出所述第一标准模板到角度校正后的表格类图像的位置对应关系。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有表格类图像的信息识别系统，所述表格类图像的信息识别系统被处理器执行时实现如权利要求5至9中任一项所述的表格类图像的信息识别方法的步骤。