买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于深度学习的发票信息识别方法、装置和计算机设备

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于深度学习的发票信息识别方法、装置和计算机设备

面议

专利号： 2021110521575

申请人：平安科技(深圳)有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于深度学习的发票信息识别方法，其特征在于，包括：

基于预设检测模型对医疗发票图像进行检测，得到与目标字段对应的第一检测框；其中，所述目标字段包括增负字段与金额字段，所述第一检测框包括与所述增负字段对应的第一增负检测框，以及与所述金额字段对应的第一金额检测框；

基于所述第一检测框的空间位置信息，按照第一预设规则对所述检测框进行区块划分，得到第二检测框；

按照第二预设规则对各区块中第二检测框包含的第二增负检测框与第二金额检测框进行匹配处理，得到对应的第一匹配框；其中，每一个所述第一匹配框中包含一对具有匹配关系的第二增负检测框与第二金额检测框；

获取所述医疗发票图像内预设的项目框的通用识别结果，基于所述通用识别结果对所述第一匹配框进行过滤处理，得到对应的第二匹配框，并基于所述通用识别结果在所述第二匹配框内写入对应的第一文本信息；

基于预设的文本填写规则对所述第二匹配框中包含的所有检测框进行过滤处理得到对应的第三检测框，并按照所述第二预设规则对所述第三检测框进行匹配处理，得到对应的第三匹配框；

根据预设的与全部自费金额字段及部分自费金额字段对应的数值计算规则对所述第三匹配框内的第二文本信息进行计算处理，生成所述全部自费金额字段的第一数值与所述部分自费金额字段的第二数值；其中，所述全部自费金额字段是指所述医疗发票图像中包含的所有全部自费项目花费的金额的总和对应的字段，所述部分自费金额字段是指所述医疗发票图像中包含的所有部分自费项目花费的金额中自费金额的总和对应的字段。

2.根据权利要求1所述的基于模型的发票信息识别方法，其特征在于，所述基于所述第一检测框的空间位置信息，按照第一预设规则对所述检测框进行处理，得到区块划分后的第二检测框的步骤，包括：基于所述第一检测框的坐标信息，通过非极大值抑制算法对所述第一检测框进行过滤处理，得到对应的第四检测框；

基于所述第四检测框的中心点横坐标对所述第四检测框进行区块划分处理，得到区块划分后的第五检测框；

基于与所述第五检测框对应的第一空间位置信息对各区块的第五检测框进行预设的列矫正处理，得到对应的第六检测框；

基于与所述第六检测框对应的第二空间位置信息对所述第六检测框进行预设的行矫正处理，得到对应的第七检测框，并通过所述非极大值抑制算法对所述第七检测框进行过滤处理，得到对应的第八检测框；

将所述第八检测框作为所述第二检测框。

3.根据权利要求2所述的基于深度学习的发票信息识别方法，其特征在于，所述基于所述第一检测框的坐标信息，通过非极大值抑制算法对所述第一检测框进行过滤处理，得到对应的第四检测框的步骤，包括：获取各所述第一检测框的置信度与各所述第一检测框的坐标值，以及获取所述项目框的坐标位置信息；

从所有所述第一检测框中过滤置信度为0的检测框，以及过滤坐标值不处于所述坐标位置信息的范围内的检测框，得到对应的第九检测框；

对所有所述第九检测框的置信度进行降序排序，得到对应的第一排序结果；

从所述第一排序结果中筛选出置信度最高的第十检测框；

计算所述第十检测框与所述第九检测框中其他检测框之间的重叠面积；

获取预设的面积阈值，将所述第九检测框中重叠面积大于所述面积阈值的检测框删除，并将剩余的检测框再次进行置信度降序排序，再次删除重叠面积大于所述面积阈值的检测框，直至重叠面积大于所述面积阈值的检测框的数量为0，并将剩下的所有检测框作为所述第四检测框。

4.根据权利要求2所述的基于深度学习的发票信息识别方法，其特征在于，所述基于所述第四检测框的中心点横坐标对所述第四检测框进行区块划分处理，得到区块划分后的第五检测框的步骤，包括：根据第一预设公式计算所有第一指定检测框的中心点横坐标的均值；其中，所述第一指定检测框为所述第四检测框中，与所述增负字段对应的第三增负检测框或与所述金额字段对应的第三金额检测框；

根据第二预设公式计算所有所述第一指定检测框的中心点横坐标对应的标准差；

获取第一预设阈值，第二预设阈值以及所述项目框的宽度值；

基于所述均值、所述标准差、所述第一预设阈值、所述第二预设阈值与所述宽度值，确定出每一个所述第一指定检测框的区块划分结果；

基于所述区块划分结果对各所述第一指定检测框进行划分处理，得到区块划分后的所述第五检测框。

5.根据权利要求2所述的基于深度学习的发票信息识别方法，其特征在于，所述基于与所述第三检测框对应的第一空间位置信息分别对各区块的第五检测框进行预设的列矫正处理，得到对应的第六检测框的步骤，包括：获取第一区块中的所有第二指定检测框；其中，所述第一区块为区块划分后的任意一个区块，所述第二指定检测框为所述第一区块中第五检测框包含的，与所述增负字段对应的第四增负检测框或与所述金额字段对应的第四金额检测框；

将所有所述第二指定检测框按照中心点纵坐标的数值从大到小进行排序，得到对应的第二排序结果；

获取与所有所述第二指定检测框对应的中心点横坐标、检测框平均宽度值与第一检测框平均高度值；

获取所有所述第二指定检测框的数量；

按照所述第二排序结果的排序，计算相邻的两个第二指定检测框之间的中心横坐标的间距；

若所述数量等于2，根据与各所述第二指定检测框之间的中心横坐标的间距对应的第一筛选规则对所有所述第二指定检测框进行筛选处理，得到所述第六检测框；

若所述数量大于2，根据与所述相邻的两个第二指定检测框之间的中心横坐标的间距、所述检测框宽度平均值以及所述第一检测框高度平均值对应的第二筛选规则对所有所述第二指定检测框进行筛选处理，得到所述第六检测框。

6.根据权利要求2所述的基于深度学习的发票信息识别方法，其特征在于，所述基于与所述第六检测框对应的第二空间位置信息对所述第六检测框进行预设的行矫正处理，得到对应的第七检测框的步骤，包括：判断第二区块中第六检测框包含的与所述增负字段对应的第五增负检测框的数量是否小于所述第二区块中包含的与所述金额字段对应的第五金额检测框的数量；其中，所述第二区块为区块划分后的任意一个区块；

若否，按照第一预设顺序对所有所述第五增负检测框进行遍历，获取相邻的两个第五增负检测框之间的纵向间距；

获取所有所述第五增负检测框的平均纵向间距；

计算所述纵向间距与所述平均纵向间距的第一差值绝对值，并判断所述第一差值绝对值是否大于预设数值阈值；

若是，获取所述相邻的两个第五增负检测框的横坐标，以及获取所有所述第五增负检测框的第二检测框平均高度值；

基于所述横坐标与所述第二检测框平均高度值在所述相邻的两个第五增负检测框中进行添加框处理，得到添加处理后的第五增负检测框，将得到的添加处理后的第五增负检测框再次进行相邻的两个第五增负检测框的纵向间距与平均纵向间距之间的匹配处理，并在纵向间距与所述平均纵向间距的第一差值绝对值大于所述预设数值阈值的两个第五增负检测框内进行添加框处理，直至任意两个第五增负检测框的纵向间距与平均纵向间距之间的第一差值绝对值不大于所述预设数值阈值，得到所述第七检测框。

7.根据权利要求1所述的基于深度学习的发票信息识别方法，其特征在于，所述按照第二预设规则对各区块中第二检测框包含的第二增负检测框与第二金额检测框进行匹配处理，得到对应的第一匹配框的步骤，包括：获取预设的平均斜率；

按照第二预设顺序对第三区块中第二检测框包括的与所述增负字段对应的第六增负检测框进行遍历处理，对于当前遍历到的第六增负检测框，分别计算所述当前遍历到的第六增负检测框与每一个所述金额字段对应的第六金额检测框之间的斜率；其中，将所述当前遍历到的第六增负检测框记为指定增负检测框；

从所有所述斜率中获取数值最小的斜率，并判断所述最小斜率与所述平均斜率的第二差值绝对值是否处于预设数值范围内；

若是，获取与所述数值最小的斜率对应的指定金额检测框，并判定所述指定增负检测框与所述指定金额检测框具有匹配关系，并为所述指定增负检测框与所述指定检测框建立匹配关系，直至完成对所有所述第六增负检测框的匹配处理得到对应的所述第一匹配框。

8.一种基于深度学习的发票信息识别装置，其特征在于，包括：

检测模块，用于基于预设检测模型对医疗发票图像进行检测，得到与目标字段对应的第一检测框；其中，所述目标字段包括增负字段与金额字段，所述第一检测框包括与所述增负字段对应的第一增负检测框，以及与所述金额字段对应的第一金额检测框；

第一处理模块，用于基于所述第一检测框的空间位置信息，按照第一预设规则对所述检测框进行处理，得到区块划分后的第二检测框；

匹配模块，用于按照第二预设规则对各区块中第二检测框包含的第二增负检测框与第二金额检测框进行匹配处理，得到对应的第一匹配框；其中，每一个所述第一匹配框中包含一对具有匹配关系的第二增负检测框与第二金额检测框；

第二处理模块，用于获取所述医疗发票图像内预设的项目框的通用识别结果，基于所述通用识别结果对所述第一匹配框进行过滤处理，得到对应的第二匹配框，并基于所述通用识别结果在所述第二匹配框内写入对应的第一文本信息；

第三处理模块，用于基于预设的文本填写规则对所述第二匹配框中包含的所有检测框进行过滤处理得到对应的第三检测框，并按照所述第二预设规则对所述第三检测框进行匹配处理，得到对应的第三匹配框；

计算模块，用于根据预设的与全部自费金额字段及部分自费金额字段对应的数值计算规则对所述第三匹配框内的第二文本信息进行计算处理，生成所述全部自费金额字段的第一数值与所述部分自费金额字段的第二数值；其中，所述全部自费金额字段是指所述医疗发票图像中包含的所有全部自费项目花费的金额的总和对应的字段，所述部分自费金额字段是指所述医疗发票图像中包含的所有部分自费项目花费的金额中自费金额的总和对应的字段。

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。