利索能及
我要发布
收藏
专利号: 2017109306798
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种电子装置,其特征在于,所述电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的票据信息识别系统,所述票据信息识别系统被所述处理器执行时实现如下步骤:A、在收到待处理的票据图片后,根据预先确定的待识别字段与区域识别模型的映射关系,确定所述票据图片中各个待识别字段对应的区域识别模型,针对各个待识别字段,调用对应的区域识别模型对所述票据图片的行字符区域进行区域识别,从所述票据图片上识别出包含字符信息且固定宽度为预设值的目标框,并将所包含的字符信息处于同一行的目标框按照识别的先后顺序拼接在一起形成包含字符信息的目标行字符区域;

B、根据预先确定的待识别字段与字符识别模型的映射关系,确定各个所述待识别字段对应的字符识别模型,针对各个所述待识别字段的目标行字符区域,调用对应的字符识别模型进行字符识别,以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息;

其中,所述根据预先确定的待识别字段与区域识别模型的映射关系,确定所述票据图片中各个待识别字段对应的区域识别模型包括:A1、利用预先训练的票据图片识别模型对收到的票据图片的票据类别进行识别,并输出票据类别的识别结果;

A2、利用预先确定的矫正规则对收到的票据图片进行倾斜矫正;

A3、根据预先确定的票据类别与待识别字段的映射关系,确定识别的票据类别对应的待识别字段;

A4、根据预先确定的待识别字段与区域识别模型的映射关系,确定各个所述待识别字段对应的区域识别模型。

2.如权利要求1所述的电子装置,其特征在于,所述区域识别模型为卷积神经网络模型,针对一个待识别字段对应的区域识别模型的训练过程如下:C1、针对该待识别字段,获取预设数量的票据图片样本;

C2、在各个票据图片样本上每隔第一预设数量的像素,设置第二预设数量的不同高宽比且固定宽度为预设值的小框;

C3、在各个票据图片样本上对包含该待识别字段的字符信息的小框进行标记;

C4、将包含该待识别字段的字符信息的票据图片样本归入第一训练集,并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集;

C5、分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片,并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片;

C6、利用提取的各个待训练的样本图片进行模型训练,以生成所述区域识别模型,并利用各个待验证的样本图片对生成的所述区域识别模型进行验证;

C7、若验证通过率大于或等于预设阈值,则训练完成,或者,若验证通过率小于预设阈值,则增加票据图片样本的数量,并重复执行步骤C2、C3、C4、C5、C6。

3.如权利要求1所述的电子装置,其特征在于,所述字符识别模型为时间递归神经网络模型LSTM,针对一个待识别字段对应的字符识别模型的训练过程如下:D1、针对该待识别字段,获取预设数量的票据图片样本,票据图片样本中仅包含一行该待识别字段的字符信息,并将各个票据图片样本的名称命名为其包含的该待识别字段的字符信息;

D2、将所述票据图片样本按照X:Y的比例分成第一数据集和第二数据集,第一数据集中的票据图片样本数量大于第二数据集中的票据图片样本数量,将第一数据集作为训练集,第二数据集作为测试集,其中,X大于0,Y大于0;

D3、将第一数据集中的票据图片样本送入预设的时间递归神经网络模型进行模型训练,每隔预设时间或预设次数的迭代,使用训练得到的模型对第二数据集中的票据图片样本进行字符信息识别,并将字符信息识别结果与测试的票据图片样本的名称进行比对,以计算字符信息识别结果的误差;若训练得到的模型对票据图片样本的字符信息识别的误差出现发散,则调整预设训练参数并重新训练模型,直至误差出现收敛,则结束模型训练,生成的模型作为最终的该待识别字段对应的字符识别模型。

4.一种票据信息识别方法,其特征在于,所述票据信息识别方法包括:

步骤一、在收到待处理的票据图片后,根据预先确定的待识别字段与区域识别模型的映射关系,确定所述票据图片中各个待识别字段对应的区域识别模型,针对各个待识别字段,调用对应的区域识别模型对所述票据图片的行字符区域进行区域识别,从所述票据图片上识别出包含字符信息且固定宽度为预设值的目标框,并将所包含的字符信息处于同一行的目标框按照识别的先后顺序拼接在一起形成包含字符信息的目标行字符区域;

步骤二、根据预先确定的待识别字段与字符识别模型的映射关系,确定各个所述待识别字段对应的字符识别模型,针对各个所述待识别字段的目标行字符区域,调用对应的字符识别模型进行字符识别,以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息;

其中,所述根据预先确定的待识别字段与区域识别模型的映射关系,确定所述票据图片中各个待识别字段对应的区域识别模型包括:A1、利用预先训练的票据图片识别模型对收到的票据图片的票据类别进行识别,并输出票据类别的识别结果;

A2、利用预先确定的矫正规则对收到的票据图片进行倾斜矫正;

A3、根据预先确定的票据类别与待识别字段的映射关系,确定识别的票据类别对应的待识别字段;

A4、根据预先确定的待识别字段与区域识别模型的映射关系,确定各个所述待识别字段对应的区域识别模型。

5.如权利要求4所述的票据信息识别方法,其特征在于,所述区域识别模型为卷积神经网络模型,针对一个待识别字段对应的区域识别模型的训练过程如下:C1、针对该待识别字段,获取预设数量的票据图片样本;

C2、在各个票据图片样本上每隔第一预设数量的像素,设置第二预设数量的不同高宽比且固定宽度为预设值的小框;

C3、在各个票据图片样本上对包含该待识别字段的字符信息的小框进行标记;

C4、将包含该待识别字段的字符信息的票据图片样本归入第一训练集,并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集;

C5、分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片,并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片;

C6、利用提取的各个待训练的样本图片进行模型训练,以生成所述区域识别模型,并利用各个待验证的样本图片对生成的所述区域识别模型进行验证;

C7、若验证通过率大于或等于预设阈值,则训练完成,或者,若验证通过率小于预设阈值,则增加票据图片样本的数量,并重复执行步骤C2、C3、C4、C5、C6。

6.如权利要求4所述的票据信息识别方法,其特征在于,所述字符识别模型为时间递归神经网络模型LSTM,针对一个待识别字段对应的字符识别模型的训练过程如下:D1、针对该待识别字段,获取预设数量的票据图片样本,票据图片样本中仅包含一行该待识别字段的字符信息,并将各个票据图片样本的名称命名为其包含的该待识别字段的字符信息;

D2、将所述票据图片样本按照X:Y的比例分成第一数据集和第二数据集,第一数据集中的票据图片样本数量大于第二数据集中的票据图片样本数量,将第一数据集作为训练集,第二数据集作为测试集,其中,X大于0,Y大于0;

D3、将第一数据集中的票据图片样本送入预设的时间递归神经网络模型进行模型训练,每隔预设时间或预设次数的迭代,使用训练得到的模型对第二数据集中的票据图片样本进行字符信息识别,并将字符信息识别结果与测试的票据图片样本的名称进行比对,以计算字符信息识别结果的误差;若训练得到的模型对票据图片样本的字符信息识别的误差出现发散,则调整预设训练参数并重新训练模型,直至误差出现收敛,则结束模型训练,生成的模型作为最终的该待识别字段对应的字符识别模型。

7.如权利要求4所述的票据信息识别方法,其特征在于,所述票据图片识别模型为深度卷积神经网络模型,该深度卷积神经网络模型由1个输入层、13个卷积层、5个池化层、2个全连接层、1个分类层构成;所述票据图片识别模型的训练过程如下:S1、为每一个预设票据类别准备预设数量的标注有对应的票据类别的票据图片样本;

S2、将每一个预设票据类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的票据图片样本进行混合以得到训练集,并将各个验证子集中的票据图片样本进行混合以得到验证集;

S3、利用所述训练集训练所述票据图片识别模型;

S4、利用所述验证集验证训练的所述票据图片识别模型的准确率,若准确率大于或者等于预设准确率,则训练结束,或者,若准确率小于预设准确率,则增加每一个预设票据类别对应的票据图片样本的数量,并重新执行步骤S2、S3、S4。

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有票据信息识别系统,所述票据信息识别系统被处理器执行时实现如权利要求4至7中任一项所述的票据信息识别方法的步骤。