利索能及
我要发布
收藏
专利号: 2018115234255
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文字识别方法,其特征在于,包括:

确定图像中卡证区域的目标角点在所述图像中的位置信息;

依据目标角点的位置信息将所述卡证区域从当前视角转换至目标视角,所述目标视角是采集图像时正对卡证的视角;

从已转换的卡证区域中确定出至少一个目标文字区域;

将每个所述目标文字区域输入至已训练的第一神经网络,以由所述第一神经网络识别并输出所述目标文字区域中的文字;

从所述第一神经网络输出的文字中确定出待校验文字段,并确定所述待校验文字段中相关联的第一文字段和第二文字段;

在预设的文字关联表的第一表项中查找所述第一文字段;

若未查找到,则计算所述第一文字段与所述第一表项中各个文字段的相似度,当最大相似度低于设定值时,在所述文字关联表的第二表项中查找是否存在所述第二文字段,若存在,则将所述第一文字段修改为所述第一表项中与所述第二文字段对应的文字段,若不存在,则计算所述第二文字段与所述第二表项中各个文字段的相似度,确定与所述第二文字段相似度最大的文字段,将所述第一文字段修改为第一表项中与所述相似度最高的文字段对应的文字段;

所述第一表项与第二表项中的文字段之间存在一一对应关系;

其中,依据目标角点的位置信息将所述卡证区域从当前视角转换至目标视角,包括:获取目标视角下的设定角点在所述图像中的位置信息;

依据目标角点确定当前视角下的所述卡证区域在所述图像中的位置;

依据至少四个目标角点的位置信息、及对应设定角点的位置信息,计算所述卡证区域从当前视角转换至目标视角的坐标转换关系;其中,所述至少四个目标角点中存在任意三个目标角点不共线的四个目标角点;

按照所述坐标转换关系将所述卡证区域从当前视角转换至目标视角;

所述目标角点包括:卡证区域的指定文字段上的文字角点、和/或卡证区域的指定图案上的图案角点。

2.如权利要求1所述的文字识别方法,其特征在于,确定图像中卡证区域的目标角点在所述图像中的位置信息,包括:将所述图像输入至已训练的第二神经网络中;所述第二神经网络至少通过用于执行卷积的卷积层、用于执行下采样的池化层、及用于执行坐标回归的回归层实现所述卡证区域的目标角点的位置信息的确定和输出;

将所述第二神经网络输出的结果确定为所述卡证区域的目标角点在所述图像中的位置信息。

3.如权利要求1所述的文字识别方法,其特征在于,所述目标角点至少包括卡证区域的指定文字段上的文字角点;

所述从已转换的卡证区域中确定出至少一个目标文字区域,包括:获取已转换的卡证区域中的文字角点到确定目标文字区域时所需的区域定位点的设定位置关系;

依据所述文字角点在已转换的卡证区域中的位置信息及所述设定位置关系,确定区域定位点在已转换的卡证区域中的位置信息;

依据所述区域定位点的位置信息确定所述卡证区域的所述目标文字区域。

4.如权利要求1所述的文字识别方法,其特征在于,所述从已转换的卡证区域中确定出至少一个目标文字区域,包括:确定所述已转换的卡证区域中的多个候选文字区域;

将所述已转换的卡证区域中的各个候选文字区域与预设的卡证区域模板中的设定文字区域进行匹配;

依据匹配结果从候选文字区域中确定出目标文字区域。

5.如权利要求1所述的文字识别方法,其特征在于,由所述第一神经网络识别出所述目标文字区域中的文字,包括:由所述第一神经网络的至少一卷积层对所述目标文字区域进行特征提取并输出特征图至第一循环网络层;

由所述第一神经网络的第一循环网络层对所述特征图进行编码并输出特征序列至第二循环网络层;

由所述第一神经网络的第二循环网络层对所述特征序列进行解码而识别出文字并输出。

6.一种文字识别装置,其特征在于,包括:

目标角点定位模块,用于确定图像中卡证区域的目标角点在所述图像中的位置信息;

卡证区域校正模块,用于依据目标角点的位置信息将所述卡证区域从当前视角转换至目标视角,所述目标视角是采集图像时正对卡证的视角;

文字区域确定模块,用于从已转换的卡证区域中确定出至少一个目标文字区域;

区域文字识别模块,用于将每个所述目标文字区域输入至已训练的第一神经网络,以由所述第一神经网络识别并输出所述目标文字区域中的文字;

文字校正模块,用于:

从所述第一神经网络输出的文字中确定出待校验文字段,并确定所述待校验文字段中相关联的第一文字段和第二文字段;

在预设的文字关联表的第一表项中查找所述第一文字段;

若未查找到,则计算所述第一文字段与所述第一表项中各个文字段的相似度,当最大相似度低于设定值时,在所述文字关联表的第二表项中查找是否存在所述第二文字段,若存在,则将所述第一文字段修改为所述第一表项中与所述第二文字段对应的文字段,若不存在,则计算所述第二文字段与所述第二表项中各个文字段的相似度,确定与所述第二文字段相似度最大的文字段,将所述第一文字段修改为第一表项中与所述相似度最高的文字段对应的文字段;

所述第一表项与第二表项中的文字段之间存在一一对应关系;

所述卡证区域校正模块包括:

设定角点获取单元,用于获取目标视角下的设定角点在所述图像中的位置信息;

当前位置确定单元,用于依据目标角点确定当前视角下的所述卡证区域在所述图像中的位置;

关系计算单元,用于依据至少四个目标角点的位置信息、及对应设定角点的位置信息,计算所述卡证区域从当前视角转换至目标视角的坐标转换关系;其中,所述至少四个目标角点中存在任意三个目标角点不共线的四个目标角点;

坐标转换单元,用于按照所述坐标转换关系将所述卡证区域从当前视角转换至目标视角;

所述目标角点包括:卡证区域的指定文字段上的文字角点、和/或卡证区域的指定图案上的图案角点。

7.如权利要求6所述的文字识别装置,其特征在于,所述目标角点定位模块包括:位置信息计算单元,用于将所述图像输入至已训练的第二神经网络中;所述第二神经网络至少通过用于执行卷积的卷积层、用于执行下采样的池化层、及用于执行坐标回归的回归层实现所述卡证区域的目标角点的位置信息的确定和输出;

位置信息确定单元,用于将所述第二神经网络输出的结果确定为所述卡证区域的目标角点在所述图像中的位置信息。

8.如权利要求6所述的文字识别装置,其特征在于,所述目标角点至少包括卡证区域的指定文字段上的文字角点;

所述文字区域确定模块包括:

位置关系获取单元,用于获取已转换的卡证区域中的文字角点到确定目标文字区域时所需的区域定位点的设定位置关系;

文字区域定位单元,用于依据所述文字角点在已转换的卡证区域中的位置信息及所述设定位置关系,确定区域定位点在已转换的卡证区域中的位置信息;

第一确定单元,用于依据所述区域定位点的位置信息确定所述卡证区域的所述目标文字区域。

9.如权利要求6所述的文字识别装置,其特征在于,所述文字区域确定模块包括:候选文字区域确定单元,用于确定所述已转换的卡证区域中的多个候选文字区域;

文字区域匹配单元,用于将所述已转换的卡证区域中的各个候选文字区域与预设的卡证区域模板中的设定文字区域进行匹配;

第二确定单元,依据匹配结果从候选文字区域中确定出目标文字区域。

10.如权利要求6所述的文字识别装置,其特征在于,所述区域文字识别模块包括:第一计算单元,用于由所述第一神经网络的至少一卷积层对所述目标文字区域进行特征提取并输出特征图至第一循环网络层;

第二计算单元,用于由所述第一神经网络的第一循环网络层对所述特征图进行编码并输出特征序列至第二循环网络层;

第三计算单元,用于由所述第一神经网络的第二循环网络层对所述特征序列进行解码而识别出文字并输出。

11.一种电子设备,其特征在于,包括处理器及存储器;所述存储器存储有可被处理器调用的程序;其中,所述处理器执行所述程序时,实现如权利要求1‑5中任意一项所述的文字识别方法。

12.一种机器可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时,实现如权利要求1‑5中任意一项所述的文字识别方法。