1.一种表单识别方法,其特征在于,所述方法包括:
获取待识别表单中的多个文本块;
获取所述多个文本块中每个文本块的目标特征信息;
对于所述多个文本块中的第一文本块,根据所述每个文本块的目标特征信息,确定所述第一文本块与第二文本块属于键值对的概率,其中,所述第二文本块包括所述多个文本块中除所述第一文本块以外的至少一个其他文本块,所述第一文本块与所述第二文本块属于键值对表示所述第二文本块指示属性,所述第一文本块指示所述属性的值;根据所述概率,确定所述第一文本块与所述第二文本块之间的键值对关系;
根据各个文本块之间的键值对关系,获得所述待识别表单的拓扑结构信息。
2.根据权利要求1所述的方法,其特征在于,所述第二文本块包括第一目标文本块以及第二目标文本块,所述第一文本块与所述第一目标文本块属于键值对的概率,大于所述第一文本块与所述第二目标文本块属于键值对的概率;
所述根据所述概率,确定所述第一文本块与所述第二文本块之间的键值对关系,包括:确定所述第一文本块与所述第一目标文本块具有键值对关系。
3.根据权利要求1所述的方法,其特征在于,确定所述第一文本块与第二文本块属于键值对的概率,包括:将所述第一文本块和所述第二文本块的目标特征信息输入至关系预测网络,所述关系预测网络输出所述第一文本块与所述第二文本块属于键值对的概率。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:通过样本集对所述关系预测网络进行训练,其中,所述样本集包含具有键值对关系的第一文本块样本和第二文本块样本,以及与所述第一文本块样本不具有键值对关系的负样本;其中,所述第二文本块样本具有指示与所述第一文本块样本具有键值对关系的第一标注信息,所述负样本具有指示与所述第一文本块样本不具有键值对关系的第二标注信息。
5.根据权利要求4所述的方法,其特征在于,所述通过样本集对所述关系预测网络进行训练,包括:通过最大化所述第一文本块样本与第二文本块具有键值对关系的概率,以及最小化所述第一文本块样本与所述负样本具有键值对关系的概率,对所述关系预测网络的参数进行调整。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述获取所述文本块的目标特征信息,包括:获取所述文本块的多个模态的特征信息;
将所述多个模态的特征信息进行融合,获得所述目标特征信息。
7.根据权利要求6所述的方法,其特征在于,所述多个模态的特征信息包括至少两个模态的文本特征信息;
所述将所述多个模态的特征信息进行融合,获得所述目标特征信息,包括:对所述至少两个模态的文本特征信息进行连接,获得目标特征信息。
8.根据权利要求7所述的方法,其特征在于,所述多个模态的特征信息包括视觉特征信息以及至少一个模态的文本特征信息;
所述将所述多个模态的特征信息进行融合,获得所述目标特征信息,包括:获得所述文本特征信息和所述视觉特征信息对应的权重,并根据所述权重对所述文本特征信息与所述视觉特征信息进行加权求和,获得所述目标特征信息。
9.根据权利要求8所述的方法,其特征在于,所述文本特征信息包括语义特征信息和位置特征信息中的至少一项。
10.根据权利要求9所述的方法,其特征在于,所述视觉特征信息利用视觉特征提取神经网络对所述文本块的图像进行特征提取获得,所述视觉特征提取神经网络包括卷积神经网络和循环神经网络;
所述利用视觉特征提取神经网络对所述文本块的图像进行特征提取获得,包括:将所述文本块的图像输入至所述卷积神经网络,获得多个通道的特征图;
将各个通道的特征图进行拼接,获得特征序列;
将所述特征序列输入至所述循环神经网络,获得所述视觉特征信息。
11.根据权利要求1至5任一项所述的方法,其特征在于,所述获取待识别表单中的多个文本块,包括:对所述待识别表单进行表格线提取处理,得到所述待识别表单的表格线提取结果,所述表格线提取结果包括多个表格线;
对所述待识别表单进行文本识别处理,得到文本识别结果;
所述多个表格线限定而成的多个表格框,对所述文本识别结果进行分割,获得所述多个文本块。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:根据所述各个文本块之间的键值对关系,确定所述待识别表单对应的多个表格框的属性信息。
13.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:根据所述待识别表单的拓扑结构信息,生成所述待识别表单中的多个文本块之间的拓扑结构图。
14.一种表单识别装置,其特征在于,所述装置包括:
第一获取单元,用于获取待识别表单中的多个文本块;
第二获取单元,用于获取所述多个文本块中每个文本块的目标特征信息;
确定单元,用于对于所述多个文本块中的第一文本块,根据所述每个文本块的目标特征信息,确定所述第一文本块与第二文本块属于键值对的概率,其中,所述第二文本块包括所述多个文本块中除所述第一文本块以外的至少一个其他文本块,所述第一文本块与所述第二文本块属于键值对表示所述第二文本块指示属性,所述第一文本块指示所述属性的值;根据所述概率,确定所述第一文本块与所述第二文本块之间的键值对关系;
识别单元,用于根据各个文本块之间的键值对关系,获得所述待识别表单的拓扑结构信息。
15.一种表单识别设备,其特征在于,所述设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时实现权利要求1至13任一项所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至13任一所述的方法。