1.一种基于融合关系信息编码的法律文书中的实体关系抽取方法,其特征在于,包括以下步骤:S1、根据预先建立的法律文书中的目标关系表使用联合标记法对训练文本中的主体、客体和非实体进行标注;
S2、使用与预训练模型BERT对经过标注的训练文本进行编码,得到原始文本编码;
S3、将原始文本编码输入多通道卷积神经网络,获得目标关系表中各个关系类别所对应的关系信息编码;
S4、使用权值法对原始文本编码和关系信息编码进行融合,得到融合信息编码;
S5、通过神经网络模型LSTM对融合信息编码进行解码,得到最后的实体关系识别结果;
其中,联合标注法具体对每个关系都进行标注,其中1、2分别对应关系中的主体标签和客体标签,0对应关系中的非实体标签;
权值法具体先使用向量点积、余弦相似度或者映射矩阵作为相关度函数计算文本的关系信息编码与原始文本编码的相关度;然后将计算后得到的相关度向量输入softmax函数,计算得到原始文本编码中各个词的权值;最后将各词的原始编码与对应的权值相乘,得到最终的融合信息编码。
2.根据权利要求1所述的基于融合关系信息编码的法律文书中的实体关系抽取方法,其特征在于,神经网络模型LSTM中仅包含一个LSTM解码器。
3.根据权利要求1所述的基于融合关系信息编码的法律文书中的实体关系抽取方法,其特征在于,多通道卷积神经网络的通道数为目标关系表中关系类别的个数。
4.一种基于融合关系信息编码的法律文书中的实体关系抽取系统,其特征在于,包括:标注模块,用于根据预先建立的法律文书中的目标关系表使用联合标记法对训练文本中的主体、客体和非实体进行标注;
原始文本编码模块,用于使用与预训练模型BERT对经过标注的训练文本进行编码,得到原始文本编码;
关系信息编码模块,用于将原始文本编码输入多通道卷积神经网络,获得目标关系表中各个关系类别所对应的关系信息编码;
融合信息编码模块,用于使用权值法对原始文本编码和关系信息编码进行融合,得到融合信息编码;
识别模块,用于通过神经网络模型LSTM对融合信息编码进行解码,得到最后的实体关系识别结果;
其中,标注模块具体采用联合标注法对每个关系都进行标注,其中1、2分别对应关系中的主体标签和客体标签,0对应关系中的非实体标签;
融合信息编码模块具体采用权值法,先使用向量点积、余弦相似度或者映射矩阵作为相关度函数计算文本的关系信息编码与原始文本编码的相关度;然后将计算后得到的相关度向量输入softmax函数,计算得到原始文本编码中各个词的权值;最后将各词的原始编码与对应的权值相乘,得到最终的融合信息编码。
5.根据权利要求4所述的基于融合关系信息编码的法律文书中的实体关系抽取系统,其特征在于,神经网络模型LSTM中仅包含一个LSTM解码器。
6.一种计算机存储介质,其特征在于,其内存储可被处理器执行的计算机程序,该计算机程序具体执行权利要求1‑3中任一项所述的基于融合关系信息编码的法律文书中的实体关系抽取方法。