1.一种基于双层图的文档级事件抽取方法,其特征在于,包括:获取文档数据,对文档数据进行预处理,得到预处理后的文档数据;将预处理后的文档数据输入到训练好的基于双层图的文档级事件抽取模型中,得到文档级事件抽取结果;
对基于双层图的文档级事件抽取模型进行训练的过程包括:S1:获取原始文档数据,对原始文档数据进行预处理,得到预处理后的文档数据;
S2:对预处理后的文档数据进行实体识别,得到识别出的实体,计算实体识别损失;
S3:根据识别出的实体和预处理后的文档数据分别得到实体提及向量和句子向量;
S4:根据实体提及向量和句子向量构建结构图;根据结构图,采用图卷积神经网络进行第一次特征聚合,得到包含文档上下文特征的实体提及向量;
S5:根据包含文档上下文特征的实体提及向量构建依赖图;对实体提及向量进行最大池化操作,得到实体向量;根据实体向量更新依赖图,根据更新后的依赖图,采用图卷积神经网路进行第二次特征聚合,得到包含实体提及之间依赖关系信息的实体向量;
S6:将包含实体提及之间依赖关系信息的实体向量输入到事件类型和事件论元联合分类器中进行事件类型和事件论元的联合抽取,得到对应事件类型和事件论元的实体,计算联合抽取损失;
S7:定义事件论元顺序;将联合抽取得到的实体按照事件论元进行路径扩展,得到扩展边向量;将扩展边向量输入到扩展分类器中,得到预测扩展边;根据预测扩展边和联合抽取得到的实体构建有向无环图;
S8:采用深度优先搜索算法对有向无环图进行解码,得到事件记录结果,计算扩展损失;
S9:根据实体识别损失、联合抽取损失和扩展损失计算文档级事件抽取总损失,当文档级事件抽取总损失最小时,得到训练好的基于双层图的文档级事件抽取模型。
2.根据权利要求1所述的一种基于双层图的文档级事件抽取方法,其特征在于,对文档数据进行预处理包括:将文档数据转化为文档数据的嵌入表示;根据BIO模式,采用上下文编码器对文档数据的嵌入表示进行编码,得到编码后的文档数据。
3.根据权利要求1所述的一种基于双层图的文档级事件抽取方法,其特征在于,计算实体识别损失的公式为:
其中,Lner表示实体识别损失,s表示句子,ys表示s的黄金标准标签序列。
4.根据权利要求1所述的一种基于双层图的文档级事件抽取方法,其特征在于,根据识别出的实体得到实体提及向量包括:对识别出的实体进行最大池化操作,得到实体提及向量;最大池化操作的公式为:
ener=Maxpooling([gi,r,gi,r+1,...,gi,e‑1,gi,e])其中,ener表示实体提及向量,Maxpooling表示最大池化操作,r表示实体提及的开始字标记,e表示实体提及的结束字标记,gi,r表示识别出的实体的第一个字的编码,gi,e表示识别出的实体的最后一个字的编码。
5.根据权利要求1所述的一种基于双层图的文档级事件抽取方法,其特征在于,根据预处理后的文档数据得到句子向量包括:对预处理后的文档数据进行最大池化操作,得到句子向量;将句子的位置信息融入句子向量中,得到融入句子位置信息的句子向量;最大池化操作的公式为:
其中, 表示第i个句子的句子向量,Maxpooling表示最大池化操作,m表示句子总数,gi,n表示第i个句子的第n个字的编码。
6.根据权利要求1所述的一种基于双层图的文档级事件抽取方法,其特征在于,对实体提及向量进行最大池化操作的公式为:ei=Maxpooling({mj}j∈M(i))其中,ei表示包含实体提及之间依赖关系信息的第i个实体向量,Maxpooling表示最大池化操作,mj表示第j个实体提及向量,M(i)表示第i个实体向量的实体提及集合向量集合。
7.根据权利要求1所述的一种基于双层图的文档级事件抽取方法,其特征在于,计算联合抽取损失的公式为:
其中,E表示事件类型的集合,A表示事件类型e的事件论元的集合, 表示实体向量在事件类型e中事件论元a的联合分类器中的触发概率。
8.根据权利要求1所述的一种基于双层图的文档级事件抽取方法,其特征在于,得到扩展边向量的公式为:
其中,eedge表示扩展边向量, 表示触发了第i个事件论元的实体向量, 表示触发了第i+1个事件论元的实体向量, 表示按位相加运算。
9.根据权利要求1所述的一种基于双层图的文档级事件抽取方法,其特征在于,计算扩展损失的公式为:
其中,Lpath表示扩展损失,yt表示第t个扩展边向量输入的扩展分类器的触发概率,T表示所有预测扩展边向量集合。
10.一种基于双层图的文档级事件抽取系统,其特征在于,包括:实体识别模块、构造图模块、依赖图模块、联合抽取模块、预测扩展模块以及事件记录解码模块;
所述实体识别模块用于对文档数据中的实体进行识别并根据文档数据生成实体提及向量和句子向量;
所述构造图模块用于根据实体提及向量和句子向量生成包含文档上下文特征的实体提及向量;
所述依赖图模块用于根据包含文档上下文特征的实体提及向量生成包含实体提及之间依赖关系信息的实体向量;
所述联合抽取模块用于根据包含实体提及之间依赖关系信息的实体向量对事件进行事件类型和事件论元的联合抽取;
所述预测扩展模块用于根据联合抽取得到的实体构建有向无环图;
所述事件记录解码模块用于根据预测扩展模块得到的有向无环图进行解码并输出解码结果。