利索能及
我要发布
收藏
专利号: 2021114431347
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种事件抽取系统,其特征在于,包括:输入层,用于对问题答案文本信息进行编码,进而生成对应的词向量,且通过问题间自身的区别来区别事件元素;

注意力编码层,用于提取注意力特征信息,并对该注意力特征信息进行处理,并形成Context信息和answer信息;

模型层,用于对Context信息和answer信息进一步提取;

输出层,包括分类器,用于获取触发词和事件论元。

2.根据权利要求1所述的事件抽取系统,其特征在于,所述输入层中包括bert模型嵌入层,且该bert模型嵌入层用于对问题答案文本信息进行编码,进而生成对应的词向量。

3.根据权利要求1所述的事件抽取系统,其特征在于,所述注意力编码层包括:多头注意力模块,用于并行采取多个注意特征,并根据上下文感知目标对单词进行建模;

前馈层模块;

残差网络层模块,用于将上下文信息传入到下层网络,以避免梯度弥散和梯度爆炸;

注意力融合层模块,用于将Context信息向量和answer信息向量进行拼接。

4.根据权利要求1所述的事件抽取系统,其特征在于,所述模型层包括BILSTM模块,且用所述BILSTM模块对Context信息和answer信息进一步提取。

5.根据权利要求1所述的事件抽取系统,其特征在于,所述分类器为两个,且一个为开始分类器,用来预测触发词的开始索引,且用来寻找触发词和事件论元的公式为另一个为结束分类器,用来寻找触发词的结束索引,且用来寻找触发词和事件论元的公式为

6.一种事件抽取方法,其特征在于,包括如下步骤:S100、触发词抽取,且在触发词抽取过程中通过问题间自身的区别来识别出事件类型;

S200、对步骤S100中的结果进行事件元素识别。

7.如权利要求6所述的一种事件抽取方法,其特征在于,所述步骤S100包括如下子步骤:

S110、在输入层内对问题答案文本信息编码从而生成对应的词向量,该词向量为Context向量和answer向量;

S120、在注意力编码层对注意力特征信息提取,对该注意力特征信息进行处理,并拼接Context信息和answer信息,输出结果;

S130、在模型层对Context和answer信息进行进一步的信息提取;

S140、在输出层获取触发词。

8.如权利要求7所述的一种事件抽取方法,其特征在于:所述步骤S110中,采用bert模型嵌入层分别对问题答案文本信息编码从而生成对应的词向量;

所述步骤S130中,用BILSTM层对Context和answer信息进行进一步的信息提取;

所述步骤S140中,用两个分类器进行触发词预测,一个为开始分类器用来预测触发词的开始索引,且用来寻找触发词和事件论元的公式为 另一个为结束分类器用来寻找事件元素的结束索引,且用来寻找触发词和事件论元的公式为

9.如权利要求7所述的一种事件抽取方法,其特征在于,所述步骤S200包括如下子步骤:

S210、根据步骤S100中的结果设置问题;

S220、将步骤S210中的问题答案文本信息用字符级向量进行编码,并将步骤S100中识别出的触发词的位置信息也加入进文本信息中;

S230、将问题与文本成对地在模型层输入分类器模型,分类器模型为两个,一个为开始分类器用来预测触发词的开始索引,且用来寻找触发词和事件论元的公式为另一个为结束分类器用来寻找事件元素的结束索引,且用来寻找触发词和事件论元的公式为

10.如权利要求7所述的一种事件抽取方法,其特征在于,所述步骤S120包括如下子步骤:

S121、采用多头注意力模块对并行采取词向量的多个注意特征,并根据上下文感知目标对单词进行建模;

S122、采用残差网络层模块将上下文信息传入到下层网络;

S123、采用注意力融合层模块将Context向量和answer的向量进行拼接;

S124、输出结果。