1.一种航空安全事故因果关系抽取方法,其特征在于:其包括按顺序进行的下列步骤:
步骤1)对航空安全事故文本进行去噪、分句和分词在内的预处理,并判断每个句子中是否含有因果提示词,若有则执行步骤2)进行显式因果关系抽取,否则执行步骤3)进行隐式因果关系抽取;
步骤2)将含有因果提示词的句子称为显式因果句子,首先根据因果提示词的类型构造因果句法模式,通过模式匹配模板抽取出句子中的原因子句和结果子句,并分别抽取原因和结果子句中的事件元组,由此获得显式因果关系事件元组对;
步骤3)将不含因果提示词的句子称为隐式因果句子,首先抽取句子中的事件元组,将句中所有事件元组两两组对,形成候选因果关系事件元组对,采用基于自注意力机制的双向LSTM方法对事件元组对的关系进行分类,获得隐式因果关系事件元组对;
步骤4)根据步骤2)和3)中获得的因果关系事件元组对构建每个航空安全事故的因果关系链。
2.根据权利要求1所述的航空安全事故因果关系抽取方法,其特征在于:在步骤1)中,所述的对航空安全事故文本进行去噪、分句和分词在内的预处理方法是:以世界航空安全事故调查报告所提取的多个航空安全事故文本为基础,通过去噪和分句处理,生成有逻辑语义的句子,再将句子进行分词并判断每个句子中是否含因果提示词,若有则执行步骤2)进行显式因果关系抽取,否则执行步骤3)进行隐式因果关系抽取。
3.根据权利要求1所述的航空安全事故因果关系抽取方法,其特征在于:在步骤2)中,所述的将含有因果提示词的句子称为显式因果句子,首先根据因果提示词的类型构造因果句法模式,通过模式匹配模板抽取出句子中的原因子句和结果子句,并分别抽取原因和结果子句中的事件元组,由此获得显式因果关系事件元组对的方法是:根据航空安全事故调查报告的文本特点归纳句法模式、构造抽取模板,并设计抽取规则,抽取原因子句和结果子句,采用依存句法分析来分析原因和结果子句中包含的事件,将分析结果以[主语及其相关成分,触发词及其相关成分,宾语及其相关成分]事件元组的方式表示,从而获得显示因果关系事件元组对。
4.根据权利要求1所述的航空安全事故因果关系抽取方法,其特征在于:在步骤3)中,所述的将不含因果提示词的句子称为隐式因果句子,首先抽取句子中的事件元组,将句中所有事件元组两两组对,形成候选因果关系事件元组对,采用基于自注意力机制的双向LSTM方法对事件元组对的关系进行分类,获得隐式因果关系事件元组对的方法是:采用词性过滤和依存句法分析相结合的方法抽取每个句子中包含的事件元组,并进行两两组对,将关系抽取问题转化为事件元组对的关系分类问题,采用基于自注意力机制的双向LSTM方法对事件元组对的关系进行分类,获得隐式因果关系事件元组对。
5.根据权利要求1所述的航空安全事故因果关系抽取方法,其特征在于:在步骤4)中,所述的根据步骤2)和3)中获得的因果关系事件元组对构建每个航空安全事故的因果关系链的方法是:将所有事件元组映射成航空安全领域本体中与之相似度最高的概念,以标题所述的事件元组为源点,遍历所有事件元组对形成因果关系链。