1.一种基于扎根理论和事理图谱的船舶航行事故致因分析方法,其特征在于,包含以下步骤:
(1)获取各类船舶航行事故调查报告;
(2)对步骤(1)中获取的船舶航行事故调查报告,结合船舶航行事故特点以及其他事故领域现有本体的复用,基于扎根理论构建船舶航行事故领域本体核心概念;
(3)基于步骤(2)中构建的船舶航行事故本体核心概念,对步骤(1)中获取的船舶航行事故调查报告中的船舶航行事故事件实体进行分类,并基于本体核心概念标注事件实体,以建立一套适用于船舶航行事故领域的事理图谱语料库,再对事件实体标注进行有监督学习模式的事件抽取;
(4)基于步骤(3)中的事件实体抽取结果,采用深度学习工具对步骤(1)中获取的船舶航行事故调查报告中的船舶航行事故的事件关系进行标注,再采用脉冲耦合神经网络PCNN的方法对标注的事件关系进行半自动抽取;
(5)将步骤(3)和步骤(4)得到的船舶航行事故事件抽取和事件关系抽取的结果导入Neo4j数据库中,完成船舶航行事故事理图谱的构建;
(6)基于步骤(5)构建的船舶航行事故事理图谱进行船舶航行事故致因分析。
2.根据权利要求1所述的一种基于扎根理论和事理图谱的船舶航行事故致因分析方法,其特征在于,步骤(2)中,所述的构建本体核心概念的具体内容和方法是,先对步骤(1)中所述的船舶航行事故调查报告中的数据,进行开放性编码、主轴编码和选择性编码,然后对航行事故核心概念进行提取,最终形成的船舶航行事故本体核心概念。
3.根据权利要求1所述的一种基于扎根理论和事理图谱的船舶航行事故致因分析方法,其特征在于,步骤(3)中,所述的有监督学习模式是指通过8:1:1的比例将事理图谱语料库分为训练集、测试集、验证集,使用Word2vec工具对事理图谱语料库进行向量化,再将向量输入双向长短时记忆神经网络和条件随机场BiLSTM‑CRF模型进行事件抽取训练,最后完成船舶航行事故事理图谱中事件的构建。
4.根据权利要求1所述的一种基于扎根理论和事理图谱的船舶航行事故致因分析方法,其特征在于,步骤(4)中,所述的脉冲耦合神经网络PCNN方法的具体内容和步骤是,将步骤(1)中获取的船舶航行事故调查报告文本分成三段进行卷积,然后进行分段最大池化,通过分类器完成事件关系半自动抽取,最后完成船舶航行事例图谱中事件关系的构建。
5.根据权利要求1所述的一种基于扎根理论和事理图谱的船舶航行事故致因分析方法,其特征在于,步骤(6)中,所述的船舶航行事故致因分析指从步骤(5)中获取的船舶航行事理图谱中挖掘事故致因关键元路径,然后分时间段分析随时间变化的事故传导路径,分析不同类型事故的关键传导路径,最后提取不同类型关键事故的中心图谱,进行具体事故的致因分析。
6.根据权利要求5所述的一种基于扎根理论和事理图谱的船舶航行事故致因分析方法,其特征在于,所述的挖掘事故致因关键元路径的具体内容和方法步骤是:a)预定义的临界值表示重要元路径连接的事故因果对的最小数目;
b)定义种子事故集合,从给定的种子事故出发遍历原因节点,对事例图谱进行广度遍历和深度遍历,形成种子节点的因果路径元组列表;
c)在遍历过程中计算每个原因节点的因果关联中心性,检查是否比给定的临界值大,当是,则保留,否则就剪枝;
d)对所挖掘的事故元路径,通过半监督学习PU方法确定元路径权重,即把种子事故和候选实体分别作为正例和无标签数据,先从无标签的数据中确认可靠的负例集合,然后采用SVM迭代建立分类器,以自动学习元路径权重,最终得到按重要性排序的元路径。
7.根据权利要求2所述的一种基于扎根理论和事理图谱的船舶航行事故致因分析方法,其特征在于,所述的开放性编码的具体内容和方法步骤是,对权利要求1的步骤(1)中所述的船舶航行事故调查报告的原始数据逐行逐句进行编码,通过不断地比较将原始数据逐步概念化与范畴化,剔除频率出现在三次以下的初始概念,从而抽取出初始范畴;所述的主轴编码的具体内容和方法步骤是,对开放性编码所形成的初始范畴进行进一步的提炼,对初始范畴的不同类型进行划分,将结构、类型以及逻辑关系相似的范畴归为一类,并进一步区分出主范畴及其对应副范畴;所述的选择性编码的具体内容和方法步骤是,指通过对主范畴的整理,对比“4M”理论模型的人为致因(Men)、设备致因(Machine)、作业致因(Media)和管理致因(Management),结合船舶航行事故的特征,选择核心范畴,把核心范畴系统地和其他范畴进行联系,验证它们之间的关系,并把概念化尚未发展完备的范畴补充完整。
8.根据权利要求7所述的一种基于扎根理论和事理图谱的船舶航行事故致因分析方法,其特征在于,所述的主范畴指安全管理、知觉错误、违规操作、决策错误、环境因素、船舶设备因素、人员因素、船员安排不恰当、航行计划不充分,所述的核心范畴指设备因素、环境因素、管理因素、人为因素以及应急反应因素。