利索能及
我要发布
收藏
专利号: 2020103632615
申请人: 西安理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,包括以下步骤:步骤1:根据轨道交通规范构建实体关系补全模型;

步骤2:对轨道交通规范进行词性标注,提取轨道交通规范中的名词词性分词;

步骤3:将所有轨道交通规范和提取的名词词性分词输入到实体关系补全模型中,提取的名词词性分词作为待补全的实体;用符号检测法判断输入的每一个轨道交通规范是否为简单句,若是简单句,进行步骤4,若不是简单句,进行步骤5;

步骤4:查找所述轨道交通规范中实体相关属性,判断实体与实体关系,生成实体关系三元组,并进行存储;

步骤5:对所述轨道交通规范进行基于深度学习的依存句法分析,若前句是并列结构的NP词组,进行步骤6,若不是,进行步骤7;

步骤6:抽取后句属性词和实体,使前句实体与后句属性词n:n匹配,生成实体关系三元组,并进行存储;

步骤7:判断是否前句语法为主谓宾,后句为宾补,若是,进行步骤8,若不是,进行步骤

9;

步骤8:将前句实体与宾语直接匹配,后句关键词与宾语实体直接匹配,生成实体关系三元组,并进行存储;

步骤9:计算词汇相关度,对相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,并进行存储;

步骤10:将步骤4、步骤8和步骤9中生成的实体关系三元组输出,得到完整的语义结构实体规范,即完成轨道交通规范实体关系的自动补全。

2.根据权利要求1所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述实体关系三元组为“实体-动词-实体”或“实体-程度-属性”。

3.根据权利要求1所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤1的具体操作步骤如下:步骤1.1:获取轨道交通规范原文数据,对获取的轨道交通规范原文数据进行预处理和训练,生成字典;

步骤1.2:对字典进行处理,挖掘缺失特征,提取实体补全规则和方法;

步骤1.3:采用提取的实体补全规则和方法构建实体关系补全模型。

4.根据权利要求1所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤2中,采用Bi-LSTM+CRF词性标注模型对轨道交通规范进行词性标注,形容词性分词划分为属性词,动词词性分词用来判断实体和实体之间的关系。

5.根据权利要求4所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤3中,简单句为只含有顿号和一个句号的句子。

6.根据权利要求5所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤4的具体操作步骤如下:步骤4.1:查找所述轨道交通规范中实体相关的属性和动作关系;

步骤4.2:提取动词,判断实体与实体关系,并进行词性分析提取属性;

步骤4.4:根据实体与实体关系以及提取的属性,生成实体关系三元组,存储实体关系。

7.根据权利要求1所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤9的具体操作步骤如下:步骤9.1:判断所述轨道交通规范是否前句为非并列结构,且后句存在指代词,若是,对指代词后属性词与前句所有实体进行词汇相关度计算,若不是,命名实体识别词组,计算所有分词之间的词汇相关度;

步骤9.2:将词汇相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,并进行存储。

8.根据权利要求7所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤9中,采用基于知网词库的词汇相关度计算算法来计算词汇相关度。

9.根据权利要求8所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述基于知网词库的词汇相关度计算算法如下:rel(w1,w2)=max{a1*sim(s1,s2)+(1-a1)*asso(s1,s2)}asso(s1,s2)=∑ri*asso(p1,p2)

上式中,rel(w1,w2)表示词汇w1与词汇w2的相关度,sim(s1,s2)表示词汇w1与词汇w2的相似度,asso(s1,s2)表示实体s1和s2的语义关联度;ɑ1表示可调节参数,用于将相似度与语义关联度进行线性调和,它的取值范围为[0,1];s1i表示词汇w1的义项,i=1,…,n表示词汇w1具有n个义项;s2j表示词汇w2的义项,j=1,…,m表示词汇w2具有m个义项;γi表示实体概念中不同部分的义原关联系数,是对两个概念每部分的拟合,同时必须满足∑ri=1,p1为义项s1的义原,p2为义项s2的义原。