1.基于思维导图的楼梯设计规范缺省主语的补全方法,其特征在于,包括以下步骤:
步骤1:从住宅建筑设计规范中获取有关楼梯设计的规范作为处理的语料集,并且采用基于词典的正向最大匹配算法对原始文本进行分词,以及基于隐马尔可夫模型的方法对分词之后的词进行词性标注,得到预处理后的文本;
步骤2:参照IFC标准中楼梯规范的描述格式,将与楼梯设计相关的本体及本体间关系梳理成思维导图,并构建相应的索引树;
步骤3:使用上下文无关语法把预处理后的文本进行语法解析,在遇到兼语句或连谓句的情况,通过在索引树中查找与宾语相关的本体来确定句中的句型成分,以此构建语法树,并分析一个句子的句法结构是否完整。最后从中过滤出缺失主语的语料;
步骤4:通过在索引树中进行搜索,对具有不完整句型结构的宾语本体查找其父结点以及到根节点的唯一的一条路径,其父结点即为此句缺省的主语,除父结点外,此路径上的所有结点即为主语的修饰定语,后将缺省的主语添加至原语句,输出主谓宾完整的楼梯设计规范。
2.根据权利要求1所述的基于思维导图的楼梯设计规范缺省主语的补全方法,其特征在于,所述步骤1中:分词所采用的方法是基于词典的正向最大匹配算法。词性标注采用的方法是基于隐马尔可夫模型的词性标注算法。
3.根据权利要求1所述的基于思维导图的楼梯设计规范缺省主语的补全方法,其特征在于,所述步骤3中:在使用上下文无关文法进行语法解析后根据词语的词性以及在句子中出现的位置来确定句中的成分。
4.根据权利要求1所述的基于思维导图的楼梯设计规范缺省主语的补全方法,其特征在于,所述步骤3中构建语法树的方法具体步骤如下:首先定义上下文无关文法G={N,∑,X,S},其中N表示一组非叶子结点的标注;Σ表示一组叶子结点的标注,即组成句子的词;X表示一组句法的规则,即为N的产生式,每条规则可表示为X=Y1Y2...Yn,X∈N,Yi∈(N∪Σ);X中至少有一个产生式的α得由S充当。而S表示语法树开始的标注;
采用自底向上的方法,从待分析的字符串开始,用待分析的字符串去匹配上下文无关文法规则X箭头的右部字符,匹配成功后替换为左部字符,直到S出现,语法树构建完毕。
5.根据权利要求1所述的基于思维导图的楼梯设计规范缺省主语的补全方法,其特征在于,所述步骤4中:查找父结点的时候采用的是遍历算法。