利索能及
我要发布
收藏
专利号: 2018104217684
申请人: 和美(深圳)信息技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-07-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文本查询纠错方法,所述方法包括:

获取输入语句的分词列表;

查询所述分词列表中的各词语在预设有向图中的索引;

当所述分词列表中的当前词语的前一词语存在索引且所述当前词语的后一词语存在索引时,获取所述前一词语的下节点集合以及所述后一词语的上节点集合;

当后一词语的上节点集合和前一词语的下节点集合存在交集,且交集为一个节点,根据所述交集对所述当前词语进行纠错。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述交集包括多个节点时,获取所述当前词语的前二词语;

根据所述交集和所述前二词语的下节点集合,对所述当前词语进行纠错。

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述交集包括多个节点时,获取所述当前词语的后二词语;

根据所述交集和所述后二词语的上节点集合,对所述当前词语进行纠错。

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述交集为空集时,输出所述当前词语作为对所述当前词语进行纠错的词语。

5.根据权利要求1至4任意一项所述的方法,其特征在于,所述查询所述分词列表中的各词语在预设有向图中的索引之后还包括:当当前词语的索引不存在时,输出预设辅助字符作为对所述当前词语进行纠错的词语。

6.根据权利要求1至4任意一项所述的方法,其特征在于,所述获取输入语句的分词列表,包括:获取输入语句中的各词语,并根据所述各词语增加辅助字符;

根据所述辅助字符和所述各词语,得到所述输入语句的分词列表。

7.根据权利要求1所述的方法,其特征在于,所述查询所述分词列表中的各词语在预设有向图中的索引之前还包括:根据预设语料库中各语句,以所述各语句中的词语为节点,进行有向图构建,所述有向图用于查询后位词语;

根据所述有向图构建反向图,所述反向图用于查询前位词语;

所述查询所述分词列表中的各词语在预设有向图中的索引,包括:查询所述分词列表中的各词语在所述有向图中的索引;

所述当所述分词列表中的当前词语的前一词语存在索引且所述当前词语的后一词语存在索引时,获取所述前一词语的下节点集合以及所述后一词语的上节点集合,包括:当所述分词列表中的当前词语的前一词语存在索引且所述当前词语的后一词语存在索引时,根据所述有向图获取所述前一词语的下节点集合,根据所述反向图获取所述后一词语的上节点集合。

8.一种文本查询纠错装置,其特征在于,所述装置包括:语句处理模块,用于获取输入语句的分词列表;

索引获取模块,用于查询所述分词列表中的各词语在预设有向图中的索引;

集合获取模块,用于当所述分词列表中的当前词语的前一词语存在索引且所述当前词语的后一词语存在索引时,获取所述前一词语的下节点集合以及所述后一词语的上节点集合;

纠错模块,用于当后一词语的上节点集合和前一词语的下节点集合存在交集,且交集为一个节点,根据所述交集对所述当前词语进行纠错。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。