利索能及
我要发布
收藏
专利号: 202111114700X
申请人: 北京林业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文档名称序号纠错方法,包括:在目标文档中查找包含数字的、目标格式的内容,得到序号字符串集合;

响应于所述序号字符串集合中各个序号字符串包含的数字之间不连续,将所述目标文档确定为包含错误信息的文档,否则执行以下步骤:对所述序号字符串集合中的每种序号字符串,确定所述序号字符串对应的文本字符串集合;

响应于所述文本字符串集合中的文本字符串不一致,将所述目标文档确定为包含错误信息的文档,否则执行以下步骤:响应于所述文本字符串集合中的目标文本字符串在所述目标文档中出现的次数与所述序号字符串在所述目标文档中出现的次数不一致,将所述目标文档确定为包含错误信息的文档。

2.根据权利要求1所述的方法,其中,所述确定所述序号字符串对应的文本字符串集合,包括:

确定所述序号字符串在所述目标文档中出现的位置,得到位置集合;

在所述位置集合中各个位置处,逐一向前检查字符;

响应于当前检查的各个字符不同或者存在于预先设定的错字集中,将所述位置集合中各个位置处上一检查字符、所述序号字符串和所述上一检查字符和所述序号字符串之间的字符确定为所述序号字符串对应的文本字符串集合。

3.根据权利要求1所述的方法,其中,所述目标文本字符串包括:所述文本字符串集合中的第一个文本字符串。

4.一种文档名称序号纠错装备,包括:检测单元,在目标文档中查找包含数字的、目标格式的内容,得到序号字符串集合;

第一确定单元,响应于所述序号字符串集合中各个序号字符串包含的数字之间不连续,将所述目标文档确定为包含错误信息的文档,否则执行以下步骤:第二确定单元,对所述序号字符串集合中的每种序号字符串,确定所述序号字符串对应的文本字符串集合;

分类单元,响应于所述文本字符串集合中的文本字符串不一致,将所述目标文档确定为包含错误信息的文档,否则执行以下步骤:生成单元,响应于所述文本字符串集合中的目标文本字符串在所述目标文档中出现的次数与所述序号字符串在所述目标文档中出现的次数不一致,将所述目标文档确定为包含错误信息的文档。

5.一种电子设备,包括:

一个或多个处理器;

存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑4中任一所述的方法。

6.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1‑4中任一所述的方法。