利索能及
我要发布
收藏
专利号: 2020106120286
申请人: 江西科技学院
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文本复制粘贴方法,应用于复制原文档的文本并粘贴至目标文档,其特征在于,包括以下步骤:当接收到文本粘贴指令时,获取格式配置信息,所述格式配置信息为自定义格式或所述目标文档的目标格式;

对所述目标文档执行去格式化和文本分析,得到预处理文档;

将格式配置信息和所述目标文档的文件类型结合,得到具体格式配置信息,根据所述格式配置信息调整所述预处理文档的文本格式;

所述文本分析为基于所述目标文档的文本格式,对所述目标文档进行角色标注;

所述角色标注的步骤包括:

若所述原文档和所述目标文档为相同文件类型,提取所述原文档中所有的标题段落;

获取所述标题段落的字体信息、字号信息和加粗信息,根据下式计算得到加权特征值P,以P作为所述角色标注的指标:P=α·A+β·B+γ·C

式中,α、β和γ分别为所述字体信息、字号信息和加粗信息预设的权重值,A、B和C分别所述字体信息、字号信息和加粗信息预设的特征值。

2.根据权利要求1所述的文本复制粘贴方法,其特征在于,所述格式配置信息包括格式化目的信息。

3.根据权利要求1所述的文本复制粘贴方法,其特征在于,所述角色标注为语义角色标注,或通过命名实体识别获取角色进行标注。

4.根据权利要求1所述的文本复制粘贴方法,其特征在于,所述角色标注的步骤还包括:若所述原文档与所述目标文档的文件类型不相同,更改所述字体信息、字号信息和加粗信息,所述更改后的字体信息、字号信息和加粗信息匹配所述目标文档。

5.一种文本复制粘贴系统,其特征在于,包括:获取模块,用于当接收到文本粘贴指令时,获取格式配置信息,所述格式配置信息为自定义格式或目标文档的目标格式;

预处理模块,用于对所述目标文档执行去格式化和文本分析,得到预处理文档;

调整模块,用于将格式配置信息和所述目标文档的文件类型结合,得到具体格式配置信息,根据所述格式配置信息调整所述预处理文档的文本格式;

所述文本分析为基于所述目标文档的文本格式,对所述目标文档进行角色标注;

所述角色标注的步骤包括:

若原文档和所述目标文档为相同文件类型,提取所述原文档中所有的标题段落;

获取所述标题段落的字体信息、字号信息和加粗信息,根据下式计算得到加权特征值P,以P作为所述角色标注的指标:P=α·A+β·B+γ·C

式中,α、β和γ分别为所述字体信息、字号信息和加粗信息预设的权重值,A、B和C分别所述字体信息、字号信息和加粗信息预设的特征值。

6.一种可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1至4任意一项所述的方法。