1.一种文本复制粘贴方法,应用于复制原文档的文本并粘贴至目标文档,其特征在于,包括以下步骤:当接收到文本粘贴指令时,获取格式配置信息,所述格式配置信息为自定义格式或所述目标文档的目标格式;
对所述目标文档执行去格式化和文本分析,得到预处理文档;
将格式配置信息和所述目标文档的文件类型结合,得到具体格式配置信息,根据所述格式配置信息调整所述预处理文档的文本格式;
所述文本分析为基于所述目标文档的文本格式,对所述目标文档进行角色标注;
所述角色标注的步骤包括:
若所述原文档和所述目标文档为相同文件类型,提取所述原文档中所有的标题段落;
获取所述标题段落的字体信息、字号信息和加粗信息,根据下式计算得到加权特征值P,以P作为所述角色标注的指标:P=α·A+β·B+γ·C
式中,α、β和γ分别为所述字体信息、字号信息和加粗信息预设的权重值,A、B和C分别所述字体信息、字号信息和加粗信息预设的特征值。
2.根据权利要求1所述的文本复制粘贴方法,其特征在于,所述格式配置信息包括格式化目的信息。
3.根据权利要求1所述的文本复制粘贴方法,其特征在于,所述角色标注为语义角色标注,或通过命名实体识别获取角色进行标注。
4.根据权利要求1所述的文本复制粘贴方法,其特征在于,所述角色标注的步骤还包括:若所述原文档与所述目标文档的文件类型不相同,更改所述字体信息、字号信息和加粗信息,所述更改后的字体信息、字号信息和加粗信息匹配所述目标文档。
5.一种文本复制粘贴系统,其特征在于,包括:获取模块,用于当接收到文本粘贴指令时,获取格式配置信息,所述格式配置信息为自定义格式或目标文档的目标格式;
预处理模块,用于对所述目标文档执行去格式化和文本分析,得到预处理文档;
调整模块,用于将格式配置信息和所述目标文档的文件类型结合,得到具体格式配置信息,根据所述格式配置信息调整所述预处理文档的文本格式;
所述文本分析为基于所述目标文档的文本格式,对所述目标文档进行角色标注;
所述角色标注的步骤包括:
若原文档和所述目标文档为相同文件类型,提取所述原文档中所有的标题段落;
获取所述标题段落的字体信息、字号信息和加粗信息,根据下式计算得到加权特征值P,以P作为所述角色标注的指标:P=α·A+β·B+γ·C
式中,α、β和γ分别为所述字体信息、字号信息和加粗信息预设的权重值,A、B和C分别所述字体信息、字号信息和加粗信息预设的特征值。
6.一种可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1至4任意一项所述的方法。