买专利、卖专利、专利购买、专利交易、专利出售、高企申报-字形生成方法、字形生成模型的训练方法及装置

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

字形生成方法、字形生成模型的训练方法及装置

￥25200

专利号： 2022104301591

申请人：北京百度网讯科技有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2025-12-08

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种字形生成方法，包括：

获取源字形图像和所述源字形图像对应的参考字形图像集，所述源字形图像包括源字体的源字符，所述参考字形图像集包括目标字体的至少一个参考字符；

将源字形图像和参考字形图像集输入经训练的字形生成模型的第一个生成模块，以便所述第一个生成模块将所述源字形图像与所述参考字形图像集进行融合，以得到所述源字符的中间字形图像，所述字形生成模型包括级联的多个生成模块；以及将所述中间字形图像和所述参考字形图像集输入所述字形生成模型的第二个生成模块，以便所述第二个生成模块至最后一个生成模块将所述中间字形图像与所述参考字形图像集进行融合，以得到所述源字符的生成字形图像，所述生成字形图像包括所述目标字体的所述源字符。

2.根据权利要求1所述的方法，其中，所述源字符由至少一个字符成分组成，所述至少一个参考字符中的每个参考字符包括所述至少一个字符成分中的至少之一，并且每个参考字符所包括的字符成分各不相同。

3.根据权利要求1或2所述的方法，还包括：

基于预设的字符对应关系，确定与所述源字符对应的所述至少一个参考字符；以及基于所述至少一个参考字符，确定所述参考字形图像集。

4.根据权利要求1所述的方法，还包括：

获取用户字形图像，所述用户字形图像包括用户书写的多个字符；以及识别所述多个字符中的每个字符所在的图像区域，得到多个图像区域，其中，所述目标字体为所述用户的手写体，所述参考字形图像集为所述多个图像区域的集合的子集。

5.根据权利要求1所述的方法，还包括：

基于所述生成字形图像，建立所述目标字体的字库。

6.一种字形生成模型的训练方法，其中，所述字形生成模型包括级联的多个生成模块，所述多个生成模块中的每个生成模块的输入为源字形图像和相应的参考字形图像集，输出为基于所述相应的参考字形图像集生成的预测字形图像，在相邻的两个生成模块中，前一个生成模块输出的预测字形图像为输入后一个生成模块的源字形图像，所述多个生成模块输入的参考字形图像集相同，所述方法包括：获取样本源字形图像、所述样本源字形图像对应的样本参考字形图像集和所述样本源字形图像对应的目标字形图像，所述样本源字形图像包括源字体的源字符，所述样本参考字形图像集包括目标字体的至少一个参考字符，所述目标字形图像包括所述目标字体的所述源字符；

将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的至少一个生成模块；以及基于经训练的所述至少一个生成模块，生成所述字形生成模型。

7.根据权利要求6所述的方法，其中，将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的至少一个生成模块包括：将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的第一个生成模块；以及将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，基于经训练的至少一个在先生成模块，训练当前生成模块，其中，所述当前生成模块为所述多个生成模块中的除所述第一个生成模块以外的任一生成模块，所述至少一个在先生成模块为所述多个生成模块中的位于所述当前生成模块之前的至少一个生成模块。

8.根据权利要求6所述的方法，其中，将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的至少一个生成模块包括：将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，分别训练所述多个生成模块中的每个生成模块。

9.根据权利要求6所述的方法，其中，所述多个生成模块结构相同并且共享参数，并且其中，将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的至少一个生成模块包括：将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的任一生成模块，得到经训练的生成模块；

基于经训练的所述至少一个生成模块，生成所述字形生成模型包括：将所述经训练的生成模块的参数同步至所述多个生成模块中的其他生成模块。

10.根据权利要求6‑9中任一项所述的方法，其中，将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的至少一个生成模块包括：将所述样本源字形图像和所述样本参考字形图像集输入所述至少一个生成模块，以得到所述至少一个生成模块输出的所述源字符的预测字形图像；

基于所述预测字形图像和所述目标字形图像，计算所述至少一个生成模块的损失；以及基于所述损失，调整所述至少一个生成模块的参数。

11.根据权利要求10所述的方法，其中，所述损失包括像素损失、特征损失和判别损失，所述至少一个生成模块的输出端连接有判别模型，所述像素损失是基于所述至少一个生成模块输出的预测字形图像与所述目标字形图像之间的像素差异确定的；

所述特征损失是基于所述预测字形图像的特征向量与所述目标字形图像的特征向量之间的差异确定的；

所述判别损失是通过将所述预测字形图像输入所述判别模型而确定的。

12.根据权利要求6所述的方法，其中，所述源字符由至少一个字符成分组成，所述至少一个参考字符中的每个参考字符包括所述至少一个字符成分中的至少之一，并且每个参考字符所包括的字符成分各不相同。

13.根据权利要求6所述的方法，还包括：

基于预设的字符对应关系，确定与所述源字符对应的所述至少一个参考字符；以及基于所述至少一个参考字符，确定所述样本参考字形图像集。

14.一种字形生成装置，包括：

第一获取单元，被配置为获取源字形图像和所述源字形图像对应的参考字形图像集，所述源字形图像包括源字体的源字符，所述参考字形图像集包括目标字体的至少一个参考字符；

第一融合单元，被配置为将源字形图像和参考字形图像集输入经训练的字形生成模型的第一个生成模块，以便所述第一个生成模块将所述源字形图像与所述参考字形图像集进行融合，以得到所述源字符的中间字形图像，所述字形生成模型包括级联的多个生成模块；

以及

第二融合单元，被配置为将所述中间字形图像和所述参考字形图像集输入所述字形生成模型的第二个生成模块，以便所述第二个生成模块至最后一个生成模块将所述中间字形图像与所述参考字形图像集进行融合，以得到所述源字符的生成字形图像，所述生成字形图像包括所述目标字体的所述源字符。

15.根据权利要求14所述的装置，其中，所述源字符由至少一个字符成分组成，所述至少一个参考字符中的每个参考字符包括所述至少一个字符成分中的至少之一，并且每个参考字符所包括的字符成分各不相同。

16.根据权利要求14或15所述的装置，还包括：

第一确定单元，被配置为基于预设的字符对应关系，确定与所述源字符对应的所述至少一个参考字符；以及第二确定单元，被配置为基于所述至少一个参考字符，确定所述参考字形图像集。

17.根据权利要求14所述的装置，还包括：

第二获取单元，被配置为获取用户字形图像，所述用户字形图像包括用户书写的多个字符；以及识别单元，被配置为识别所述多个字符中的每个字符所在的图像区域，得到多个图像区域，其中，所述目标字体为所述用户的手写体，所述参考字形图像集为所述多个图像区域的集合的子集。

18.根据权利要求14所述的装置，还包括：

建立单元，被配置为基于所述生成字形图像，建立所述目标字体的字库。

19.一种字形生成模型的训练装置，其中，所述字形生成模型包括级联的多个生成模块，所述多个生成模块中的每个生成模块的输入为源字形图像和相应的参考字形图像集，输出为基于所述相应的参考字形图像集生成的预测字形图像，在相邻的两个生成模块中，前一个生成模块输出的预测字形图像为输入后一个生成模块的源字形图像，所述多个生成模块输入的参考字形图像集相同，所述装置包括：获取单元，被配置为获取样本源字形图像、所述样本源字形图像对应的样本参考字形图像集和所述样本源字形图像对应的目标字形图像，所述样本源字形图像包括源字体的源字符，所述样本参考字形图像集包括目标字体的至少一个参考字符，所述目标字形图像包括所述目标字体的所述源字符；

训练单元，被配置为将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的至少一个生成模块；以及生成单元，被配置为基于经训练的所述至少一个生成模块，生成所述字形生成模型。

20.根据权利要求19所述的装置，其中，所述训练单元包括：

第一训练单元，被配置为将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的第一个生成模块；以及第二训练单元，被配置为将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，基于经训练的至少一个在先生成模块，训练当前生成模块，其中，所述当前生成模块为所述多个生成模块中的除所述第一个生成模块以外的任一生成模块，所述至少一个在先生成模块为所述多个生成模块中的位于所述当前生成模块之前的至少一个生成模块。

21.根据权利要求19所述的装置，其中，所述训练单元包括：

第三训练单元，被配置为将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，分别训练所述多个生成模块中的每个生成模块。

22.根据权利要求19所述的装置，其中，所述训练单元包括：

第四训练单元，被配置为将所述样本源字形图像和所述样本参考字形图像集作为输入，将所述目标字形图像作为标签，训练所述多个生成模块中的任一生成模块，得到经训练的生成模块；

并且其中，所述生成单元包括：

同步单元，被配置为将所述经训练的生成模块的参数同步至所述多个生成模块中的其他生成模块。

23.根据权利要求19‑22中任一项所述的装置，其中，所述训练单元包括：预测单元，被配置为将所述样本源字形图像和所述样本参考字形图像集输入所述至少一个生成模块，以得到所述至少一个生成模块输出的所述源字符的预测字形图像；

计算单元，被配置为基于所述预测字形图像和所述目标字形图像，计算所述至少一个生成模块的损失；以及调整单元，被配置为基于所述损失，调整所述至少一个生成模块的参数。

24.根据权利要求23所述的装置，其中，所述损失包括像素损失、特征损失和判别损失，所述至少一个生成模块的输出端连接有判别模型，所述像素损失是基于所述至少一个生成模块输出的预测字形图像与所述目标字形图像之间的像素差异确定的；

所述特征损失是基于所述预测字形图像的特征向量与所述目标字形图像的特征向量之间的差异确定的；

所述判别损失是通过将所述预测字形图像输入所述判别模型而确定的。

25.根据权利要求19所述的装置，其中，所述源字符由至少一个字符成分组成，所述至少一个参考字符中的每个参考字符包括所述至少一个字符成分中的至少之一，并且每个参考字符所包括的字符成分各不相同。