利索能及
我要发布
收藏
专利号: 2021110578380
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-02-06
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种字符生成模型的训练方法,包括:

将源域样本字和目标域风格字输入至字符生成模型,得到目标域生成字;所述源域样本字、所述目标域风格字和所述目标域生成字具有相同的至少一个组件;所述组件包括字符的偏旁部首或词根;所述目标域样本字为所述源域样本字对应的真值;所述源域样本字、所述目标域风格字、所述目标域生成字和所述目标域样本字是字的图像;

将所述目标域生成字和目标域样本字输入至预先训练的字符分类模型,计算所述字符生成模型的特征损失;

将所述目标域风格字输入至字符生成模型,得到所述目标域风格字的第一风格特征向量;

将所述目标域生成字输入至所述字符生成模型中,得到所述目标域生成字的第二风格特征向量;

将所述第二风格特征向量和所述第一风格特征向量输入至组件分类模型中,计算组件分类损失;

根据所述特征损失和所述组件分类损失调整所述字符生成模型的参数;

所述将所述目标域生成字和目标域样本字输入至预先训练的字符分类模型,计算所述字符生成模型的特征损失,包括:将所述目标域生成字输入到所述字符分类模型,得到所述字符分类模型的至少一个特征层输出的生成特征图;

将所述目标域样本字输入到所述字符分类模型,得到所述字符分类模型的所述至少一个特征层输出的样本特征图;

根据所述至少一个特征层的生成特征图和样本特征图之间的差异,计算所述字符生成模型的特征损失。

2.根据权利要求1所述的方法,其中,所述计算所述字符生成模型的特征损失,包括:针对所述至少一个特征层中的每一特征层,计算所述特征层的生成特征图和样本特征图之间的像素差异,得到所述特征层的像素损失;

根据所述至少一个特征层的像素损失,计算所述字符生成模型的特征损失。

3.根据权利要求2所述的方法,其中,所述计算所述特征层的生成特征图和样本特征图之间的像素差异,包括:针对所述特征层的生成特征图中的每个位置的像素点,计算所述像素点的像素值与所述样本特征图中对应位置的像素点的像素值之间的差值的绝对值,得到每个位置的像素点的差异;

根据多个位置的像素点的差异,确定所述特征层的生成特征图和样本特征图之间的像素差异。

4.根据权利要求1所述的方法,还包括:

将所述目标域样本字和所述目标域生成字输入至鉴别模型中,计算字符对抗损失和风格对抗损失;

将所述目标域生成字输入至所述字符分类模型,计算错字损失;

根据所述字符对抗损失、所述风格对抗损失和所述错字损失,调整所述字符生成模型的参数。

5.根据权利要求1至4中任一项所述的方法,其中,所述源域样本字为具有源域字体风格的图像,所述目标域样本字为具有目标域字体风格的图像。

6. 一种字符生成方法,包括:

获取源域输入字,和对应的目标域输入字;

将所述源域输入字和所述目标输入字输入到字符生成模型中,得到目标域新字;其中,所述字符生成模型根据如权利要求1至5中任一项所述的字符生成模型的训练方法训练得到。

7.一种字符生成模型的训练装置,包括:

目标域生成字获取模块,用于将源域样本字和目标域风格字输入至字符生成模型,得到目标域生成字;所述源域样本字、所述目标域风格字和所述目标域生成字具有相同的至少一个组件;所述组件包括字符的偏旁部首或词根;所述目标域样本字为源域样本字对应的真值;所述源域样本字、所述目标域风格字、所述目标域生成字和所述目标域样本字是字的图像;

特征损失计算模块,用于将所述目标域生成字和目标域样本字输入至预先训练的字符分类模型,计算所述字符生成模型的特征损失;

第一特征向量计算模块,用于将所述目标域风格字输入至字符生成模型,得到所述目标域风格字的第一风格特征向量;

第二特征向量计算模块,用于将所述目标域生成字输入至所述字符生成模型中,得到所述目标域生成字的第二风格特征向量;

组件分类损失计算模块,用于将所述第二风格特征向量和所述第一风格特征向量输入至组件分类模型中,计算组件分类损失;

第一损失调整模块,用于根据所述特征损失和所述组件分类损失调整所述字符生成模型的参数;

所述特征损失计算模块,包括:

第一特征图生成单元,用于将所述目标域生成字输入到所述字符分类模型,得到所述字符分类模型的至少一个特征层输出的生成特征图;

第二特征图生成单元,用于将所述目标域样本字输入到所述字符分类模型,得到所述字符分类模型的所述至少一个特征层输出的样本特征图;

特征损失计算单元,用于根据所述至少一个特征层的生成特征图和样本特征图之间的差异,计算所述字符生成模型的特征损失。

8.根据权利要求7所述的装置,其中,所述特征损失计算单元,包括:像素损失计算子单元,用于针对所述至少一个特征层中的每一特征层,计算所述特征层的生成特征图和样本特征图之间的像素差异,得到所述特征层的像素损失;

特征损失计算子单元,用于根据所述至少一个特征层的像素损失,计算所述字符生成模型的特征损失。

9.根据权利要求8所述的装置,其中,所述像素损失计算子单元,用于:针对所述特征层的生成特征图中的每个位置的像素点,计算所述像素点的像素值与所述样本特征图中对应位置的像素点的像素值之间的差值的绝对值,得到每个位置的像素点的差异;根据多个位置的像素点的差异,确定所述特征层的生成特征图和样本特征图之间的像素差异。

10.根据权利要求7所述的装置,还包括:

对抗损失计算模块,用于将所述目标域样本字和所述目标域生成字输入至鉴别模型中,计算字符对抗损失和风格对抗损失;

错字损失计算模块,用于将所述目标域生成字输入至所述字符分类模型,计算错字损失;

第二损失调整模块,用于根据所述字符对抗损失、所述风格对抗损失和所述错字损失,调整所述字符生成模型的参数。

11.根据权利要求7至10中任一项所述的装置,其中,所述源域样本字为具有源域字体风格的图像,所述目标域样本字为具有目标域字体风格的图像。

12. 一种字符生成装置,包括:

输入字获取模块,用于获取源域输入字,和对应的目标域输入字;

字符生成模块,用于将所述源域输入字和所述目标输入字输入到字符生成模型中,得到目标域新字;其中,所述字符生成模型根据如权利要求1至5中任一项所述的字符生成模型的训练方法训练得到。

13. 一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑5中任一项所述的字符生成模型的训练方法,或执行权利要求6所述的字符生成方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑5中任一项所述的字符生成模型的训练方法,或执行权利要求6所述的字符生成方法。