买专利、卖专利、专利购买、专利交易、专利出售、高企申报-训练方法、译文展示方法、装置、电子设备以及存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

训练方法、译文展示方法、装置、电子设备以及存储介质

￥19800

专利号： 2021109458710

申请人：北京百度网讯科技有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2025-02-06

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种文字擦除模型的训练方法，包括：

利用生成对抗网络模型的生成器处理原文文字块图像集，得到仿真文字块擦除图像集，其中，所述生成对抗网络模型包括所述生成器和判别器；

利用真实文字块擦除图像集和所述仿真文字块擦除图像集，对所述生成器和所述判别器进行交替训练，得到训练完成的生成器和判别器，包括：在每次迭代过程中，利用所述真实文字块擦除图像集和所述仿真文字块擦除图像集训练所述判别器；以及在完成针对所述判别器配置的训练次数后，利用所述仿真文字块擦除图像集训练所述生成器；以及将所述训练完成的生成器确定为所述文字擦除模型；

其中，所述真实文字块擦除图像集包括的真实文字块擦除图像中的文字擦除区域的像素值是根据所述真实文字块擦除图像中除所述文字擦除区域以外的其他区域的像素值确定的。

2.根据权利要求1所述的方法，其中，所述原文文字块图像集包括第一原文文字块图像集和第二原文文字块图像集，所述仿真文字块擦除图像集包括第一仿真文字块擦除图像集和第二仿真文字块擦除图像集；

所述利用生成对抗网络模型的生成器处理原文文字块图像集，得到仿真文字块擦除图像集，包括：利用所述生成器处理所述第一原文文字块图像集，生成所述第一仿真文字块擦除图像集；以及利用所述生成器处理所述第二原文文字块图像集，生成所述第二仿真文字块擦除图像集。

3.根据权利要求2所述的方法，其中，所述真实文字块擦除图像集包括第一真实文字块擦除图像集和第二真实文字块擦除图像集；

所述利用真实文字块擦除图像集和所述仿真文字块擦除图像集，对所述生成器和所述判别器进行交替训练，得到训练完成的生成器和判别器，包括：利用所述第一真实文字块擦除图像集和所述第一仿真文字块擦除图像集对所述判别器进行训练；

利用所述第二仿真文字块擦除图像集对所述生成器进行训练；

交替执行对所述判别器进行训练的操作和对所述生成器进行训练的操作，直至满足所述生成对抗网络模型的收敛条件；以及将在满足所述生成对抗网络模型的收敛条件的情况下得到的生成器和判别器，确定为所述训练完成的生成器和判别器。

4.根据权利要求3所述的方法，其中，所述第一真实文字块擦除图像集包括多个第一真实文字块擦除图像，所述第一仿真文字块擦除图像集包括多个第一仿真文字块擦除图像；

所述利用所述第一真实文字块擦除图像集和所述第一仿真文字块擦除图像集对所述判别器进行训练，包括：将所述第一真实文字块擦除图像集中的每个所述第一真实文字块擦除图像输入所述判别器，得到与所述第一真实文字块擦除图像对应的第一判别结果；

将所述第一仿真文字块擦除图像集中的每个所述第一仿真文字块擦除图像输入所述判别器，得到与所述第一仿真文字块擦除图像对应的第二判别结果；以及基于所述第一判别结果和所述第二判别结果对所述判别器进行训练。

5.根据权利要求4所述的方法，其中，所述基于第一判别结果和第二判别结果对所述判别器进行训练，包括：在保持所述生成器的模型参数不变的情况下，基于第一损失函数，利用第一判别结果和第二判别结果，得到第一输出值；以及根据所述第一输出值调整所述判别器的模型参数，得到调整后的判别器的模型参数；

其中，所述利用所述第二仿真文字块擦除图像集对所述生成器进行训练，包括：在保持所述调整后的判别器的模型参数不变的情况下，基于第二损失函数，利用所述第二仿真文字块擦除图像集，得到第二输出值；以及根据所述第二输出值调整所述生成器的模型参数。

6.根据权利要求5所述的方法，其中，所述第一损失函数包括判别器损失函数和最小均方值误差损失函数，所述第二损失函数包括生成器损失函数和所述最小均方值误差损失函数，所述判别器损失函数、所述最小均方值误差损失函数和所述生成器损失函数均是包括正则项的损失函数。

7.一种译文展示方法，包括：

利用文字擦除模型处理目标原文文字块图像，得到目标文字块擦除图像，所述目标原文文字块图像包括目标原文文字块；

确定译文展示参数；

根据所述译文展示参数，将与所述目标原文文字块对应的译文文字块叠加至所述目标文字块擦除图像上，得到目标译文文字块图像；以及展示所述目标译文文字块图像；

其中，所述文字擦除模型是利用根据权利要求1～6中任一项所述的方法训练的。

8.根据权利要求7所述的方法，还包括：

在确定与所述目标原文文字块对应的文字框不是方形文字框的情况下，利用仿射变换将所述文字框变换为所述方形文字框。

9.根据权利要求7或8所述的方法，其中，所述目标原文文字块图像包括多个目标子原文文字块图像；

所述方法还包括：

将所述多个目标子原文文字块图像进行拼接，得到所述目标原文文字块图像。

10.根据权利要求7或8所述的方法，其中，所述译文展示参数包括译文像素值；

所述确定译文展示参数，包括：

确定所述目标原文文字块图像的文字区域；

确定所述目标原文文字块图像的文字区域的像素均值；以及将所述目标原文文字块图像的文字区域的像素均值确定为所述译文像素值。

11.根据权利要求10所述的方法，其中，所述确定所述目标原文文字块图像的文字区域，包括：利用图像二值化处理所述目标原文文字块图像，得到第一图像区域和第二图像区域；

确定与所述第一图像区域对应的目标原文文字块图像的第一像素均值；

确定与所述第二图像区域对应的目标原文文字块图像的第二像素均值；

确定与所述目标文字块擦除图像对应的第三像素均值；以及根据所述第一像素均值、所述第二像素均值和所述第三像素均值，确定所述目标原文文字块图像的文字区域。

12.根据权利要求11所述的方法，其中，所述根据所述第一像素均值、所述第二像素均值和所述第三像素均值，确定所述目标原文文字块图像的文字区域，包括：在确定所述第一像素均值与所述第三像素均值之间的差值的绝对值小于所述第二像素均值与所述第三像素均值之间的差值的绝对值的情况下，将与所述第一像素均值对应的第一图像区域确定为所述目标原文文字块图像的文字区域；以及在确定所述第一像素均值与所述第三像素均值之间的差值的绝对值大于或等于所述第二像素均值与所述第三像素均值之间的差值的绝对值的情况下，将与所述第二像素均值对应的第二图像区域确定为所述目标原文文字块图像的文字区域。

13.根据权利要求7或8所述的方法，其中，所述译文展示参数包括译文排列参数值，所述译文排列参数值包括译文展示行数和/或译文展示高度；

所述确定译文展示参数，包括：

根据与所述目标文字块擦除图像对应的文字区域的高度和宽度，以及与所述目标译文文字块对应的高度和宽度，确定所述译文展示行数和/或所述译文展示高度。

14.根据权利要求13所述的方法，其中，所述根据与所述目标文字块擦除图像对应的文字区域的高度和宽度，以及与所述目标译文文字块对应的高度和宽度，确定所述译文展示行数和/或所述译文展示高度，包括：确定与所述目标译文文字块对应的宽度和；

将与所述目标译文文字块对应的译文展示行数设置为i行，其中，所述i行中的每行的高度是与所述目标文字块擦除图像对应的文字区域的高度的1/i，i是大于或等于1的整数；

在确定所述宽度和大于与所述i行对应的预设宽度阈值的情况下，将与所述目标译文文字块对应的译文展示行数设置为i＝i+1行，其中，所述预设宽度阈值是根据与所述目标文字块擦除图像对应的文字区域的宽度的i倍确定；

重复执行确定所述宽度和是否小于或等于与所述i行对应的预设宽度阈值的操作，直至确定所述宽度和小于或等于与所述i行对应的预设宽度阈值；以及在确定所述宽度和小于或等于与所述i行对应的预设宽度阈值的情况下，将所述i行确定为所述译文展示行数和/或将与所述目标文字块擦除图像对应的文字区域的高度的1/i确定为所述译文展示高度。

15.根据权利要求13所述的方法，其中，所述译文排列参数值包括译文展示方向，所述译文展示方向是根据所述目标原文文字块的文字方向确定的。

16.一种文字擦除模型的训练装置，包括：

第一获得模块，用于利用生成对抗网络模型的生成器处理原文文字块图像集，得到仿真文字块擦除图像集，其中，所述生成对抗网络模型包括所述生成器和判别器；

第二获得模块，用于利用真实文字块擦除图像集和所述仿真文字块擦除图像集，对所述生成器和所述判别器进行交替训练，得到训练完成的生成器和判别器，包括：在每次迭代过程中，利用所述真实文字块擦除图像集和所述仿真文字块擦除图像集训练所述判别器；以及在完成针对所述判别器配置的训练次数后，利用所述仿真文字块擦除图像集训练所述生成器；以及第一确定模块，用于将所述训练完成的生成器确定为所述文字擦除模型；

17.一种译文展示装置，包括：

第三获得模块，用于利用文字擦除模型处理目标原文文字块图像，得到目标文字块擦除图像，所述目标原文文字块图像包括目标原文文字块；

第二确定模块，用于确定译文展示参数；

第四获得模块，用于根据所述译文展示参数，将与所述目标原文文字块对应的译文文字块叠加至所述目标文字块擦除图像上，得到目标译文文字块图像；以及展示模块，用于展示所述目标译文文字块图像；

其中，所述文字擦除模型是利用根据权利要求16中所述的装置训练的。

18.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1～6中任一项或权利要求7～15中任一项所述的方法。

19.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1～6中任一项或权利要求7～15中任一项所述的方法。