利索能及
我要发布
收藏
专利号: 2021109039562
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-02-06
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种预训练模型的确定方法,应用于图像处理,包括:将模型集合中的特征提取模型进行组合,得到多种候选模型,所述特征提取模型为计算机视觉和图像处理领域中的具有提取图像特征的功能的任意模型;

根据所述多种候选模型的模型结构进行结构编码,以得到各所述候选模型的结构编码;

采用经过训练的编码器将各所述候选模型的结构编码映射得到对应的频域编码;

根据各所述候选模型的频域编码,预测各所述候选模型的模型性能参数;

根据各所述候选模型的模型性能参数,从多种所述候选模型中确定目标模型作为预训练模型。

2.根据权利要求1所述的方法,还包括:

将作为训练样本的样本结构编码输入所述编码器,得到所述编码器输出的预测频域编码;

将所述预测频域编码输入所述解码器;

根据所述解码器的输出与所述样本结构编码之间的差异,对所述编码器和所述解码器进行训练。

3.根据权利要求2所述的方法,其中,所述将作为训练样本的样本结构编码输入所述编码器,得到所述编码器输出的预测频域编码,包括:将作为所述训练样本的样本结构编码输入所述编码器进行至少二维编码,以得到所述编码器输出的至少二维的预测频域编码。

4.根据权利要求1‑3任一项所述的方法,其中,所述根据各所述候选模型的频域编码,预测各所述候选模型的模型性能参数,包括:根据待执行的任务,确定目标相关函数;

分别将各所述候选模型的频域编码代入所述目标相关函数,以得到各所述候选模型的模型性能参数。

5.一种预训练模型的确定装置,应用于图像处理,包括:获取模块,用于将模型集合中的特征提取模型进行组合,得到多种候选模型,所述特征提取模型为计算机视觉和图像处理领域中的具有提取图像特征的功能的任意模型;

编码模块,用于根据所述多种候选模型的模型结构进行结构编码,以得到各所述候选模型的结构编码;

映射模块,用于采用经过训练的编码器将各所述候选模型的结构编码映射得到对应的频域编码;

预测模块,用于根据各所述候选模型的频域编码,预测各所述候选模型的模型性能参数;

确定模块,用于根据各所述候选模型的模型性能参数,从多种所述候选模型中确定目标模型作为预训练模型。

6.根据权利要求5所述的装置,还包括:

第一处理模块,用于将作为训练样本的样本结构编码输入所述编码器,得到所述编码器输出的预测频域编码;

第二处理模块,用于将所述预测频域编码输入所述解码器;

训练模块,用于根据所述解码器的输出与所述样本结构编码之间的差异,对所述编码器和所述解码器进行训练。

7.根据权利要求6所述的装置,其中,所述第一处理模块,包括:处理单元,用于将作为所述训练样本的样本结构编码输入所述编码器进行至少二维编码,以得到所述编码器输出的至少二维的预测频域编码。

8.根据权利要求5‑7任一项所述的装置,其中,所述预测模块,包括:确定单元,用于根据待执行的任务,确定目标相关函数;

获取单元,用于分别将各所述候选模型的频域编码代入所述目标相关函数,以得到各所述候选模型的模型性能参数。

9.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑4中任一项所述的方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑4中任一项所述的方法。