利索能及
我要发布
收藏
专利号: 2019106555478
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-25
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种训练模型的方法,其特征在于,所述方法包括:获取第一样本场景图像,所述第一样本场景图像为包含预先标定的标定对象的图像;

获取预设的所述标定对象的标定深度,根据所述标定深度,计算所述第一样本场景图像中各像素点的深度值,得到第一深度图,并将所述第一样本场景图像输入至待训练的深度估计模型,输出第二深度图;

根据所述第一深度图中各像素点的深度值、以及所述第二深度图中各像素点的深度值,计算第一深度损失;

根据所述第一深度损失和预设的训练算法,训练所述深度估计模型。

2.根据权利要求1所述的方法,其特征在于,所述获取所述第一样本场景图像之后,还包括:若所述第一样本场景图像为包含干扰区域的图像,则获取预设的所述第一样本场景图像对应的地面掩码;

所述根据所述第一深度图中各像素点的深度值、以及所述第二深度图中各像素点的深度值,计算第一深度损失,包括:根据所述第一深度图中各像素点的深度值、所述第二深度图中各像素点的深度值和所述地面掩码,计算第一深度损失。

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取第二样本场景图像,所述第二样本场景图像为,所述第一样本场景图像所在的样本图像集合中的临近帧图像;

将所述第一样本场景图像和所述第二样本场景图像输入待训练的位姿估计模型,输出第一位姿参数;

根据所述第一位姿参数、所述第一样本场景图像和所述第二深度图,生成所述第一样本场景图像对应的第一重构图像;

根据所述第一重构图像中各像素点的深度值和所述第一样本场景图像中各像素点的深度值,计算第二深度损失;

根据所述第一深度损失和所述第二深度损失,计算第三深度损失;

根据所述第三深度损失和预设的所述训练算法训练所述位姿估计模型。

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一深度损失和预设的训练算法,训练所述深度估计模型,包括:根据所述第三深度损失和预设的所述训练算法,训练所述深度估计模型。

5.一种训练模型的装置,其特征在于,所述装置包括:第一获取模块,用于获取第一样本场景图像,所述第一样本场景图像为包含预先标定的标定对象的图像;

第一输出模块,用于获取预设的所述标定对象的标定深度,根据所述标定深度,计算所述第一样本场景图像中各像素点的深度值,得到第一深度图,并将所述第一样本场景图像输入至待训练的深度估计模型,输出第二深度图;

第一计算模块,用于根据所述第一深度图中各像素点的深度值、以及所述第二深度图中各像素点的深度值,计算第一深度损失;

第一训练模块,用于根据所述第一深度损失和预设的训练算法,训练所述深度估计模型。

6.根据权利要求5所述的装置,其特征在于,所述装置还包括:第二获取模块,用于若所述第一样本场景图像为包含干扰区域的图像,则获取预设的所述第一样本场景图像对应的地面掩码;

所述第一计算模块,具体用于:

根据所述第一深度图中各像素点的深度值、所述第二深度图中各像素点的深度值和所述地面掩码,计算第一深度损失。

7.根据权利要求5所述的装置,其特征在于,所述装置还包括:第三获取模块,用于获取第二样本场景图像,所述第二样本场景图像为,所述第一样本场景图像所在的样本图像集合中的临近帧图像;

第二输出模块,用于将所述第一样本场景图像和所述第二样本场景图像输入待训练的位姿估计模型,输出第一位姿参数;

生成模块,用于根据所述第一位姿参数、所述第一样本场景图像和所述第二深度图,生成所述第一样本场景图像对应的第一重构图像;

第二计算模块,用于根据所述第一重构图像中各像素点的深度值和所述第一样本场景图像中各像素点的深度值,计算第二深度损失;

第三计算模块,用于根据所述第一深度损失和所述第二深度损失,计算第三深度损失;

第二训练模块,用于根据所述第三深度损失和预设的所述训练算法训练所述位姿估计模型。

8.根据权利要求7所述的装置,其特征在于,所述第一训练模块,具体用于:根据所述第三深度损失和预设的所述训练算法,训练所述深度估计模型。

9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。