利索能及
我要发布
收藏
专利号: 2022112427820
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-02-06
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图像检测方法,包括:

获得目标图像,所述目标图像包含有目标对象;

基于所述目标图像的至少两个边中的每一个边的长度,获得该边对应的多个目标序列值;

基于所述目标图像,获得所述目标图像的目标定位特征,所述目标定位特征指示所述至少两个边对应的多个目标序列值中的每一个目标序列值与所述目标对象的检测框在所述目标图像中的位置相应的概率;以及基于所述目标定位特征,获得所述目标对象的检测框的位置;

其中,所述基于所述目标图像的至少两个边中的每一个边的长度,获得该边对应的多个目标序列值包括:获取所述目标图像的四条边中的每一个条边对应的多个目标序列值,并且其中,所述目标定位特征指示相邻的两条边对应的多个目标序列值构成的多个目标序列值组与目标对象的检测框的对角线上的顶点的位置的对应的概率,每一个目标序列值组包括由所述四条边中的每一个条边对应的多个目标序列值中的一个目标序列值。

2.根据权利要求1所述的方法,其中,所述基于所述目标图像,获得所述目标图像的目标定位特征包括:通过将所述目标图像输入图像检测模型,以获得所述定位特征,其中,所述图像检测模型是采用训练图像基于经训练的教师模型训练学生模型获得的,所述训练图像包括与所述目标对象相应的训练对象,在训练所述学生模型的过程中,通过将所述训练图像分别输入所述教师模型和所述学生模型,获得所述教师模型输出的第一定位特征和所述学生模型输出的第二定位特征,并且基于所述第一定位特征和所述第二定位特征获得的损失调整所述学生模型的参数;其中,所述第一定位特征和所述第二定位特征分别指示多个训练序列值中的每一个训练序列值与所述训练对象的检测框在所述训练图像中的位置相应的概率,所述多个训练序列值包括基于所述训练图像的至少两个边中的每一个边的长度获得的该边对应的多个训练序列值。

3.根据权利要求1所述的方法,其中,所述目标定位特征包括维度为4×n的矩阵,n为正整数;其中,所述矩阵中的多个行与所述目标图像的四个边分别对应,所述矩阵中的每一个行的多个元素与所述目标图像中的相应边所对应的多个目标序列值分别对应。

4.根据权利要求1所述的方法,其中,所述至少两个边中的每一个边对应的多个目标序列值中的任意两个相邻目标序列值之差为预设值。

5.根据权利要求1所述的方法,其中,所述至少两个边中的每一个边对应的多个目标序列值的数量与所述目标图像的多个边中较长的边相应。

6.一种图像检测模型的训练方法,其中,所述图像检测模型包括学生模型,所述方法包括:获得训练图像,所述训练图像包括训练对象;

基于所述训练图像的至少两个边中的每一个边的长度,获得该边对应的多个训练序列值;

获得所述学生模型基于所述训练图像获得的第一定位特征,并且获得经训练的教师模型于所述训练图像获得的第二定位特征,所述第一定位特征和所述第二定位特征分别指示所述至少两个边对应的多个训练序列值中的每一个训练序列值与所述训练对象的检测框在所述训练图像中的位置相应的概率;

基于所述第一定位特征所述第二定位特征,获得第一损失;以及

基于所述第一损失,调整所述学生模型的参数,

其中,所述基于所述训练图像的至少两个边中的每一个边的长度,获得该边对应的多个训练序列值包括:获取所述训练图像的四条边中的每一个条边对应的多个训练序列值,并且其中,所述第一定位特征和所述第二定位特征分别指示相邻的两条边对应的多个训练序列值构成的多个训练序列值组与训练对象的检测框的对角线上的顶点的位置的对应的概率,每一个训练序列值组包括由所述四条边中的每一个条边对应的多个训练序列值中的一个训练序列值。

7.根据权利要求6所述的方法,还包括:

获得所述学生模型基于所述训练图像获得的第一分类特征,并且获得所述教师模型基于所述训练图像基于所述训练图像获得的第二分类特征,所述第一分类特征和所述第二分类特征分别指示所述训练对象对应于目标分类的概率;以及将所述第一分类特征和所述第二分类特征获得第二损失,并且其中,所述基于所述第一损失,调整所述学生模型的参数包括:基于所述第一损失和所述第二损失,调整所述学生模型的参数。

8.根据权利要求6所述的方法,其中,第一定位特征和所述第二定位特征分别包括维度为4×n的矩阵,n为正整数;其中,所述矩阵中的多个行与所述训练图像的四个边分别对应,所述矩阵中的每一个行的多个元素与所述训练图像中的相应边所对应的多个训练序列值分别对应。

9.根据权利要求6所述的方法,其中,所述至少两个边中的每一个边对应的多个训练序列值中的任意两个相邻训练序列值之差为预设值。

10.根据权利要求6所述的方法,其中,所述至少两个边中的每一个边对应的多个训练序列值的数量与所述至少两个边中较长的边相应。

11.一种图像检测装置,包括:

目标图像获取单元,被配置用于获得目标图像,所述目标图像包含有目标对象;

目标序列值获取单元,被配置用于基于所述目标图像的至少两个边中的每一个边的长度,获得该边对应的多个目标序列值;

目标定位特征获取单元,被配置用于基于所述目标图像,获得所述目标图像的目标定位特征,所述目标定位特征指示所述至少两个边对应的多个目标序列值中的每一个目标序列值与所述目标对象的检测框在所述目标图像中的位置相应的概率;以及检测框位置获取单元,被配置用于基于所述目标定位特征,获得所述目标对象的检测框的位置,其中,目标序列值获取单元,还被配置用于获取所述目标图像的四条边中的每一个条边对应的多个目标序列值,并且其中,所述目标定位特征指示相邻的两条边对应的多个目标序列值构成的多个目标序列值组与目标对象的检测框的对角线上的顶点的位置的对应的概率,每一个目标序列值组包括由所述四条边中的每一个条边对应的多个目标序列值中的一个目标序列值。

12.根据权利要求11所述的装置,其中,所述目标定位特征获取单元包括:

图像输入单元,被配置用于通过将所述目标图像输入图像检测模型,以获得所述定位特征,其中,所述图像检测模型是采用训练图像基于经训练的教师模型训练学生模型获得的,所述训练图像包括与所述目标对象相应的训练对象,在训练所述学生模型的过程中,通过将所述训练图像分别输入所述教师模型和所述学生模型,获得所述教师模型输出的第一定位特征和所述学生模型输出的第二定位特征,并且基于所述第一定位特征和所述第二定位特征获得的损失调整所述学生模型的参数;其中,所述第一定位特征和所述第二定位特征分别指示多个训练序列值中的每一个训练序列值与所述训练对象的检测框在所述训练图像中的位置相应的概率,所述多个训练序列值包括基于所述训练图像的至少两个边中的每一个边的长度获得的该边对应的多个训练序列值。

13.根据权利要求11所述的装置,其中,所述目标定位特征包括维度为4×n的矩阵,n为正整数;其中,所述矩阵中的多个行与所述目标图像的四个边分别对应,所述矩阵中的每一个行的多个元素与所述目标图像中的相应边所对应的多个目标序列值分别对应。

14.根据权利要求11所述的装置,其中,所述至少两个边中的每一个边对应的多个目标序列值中的任意两个相邻目标序列值之差为预设值。

15.根据权利要求11所述的装置,其中,所述至少两个边中的每一个边对应的多个目标序列值的数量与所述目标图像的至少两个边中较长的边相应。

16.一种图像处理模型的训练装置,其中,所述图像处理模型包括学生模型,所述装置包括:训练图像获取单元,被配置用于获得训练图像,所述训练图像包括训练对象;

训练序列值获取单元,被配置用于基于所述训练图像的至少两个边中的每一个边的长度,获得该边对应的多个训练序列值;

定位特征获取单元,被配置用于获得所述学生模型基于所述训练图像获得的第一定位特征,并且获得经训练的教师模型于所述训练图像获得的第二定位特征,所述第一定位特征和所述第二定位特征分别指示所述至少两个边对应的多个训练序列值中的每一个训练序列值与所述训练对象的检测框在所述训练图像中的位置相应的概率;

第一损失计算单元,被配置用于基于所述第一定位特征所述第二定位特征,获得第一损失;以及参数调整单元,被配置用于基于所述第一损失,调整所述学生模型的参数,其中,所述训练序列值获取单元被配置用于获取所述训练图像的四条边中的每一个条边对应的多个训练序列值,并且其中,所述第一定位特征和所述第二定位特征分别指示相邻的两条边对应的多个训练序列值构成的多个训练序列值组与训练对象的检测框的对角线上的顶点的位置的对应的概率,每一个训练序列值组包括由所述四条边中的每一个条边对应的多个训练序列值中的一个训练序列值。

17.根据权利要求16所述的装置,还包括:

分类特征获取单元,被配置用于获得所述学生模型基于所述训练图像获得的第一分类特征,并且获得所述教师模型基于所述训练图像基于所述训练图像获得的第二分类特征,所述第一分类特征和所述第二分类特征分别指示所述训练对象对应于目标分类的概率;以及第二损失计算单元,被配置用于将所述第一分类特征和所述第二分类特征获得第二损失,并且其中,所述参数调整单元包括:参数调整子单元,被配置用于基于所述第一损失和所述第二损失,调整所述学生模型的参数。

18.根据权利要求16所述的装置,其中,第一定位特征和所述第二定位特征分别包括维度为4×n的矩阵,n为正整数;其中,所述矩阵中的多个行与所述训练图像的四个边分别对应,所述矩阵中的每一个行的多个元素与所述训练图像中的相应边所对应的多个训练序列值分别对应。

19.根据权利要求16所述的装置,其中,所述至少两个边中的每一个边对应的多个训练序列值中的任意两个相邻目标序列值之差为预设值。

20.根据权利要求16所述的装置,其中,所述至少两个边中的每一个边对应的多个训练序列值的数量与所述至少两个边中较长的边相应。

21.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑10中任一项所述的方法。