利索能及
我要发布
收藏
专利号: 2019110546842
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图像识别方法,其特征在于,所述方法包括:

获取待识别图像在多个不同降采样倍率下的多个图像特征;

针对所述多个不同降采样倍率中的每个降采样倍率,融合所述多个图像特征在该降采样倍率下的投影,得到所述待识别图像在该将降采样倍率下的融合特征;

根据所述待识别图像在所有降采样倍率下的融合特征,确定所述待识别图像的识别结果。

2.根据权利要求1所述的方法,其特征在于,所述针对所述多个不同降采样倍率中的每个降采样倍率,融合所述多个图像特征在该降采样倍率下的投影,得到所述待识别图像在该将采样倍率下的融合特征,包括:针对所述多个不同降采样倍率中的每个降采样倍率,重复执行以下步骤直至重复执行的次数达到预设次数,所述预设次数不小于所述多个不同采样倍率的数目:将所述待识别图像在与该降采样倍率的相邻降采样倍率下的图像特征投影至该降采样倍率,得到投影特征,所述相邻降采样倍率为将所述多个降采样倍率按照由大到小或由小到大的顺序进行排序时与该降采样倍率相邻的降采样倍率;

融合所述投影特征与所述待识别图像在该降采样倍率下的图像特征,得到所述待识别图像在该降采样倍率下的新的图像特征;

当重复执行的次数到达预设次数时,将每个降采样倍率下的图像特征作为所述待识别图像在该将降采样倍率下的融合特征。

3.根据权利要求2所述的方法,其特征在于,所述融合所述投影特征与所述待识别图像在该降采样倍率下的图像特征,得到所述待识别图像在该降采样倍率下的新的图像特征,包括:如果不是第预设次数重复执行,则融合所述投影特征与所述待识别图像在该降采样倍率下最新的图像特征,得到所述待识别图像在该降采样倍率下的新的图像特征;

如果是第预设次数重复执行,则融合所述投影特征、所述待识别图像在该降采样倍率下最新的图像特征、以及所述待识别图像在该降采样倍率下初始的图像特征。

4.根据权利要求2所述的方法,其特征在于,所述将所述待识别图像在与该降采样倍率的相邻降采样倍率下的图像特征投影至该降采样倍率,得到投影特征,包括:对相邻降采样倍率中小于该降采样倍率的降采样倍率下的图像特征,进行步长大于1的池化处理,得到在该降采样倍率下的投影特征;或,对相邻降采样倍率中大于该降采样倍率的降采样倍率下的图像特征,进行上采样处理,得到在该降采样倍率下的投影特征。

5.根据权利要求1所述的方法,其特征在于,所述根据所述待识别图像在所有降采样倍率下的融合特征,确定所述待识别图像的识别结果,包括:将所述待识别图像在所有降采样倍率下的融合特征,输入至预先建立的识别模型进行识别,得到所述待识别图像的识别结果;

所述识别模型包括目标检测子模型、语义分割子模型、实例分割子模型以及姿态点估计子模型中的多个子模型;

所述识别模型通过以下方式训练:

获取样本图像在所述多个不同降采样倍率下的多个图像特征,所述样本图像针对每个子模型标注有真值;

针对所述多个不同降采样倍率中的每个降采样倍率,融合所述多个图像特征在该降采样倍率下的投影,得到所述样本图像在该将降采样倍率下的融合特征;

将所述待识别图像在所有降采样倍率下的融合特征,输入至所述识别模型的每个子模型,得到所述识别模型的所有子模型输出的预测值;

针对每个子模型,根据该子模型输出的预测值与所述样本图像针对该子模型标注的真值间的损失,通过针对该子模型预设的训练方式,调整该子模型的模型参数。

6.一种图像识别装置,其特征在于,所述装置包括:

特征提取模块,用于获取待识别图像在多个不同降采样倍率下的多个图像特征;

特征融合模块,用于针对所述多个不同降采样倍率中的每个降采样倍率,融合所述多个图像特征在该降采样倍率下的投影,得到所述待识别图像在该将降采样倍率下的融合特征;

识别模块,用于根据所述待识别图像在所有降采样倍率下的融合特征,确定所述待识别图像的识别结果。

7.根据权利要求6所述的装置,其特征在于,所述特征融合模块,具体用于针对所述多个不同降采样倍率中的每个降采样倍率,重复执行以下步骤直至重复执行的次数达到预设次数,所述预设次数不小于所述多个不同采样倍率的数目:将所述待识别图像在与该降采样倍率的相邻降采样倍率下的图像特征投影至该降采样倍率,得到投影特征,所述相邻降采样倍率为将所述多个降采样倍率按照由大到小或由小到大的顺序进行排序时与该降采样倍率相邻的降采样倍率;

融合所述投影特征与所述待识别图像在该降采样倍率下的图像特征,得到所述待识别图像在该降采样倍率下的新的图像特征;

当重复执行的次数到达预设次数时,将每个降采样倍率下的图像特征作为所述待识别图像在该将降采样倍率下的融合特征。

8.根据权利要求7所述的装置,其特征在于,所述特征融合模块,具体用于如果不是第预设次数重复执行,则融合所述投影特征与所述待识别图像在该降采样倍率下最新的图像特征,得到所述待识别图像在该降采样倍率下的新的图像特征;

如果是第预设次数重复执行,则融合所述投影特征、所述待识别图像在该降采样倍率下最新的图像特征、以及所述待识别图像在该降采样倍率下初始的图像特征。

9.根据权利要求7所述的装置,其特征在于,所述特征融合模块,具体用于对相邻降采样倍率中小于该降采样倍率的降采样倍率下的图像特征,进行步长大于1的池化处理,得到在该降采样倍率下的投影特征;或,对相邻降采样倍率中大于该降采样倍率的降采样倍率下的图像特征,进行上采样处理,得到在该降采样倍率下的投影特征。

10.根据权利要求6所述的装置,其特征在于,所述识别模块,具体用于将所述待识别图像在所有降采样倍率下的融合特征,输入至预先建立的识别模型进行识别,得到所述待识别图像的识别结果;

所述识别模型包括多个目标检测子模型、语义分割子模型、实例分割子模型以及姿态点估计子模型中的多个子模型;

所述识别模型通过以下方式训练:

获取样本图像在所述多个不同降采样倍率下的多个图像特征,所述样本图像针对每个子模型标注有真值;

针对所述多个不同降采样倍率中的每个降采样倍率,融合所述多个图像特征在该降采样倍率下的投影,得到所述样本图像在该将降采样倍率下的融合特征;

将所述待识别图像在所有降采样倍率下的融合特征,输入至所述识别模型的每个子模型,得到所述识别模型的所有子模型输出的预测值;

针对每个子模型,根据该子模型输出的预测值与所述样本图像针对该子模型标注的真值间的损失,通过针对该子模型预设的训练方式,调整该子模型的模型参数。

11.一种电子设备,其特征在于,包括:

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。