利索能及
我要发布
收藏
专利号: 2019101146215
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于YOLO的图像目标识别方法,其特征在于,包括:接收待检测图像;

根据预设的要求调整所述待检测图像的尺寸大小,生成第一检测图像;

将所述第一检测图像发送至神经网络模型中进行匹配识别,生成检测框和分类识别信息以及分类识别信息对应的分类概率值;

将每个检测框内部的分类概率值按照从大到小进行排列,选取排名最高的分类;然后将排名最高的分类的分类概率值与预设的概率阈值进行比较,判断所述排名最高的分类的分类概率值是否大于预设的概率阈值;

若小于所述预设的概率阈值,则删除所述检测框;若大于所述预设的概率阈值,则将所述检测框和分类识别信息作为识别的分类结果;

其中,所述生成检测框的步骤具体为:

根据初始预设坐标点位生成初始检测框;

进行动态检测框的预测,对已经生成的检测框进行迭代预测,生成最新的检测框;

计算所述最新的检测框的重合度;

若最新的检测框重合度大于等于预设的重合度阈值,则保留所述最新的检测框;若所述最新的检测框重合度小于预设的重合度阈值,则继续进行动态检测框的预测;

最后生成同类别的N个同类检测框;

其中,所述进行动态检测框的预测,对已经生成的检测框进行迭代预测,生成最新的检测框具体为:预测每个检测框的4个坐标( );如果单元格偏离图像的左上角坐标,并且上步预测的检测框具有宽度 和高度 ,则最新检测框的坐标为:其中, 分别为最新检测框的四个坐标点位值。

2.根据权利要求1所述的基于YOLO的图像目标识别方法,其特征在于,在所述接收待检测图像之前还包括:进行图片训练,得到神经网络模型;所述神经网络模型通过如下步骤进行训练:获取训练图像数据集;

将所述训练图像数据集进行图像预处理,得到预处理后的图像集;

将所述预处理后的图像集进行训练,得到具备输入接口和输出接口的神经网络模型。

3.根据权利要求2所述的基于YOLO的图像目标识别方法,其特征在于,所述的神经网络模型中采用53层卷积运算,并且每层的卷积运算为 3×3和1×1卷积层交替计算。

4.根据权利要求1所述的基于YOLO的图像目标识别方法,其特征在于,所述尺寸大小为神经网络模型规定的大小。

5.一种基于YOLO的图像目标识别系统,其特征在于,该系统包括:存储器、处理器及摄像装置,所述存储器中包括基于YOLO的图像目标识别方法程序,所述基于YOLO的图像目标识别方法程序被所述处理器执行时实现如下步骤:接收待检测图像;

根据预设的要求调整所述待检测图像的尺寸大小,生成第一检测图像;

将所述第一检测图像发送至神经网络模型中进行匹配识别,生成检测框和分类识别信息以及分类识别信息对应的分类概率值;

将每个检测框内部的分类概率值按照从大到小进行排列,选取排名最高的分类;然后将排名最高的分类的分类概率值与预设的概率阈值进行比较,判断所述排名最高的分类的分类概率值是否大于预设的概率阈值;

若小于所述预设的概率阈值,则删除所述检测框;若大于所述预设的概率阈值,则将所述检测框和分类识别信息作为识别的分类结果;

其中,所述生成检测框的步骤具体为:

根据初始预设坐标点位生成初始检测框;

进行动态检测框的预测,对已经生成的检测框进行迭代预测,生成最新的检测框;

计算所述最新的检测框的重合度;

若最新的检测框重合度大于等于预设的重合度阈值,则保留所述最新的检测框;若所述最新的检测框重合度小于预设的重合度阈值,则继续进行动态检测框的预测;

最后生成同类别的N个同类检测框;

其中,所述进行动态检测框的预测,对已经生成的检测框进行迭代预测,生成最新的检测框具体为:预测每个检测框的4个坐标( );如果单元格偏离图像的左上角坐标 ,并且上步预测的检测框具有宽度 和高度 ,则最新检测框的坐标为:其中, 分别为最新检测框的四个坐标点位值。

6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于YOLO的图像目标识别方法程序,所述基于YOLO的图像目标识别方法程序被处理器执行时,实现如权利要求1至4中任一项所述的一种基于YOLO的图像目标识别方法的步骤。