利索能及
我要发布
收藏
专利号: 2019105161394
申请人: 合肥工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种多尺度目标检测方法,其特征在于,所述多尺度目标检测方法包括:获取初始图像;

将所述初始图像放大形成图像金字塔,输入到预设的特征金字塔网络;

通过所述预设的特征金字塔网络对所述初始图像中的目标进行识别和框选定位处理,得到第一预测结果;

对所述初始图像按照预设方式进行放大处理,得到放大图像;

将所述放大图像输入到预设的小尺度目标检测网络;

通过所述预设的小尺度目标检测网络对所述放大图像进行特征提取和分类,得到第二预测结果;

对所述第一预测结果和所述第二预测结果进行汇总分析,得到目标检测结果。

2.如权利要求1所述的多尺度目标检测方法,其特征在于,所述通过所述预设的特征金字塔网络对所述初始图像中的目标进行识别和框选定位处理,得到第一预测结果包括:通过对初始图像进行候选框特征提取,得到至少一种尺度的初始候选框;

按照预设的分类器,对所述初始候选框进行分类,得到分类后的候选框;

对所述分类后的候选框进行校正处理,得到所述第一预测结果。

3.如权利要求2所述的多尺度目标检测方法,其特征在于,所述预设的特征金字塔网络包括输入层、卷积层和区域建议网络,所述卷积层包括第一预设卷积层和第二预设卷积层,通过对初始图像进行候选框特征提取,得到至少一种尺度的初始候选框包括:通过所述预设的特征金字塔网络的输入层提取所述初始图像中的多通道数据;

采用所述卷积层对所述多通道数据进行特征提取,并对所述第一预设卷积层提取到的数据特征进行降维处理,得到第一特征,对所述第二预设卷积层提取到的数据特征进行降维处理,得到第二特征;

采用双线性插值的方式,对所述第一特征进行双线性插值的上采样,得到上采样特征,并将所述上采样特征与所述第二特征进行求和,得到更新后的第二特征;

使用所述区域建议网络,根据所述第一特征和所述更新后的第二特征,生成所述初始候选框。

4.如权利要求2所述的多尺度目标检测方法,其特征在于,所述对所述分类后的候选框进行校正处理,得到所述第一预测结果包括:计算所述分类后的候选框与预设的真实框的欧式距离损失;

根据所述欧式距离损失,对所述分类后的候选框的位置进行调整;

返回所述计算所述分类后的候选框与真实框的欧式距离损失的步骤继续执行,直到所述欧式距离损失小于预设阈值,将得到的分类后的候选框作为所述第一预测结果。

5.如权利要求1所述的多尺度目标检测方法,其特征在于,所述预设的小尺度目标检测网络为VGG16网络,所述通过所述预设的小尺度目标检测网络对所述放大图像进行特征提取和分类,得到第二预测结果包括:采用所述VGG16网络的卷积层对所述放大图像进行特征提取,并使用所述VGG16网络的池化层对提取到的特征进行映射,生成特征图,其中,所述VGG16网络的池化层为ROIAlign层;

针对每个所述特征图,通过softmax分类器计算所述特征图属于每个预设类别的预测概率,选取最大概率对应的预设类别,作为所述特征图对应的预测类别;

将得到的每个所述预测类别作为所述第二预测结果。

6.如权利要求1至5任一项所述的多尺度目标检测方法,其特征在于,所述对所述第一预测结果和所述第二预测结果进行汇总分析,得到目标检测结果包括:分别计算所述第一预测结果中的每个预测结果属于预设分类的概率,获取概率小于第一预设阈值的预测结果,作为第一候选结果;

从所述第二预测结果中,获取预测框面积小于预设大小的预测结果,作为有效预测结果,并分别计算每个所述有效预测结果属于所述预设分类的概率,得到第二候选结果;

对所述第一候选结果和所述第二候选结果进行非极大值抑制,得到所述目标检测结果。

7.一种多尺度目标检测装置,其特征在于,所述多尺度目标检测装置包括:图像获取模块,用于获取初始图像;

第一传输模块,用于将所述初始图像放大形成图像金字塔,输入到预设的特征金字塔网络;

第一预测模块,用于通过所述预设的特征金字塔网络对所述初始图像中的目标进行识别和框选定位处理,得到第一预测结果;

图像处理模块,用于对所述初始图像按照预设方式进行放大处理,得到放大图像;

第二传输模块,用于将所述放大图像输入到预设的小尺度目标检测网络;

第二预测模块,用于通过所述预设的小尺度目标检测网络对所述放大图像进行特征提取和分类,得到第二预测结果;

检测分析模块,用于对所述第一预测结果和所述第二预测结果进行汇总分析,得到目标检测结果。

8.如权利要求7所述的多尺度目标检测装置,其特征在于,所述第一预测模块包括:特征提取单元,用于通过对初始图像进行候选框特征提取,得到至少一种尺度的初始候选框;

候选框分类单元,用于按照预设的分类器,对所述初始候选框进行分类,得到分类后的候选框;

候选框校正单元,用于对所述分类后的候选框进行校正处理,得到所述第一预测结果。

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至

6任一项所述的多尺度目标检测方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的多尺度目标检测方法。