利索能及
我要发布
收藏
专利号: 2021103028085
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种结合头部和整体信息的行人检测方法,其特征在于:该方法包括以下步骤:S1:将数据集中的行人及其头部矩形边界框标签转换为中心点标签,同时对图像进行相应的预处理;

S2:基于深度卷积神经网络搭建特征提取模块获取用于检测的行人头部和整体特征图信息;

S3:构建包含头部检测和整体检测两个分支的检测模块,检测模块从特征图中预测中心点位置、高度和偏移量信息,生成头部边界框和整体边界框;

S4:对于获得的头部边界框和整体边界框,使用改进后的非极大值抑制算法将两者结合,同时滤除置信度较低的边界框从而得到最终的检测结果;

所述S1包含以下步骤:

S11:对训练图像进行随机比例的缩放,若图像大小小于预设尺寸则使用灰度像素点进行填充,若其大小大于预设尺寸则对边缘进行裁剪,同时对边界框标签进行位置修正;

S12:对训练图像进行随机水平翻转,同时修正边界框坐标;

S13:将图像从RGB颜色空间转换至HSV或HSL颜色空间,同时对图像的亮度进行随机调整;

h h b b

S14:根据标签信息计算获得其头部中心位置(x ,y)和整体中心位置(x ,y),使用二维head body高斯函数G(·)分别生成头部中心点掩膜M 和整体中心点掩膜M ;

所述S2中,构建特征提取模块包括以下步骤:S21:使用主干网络对图像进行特征提取,获得四张具有不同激活程度以及大小的特征图{p1,p2,p3,p4};

S22:对特征图{p1,p2,p3,p4}使用卷积进行计算得到特征图{P1,P2,P3,P4},对特征图P4使用相同的卷积计算得到特征图P5,从而构成具有五层结构的特征金字塔;

S23:对特征图P2和P3进行上采样使其大小与P1保持一致,融合这三张特征图从而获得head用于头部检测特征图F ;对特征图P4和P5进行相同运算使其大小与P3一致,融合特征图P3、bodyP4和P5得到用于行人整体检测的特征图F ;

所述S3具体包括以下步骤:

head head head headS31:从头部特征图F 中预测获得头部中心点C 、高度H 以及位置偏移量O ,同head时生成头部边界框B ;

body body body bodyS32:从整体特征图F 中预测获得整体中心点C 、高度H 以及位置偏移量O ,同body时生成整体边界框B ;

所述S4具体包含以下步骤:

S41:对于检测部分输出的行人整体边界框 其中 和b b

分别为边界框的左上角点和右下角点,基于边界框的高度h 和宽度w计算获得行人的头部区域Hregion;

body

S42:对于每一个行人整体边界框B ,首先判断其头部区域Hregion内是否存在头部边界head body head框B ,若存在则选取位于该区域中置信度s最高的头部边界框与之配对得到{B ,B ,body heads ,s };

S43:如果整体边界框的置信度较高则直接予以保留,如果行人边界框的置信度较低但存在与之配对的头部边界框,并且头部边界框的置信度较高,则依然保留该行人整体边界框。