利索能及
我要发布
收藏
专利号: 2018111760622
申请人: 中山大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种实时鲁棒的人脸检测方法,其特征在于,包括以下步骤:

S1、获取要进行人脸检测的目标图像并进行预处理;

S2、建立并训练检测模型;

检测模型包括多个卷积模块、多个Inception模块、多个带残差的Inception模块及多个检测模块,第一卷积模块、第一Inception模块、第二Inception模块、第三Inception模块、第一带残差的Inception模块、第二卷积模块、第二带残差的Inception模块、第三卷积模块、第三带残差的Inception模块依次连接,第一带残差的Inception模块、第二带残差的Inception模块及第三带残差的Inception模块分别与第一检测模块、第二检测模块及第三检测模块连接,最终输出位置信息和分类信息;

S3、将目标图像输入训练好的检测模型中,分别获取指定层级上的卷积结果;

S4、对获取的卷积结果进行分类和回归;

S5、根据回归和分类结果计算出人脸的位置。

2.根据权利要求1所述的实时鲁棒的人脸检测方法,其特征在于,Inception模块是具有两条支路的通道分离卷积模块;每个Inception模块包括两条并联的支路,其中第一条支路是步长s=2的瓶颈模块,第二条支路由一个步长s=1的瓶颈模块和步长s=2的瓶颈模块串联组成;两条支路的输出按照通道连接,组成整个Inception模块的输出。

3.根据权利要求2所述的实时鲁棒的人脸检测方法,其特征在于,步长s=2的瓶颈模块对输入依次进行带激活函数的卷积操作、通道分离卷积操作和线性卷积操作,其中,通道分离卷积的步长设为2;步长s=1的瓶颈模块对输入依次进行带激活函数的卷积操作、通道分离卷积操作和线性卷积操作后,再与输入相加,得到最终瓶颈模块的输出。

4.根据权利要求1所述的实时鲁棒的人脸检测方法,其特征在于,带残差的Inception模块是带残差连接的多支路通道分离卷积模块;每个带残差的Inception模块具有四条支路,其中三条支路分别由不同数量的卷积串联形成,第四条支路直接与前三条支路的输出结果对应元素相加,作为整个带残差的Inception模块的最终输出。

5.根据权利要求4所述的实时鲁棒的人脸检测方法,其特征在于,带残差的Inception模块中,三条带卷积的支路均首先进行1x1的卷积,调整通道数量,然后再分别串联上若干数量核卷积。

6.根据权利要求5所述的实时鲁棒的人脸检测方法,其特征在于,三条带卷积的支路在进行1x1的卷积后,分别串联上0个、1个和2个卷积核,所串联的卷积核大小为3x3。

7.根据权利要求1所述的实时鲁棒的人脸检测方法,其特征在于,所述第一卷积模块的输出通道为32,第二卷积模块的输出通道为128,第三卷积模块的输出通道为256;第一Inception模块的输出通道为32,第二Inception模块的输出通道为64,第三Inception模块的输出通道为128。

8.根据权利要求1所述的实时鲁棒的人脸检测方法,其特征在于,检测模型的训练过程为:将训练图片输入检测模型,获取检测结果后计算检测结果与真实值的差距,使用随机梯度下降和反向传播的方法调整检测模型的参数,逐步缩小检测结果与真实值的差距。

9.根据权利要求8所述的实时鲁棒的人脸检测方法,其特征在于,检测模型的训练过程包括如下步骤:a.将训练集中的图片调整到神经网络制定的尺寸,然后进行数据增强处理;

b.在检测模块对应的几个特征层上设置先验框,使先验框与训练集图片上人脸的真实标签相匹配,成功匹配的先验框设置为正样本,不能成功匹配的先验框则是负样本;

c.将损失函数定义为位置误差函数与分类误差函数的加权和,使用该损失函数训练检测模型。