利索能及
我要发布
收藏
专利号: 2017106056610
申请人: 南京邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-11-12
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种实时高精度人脸快速检测方法,其特征在于,包括以下步骤:

步骤A、设计基于人脸分类的卷积神经网络模型BFCNN;

步骤B、采用交占比IOU,从公开的人脸数据库中的图像Iraw中,获取正负样本作为人脸训练集Itrain;

步骤C、对步骤A中设计的BFCNN,利用步骤B中得到的人脸训练集Itrain来进行分类训练,训练完成后,得到训练好的BFCNN网络的中间特征层LO,从LO中选取能够滤除环境噪声并能提取人脸特征的卷积输出层,卷积输出层输出特征图Lfeature;

步骤D、设计符合检测人脸的中心对称向量特征算子CSVCO,CSVCO能够利用特征图Lfeature中的空间拓扑关系来反映图像中人脸的特征描述;

步骤E、设计多个图像输入维度在预设像素区域间的、由小卷积核重叠构成的全卷积神经网络分类器MMKSFCN;

步骤F、利用步骤D和步骤E中设计的中心对称向量特征算子CSVCO和多个全卷积神经网络分类器MMKSFCN,依赖于步骤B、步骤C中分别获得的人脸训练集Itrain和Lfeature的空间对应关系,获取到用来训练Boosting算法的训练集Iboosting,利用CSVCO和MMKSFCN来构建多个弱分类器CLASSIFIERweakly;

步骤G、使用Boosting算法来融合步骤F中构建的多个弱分类器CLASSIFIERweakly,构建强分类器CLASSIFIERpowerful,利用CLASSIFIERpowerful实现人脸检测。

2.根据权利要求1所述的一种实时高精度人脸快速检测方法,其特征在于,小卷积核的大小为1或者3。

3.根据权利要求1所述的一种实时高精度人脸快速检测方法,其特征在于,所述步骤A中设计基于人脸分类的卷积神经网络模型BFCNN的详细架构如下:步骤A.1、设计的BFCNN总共包含分别接受图像的R、G、B分量的图像三通道输入;BFCNN总共包含12层;

步骤A.2、前6层为连续的卷积层,每一层得到输出通道数分别为16、24、32、48、64、20,第六层采用了稠密连接,第六层允许前五个卷积层的跨层连接;在卷积的过程中,限制了每一层输出的维度都是输入图像的尺度;前6层是用来提取三通道输入的人脸特征同时滤除噪声;

步骤A.3、第7到第10层是降维层,能够使前6层中提取到的特征保留,并且去除冗余信息,最后两层分别为128个隐藏单元的全连接层和softmax输出层。

4.根据权利要求1所述的一种实时高精度人脸快速检测方法,其特征在于,所述步骤B具体如下:在公开的人脸数据库中的图像Iraw上取随机224*224大小的图像切片作为源样本Sample,源样本Sample与标注的人脸标注框boundingbox相交部分的面积占二者合集的比例为交占比IOU,以IOU来判断正负样本,当IOU大于0.65时候,标注为正样本,当IOU小于

0.35时为负样本,正负样本作为人脸训练集Itrain。

5.根据权利要求1所述的一种实时高精度人脸快速检测方法,其特征在于,所述CSVCO是以中心对称的两个相同的几何图形作为基本模型,其中一个几何图形中所有位置的系数全部为+1,另外一个全部为-1,计算CSVCO与特征图Lfeature重叠部分的累乘和SumCSVCO,SumCSVCO能够反映特征图Lfeature中的空间拓扑关系。

6.根据权利要求1所述的一种实时高精度人脸快速检测方法,其特征在于,步骤E中的预设像素区域为12像素至20像素。