利索能及
我要发布
收藏
专利号: 2021107622212
申请人: 北京澎思科技有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2024-12-10
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种人脸检测方法,包括:

通过主干卷积神经网络处理人脸图像数据,其中,所述主干卷积神经网络包括多个处理阶段,每个所述处理阶段输出第一特征图;

通过特征融合网络处理多个所述第一特征图,得到多个第二特征图;

基于所述第二特征图中的像素点确定锚点位置;

基于所述第二特征图的尺寸确定锚点框的尺寸,其中,所述第二特征图的尺寸与所述锚点框的尺寸之间呈负相关关系;

基于所述第二特征图的下采样倍率和所述锚点框的尺寸确定各个锚点位置产生的预测框的密度;

基于所述锚点位置、锚点框的尺寸以及各个锚点位置产生的预测框的密度确定多个预测框,每个所述预测框包括以下信息:所述预测框的位置和尺寸,所述预测框为正样本的第一置信度以及所述预测框为负样本的第二置信度;

获取在柔性最大值运算下表明置信度的阈值;

获取在柔性最大值运算下表明置信度的第一阈值,包括:将所述第一阈值转化为在加减运算下表明置信度的第二阈值,其中,通过下式将所述第一阈值转化为所述第二阈值,其中,t1为第一阈值,t2为第二阈值;

基于所述预测框和所述阈值确定预测结果包括:基于所述预测框和所述第二阈值确定预测结果;

基于所述预测框和所述阈值确定预测结果,包括:

基于所述第一置信度和所述第二置信度的差值,确定预测得分大于阈值的预测框;

通过二叉树插值和中序排序算法对所述预测得分大于所述阈值的预测框按照预测得分排序,得到排序结果;

根据所述排序结果,通过非极大值抑制处理所述预测得分大于所述阈值的预测框,以过滤重复的预测框,得到预测结果。

2.根据权利要求1所述的方法,其中,所述基于所述锚点位置、锚点框的尺寸以及各个锚点位置产生的预测框的密度确定多个预测框包括:根据锚点框的尺寸和各个锚点位置产生的预测框的密度,在每个锚点位置预测一组不同宽高比和不同尺寸的锚点框;

基于所述不同宽高比和不同尺寸的锚点框确定多个预测框。

3.根据权利要求1所述的方法,其中,所述基于所述锚点位置、锚点框的尺寸以及各个锚点位置产生的预测框的密度确定多个预测框包括:根据各锚点位置产生的预测框的密度和锚点框的尺寸,以锚点位置为中心进行偏移加倍,以确定多个预测框。

4.根据权利要求1所述的方法,其中,所述基于所述第二特征图的下采样倍率和所述锚点框的尺寸确定各个锚点位置产生的预测框的密度包括:基于预设常数和锚点框的尺寸,确定锚点框步长;

确定所述第二特征图的下采样倍率与所述锚点框的步长的比值为预测框的密度。

5.根据权利要求1~4任一项所述的方法,其中,所述通过特征融合网络处理多个所述第一特征图,得到多个第二特征图包括:通过第一融合子网络处理多个所述第一特征图,用于在所述第一特征图之间融合特征,得到多个第三特征图;

通过第二融合子网络分别处理所述多个第三特征图,得到多个第二特征图;

多个所述第一特征图至少包括特征图C1和特征图C2,所述特征图C1的尺寸大于特征图C2的尺寸,所述通过第一融合子网络处理多个所述第一特征图,用于在所述第一特征图之间融合特征,得到多个第三特征图包括:分别通过1×1的卷积层处理所述特征图C1和C2,得到通道数相同的特征图M1和P2;对P2上采样得到特征图M2_up,并与M1叠加,得到特征图M1_add;

通过3×3的卷积层处理M1_add,得到特征图P1,其中,P1和P2为第三特征图,所述上采样使用最近邻插值算法实现;

所述通过第二融合子网络分别处理所述多个第三特征图,得到多个第二特征图包括对每个第三特征图P执行以下操作:通过具有第一输出通道数的卷积层处理P,得到特征图S1;通过具有第二输出通道数的卷积层处理P,得到特征图T;

通过两个卷积通道分别处理T,得到特征图S2和S3,其中,S2和S3的通道数为所述第二输出通道数;

按通道叠加S1、S2和S3,得到具有预定通道数的第二特征图F。

6.根据权利要求1~5任一项所述方法的人脸检测装置,其特征在于,包括:特征提取模块,被配置为通过主干卷积神经网络处理人脸图像数据,其中,所述主干卷积神经网络包括多个处理阶段,每个所述处理阶段输出第一特征图;

特征融合模块,被配置为通过特征融合网络处理多个所述第一特征图,得到多个第二特征图;

预测框确定模块,被配置为执行以下操作:

基于所述第二特征图中的像素点确定锚点位置;

基于所述第二特征图的尺寸确定锚点框的尺寸,其中,所述第二特征图的尺寸与所述锚点框的尺寸之间呈负相关关系;

基于所述第二特征图的下采样倍率和所述锚点框的尺寸确定各个锚点位置产生的预测框的密度;

以及基于所述锚点位置、锚点框的尺寸以及各个锚点位置产生的预测框的密度确定多个预测框,每个所述预测框包括以下信息:所述预测框的位置和尺寸,所述预测框为正样本的第一置信度以及所述预测框为负样本的第二置信度;

阈值获取模块,被配置为获取在柔性最大值运算下表明置信度的阈值;以及结果确定模块,被配置为基于所述预测框和所述阈值确定预测结果。

7.一种电子设备,其特征在于,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现权利要求1~5任一项所述方法的步骤。

8.一种可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1~5任一项所述方法的步骤。