利索能及
我要发布
收藏
专利号: 2021101603326
申请人: 成都东方天呈智能科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-05-17
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种主样本注意力机制的人脸检测方法,其特征在于,包括以下步骤:步骤S100:收集自然场景中包含人脸的图像数据,构成训练集;

步骤S200:利用网络模型提取训练图像的特征图信息,然后由锚框筛选模块在特征图的每一特征点上利用预测坐标值偏移量生成预测锚框集合,并将预测锚框分为候选正样本和候选负样本,分别对候选正样本和候选负样本进行排序;

步骤S300:最后使用损失函数计算损失值,所述损失函数分为类别分类损失函数和位置回归损失函数,并根据候选正样本和候选负样本的排名结果赋予重要程度不同的损失值权重,利用主样本注意力机制将权重偏向主样本;优化损失值并设置相关超参数,迭代计算,直至损失值收敛;

所述损失函数的计算公式如下:其中:

为类别分类损失函数,

为位置回归损失函数,

为类别分类损失函数计算的批处理大小,为位置回归损失函数计算的批处理大小,(s=1)表示只有正样本才进行位置回归损失值计算。

2.根据权利要求1所述的一种主样本注意力机制的人脸检测方法,其特征在于,所述类别分类损失函数采用二元交叉熵损失函数,并根据样本在所处的集合中的排序设定损失值权重,为不同重要性的样本分配对应的损失权重,计算公式如下:其中:

BCE为二元交叉熵损失函数,是归一化之后的排序,

为集合中排名的最大值;

为预测锚框在所属集合中的排名;

为将集合的排名转化成的权重值;

β和γ分别为设定的调节权重值的参数;

将 归一化成 ,

为真实类别标签,

为预测为某类的概率值,

公式(4)中的i为正样本,j为负样本,若预测锚框与真实边界框之间的距离交并比值大于阈值,则真实类别标签 为1,否则 为0。

3.根据权利要求1所述的一种主样本注意力机制的人脸检测方法,其特征在于,所述位置回归损失函数采用分类感知回归损失函数,将分类和定位回归构成正相关,同时优化分类和位置回归分支,计算预测锚框坐标偏移量与真实坐标偏移量之间的损失值,计算公式如下:

其中:

为通用的平滑L1损失函数,为用调节因子计算之后的类别概率值,n为类别概率值为 的样本总数量,为根据类别概率值归一化之后得到的回归损失权重值,为真实坐标偏移量,

为预测坐标偏移量;

为锚框的类别概率值,

b和k均为调节因子。

4.根据权利要求1‑3任一项所述的一种主样本注意力机制的人脸检测方法,其特征在于,所述类别分类损失函数采用二元交叉熵损失函数,所述位置回归损失函数采用分类感知回归损失函数。

5.根据权利要求1所述的一种主样本注意力机制的人脸检测方法,其特征在于,所述步骤S200包括以下步骤:步骤S210:首先利用预测坐标偏移量和锚框尺寸计算得到预测锚框集合;

步骤S220:然后计算预测锚框与真实边界框之间的距离交并比,若预测锚框的距离交并比大于等于阈值则为候选正样本,若预测锚框的距离交并比小于阈值则为候选负样本;

步骤S230:通过距离交并比值对候选正样本进行排序得到预测正样本集合,利用非极大值抑制算法对候选负样本进行排序得到预测负样本集合。

6.根据权利要求5所述的一种主样本注意力机制的人脸检测方法,其特征在于,所述步骤S220中的阈值为0.5。

7.根据权利要求1所述的一种主样本注意力机制的人脸检测方法,其特征在于,所述步骤S200中的网络模型采用ResNet‑20网络结构,所述网络模型的主干网络由从前至后依次设置的卷积层、批归一化层、激活函数层、残差块组成,所述残差块由从前至后依次设置的卷积层、批归一化层、激活函数层、特征相加层组成。

8.根据权利要求7所述的一种主样本注意力机制的人脸检测方法,其特征在于,所述网络模型的主干网络设置有8个残差块。

9.根据权利要求7所述的一种主样本注意力机制的人脸检测方法,其特征在于,所述的激活函数层采用参数修正线性单元层。

10.根据权利要求3所述的一种主样本注意力机制的人脸检测方法,其特征在于,使用K‑means算法在样本上聚类得到锚框的尺寸,计算锚框与真实边界框之间的坐标偏移量,称为真实坐标偏移量。