利索能及
我要发布
收藏
专利号: 2021114189108
申请人: 江苏科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种人脸识别方法,其特征在于,包括以下步骤:(1)输入人脸图像,通过深度神经网络对图像进行裁剪和对齐;

(2)对所述图片进行特征提取:将图像通过深度卷积神经网络映射到128维的特征空间中,得到对应的128维特征向量;

(3)引入注意力模块来增强特征向量:将上一步得到的128维特征向量通过注意力机制模块,得到自适应权重不同的特征向量,然后通过特征归一化来加快收敛速度;

(4)训练注意力神经网络模型:将自己提前准备好的训练集数据输入到系统内,然后运行MTCNN算法来检测头像并将图片的尺寸裁剪为160×160,然后经过神经网络进行特征提取,并通过位置注意力模块以及坐标注意力模块来进行特征增强,之后通过L2正则范数进行归一化,之后通过损失函数计算损失,校正参数,最后输出训练集模型;

(5)人脸识别验证:输入待识别图片,经过预处理步骤后,通过训练后的模型,计算两者间的欧氏距离,完成对样本的识别。

2.根据权利要求1所述的一种人脸识别方法,其特征在于,步骤(1)所述的深度卷积神经网络为facenet网络框架中带有的MTCNN工程。

3.根据权利要求1所述的一种人脸识别方法,其特征在于,步骤(2)所述的深度神经网络为inception‑resnet‑v2。

4.根据权利要求1所述的一种人脸识别方法,其特征在于,步骤3所述的注意力模块具体为:在reduction‑A和reduction‑B模块后面引入一个位置注意力模块;在inception‑Resnet‑C模块后引入一个坐标注意力模块。

5.根据权利要求4所述的一种人脸识别方法,其特征在于,所述位置注意力模块的工作C×H×W C×H×W

原理为:输入一个特征图A∈R ,将其通过卷积层,生成三个特征映射B、C、D∈R ,B和C运算之后通过softmax层计算注意力映射Sji;

C×N

其中N=H×W,Sji为第i个位置对第j个位置的影响,将D展开为R 矩阵与S相乘,然后乘上比例参数,并对特征A进行求和即可得到最终输出:

6.根据权利要求4所述的一种人脸识别方法,其特征在于,所述坐标注意力模块的工作原理为:对输入的特征图进行x,y轴方向的池化然后将池化结果连接起来经过激活函数获得非线性的数据之后,再将输入的结果重新按照水平和垂直方向分为两组特征图,再将这两组特征分别经过1×1卷积之后,利用sigmoid获得注意力的权重数据;最后,再将输入的Feature Map数据与水平和垂直权重相乘获得坐标注意力输出特征的Map,可以写成下面公式:

其中,xc(i,j)为输入的输入的Feature Map, 为水平方向的权重, 为垂直方向的权重,yc(i,j)输出特征的Map。

7.根据权利要求1所述的一种人脸识别方法,其特征在于,步骤(4)所述的损失函数定义了一种将softmax loss与triplet‑center loss相结合的损失函数L,其计算公式为:其中,Ls为softmax loss,Ltc为triplet‑center loss,用来平衡两个损失,xi是测试样本yi的所属类别,cyi是yi类的样本中心,m为样本个数,k为分类个数,f(xi)表示测试样本xi网络特征embedding output。

8.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1‑7中任一项所述的一种人脸识别方法。

9.一种计算机设备,包括储存器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1‑7中任一项所述的一种人脸识别方法。