1.一种基于分层伪三维注意力卷积神经网络的人脸图像分类方法,包括如下步骤:S100:对待分类的彩色人脸图像进行预处理;
S200:对预处理后的待分类彩色人脸图像进行几何归一化处理;
S300:构建分层伪三维注意力卷积神经网络并进行训练,所述分层伪三维注意力卷积神经网络包括3个输入层、1个卷积层、1个最大池化层、16个由伪三维卷积模块、注意力模块和全局上下文模块组成的伪三维注意力模块、1个全局平均化层和1个输出层;
S400:将几何归一化处理后的待分类彩色人脸图像输入所述分层伪三维注意力卷积神经网络进行分类。
2.根据权利要求1所述的方法,其中,优选的,所述伪三维卷积模块由1个卷积核大小为
1×1×1的卷积层和2个卷积核大小分别为3×3×1和1×1×3的卷积层构成。
3.根据权利要求1所述的方法,其中,所述注意力模块包括:第一单元,通过3×3×3和5×5×5的卷积核分别对伪三维卷积模块进行卷积处理获得两个特征矩阵,将两个特征矩阵分别进行最大池化和平均池化处理并进行级联操作得到两个级联特征矩阵,对两个级联特征矩阵采用多卷积方式,得到输出特征矩阵;
第二单元,用于将输出特征矩阵通过全局平均池化的方式挤压进通道中,经过非线性处理后,采用sigmoid函数得到两个权重特征矩阵,且该权重特征矩阵的参数随反向传播更新;
第三单元,用于将两个权重特征矩阵与第一单元中的两个输出特征矩阵分别进行乘积,得到两个带注意力权重的特征矩阵,最后进行级联和1×1的卷积操作,即获得注意力模块的输出特征矩阵。
4.根据权利要求3所述的方法,其中,所述注意力模块表示为:s=Fz(z,W)=δ(BN(z))其中,D、H和W为输出特征矩阵的深度、高度和宽度,K为第一单元的输出特征矩阵,i、j、k分别为K的深度、高度和宽度的元素值,z为经过GAP层后得到的、经过挤压的特征矩阵,δ为ReLU非线性激活函数,BN为批归一化处理操作,s为输出权重矩阵。
5.根据权利要求1所述的方法,其中,所述全局上下文模块包括:第四单元,通过采用卷积核大小为1×1×1卷积和Reshape变形函数对注意力模块的输出特征矩阵进行线性变换,获得线性变换后的特征矩阵,然后使用softmax函数对线性变换后的特征矩阵进行处理,以获得该特征矩阵上不同位置的权重,最后将权重与线性变换后的特征矩阵相乘,获得全局上下文特征矩阵;
第五单元,通过1个由批量归一化和ReLU激活函数组成的非线性变换层、1个卷积核大小为1×1的卷积层对全局上下文特征矩阵进行特征变换,获得特征变换后的全局上下文特征矩阵;
第六单元,用于将特征变换后的全局上下文特征矩阵与注意力模块的输出特征矩阵相加,获得全局上下文模块的输出特征矩阵。
6.根据权利要求5所述的方法,其中,全局上下文模块表示为:其中,x为全局上下文模块的输出特征矩阵,V为1×1×1卷积,ReLU表示激活函数,GN为分组归一化函数,N为特征矩阵中位置的数量,e为自然对数函数的底数,j,m为特征矩阵中所有可能的位置,xj,xm全局上下文特征矩阵中某一位置的像素值,t表示x矩阵的权重,txj和txm为经过全局平均池化操作后的特征矩阵进行计算处理得到的输出值。
7.根据权利要求1所述的方法,其中,步骤S300中,通过以下步骤对分层伪三维注意力卷积神经网络进行训练:
S301:选取若干彩色人脸图像进行样本划分,划分为训练样本和验证样本;
S302:对所述训练样本、验证样本依次进行预处理和几何归一化处理,获得新的训练样本和验证样本;
S303:利用新的训练样本通过前向传播和反向传播的方式对分层伪三维注意力卷积神经网络进行训练,并通过新的验证样本对训练后的分层伪三维注意力卷积神经网络进行验证。
8.根据权利要求7所述的方法,其中,对待分类的彩色人脸图像及对所述训练样本和验证样本均通过直方图均衡法和中值滤波法进行预处理。
9.根据权利要求7所述的方法,其中,对待分类的彩色人脸图像及对所述训练样本和验证样本进行归一化处理均通过以下方式进行:S3001:标定特征点,通过matlab自带的[x,y]=ginput(3)函数来标定两眼和鼻子三个特征点;
S3002:根据两眼的坐标值旋转图像,以保证人脸方向的一致性,其中,设两眼之间的距离为d,中点为O;
S3003:根据面部特征点和几何模型确定矩形特征区域,以中点O为基准,左右各剪切d,垂直方向各取0.5d和1.5d的矩形区域进行裁剪;
S3004:对人脸子区域图像进行尺度变换,以获得统一的尺寸,实现图像的几何归一化。
10.根据权利要求7所述的方法,其中,所述分层伪三维注意力卷积神经网络的性能通过以下指标进行评价:
准确率
精确率
错误的将其他类预测为本类比例
召回率
其中,TP表示正确的预测为本类,FP表示错误的将其他类预测为本类,TN表示正确的预测为其他类,FN表示错误的将本类预测为其他类。