利索能及
我要发布
收藏
专利号: 2020102160585
申请人: 成都东方天呈智能科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-06-25
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种融合红外图像训练的人脸识别网络构建方法,其特征在于,包括以下步骤:采用卷积层、批归一化层、修正线性单元层和深度可分离卷积层封装成网络单块;

从前至后按卷积层、批归一化层、修正线性单元层和网络单块依次堆叠,得到网络块,复制并堆叠4个网络块,得到主干网络,并在所述主干网络后依次插入随机失活层和全连接层,以得到网络模型;

将人脸的RGB图像与人脸对应的红外图像堆叠融合成四通道图像,得到训练集样本,将所述训练集样本输入至网络模型;

利用附加角度间隔的柔性最大值损失函数计算训练集样本的真实标签与全连接层输出的预测结果之间的损失值;

随机初始化网络模型的网络参数,并设定超参数;

采用随机梯度下降法作为网络优化策略,并根据设定的迭代次数重复计算,直至损失值收敛得到最优的网络模型,所述网络单块为从前至后按卷积层、批归一化层、修正线性单元层、深度可分离卷积层、批归一化层、修正线性单元层、卷积层和批归一化层封装而成,所述修正线性单元层的最大限制值为6。

2.根据权利要求1所述的一种融合红外图像训练的人脸识别网络构建方法,其特征在于,所述主干网络中含有4个网络块,且4个网络块中的网络单块数量依次为1、2、4和1。

3.根据权利要求1所述的一种融合红外图像训练的人脸识别网络构建方法,其特征在于,将人脸的RGB图像的三通道和人脸对应的红外图像堆叠融合成四通道图像。

4.根据权利要求1所述的一种融合红外图像训练的人脸识别网络构建方法,其特征在于,所述附加角度间隔的柔性最大值损失函数的表达式为:其中, 表示预测为真实标签yi对应的余弦角度,θj表示预测为j类的余弦角度,m表示调整角度间隔,s表示控制特征比例,N表示批处理的样本总数。

5.根据权利要求4所述的一种融合红外图像训练的人脸识别网络构建方法,其特征在于,所述调整角度间隔m的取值为0.5,且控制特征比例s的取值为64。

6.根据权利要求1所述的一种融合红外图像训练的人脸识别网络构建方法,其特征在于,采用随机梯度下降法作为网络优化策略,并根据设定的迭代次数重复计算,直至损失值收敛得到最优的网络模型,包括以下步骤:步骤S01,采用预热余弦学习率衰减法控制学习率,并预设预热迭代次数为2000次;

步骤S02,采用带牛顿动量参数的随机梯度下降法优化整个网络的权重参数,所述带牛顿动量参数为0.9;

步骤S03,提取卷积特征并求得损失值,利用随机梯度下降法进行反向传播优化权重参数;

步骤S04,重复步骤S03,直至损失值收敛得到最优的网络模型。

7.根据权利要求6所述的一种融合红外图像训练的人脸识别网络构建方法,其特征在于,所述学习率取值为0.001。

8.根据权利要求1所述的一种融合红外图像训练的人脸识别网络构建方法,其特征在于,所述随机初始化网络模型的网络参数,并设定超参数,所述网络参数和超参数包括:批处理大小、批归一化层的权重衰减率、调整角度间隔、控制特征比例、预热迭代次数、最大迭代次数、随机失活层的失活率和随机梯度下降法的动量参数;

所述批处理大小取值为128;所述批归一化层的权重衰减率取值为0.001;所述调整角度间隔取值为0.5;所述控制特征比例的取值为64;所述预热迭代次数取值为2000次;所述最大迭代次数取值为20000次;所述随机失活层的失活率取值为0.5;所述随机梯度下降法的动量参数取值为0.9。