利索能及
我要发布
收藏
专利号: 2020107617050
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种建立表情识别模型方法,其特征在于,包括下述步骤:

获取多张第一训练图像数据以及多张第二训练图像数据;

通过所述多张第一训练图像数据以及所述多张第二训练图像数据,训练残差神经网络,得到目标残差神经网络以及所述多张第一训练图像对应输出的特征值;

根据所述特征值,获取多张目标图像数据、所述多张目标图像数据对应的聚类中心、以及所述多张目标图像数据对应的基准图;

为每一张所述目标图像数据,随机抽取同一所述聚类中心,并且不同基准图的至少两张所述目标图像数据作为第一输入图像数据,得到与所述聚类中心相对应的一组配对的第一输入图像数据;

为每一张目标图像数据的配对的所述第一输入图像数据,随机抽取相对应不同所述聚类中心的至少一张基准图,得到与所述第一输入图像数据对应的第二输入图像数据;

将所述第一输入图像数据、所述第二输入图像数据以及所述第一输入图像数据对应的聚类中心输入至EmtionNet;

通过三元损失函数训练所述EmtionNet,得到训练好的EmtionNet。

2.根据权利要求1所述的建立表情识别模型方法,其特征在于,所述通过所述多张第一训练图像数据以及所述多张第二训练图像数据,训练残差神经网络,得到目标残差神经网络以及所述多张第一训练图像对应输出的特征值的步骤具体包括:通过所述多张第一训练图像数据训练初始残差神经网络,得到训练好的残差神经网络;

获取第二训练图像数据,通过所述第二训练图像数据微调所述训练好的残差神经网络,得到目标残差神经网络;

去除所述目标残差神经网络的逻辑回归层,将所述多张第一训练图像数据输入至所述目标残差神经网络,得到所述多张第一训练图像对应输出的特征值。

3.根据权利要求2所述的建立表情识别模型方法,其特征在于,所述通过所述多张第一训练图像数据训练初始残差神经网络,得到训练好的残差神经网络的步骤具体包括:获取所述多张第一训练图像数据以及所述第一训练图像数据所对应的标注标签;

将所述第一训练图像数据以及所述对应的标注标签输入至所述初始残差神经网络;

通过 训练所述初始残差神经网络,得到训

练好的残差神经网络,其中i,j为所述第一训练图像数据的图像标号,x为所述残差神经网络输出特征,W为神经元的权重,m为超参数,L为损失函数的值,s为固定值, 为向量i以及向量j之间的夹角,X*为所述残差神经网络输出特征归一化前的值,W*为所述神经元的权重归一化前的值;

将所述训练好的残差神经网络部署至客户端。

4.根据权利要求1-3任一项所述的建立表情识别模型方法,其特征在于,所述根据所述特征值,获取多张目标图像数据、所述多张目标图像数据对应的聚类中心、以及所述多张目标图像数据对应的基准图的步骤之前还包括:通过k均值聚类算法聚类所述述多张第一训练图像对应输出的特征值,得到7个聚类中心;

预设第一预设值m;

通过k均值聚类算法为每个所述聚类中心聚类所述第一预设值个聚类中心,得到每个所述聚类中心对应的m个基准图。

5.根据权利要求4中所述的建立表情识别模型方法,其特征在于,所述通过三元损失函数训练所述EmtionNet的步骤具体包括:通过L=max(d(a,p)-d(a,n)+margin,0)训练所述EmtionNet,得到EmtionNet,其中d(a,p)为同一个聚类中心的输入图像,d(a,n)为不同一个聚类中心的输入图像,margin为超参数;

将所述训练好的EmtionNet部署至客户端。

6.根据权利要5中所述的建立表情识别模型方法,其特征在于,所述通过三元损失函数训练所述EmtionNet的步骤之后还包括:获取多张测试集图像以及所述多张测试集图像对应的表情标签;

将所述多张测试集图像输入至所述训练好的EmtionNet,得到多个表情识别结果;

若所述表情标签与对应所述表情识别结果相同,则将所述测试集图像对应的识别结果设为正确;

统计正确识别结果的数量,并计算所述正确识别结果的数量与所述表情标签数量的百分比,作为所述EmtionNet的准确度。

7.根据权利要求6所述的建立表情识别模型方法,其特征在于,所述统计正确识别结果的数量,并计算所述正确识别结果的数量与所述表情标签数量的百分比,作为所述EmtionNet的准确度之后还包括:若所述EmtionNet的准确度低于预设精确度,则调整所述EmtionNet模型中的参数,重新训练。

8.一种建立表情识别模型装置,其特征在于,包括:

训练数据获取模块,用于获取多张第一训练图像数据以及多张第二训练图像数据;

残差神经网络训练模块,用于通过所述多张第一训练图像数据以及所述多张第二训练图像数据,训练残差神经网络,得到目标残差神经网络以及所述多张第一训练图像对应输出的特征值;

基准图获取模块,用于根据所述特征值,获取多张目标图像数据、所述多张目标图像数据对应的聚类中心、以及所述多张目标图像数据对应的基准图;

聚类模块,用于为每一张所述目标图像数据,随机抽取同一所述聚类中心,并且不同基准图的至少两张所述目标图像数据作为第一输入图像数据,得到与所述聚类中心相对应的一组配对的第一输入图像数据;

抽取模块,用于为每一张目标图像数据的配对的所述第一输入图像数据,随机抽取相对应不同所述聚类中心的至少一张基准图,得到与所述第一输入图像数据对应的第二输入图像数据;

输入模块,用于将所述第一输入图像数据、所述第二输入图像数据以及所述第一输入图像数据对应的聚类中心输入至EmtionNet;

EmtionNet训练模块,用于通过三元损失函数训练所述EmtionNet,得到训练好的EmtionNet。

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的建立表情识别模型方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的建立表情识别模型方法的步骤。