利索能及
我要发布
收藏
专利号: 201710734303X
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于情绪识别的语音质检方法,其特征在于,包括:

获取待测语音数据;所述待测语音数据的获取方式包括在线实时获取和离线获取两种方式;其中,所述在线实时获取是指在通话过程中对通话内容进行录音,以获取待测语音数据;所述离线获取是指获取已保存在数据库中的所述待测语音数据;

对所述待测语音数据进行特征提取,获取语音特征;

采用情绪识别模型对所述语音特征进行识别,获取情绪识别结果;

将所述情绪识别结果发送给关联终端,以使所述关联终端显示所述情绪识别结果;其中,所述关联终端为与坐席人员或质检人员进行人机交互的终端;

所述采用情绪识别模型对所述语音特征进行识别,获取情绪识别结果,包括:

采用基于神经网络的情绪识别模型对所述语音特征进行识别,判断能否输出准确识别结果;所述采用基于神经网络的情绪识别模型对所述语音特征进行识别是指:将获取的所述语音特征输入所述情绪识别模型的输入层,通过所述情绪识别模型的隐藏层计算获取所述语音特征中对应于各情绪的概率,并比较各所述情绪的概率中最高概率和第二高概率的差值是否大于预设概率差值;在最高概率和第二高概率的差值大于预设概率差值时,通过所述情绪识别模型的输出层输出准确识别结果;在最高概率和第二高概率的差值不大于预设概率差值时,通过所述情绪识别模型的输出层输出模糊识别结果;所述准确识别结果是用于指示语音特征对应一具体情绪的识别结果,所述模糊识别结果用于指示语音特征无法对应一具体情绪的识别结果;

若能输出所述准确识别结果,则将所述准确识别结果作为所述情绪识别结果;

若不能输出所述准确识别结果,则采用基于支持向量机的情绪识别模型对所述语音特征进行识别,获取所述情绪识别结果;所述采用基于支持向量机的情绪识别模型对所述语音特征进行识别是指:基于支持向量机的情绪识别模型中需分别创建基于SVM的高兴识别模型、愤怒识别模型、悲伤识别模型、烦躁识别模型和平静识别模型;将所述语音特征分别通过高兴识别模型、愤怒识别模型、悲伤识别模型、烦躁识别模型和平静识别模型进行识别,分别获取相应的情绪得分;将五个情绪得分进行比较,选取得分最高的情绪作为情绪识别结果。

2.如权利要求1所述的基于情绪识别的语音质检方法,其特征在于,所述待测语音数据携带数据来源ID;

所述采用情绪识别模型对所述语音特征进行识别,获取情绪识别结果,包括:

基于所述待测语音数据的数据来源ID,获取与所述数据来源ID相关联的目标情绪识别模型;

采用所述目标情绪识别模型对所述语音特征进行识别,获取所述情绪识别结果。

3.如权利要求2所述的基于情绪识别的语音质检方法,其特征在于,所述基于情绪识别的语音质检方法还包括:预先训练与所述数据来源ID相关联的目标情绪识别模型;

所述预先训练与所述数据来源ID相关联的目标情绪识别模型,包括:

基于所述数据来源ID,获取数据库中与所述数据来源ID关联的训练语音数据;

判断所述训练语音数据的数量是否达到情绪模型训练阈值;

若所述训练语音数据达到所述情绪模型训练阈值,则基于与所述数据来源ID关联的所述训练语音数据进行情绪识别模型训练,获取所述目标情绪识别模型。

4.如权利要求1所述的基于情绪识别的语音质检方法,其特征在于,所述获取待测语音数据,包括:获取呼叫终端实时采集的所述待测语音数据;

所述将所述情绪识别结果发送给关联终端,以使所述关联终端显示所述情绪识别结果,包括:将所述情绪识别结果实时发送给所述关联终端,以使所述关联终端显示所述情绪识别结果。

5.一种基于情绪识别的语音质检装置,其特征在于,包括:

待测语音数据获取模块,用于获取待测语音数据;所述待测语音数据的获取方式包括在线实时获取和离线获取两种方式;其中,所述在线实时获取是指在通话过程中对通话内容进行录音,以获取待测语音数据;所述离线获取是指获取已保存在数据库中的所述待测语音数据;

语音数据特征获取模块,用于对所述待测语音数据进行特征提取,获取语音特征;

情绪识别结果获取模块,用于采用情绪识别模型对所述语音特征进行识别,获取情绪识别结果;

情绪识别结果反馈模块,用于将所述情绪识别结果发送给关联终端,以使所述关联终端显示所述情绪识别结果;其中,所述关联终端为与坐席人员或质检人员进行人机交互的终端;

所述情绪识别结果获取模块包括:

识别结果输出判断单元,用于采用基于神经网络的情绪识别模型对所述语音特征进行识别,判断能否输出准确识别结果;所述采用基于神经网络的情绪识别模型对所述语音特征进行识别是指:将获取的所述语音特征输入所述情绪识别模型的输入层,通过所述情绪识别模型的隐藏层计算获取所述语音特征中对应于各情绪的概率,并比较各所述情绪的概率中最高概率和第二高概率的差值是否大于预设概率差值;在最高概率和第二高概率的差值大于预设概率差值时,通过所述情绪识别模型的输出层输出准确识别结果;在最高概率和第二高概率的差值不大于预设概率差值时,通过所述情绪识别模型的输出层输出模糊识别结果;所述准确识别结果是用于指示语音特征对应一具体情绪的识别结果,所述模糊识别结果用于指示语音特征无法对应一具体情绪的识别结果;

第一识别结果处理单元,用于在能输出所述准确识别结果时,将所述准确识别结果作为所述情绪识别结果;

第二识别结果处理单元,用于在不能输出所述准确识别结果时,采用基于支持向量机的情绪识别模型对所述语音特征进行识别,获取所述情绪识别结果;所述采用基于支持向量机的情绪识别模型对所述语音特征进行识别是指:基于支持向量机的情绪识别模型中需分别创建基于SVM的高兴识别模型、愤怒识别模型、悲伤识别模型、烦躁识别模型和平静识别模型;将所述语音特征分别通过高兴识别模型、愤怒识别模型、悲伤识别模型、烦躁识别模型和平静识别模型进行识别,分别获取相应的情绪得分;将五个情绪得分进行比较,选取得分最高的情绪作为情绪识别结果;

或者,所述待测语音数据携带数据来源ID;

所述情绪识别结果获取模块包括:

目标模型获取单元,用于基于所述待测语音数据的数据来源ID,获取与所述数据来源ID相关联的目标情绪识别模型;

识别结果获取单元,用于采用所述目标情绪识别模型对所述语音特征进行识别,获取所述情绪识别结果。

6.如权利要求5所述的基于情绪识别的语音质检装置,其特征在于,所述基于情绪识别的语音质检装置还包括:目标模型训练模块,用于预先训练与所述数据来源ID相关联的目标情绪识别模型;

所述目标模型训练模块包括:

训练语音数据获取单元,用于基于所述数据来源ID,获取数据库中与所述数据来源ID关联的训练语音数据;

数量判断单元,用于判断所述训练语音数据的数量是否达到情绪模型训练阈值;

目标模型训练单元,用于在所述训练语音数据达到所述情绪模型训练阈值时,基于与所述数据来源ID关联的所述训练语音数据进行情绪识别模型训练,获取所述目标情绪识别模型;

所述待测语音数据获取模块,还用于获取关联终端实时采集的所述待测语音数据;

所述情绪识别结果反馈模块,还用于将所述情绪识别结果实时发送给所述关联终端,以使所述关联终端显示所述情绪识别结果。

7.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述基于情绪识别的语音质检方法的步骤。

8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述基于情绪识别的语音质检方法的步骤。