利索能及
我要发布
收藏
专利号: 2023111415676
申请人: 宁波尚煦智能科技有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2024-07-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于人工智能的在线服务反馈交互方法,其特征在于,所述方法包括:获取范例基础对话音频数据以及范例情感对话音频数据,所述范例基础对话音频数据对应携带有第一先验对话知识点数据以及携带有第一先验情感类别数据,所述范例情感对话音频数据对应携带有第二先验对话知识点数据以及携带有第二先验情感类别数据,所述第一先验情感类别数据与所述第二先验情感类别数据分别对应不同的对话情感标签;

基于所述范例基础对话音频数据以及所述范例情感对话音频数据,生成范例融合对话音频数据,所述范例融合对话音频数据具有所述第一先验对话知识点数据以及所述第二先验情感类别数据;

依据所述范例融合对话音频数据,利用对话音频特征训练网络获取所述范例融合对话音频数据的第一估计对话知识点数据以及第一估计情感类别数据;

依据所述范例情感对话音频数据,利用所述对话音频特征训练网络获取所述范例情感对话音频数据的第二估计对话知识点数据以及第二估计情感类别数据;

基于所述范例融合对话音频数据的所述第一先验对话知识点数据、所述第一估计对话知识点数据、所述范例融合对话音频数据的所述第二先验情感类别数据、所述第一估计情感类别数据、所述范例情感对话音频数据的所述第二先验对话知识点数据、所述第二估计对话知识点数据、所述范例情感对话音频数据的所述第二先验情感类别数据以及所述第二估计情感类别数据,对所述对话音频特征训练网络的网络权重信息进行优化,直至符合网络收敛要求,生成对话音频特征提取网络;

获取目标用户的目标对话音频数据,并依据所述目标对话音频数据,通过对话音频特征提取网络获取估计对话知识点数据以及估计情感类别数据,基于所述估计对话知识点数据以及估计情感类别数据,对所述目标用户进行在线服务反馈交互;

所述获取范例基础对话音频数据以及范例情感对话音频数据,包括:

获取基础对话音频数据序列,所述基础对话音频数据序列包括W个基础对话音频数据;

将所述基础对话音频数据序列中的一个基础对话音频数据作为所述范例基础对话音频数据;

获取情感对话音频数据序列,所述情感对话音频数据序列包括Q个情感对话音频数据;

将所述情感对话音频数据序列中的一个情感对话音频数据作为所述范例情感对话音频数据;

所述获取情感对话音频数据序列,包括:

获取候选情感对话音频数据序列,所述候选情感对话音频数据序列包括L个候选情感对话音频数据,所述L大于所述Q;

提取所述候选情感对话音频数据序列中的每个候选情感对话音频数据所对应的情感表征矢量;

基于第一分簇数量以及各所述候选情感对话音频数据所对应的情感表征矢量,对所述L个候选情感对话音频数据进行分簇,生成V个第一分簇簇心,所述第一分簇数量为所述V,所述V小于所述L;

基于第二分簇数量以及各所述候选情感对话音频数据所对应的情感表征矢量,对所述L个候选情感对话音频数据进行分簇,生成S个第二分簇簇心,所述第二分簇数量为所述S,所述S大于所述V且小于所述L;

获取与各所述第一分簇簇心的偏离度最小的情感表征矢量,生成V个情感表征矢量;

获取与各所述第二分簇簇心的偏离度最小的情感表征矢量,生成S个情感表征矢量;

基于所述V个情感表征矢量中每个情感表征矢量所对应的候选情感对话音频数据,以及所述S个情感表征矢量中每个情感表征矢量所对应的候选情感对话音频数据,生成所述情感对话音频数据序列。

2.根据权利要求1所述的基于人工智能的在线服务反馈交互方法,其特征在于,所述提取所述候选情感对话音频数据序列中的每个候选情感对话音频数据所对应的情感表征矢量,包括:通过音频对话情感表征网络所包括的编码器提取所述候选情感对话音频数据序列中的每个候选情感对话音频数据所对应的情感编码特征;

利用所述音频对话情感表征网络所包括的特征降维参数层获取各所述候选情感对话音频数据所对应的情感表征矢量。

3.根据权利要求1所述的基于人工智能的在线服务反馈交互方法,其特征在于,所述基于所述范例基础对话音频数据以及所述范例情感对话音频数据,生成范例融合对话音频数据,包括:依据所述范例基础对话音频数据以及所述范例情感对话音频数据,通过情感特征映射神经网络所包括的编码器,获取所述范例基础对话音频数据所对应的第一对话特征矢量,以及所述范例情感对话音频数据所对应的第二对话特征矢量;

依据所述第一对话特征矢量以及所述第二对话特征矢量,利用所述情感特征映射神经网络所包括的情感特征转换器获取目标对话特征矢量;

依据所述目标对话特征矢量,利用所述情感特征映射神经网络所包括的解码器获取所述范例融合对话音频数据。

4.根据权利要求1所述的基于人工智能的在线服务反馈交互方法,其特征在于,所述基于所述范例基础对话音频数据以及所述范例情感对话音频数据,生成范例融合对话音频数据,包括:基于所述范例情感对话音频数据所对应所述第二先验情感类别数据,确定情感特征映射神经网络;

依据所述范例基础对话音频数据,利用所述情感特征映射神经网络获取所述范例融合对话音频数据。

5.根据权利要求1所述的基于人工智能的在线服务反馈交互方法,其特征在于,所述基于所述范例融合对话音频数据的所述第一先验对话知识点数据、所述第一估计对话知识点数据、所述范例融合对话音频数据的所述第二先验情感类别数据、所述第一估计情感类别数据、所述范例情感对话音频数据的所述第二先验对话知识点数据、所述第二估计对话知识点数据、所述范例情感对话音频数据的所述第二先验情感类别数据以及所述第二估计情感类别数据,对所述对话音频特征训练网络的网络权重信息进行优化,包括:基于所述范例融合对话音频数据的所述第一先验对话知识点数据以及所述第一估计对话知识点数据,确定第一对话知识点训练误差值;

基于所述范例融合对话音频数据的所述第二先验情感类别数据以及所述第一估计情感类别数据,确定第一情感特征训练误差值;

基于所述范例情感对话音频数据的所述第二先验对话知识点数据以及所述第二估计对话知识点数据,确定第二对话知识点训练误差值;

基于所述范例情感对话音频数据的所述第二先验情感类别数据以及所述第二估计情感类别数据,确定第二情感特征训练误差值;

对所述第一对话知识点训练误差值、所述第一情感特征训练误差值、所述第二对话知识点训练误差值以及所述第二情感特征训练误差值进行融合,生成目标训练误差值;

基于所述目标训练误差值对所述对话音频特征训练网络的网络权重信息进行优化。

6.根据权利要求1所述的基于人工智能的在线服务反馈交互方法,其特征在于,所述方法还包括:依据所述范例基础对话音频数据,利用所述对话音频特征训练网络获取所述范例基础对话音频数据的第三估计对话知识点数据以及第三估计情感类别数据;

所述基于所述范例融合对话音频数据的所述第一先验对话知识点数据、所述第一估计对话知识点数据、所述范例融合对话音频数据的所述第二先验情感类别数据、所述第一估计情感类别数据、所述范例情感对话音频数据的所述第二先验对话知识点数据、所述第二估计对话知识点数据、所述范例情感对话音频数据的所述第二先验情感类别数据以及所述第二估计情感类别数据,对所述对话音频特征训练网络的网络权重信息进行优化,包括:基于所述范例融合对话音频数据的所述第一先验对话知识点数据以及所述第一估计对话知识点数据,确定第一对话知识点训练误差值;

基于所述范例融合对话音频数据的所述第二先验情感类别数据以及所述第一估计情感类别数据,确定第一情感特征训练误差值;

基于所述范例情感对话音频数据的所述第二先验对话知识点数据以及所述第二估计对话知识点数据,确定第二对话知识点训练误差值;

基于所述范例情感对话音频数据的所述第二先验情感类别数据以及所述第二估计情感类别数据,确定第二情感特征训练误差值;

基于所述范例基础对话音频数据的所述第一先验对话知识点数据以及所述第三估计对话知识点数据,确定第三对话知识点训练误差值;

基于所述范例基础对话音频数据的所述第一先验情感类别数据以及所述第三估计情感类别数据,确定第三情感特征训练误差值;

对所述第一对话知识点训练误差值、所述第一情感特征训练误差值、所述第二对话知识点训练误差值、所述第二情感特征训练误差值、所述第三对话知识点训练误差值以及所述第三情感特征训练误差值进行融合,生成目标训练误差值;

基于所述目标训练误差值对所述对话音频特征训练网络的网络权重信息进行优化。

7.一种大数据系统,其特征在于,所述大数据系统包括处理器和用于存储能够在处理器上运行的计算机程序的存储器,所述处理器用于运行所述计算机程序时,执行权利要求

1‑6中任意一项所述的基于人工智能的在线服务反馈交互方法。