利索能及
我要发布
收藏
专利号: 2019108320566
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于大数据的音频评估方法,其特征在于,包括:

获取目标音频数据;

对所述目标音频数据进行离散化处理,以将所述目标音频数据分割为多个目标音频帧;

将每个目标音频帧转化为包括M个频率分量的目标音频序列;及将每个目标音频帧对应的目标音频序列输入至演奏评估模型中,以通过所述演奏评估模型输出所述目标音频数据的目标音频评估参数,所述演奏评估模型为预先训练好的深度学习网络模型;其中,所述深度学习网络模型包括由遗忘门、输入门与输出门组成的解码器。

2.根据权利要求1所述的音频评估方法,其特征在于,所述演奏评估模型依次包括:编码器,所述编码器包括第一网络层、第二网络层和第三网络层,其中,所述第一网络层包括由N个神经元构成的第一双向循环层,所述第二网络层包括由N/2个神经元构成的第二双向循环层,所述第三网络层包括由N/4个循环神经元构成的单向层;

固定编码层,耦合于所述编码器,所述固定编码层包括激活层,用于初始化解码器;

所述解码器,耦合于所述固定编码层,所述解码器包括由多个LSTM单元构成的循环层,并用于为每个目标音频序列输出一个参数范围为0‑M的整数值;

全连接层,耦合于所述解码器,用于接收每个目标音频序列对应的整数值并根据每个目标音频序列对应的整数值输出特征数据;

输出层,耦合于所述解码器,用于根据所述全连接层提供的特征数据计算并输出各个预设评估参数的置信度。

3.根据权利要求2所述的音频评估方法,其特征在于,将每个目标音频帧对应的目标音频序列输入至演奏评估模型中,以通过所述演奏评估模型输出所述目标音频数据的目标音频评估参数的步骤,包括:将每个目标音频序列输入到所述编码器中以及经由所述固定编码层、所述解码器、所述全连接层及所述输出层,并通过所述输出层输出所述各个预设评估参数的置信度;及将置信度最高的预设评估参数确定为所述目标音频评估参数。

4.根据权利要求1所述的音频评估方法,其特征在于,将每个所述目标音频帧转化为包括M个频率分量的目标音频序列的步骤,包括:对每个所述目标音频帧进行去噪处理;

将每个去噪处理后的目标音频帧转化为包括M个频率分量的目标音频序列。

5.根据权利要求1所述的音频评估方法,其特征在于,还包括所述演奏评估模型的训练步骤:获取训练数据集,所述训练数据集中包括多个样本音频数据及对应的样本音频评估参数;

将每个样本音频数据进行离散化处理,以将对应的样本音频数据分割为多个样本音频帧;

将每个所述样本音频帧转化为包括M个频率分量的样本音频序列;

将所述样本音频序列及对应的样本音频评估参数输入至深度学习网络模型中;

基于所述深度学习网络模型将所述样本音频数据的样本音频评估参数的频率最大化,以构建演奏评估模型;

其中,所述深度学习网络模型包括由遗忘门、输入门与输出门组成的解码器。

6.一种基于大数据的音频评估系统,其特征在于,包括:

获取模块,用于获取目标音频数据;

处理模块,用于对所述目标音频数据进行离散化处理,以将所述目标音频数据分割为多个目标音频帧;

转化模块,用于将每个目标音频帧转化为包括M个频率分量的目标音频序列;

执行输出模块,用于将每个目标音频帧对应的目标音频序列输入至演奏评估模型中,以通过所述演奏评估模型输出所述目标音频数据的目标音频评估参数,所述演奏评估模型为预先训练好的深度学习网络模型;其中,所述深度学习网络模型包括由遗忘门、输入门与输出门组成的解码器。

7.根据权利要求6所述的评估系统,其特征在于,所述演奏评估模型依次包括编码器、固定编码层、解码器、全连接层及输出层,所述执行输出模块还用于:将每个目标音频序列输入到所述编码器中以及经由所述固定编码层、所述解码器、所述全连接层及所述输出层,并通过所述输出层输出各个预设评估参数的置信度;及将置信度最高的预设评估参数确定为所述目标音频评估参数。

8.根据权利要求6所述的评估系统,其特征在于,所述转化模块还用于:对每个所述目标音频帧进行去噪处理;

将每个去噪处理后的目标音频帧转化为包括M个频率分量的目标音频序列。

9.一种计算机设备,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1‑5中任一项所述的基于大数据的音频评估方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1‑5中任一项所述的基于大数据的音频评估方法的步骤。