利索能及
我要发布
收藏
专利号: 201810963057X
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种音乐情感识别方法,其特征在于,所述方法包括:

从音频样本数据中提取音频特征数据,所述音频特征数据携带有各个情感维度标注值;

将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模型用于从音频数据中提取出各个情感维度的局部平移不变特征;

通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;

将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型用于识别音频数据在各个情感维度上的音乐情感识别结果;

通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。

2.根据权利要求1所述的方法,其特征在于,在所述从音频样本数据中提取音频特征数据之前,所述方法还包括:按照预设时间间隔对所述音频样本数据进行分段,得到多段分段音频样本数据;

获取对每段分段音频样本数据所属情感维度的标注值,得到多段携带各个情感维度标注值的分段音频样本数据。

3.根据权利要求1所述的方法,其特征在于,所述卷积神经网络为多层结构的网络模型,所述将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型包括:通过所述卷积神经网络的卷积层提取所述音频特征数据中各个情感维度的局部音频特征信息;

通过所述卷积神经网络的全连接层汇总所述各个情感维度的局部音频特征信息,得到多维度的局部音频特征信息;

通过所述卷积神经网络的池化层对所述多维度的局部音频特征信息进行降维处理,得到各个情感维度的局部平移不变特征;

通过所述卷积神经网络的分类层对所述各个情感维度的局部平移不变特征进行分类,得到情感分类模型。

4.根据权利要求1所述的方法,其特征在于,所述递归神经网络为多层结构的网络模型,所述将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型包括:通过所述递归神经网络的全连接层汇总所述各个情感维度的局部平移不变特征,得到多维度的局部平移不变特征;

通过所述递归神经网络的隐含层根据音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数;

通过所述递归神经网络的输出层根据所述多维度的局部平移不变特征在各个情感维度上的权重参数,构建用于识别音频数据在各个情感维度上的音乐情感识别模型。

5.根据权利要求4所述的方法,其特征在于,所述递归神经网络的隐含层内设置有双向门控循环单元,所述通过所述递归神经网络的隐含层根据音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数包括:通过所述双向门控循环单元学习多维度的局部平移不变特征中的时间信息,并根据所述时间信息训练所述多维度的局部平移不变特征在各个情感维度上的权重参数;

根据所述音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数。

6.根据权利要求2所述的方法,其特征在于,在根据所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到音乐情感识别结果之后,所述方法还包括:根据所述多段携带各个音乐情感维度标注值的分段音频样本数据与音乐情感识别结果,计算所述音乐情感识别模型的均方根误差;

将所述音乐情感识别模型的均方根误差作为衡量所述音乐情感识别模型的统计矩阵,对所述音乐情感识别结果进行校验。

7.根据权利要求6所述的方法,其特征在于,在所述将所述音乐情感识别模型的均方根误差作为衡量所述音乐情感识别模型的统计矩阵,对所述音乐情感识别结果进行校验之后,所述方法还包括:将所述音乐情感识别模型的均方根误差作为损失函数反馈至所述递归神经网络模型的隐含层,对所述隐含层的权重参数进行更新。

8.一种音乐情感识别装置,其特征在于,所述装置包括:

提取单元,用于从音频样本数据中提取音频特征数据;

第一训练单元,用于将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模型用于从音频数据中提取出各个情感维度的局部平移不变特征;

分类单元,用于通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;

第二训练单元,用于将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型用于识别音频数据在各个情感维度上的音乐情感识别结果;

识别单元,用于通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述音乐情感识别方法的步骤。

10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述音乐情感识别方法的步骤。