利索能及
我要发布
收藏
专利号: 2021107648509
申请人: 湖南师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种人工智能作曲方法,其特征在于:包括如下步骤:

步骤一,构建预处理模块,将包含若干音乐文件的训练集输入预处理模块得到训练集的音乐文件中的音乐信息并保存为钢琴卷帘格式;所述音乐信息包括音符、音高、起始时间以及音符的时值;

步骤二,通过预处理模块,对所述音乐信息进行清洗,切分成预设长度范围的音乐片段,删除超出预设音高范围的音符;

步骤三,构建数据转换模块,将当下的音乐信息与上一个时间点输入的音乐信息,共同编码为其相应的潜在信息,并保存在潜在空间中;

所述数据转换模块由多个单层双向GRU网络组成,每个时序片段的单层双向GRU网络同时向前一个时序和后一个时序的传递参数,也接受前一个时序和后一个时序的参数;完成对所有音乐特征信息的提取后,由第一个时序的单层双GRU网络和最后一个时序的单层双GRU网络将所有音乐特征信息编码为相应的潜在信息,并保存在潜在空间中;所述潜在信息为数据转换模块提出来的音乐特征信息,所述潜在空间为所有保存潜在信息的变量的集合,为一个或多个一维数组;

步骤四,构建音乐生成模块,提取潜在空间中的低维信息,产生新的音乐信息,将音乐信息进行筛分,并保存为不同音轨,不同乐器的音乐,实现自动作曲;数据转换模块和音乐生成模块构成变分自编码器;数据转换模块作为变分自编码器的编码器网络,音乐生成模块作为变分自编码器的解码器网络;

步骤五,构建音乐评估模块,设置奖励函数,将音乐生成模块输出的音乐与真实音乐进行对比,指导音乐生成模块下一轮的音乐生成;音乐生成模块与音乐评估模块构成GAN神经网络,音乐生成模块作为GAN神经网络的生成器,音乐评估模块作为GAN神经网的鉴别器;

步骤六,在音乐生成模块经多轮训练后,输出效果稳定时,音乐生成模块生成的音乐即为智能作曲作品。

2.如权利要求1所述的人工智能作曲方法,其特征在于:GAN神经网络的目标函数为:

其中,D表示音乐评估函数,G表示音乐生成函数;x表示真实数据输入,Ex~pdata(x)表示从分布pdata中采样x;data表示真实数据,pdata(x)表示真实数据data的分布;z表示噪声数据,pz为噪声数据所服从的分布,pg为生成数据所服从的分布;D(x)表示x在服从padata分布时x的期望,输出为一个最大值为1,最小值为0的值;λ为惩罚项 的参数。

3.如权利要求1所述的人工智能作曲方法,其特征在于:所述音乐生成模块由一种分层次的GRU网络构成,其结构为一层U个GRU网络和一层U×n个GRU网络;所述GRU网络,有两个门控制单元,一个更新门,和一个重置门;

构成函数如下

zt=σ(Wz·[ht‑1,xt])

rt=σ(Wr·[ht‑1,xt])

yt=σ(Wo·ht)

其中:zt表示t时刻的更新门,rt表示t时刻的重置门,表示t时刻的候选激活状态,ht表示t时刻的激活状态,ht‑1表示(t‑1)时刻的隐层状态,xt表示t时刻的输入,σ表示激活函数,Wr、Wz、Wh、Wo均为要学习的权重参数;更新门z由当前状态需要被遗忘的历史信息和接受的新信息决定;重置门r由候选状态从历史信息中得到的信息决定;更新门控制前一时刻有多少信息传递到当前状态,更新门的数值越大则传递的信息越多;而重置门则控制前一状态有多少信息被输入进当前状态下,重置门越大,则写入当前状态的信息越多。

4.如权利要求1所述的人工智能作曲方法,其特征在于:所述音乐评估模块,包括x个GRU网络,x的大小取决于音乐生成模块输入的音乐信息序列长度,x大小为输入音乐信息序列长度/a,a为设定的每小节时间分辨率宽度;在开始训练之前指定好奖励函数,奖励函数的设置如下,若两个相邻的音符之间的音程差大于预设音阶的话将被记为0,反之则记为1,g(x)则是每段音乐的平均值;即:若一段音乐有n组相邻音符的音程差大于预设音阶,剩余的m组小于等于预设音阶,则用如下公式表示:所述音乐评估模块将音乐生成模块输出的音乐序列作为输入,通过比对真实音乐序列判断它是真实的还是生成的音乐,并依据判断结果决定是否对音乐评估模块施加惩罚。

5.如权利要求4所述的人工智能作曲方法,其特征在于:a=96。

6.如权利要求4所述的人工智能作曲方法,其特征在于:所述预设音阶设置为84。

7.一种人工智能作曲系统,其特征在于,包括预处理模块、数据转换模块、音乐生成模块和音乐评估模块;

所述预处理模块用于提取音乐文件中的音乐信息并保存为钢琴卷帘格式,还用于对音乐信息进行清洗,切分成预设长度范围的音乐片段,删除超出预设音高范围的音符;

所述数据转换模块用于将当下的音乐信息与上一个时间点输入的音乐信息,共同编码为其相应的潜在信息,并保存在潜在空间中;

所述数据转换模块由多个单层双向GRU网络组成,每个时序片段的单层双向GRU网络同时向前一个时序和后一个时序的传递参数,也接受前一个时序和后一个时序的参数;完成对所有音乐特征信息的提取后,由第一个时序的单层双GRU网络和最后一个时序的单层双GRU网络将所有音乐特征信息编码为相应的潜在信息,并保存在潜在空间中;所述潜在信息为数据转换模块提出来的音乐特征信息,所述潜在空间为所有保存潜在信息的变量的集合,为一个或多个一维数组;

所述音乐生成模块用于提取潜在空间中的低维信息,产生新的音乐信息,将音乐信息进行筛分,并保存为不同音轨,不同乐器的音乐,实现自动作曲;

所述音乐评估模块用于设置奖励函数,将音乐生成模块输出的音乐与真实音乐进行对比,指导音乐生成模块下一轮的音乐生成;

其中,数据转换模块和音乐生成模块构成变分自编码器;数据转换模块作为变分自编码器的编码器网络,音乐生成模块作为变分自编码器的解码器网络;

音乐生成模块与音乐评估模块构成GAN神经网络,音乐生成模块作为GAN神经网络的生成器,音乐评估模块作为GAN神经网的鉴别器。