1.一种高质量的语音转换方法,包括训练部分和转换部分:
1)、训练部分步骤:
1-1)获取源说话人和目标说话人的平行语料库;
1-2)使用AHOcoder语音分析模型提取语音特征参数和对数基频;
1-3)对步骤1-2)中的语音特征参数进行DTW;
2)、转换部分步骤:
2-1)输入待转换的源说话人语音;
2-2)使用AHOcoder语音分析模型提取特征参数和对数基频;
2-3)使用ISODATA+GMM和训练时得到的参数λ,求取后验条件概率矩阵;
2-4)将频率弯折因子α(x,λ)和幅度调节因子s(x,λ)代入BLFW+AS转换函数,求得转换后的特征参数;
2-5)将对数基频代入训练时得到的基频转换函数得到转换后的对数基频;
2-6)使用AHOdecoder语音合成模型将转换后的特征参数和对数基频合成转换后的语音。
其特征在于,所述训练部分步骤中,还包括:
1-4)使用迭代自组织算法ISODATA对步骤1-3)中的特征参数进行GMM训练的初始值设定,并用EM算法进行GMM训练,得到GMM参数λ,P(X|λ);
1-5)使用步骤1-4)中的后验条件概率矩阵P(X|λ)进行BLFW+AS训练,得到频率弯折因子α(x,λ)和幅度调节因子s(x,λ),从而构建BLFW+AS转换函数;使用对数基频的均值和方差建立源语音基音频率和目标语音基音频率之间的转换函数。
2.根据权利要求1所述的一种高质量语音转换方法,其特征在于,训练部分步骤1-4)中所述的高斯分类数是根据说话人语音特征参数的ISODATA具体分布来决定的。
3.根据权利要求1所述的一种高质量语音转换方法,其特征在于,训练部分步骤1-5)中频率弯折因子和幅度调节因子是根据ISODATA+GMM训练得到的后验条件概率矩阵来训练得到的。