利索能及
我要发布
收藏
专利号: 2021109205153
申请人: 内蒙古工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种蒙古语语音特征融合方法,其特征在于,包括:获取原始蒙古语语音数据;

对所述原始蒙古语语音数据进行提取,得到蒙古语声学特征以及蒙古语个性特征;

将所述蒙古语声学特征以及所述蒙古语个性特征利用门控融合机制进行融合,得到整体声学特征。

2.根据权利要求1所述的一种蒙古语语音特征融合方法,其特征在于,得到蒙古语声学特征的过程具体包括:对所述原始蒙古语语音数据提取FBANKs特征;

对所述FBANKs特征通过自注意力机制学习特征内部信息的依赖关系,并分配权重,得到对应的所述蒙古语声学特征。

3.根据权利要求2所述的一种蒙古语语音特征融合方法,其特征在于,得到所述蒙古语个性特征的过程具体包括:对所述原始蒙古语语音数据提取t‑vector特征;

对所述t‑vector特征通过自注意力机制进行提取,得到对应的蒙古语个性特征。

4.根据权利要求3所述的一种蒙古语语音特征融合方法,其特征在于,得到整体声学特征的过程具体包括:对所述蒙古语声学特征及所述蒙古语个性特征去除冗余信息;

调整所述蒙古语声学特征及所述蒙古语个性特征的输入比例,利用门控融合机制进行融合,得到整体声学特征;

将所述整体声学特征输入声学模型,得到最终训练结果。

5.根据权利要求4所述的一种蒙古语语音特征融合方法,其特征在于,对所述声学模型进行参数更新的过程具体包括:初始化所述声学模型;

利用自适应模型参数更新所述声学模型;

利用损失函数进行有监督训练。

6.一种蒙古语语音特征融合装置,其特征在于,包括:语音数据获取模块(1),用于获取原始蒙古语语音数据;

蒙古语声学特征模块(2),用于对所述原始蒙古语语音数据进行处理,得到蒙古语声学特征;

蒙古语个性特征模块(3),用于对所述原始蒙古语语音数据进行处理,得到蒙古语个性特征;

门控融合模块(4),用于对所述蒙古语声学特征及所述蒙古语个性特征利用门控融合机制进行融合,得到整体声学特征。