买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于卷积神经网络的多说话人语音分离方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于卷积神经网络的多说话人语音分离方法

￥16800

专利号： 2019109141775

申请人：电子科技大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-12-17

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于卷积神经网络的多说话人语音分离方法，其特征在于，包括以下步骤：S1：获取多说话人语音的频谱图；

S2：构建基于可分离门控卷积神经网络的语音分离模型，所述模型包括嵌入生成网络和吸引子计算网络；所述嵌入生成网络用于将时频点从频谱图映射到高维嵌入空间，所述吸引子计算网络用于在高维嵌入空间中直接计算每个声源的吸引子；

S3：使用基于可分离门控卷积神经网络的嵌入生成网络将频谱图中的时频点映射到高维嵌入空间；

S4：使用吸引子计算网络计算每个声源的吸引子，通过在高维嵌入空间计算每个吸引子与各个时频点的相似度，计算得到每个声源的时频掩膜；

S5：将每个声源的时频掩膜分别与多说话人语音的频谱图相乘，得到分离后每个声源的频谱图。

2.根据权利要求1所述的多说话人语音分离方法，其特征在于：所述语音分离方法使用多个可分离一维卷积块将频谱图的时频点映射到一个高维嵌入空间。

3.根据权利要求2所述的多说话人语音分离方法，其特征在于：所述语音分离方法使用一维门控卷积构成的吸引子计算网络在高维嵌入空间直接计算吸引子。

4.根据权利要求3所述的多说话人语音分离方法，其特征在于：所述吸引子计算网络通过将时间以及频率维度作为卷积操作中的通道维度，在嵌入维度上实现卷积操作，来计算吸引子。

推荐专利

一种卷积增强外部注意力的多说话人时域语音分离方法

发明专利

￥18000

基于并联张量分解卷积神经网络的语音情感识别方法

发明专利

￥22300

一种基于多级残差卷积神经网络的语音情感识别方法

发明专利

￥19800

一种卷积神经网络的注意力模块、注意力机制及卷积神经网络

发明专利

面议

我要求购

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

利索能及

友情链接

关于我们

联系我们