利索能及
我要发布
收藏
专利号: 2019101824622
申请人: 南京邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于会议场景的噪声分类去除方法,其特征在于:包括以下步骤:

步骤(1):首先根据会议场景下噪声的特点,将会议场景中的非背景噪声分为非目标说话人噪声、会议设备噪声、用户行为噪声、采集设备噪声;

步骤(2):根据不同种类噪声与目标说话人语音之间在时域波形图和语谱图上的区别,利用双MIC降噪方法去除采集设备噪声,利用小波降噪方法去除用户行为噪声,利用SOX降噪方法去除会议设备噪声,利用PCA降噪方法去除非目标说话人噪声,从而去除会议场景下的噪声。

2.根据权利要求1所述的一种基于会议场景的噪声分类去除方法,其特征在于:在步骤(2)中,通过控制变量法得到各类噪声的时域波形图和语谱图。

3.根据权利要求1所述的一种基于会议场景的噪声分类去除方法,其特征在于:在步骤(2)中,双MIC降噪方法具体包括以下步骤:步骤(2.1.1):先在语音采集设备的上端设置一个用于采集环境噪音的降噪麦克风,并在语音采集设备的下端设置一个用于采集环境噪音及用户语音的采集语音麦克风;

步骤(2.1.2):然后将降噪麦克风与采集语音麦克风采集的语音信号强度进行对比,分出背景噪声与语音信号,然后将噪声信号清除,语音信号保留。

4.根据权利要求1所述的一种基于会议场景的噪声分类去除方法,其特征在于:小波降噪方法去除用户行为噪声方法具体包括以下步骤:步骤(2.2.1):采用三层小波变换架构,然后选用合适的阈值函数和阈值去除带噪语音信号中的高频分量;

步骤(2.2.2):最后对小波变换后的频率分量执行重构信号操作,将噪声信号清除,语音信号保留。

5.根据权利要求1所述的一种基于会议场景的噪声分类去除方法,其特征在于:SOX降噪方法具体包括以下步骤:步骤(2.3.1):先为SOX提供此时用户所处的环境噪声,从而生成环境噪声的Profile文件;其中,SOX处理命令如下:os.system(“SOX{0}–nnoiseprof{1}”.format(noise_wav,noise_model))步骤(2.3.2):提供待去除噪声的音频文件及降噪等级,并用SOX的命令来去除音频文件中的环境噪声,SOX处理命令如下:os.system(“SOX{0}{1}noisered{2}{3}”.format(fname,fname_clean,noise_model,thres))。