利索能及
我要发布
收藏
专利号: 2015108646488
申请人: 南京师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种手机麦克风的语音增强系统,其特征在于,包括:第一模数转换模块、第二模数转换模块、语音和噪声活动检测装置以及消噪装置;所述第一模数转换模块连接手机上的主麦克风,将主麦克风接收到的模拟带噪语音信号转换为主麦克风数字带噪语音信号并传递给语音和噪声活动检测装置和消噪装置;所述第二模数转换模块连接手机上的次麦克风,将次麦克风接收到的模拟带噪语音信号转换为次麦克风数字带噪语音信号并传递给语音和噪声活动检测装置和消噪装置;所述语音和噪声活动检测装置根据主麦克风数字带噪语音信号和次麦克风数字带噪语音信号为所述消噪装置确定语音采样点和噪声采样点;消噪装置包括时域消噪模块和频域消噪模块,时域消噪模块在语音采样点先将次麦克风数字带噪语音信号中的语音信号进行消除处理得到背景噪声信号,再在噪声采样点对主麦克风数字带噪语音信号中的背景噪声信号进行降噪处理得到主麦克风时域增强语音信号;频域消噪模块先分别对主麦克风时域增强语音信号和背景噪声信号进行短时傅里叶变化得到主麦克风频域增强语音信号和频域背景噪声信号,然后,在频域中先通过主麦克风噪声估计单元估计出主麦克风频域增强信号中的噪声,再利用语音的基音和谐波检测单元分别标记出语音和噪声频点并针对语音和噪声频点控制维纳滤波器参数进行调整,通过维纳滤波器将估计的噪声从主麦克风频域增强信号中滤除得到频域增强信号,最后,通过短时傅里叶逆变换将频域增强信号转化到时域,得到最终的消噪信号。

2.根据权利要求1所述的手机麦克风的语音增强系统,其特征在于,所述时域消噪模块包括:

第一滤波器,以主麦克风数字带噪语音信号和次麦克风数字带噪语音信号为输入信号,在所述语音采样点调整滤波器参数将纯净语音信号从所述次麦克风数字带噪语音信号中滤除得到所述背景噪声信号;

第二滤波器,以主麦克风数字带噪语音信号作为参考信号,将所述第一滤波器输出的背景噪声信号作为输入,在所述噪声采样点调整滤波器参数将所述背景噪声信号从所述主麦克风数字带噪语音信号中滤除,得到所述主麦克风时域增强语音信号。

3.根据权利要求1所述的手机麦克风的语音增强系统,其特征在于,所述频域消噪模块包括:

主麦克风噪声估计单元,对所述主麦克风频域增强语音信号中的噪声进行估计得到频域噪声估计

语音的基音和谐波检测单元,在语音帧中估计语音的基音和谐波,并将估计出的语音的基音和谐波所在的频点标记为语音频点,对基音和谐波以外的频点通过预设的判断条件来确定是否为噪声频点;

维纳滤波器消噪处理单元,根据增益函数Gp(wk)与所述频域噪声估计 的噪声功率Pnn(wk)的乘积调节维纳滤波器的参数,将所述频域噪声估计 从主麦克风频域增强语音信号中滤除得到所述最终的消噪信号,所述增益函数Gp(wk)的值根据所述噪声和语音频点而调整。

4.一种应用于权利要求1所述的手机麦克风的语音增强系统的语音增强方法,其特征在于,包括以下步骤:

所述第一模数转换模块连接手机上的主麦克风,将主麦克风接收到的模拟带噪语音信号转换为主麦克风数字带噪语音信号并传递给语音和噪声活动检测装置和消噪装置;

所述第二模数转换模块连接手机上的次麦克风,将次麦克风接收到的模拟带噪语音信号转换为次麦克风数字带噪语音信号并传递给语音和噪声活动检测装置和消噪模块;

所述语音和噪声活动检测装置根据主麦克风数字带噪语音信号和次麦克风数字带噪语音信号为所述消噪装置确定语音采样点和噪声采样点;

所述消噪装置的时域消噪模块在语音采样点先将次麦克风数字带噪语音信号中的语音信号进行消除处理得到背景噪声信号,再在噪声采样点对主麦克风数字带噪语音信号中的背景噪声信号进行降噪处理得到主麦克风时域增强语音信号;

所述消噪装置的频域消噪模块先分别对主麦克风时域增强语音信号和背景噪声信号进行短时傅里叶变化得到主麦克风频域增强语音信号和频域背景噪声信号,然后,在频域中先通过主麦克风噪声估计单元估计出主麦克风频域增强信号中的噪声,再利用语音的基音和谐波检测单元分别标记出语音和噪声频点并针对语音和噪声频点控制维纳滤波器参数进行调整,通过维纳滤波器将估计的噪声从主麦克风频域增强信号中滤除得到频域增强信号,最后,通过短时傅里叶逆变换将频域增强信号转化到时域,得到最终的消噪信号。

5.根据权利要求4所述的语音增强方法,其特征在于,所述频域消噪模块在频域滤除主麦克风频域增强语音信号中的噪声得到最终的消噪信号,包括以下步骤:(1)对所述主麦克风频域增强语音信号采用基于最小值迭代的噪声估计算法得到每一帧带噪语音信号在每一个频点的先验信噪比和后验信噪比,并通过先验信噪比和后验信噪比计算每一个频点的语音存在概率,通过语音存在概率调整噪声估计的平滑参数,并通过噪声估计的平滑参数迭代计算得到每一帧带噪语音信号在每一个频点的第一噪声估计(2)利用所述频域背景噪声信号估计所述主麦克风频域增强语音信号中的噪声,得到第二噪声估计(4)将所述第一噪声估计 和所述第二噪声估计 相加得到最终的频域

噪声估计 并利用所述最终的频域噪声估计 计算噪声功率Pnn(wk);

(5)利用所述基于最小值迭代的噪声估计算法得到的每一帧带噪语音信号在每一个频点的先验信噪比和后验信噪比确定语音主宰帧和噪声主宰帧,在语音主宰帧中估计所述主麦克风频域增强语音信号的基音和谐波,并将估计的基音和谐波所在的频点标记为语音频点,在基音和谐波以外的频点通过预设的判断条件标记噪声频点;

(6)结合步骤(5)标记的噪声频点和语音频点调节维纳滤波器的参数H(wk),对所述主麦克风频域增强语音信号中的噪声频点进行滤除,同时对标记为语音的频点进行保留,得到频域增强后的语音信号(7)将所述频域增强后的语音信号 通过短时傅里叶逆变换转化到时域输出最终的增强语音信号

6.根据权利要求5所述的语音增强方法,其特征在于,步骤(5)中标记语音频点和噪声频点包括以下步骤:

(51)将每一帧带噪语音信号中基于最小值迭代的噪声估计算法得到的后验信噪比的谷值对应的频点标记为噪声;

(52)将所述主麦克风频域增强语音信号分为高频段和低频段,计算每一帧信号的先验信噪比和后验信噪比在所述低频段和高频段的均值,如果两个频带上的先验信噪比和后验信噪比的均值都小于预设阈值,则判断为噪声主宰帧,在帧内搜索带噪语音的峰值,将峰值对应频点标记为噪声;

(53)对于先验信噪比和后验信噪比的均值都大于等于预设阈值的帧,认为是语音主宰帧,通过计算语音的基音和谐波分量来标记语音频点。

7.根据权利要求6所述的语音增强方法,其特征在于,所述计算语音的基音和谐波分量包括以下步骤:

A.将大于预设频率的频段划分为若干个等间隔的频带,分别计算这些频带的带噪语音信号幅度值的和,并从这些频带中挑选幅值的和最大的频带作为语音信号基音和谐波分量存在的备选频带;

B.在所述备选频带内将幅度的峰值对应的频点作为基音和谐波的候选频点,计算这些频点之间间隔的均值,通过将峰值两两之间的间隔和均值进行比较去掉间隔超出预设间隔范围的候选频点,初步筛选出语音基音和谐波存在的频点;

C.第二次筛选去除频率小于预设频率的频点,然后从频率大于所述预设频率的频点中去除间隔最大峰值所对应频点以及间隔最小的峰值所对应的频点;

D.对经过筛选得到的基音和谐波分量对应的峰值点之间的间隔取平均,可以得到基音的估计值;

E.在得到了基音的估计值之后,对这一帧的信号,在频域上将每个峰值对应频点和基音以及谐波分量进行比较,如果当前峰值对应频点和基音或者其谐波分量重合则判定为语音频点,如果峰值对应频点与基音和谐波分量不重合则判定为噪声频点。