利索能及
我要发布
收藏
专利号: 2020104511478
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-24
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种语音识别方法,其特征在于,包括以下步骤:S1、对获取的语音信号进行语音增强处理;

S2、对语音增强处理之后的语音信号进行去噪处理;

S3、提取去噪之后语音信号的语音信号;

S4、根据语音信号进行判断和处理;

S5、将处理后语音信号转换为文字数据,并将文字数据转换为计算机语言。

2.根据权利要求1所述的一种语音识别方法,其特征在于,对获取的语音信号进行语音增强处理包括:S11、构建校准滤波器并使用该滤波器对增益和相位不匹配的语音信号进行校正;

S12、通过对广义旁瓣相消器中阻塞矩阵的输出来调整权重,得到纯净的语音信号估计;

S13、利用后置滤波器来抑制语音信号的残留噪声。

3.根据权利要求1所述的一种语音识别方法,其特征在于,校准滤波器的构建过程包括:利用自适应波速法的自适应噪声抵消原理消除干扰和噪声,即以噪声为处理对象将噪声抑制或进行非常大的衰减以提高接收信号的质量;

根据实际麦克风输出和理想麦克风输出的频谱均方误差,利用频域最小均方算法求出各麦克风通道的滤波器系数;

通过最小化目标函数更新和调整滤波器系数,使输出信号不断接近期望信号。

4.根据权利要求1所述的一种语音识别方法,其特征在于,对语音信号进行去噪处理包括:S21、计算待处理的语音信号的小波变换;

S22、对小波变换得到的小波进行阈值化;

S23、对阈值化之后的小波进行小波逆变换,得到去噪后的语音信号。

5.根据权利要求4所述的一种语音识别方法,其特征在于,小波变换包括:选择支撑长度为5~9之间的小波以及sym小波系的小波基函数;

设置阈值,选尺度大于设置的阈值的信号进行小波变换,再将选取信号的低频部分在原信号尺度的一半上再进行小波变换,获取完成小波变换的信号。

6.根据权利要求4所述的一种语音识别方法,其特征在于,对小波变换得到的小波进行阈值化的方法包括定阈值估计、极值阈值估计、无偏似然估计以及启发式估计。

7.根据权利要求1所述的一种语音识别方法,其特征在于,提取去噪之后语音信号的语音特征包括:S31、通一个高通滤波器滤除语音信号中声带和嘴唇的效应;

S32、将语音信号分帧,即讲一段持续的语音信号分成多段语音信号;

S33、将分帧之后的语音信号进行加窗,即将该语音信号与一个窗函数相乘;

S34、将加窗之后的信号进行傅里叶变换,计算语音信号的功率谱;

S35、使用三角带通率比起对功率谱进行平滑;

S36、平滑后的数据经过余弦离散变换,得到梅尔频率倒谱系数,即语音特征。

8.根据权利要求1所述的一种语音识别方法,其特征在于,根据语音信号进行判断并处理包括:除去语音信号中的冗余信息;

提取影响语音识别的关键信息和表达语言含义的特征信息;

利用最小单元字词识别方法,依照不同语言的语法的先后顺序识别字词;

按照语义分析,给关键信息划分段落,取出所识别出的字词并连接起来,得到处理后的信号。

9.一种语音交互系统,其特征在于,包括:语音输入模块,用于采集语音输入数据;

语音增强模块,对语音输入模块获取的语音信号进行信号增强;

去噪模块,对预处理之后的语音信号进行去噪;

特征分类模块,提取去噪之后语音信号的语音特征;

分类模块,根据语音信号的语音特征对语音信号进行分类;

语音转化模块,将去噪后的语音信号转化为文字语言,再将文字语言转换为计算机语言;

语音输出模块,用于将服务器中的数据通过人声合成,转化为语音数据。

10.一种包括语音交互系统的成绩管理系统,其特征在于,包括权利要求9所述的语音交互系统,并且该系统的语音输入模块、语音输出模块设置在移动终端上,语音增强模块、预处理模块、去噪模块、特征分类模块、分类模块以及语音转化模块设置在成绩管理系统的服务器上,服务器上根据语音转化模块输出的计算机语言进行存储和相关操作。