利索能及
我要发布
收藏
专利号: 2023106889511
申请人: 深圳市遐拓科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.适用于消防头盔中骨传导清晰化处理模型的语音合成方法,其特征在于,包括以下步骤:S1:将原始的语音信号进行预处理,并合成不同频率的噪音,生成训练信号;

S2:构造训练数据,将所述训练信号做傅里叶变换,获得具有频域信息的训练信号,与对应的训练信号构成信号组,S3:构建处理模型,将所述信号组输入至处理模型中,根据处理模型生成的语音信号,与原始的语音信号做对比,计算两者的特征距离;

S4:判断特征距离是否大于预设值,若大于,则计算两者之间的损失,将损失上传至处理模型中,并调整处理模型的参数,并重复S2‑S4;

S5:对训练模型进行验证,分别输入含有不同频率的噪音的语音信号输入到处理模型中进行处理,若无法得到准确的语音信号,则调整处理模型的参数并重复S3,直至处理模型的准确性达到预设水平;

在处理模型中,将所述训练信号输入处理模型中;

处理模型对纯噪音和含噪语音分别进行建模;

对训练信号进行加窗分帧;

取一帧的语音数据进行短时傅里叶变换;将

含噪语音中的噪音进行分解;

得到不含噪音的语音信号;

其中在通过处理模型对语音信号处理之前还包括:, 反应语音信号周期性强

弱, 代表在n帧的语音能量值, 是取样周期,根据语音信号的强弱区分纯语音、含噪语音以及纯噪音;由于在火场中的复杂环境,语音信号的类型也分为三种情况,纯语音、含噪语音以及纯噪音,在纯语音的条件下,处理模型是无需对语音进行处理的,在纯噪音的条件下,处理模型通过建立噪音模型从而屏蔽,情况最多且最复杂的就是含噪语音,设置语音信号强弱判定的两个阈值分别为 ,若 ,则判断该语音信号是含噪语音信号,若 ,则判断为纯语音信号,若 ,则判断为纯噪音。

2.根据权利要求1所述的适用于消防头盔中骨传导清晰化处理模型的语音合成方法,其特征在于,所述步骤S1中,包括:假设原始的语音信号为纯净语音信号,为了生成含有不同频率噪音的训练信号,需要对合成的噪声能量进行调整:, 是纯净语音和噪音的信噪比,

是纯净语音能量, 是噪声能量;

若需要一个信噪比为定值的含噪语音,则可以调整噪声能量大小为原来的 倍,是为:,则公式变化为:

3.根据权利要求2所述的适用于消防头盔中骨传导清晰化处理模型的语音合成方法,其特征在于,包括:在得到信噪比的公式后,需要合成指定信噪比的含噪语音合成公式为:。

4.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3任一项所述的适用于消防头盔中骨传导清晰化处理模型的语音合成方法的步骤。

5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3任一项所述的适用于消防头盔中骨传导清晰化处理模型的语音合成方法的步骤。