利索能及
我要发布
收藏
专利号: 201911038804X
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种音频信号处理方法,其特征在于,包括:

获取待处理的第一音频信号;

确定所述第一音频信号包含的至少一个音素;

计算所述至少一个音素的音素覆盖率,所述音素覆盖率用于表示所述至少一个音素中音素的种类与音素的总数量之间的比例;

若所述音素覆盖率满足目标条件,则将第一声纹识别模型更新为第二声纹识别模型,所述第一声纹识别模型为采用所述第一音频信号的声纹特征信息训练得到的,所述第二声纹识别模型为采用第二音频信号的声纹特征信息训练得到的。

2.如权利要求1所述的方法,其特征在于,所述将第一声纹识别模型更新为第二声纹识别模型之前,还包括:输出用于提示用户输入第二音频信号的提示信息;

获取输入的所述第二音频信号;

提取所述第二音频信号的声纹特征信息;

采用所述第二音频信号的声纹特征信息训练第二声纹识别模型。

3.如权利要求1所述的方法,其特征在于,所述音素覆盖率包括声母覆盖率和/或韵母覆盖率,所述声母覆盖率用于表示所述至少一个音素中声母的种类与声母的总数量之间的比例,所述韵母覆盖率用于表示所述至少一个音素中韵母的种类与韵母的总数量之间的比例。

4.如权利要求3所述的方法,其特征在于,所述音素覆盖率包括声母覆盖率和韵母覆盖率;

所述若所述音素覆盖率满足目标条件,则将第一声纹识别模型更新为第二声纹识别模型,包括:若所述声母覆盖率小于第一阈值,且所述韵母覆盖率小于第二阈值,则将第一声纹识别模型更新为第二声纹识别模型。

5.如权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:若所述音素覆盖率不满足所述目标条件,则将所述第一声纹识别模型确定为第一用户标识对应的声纹识别模型;

获取第三音频信号,并将所述第三音频信号输入所述第一声纹识别模型进行声纹识别处理,获得处理结果;

根据所述处理结果,确定所述第三音频信号是否与所述第一用户标识关联。

6.如权利要求1所述的方法,其特征在于,所述确定所述第一音频信号包含的至少一个音素之前,还包括:对所述第一音频信号进行预处理,所述预处理包括保留所述第一音频信号中符合预设语音特征的音频信号,和/或,删除所述第一音频信号中的静默语音信号;

所述确定所述第一音频信号包含的至少一个音素,包括:确定所述预处理后的所述第一音频信号包含的至少一个音素。

7.如权利要求1所述的方法,其特征在于,所述计算所述至少一个音素的音素覆盖率之前,还包括:根据所述至少一个音素,确定所述第一音频信号对应的目标文本;

若所述目标文本与预设文本不匹配,则执行计算所述至少一个音素的音素覆盖率的步骤。

8.一种音频信号处理装置,其特征在于,包括:

第一获取单元,用于获取待处理的第一音频信号;

第一确定单元,用于确定所述第一音频信号包含的至少一个音素;

计算单元,用于计算所述至少一个音素的音素覆盖率,所述音素覆盖率用于表示所述至少一个音素中音素的种类与音素的总数量之间的比例;

更新单元,用于若所述音素覆盖率满足目标条件,则将第一声纹识别模型更新为第二声纹识别模型,所述第一声纹识别模型为采用所述第一音频信号的声纹特征信息训练得到的,所述第二声纹识别模型为采用第二音频信号的声纹特征信息训练得到的。

9.一种音频信号处理装置,其特征在于,包括处理器、存储器以及通信接口,所述处理器、存储器和通信接口相互连接,其中,所述通信接口用于接收和发送数据,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行如权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1至7任一项所述的方法。