利索能及
我要发布
收藏
专利号: 2018100417643
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种语音验证方法,所述方法包括:获取待验证语音信息和相应的用户标识;

从所述待验证语音信息中提取待验证的声纹特征和待验证文本;

获取当前场景类型;

查询与所述当前场景类型匹配、且与所述用户标识对应的特征模型;

通过所述特征模型,将所述待验证文本转换为参考声纹特征;

比较所述待验证的声纹特征和所述参考声纹特征,得到语音验证结果;

当所述语音验证结果表示验证通过时,则根据所述待验证的声纹特征对所述特征模型进行再训练;

使用再训练后的特征模型更新与所述当前场景类型匹配、且与所述用户标识对应的特征模型。

2.根据权利要求1所述的方法,其特征在于,所述获取待验证语音信息和相应的用户标识,包括:获取身份验证指令;

响应于所述身份验证指令,获取用户标识;

查询对应于所述用户标识预配置的文本;

当未查询到所述文本时,随机生成文本;

反馈随机生成的所述文本;

采集与反馈的所述文本相匹配的待验证语音信息。

3.根据权利要求1所述的方法,其特征在于,所述从所述待验证语音信息中提取待验证的声纹特征和待验证文本,包括:解析所述待验证语音信息,得到相应的声波信号;

将所述声波信号分帧,得到每一帧的声波信号;

对所述每一帧的声波信号进行傅立叶变换,得到相应的频谱;

从所述频谱中提取单帧声纹特征;

根据每一帧的单帧声纹特征生成所述待验证语音信息的声纹特征;

将所述声纹特征转化为待验证文本。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:采集当前的噪音信息;

根据采集的噪音信息生成抗干扰模型;

在解析得到声波信号后,通过所述抗干扰模型将解析得到的声波信号修正后,执行所述将所述声波信号分帧,得到每一帧的声波信号的步骤。

5.根据权利要求1所述的方法,其特征在于,所述获取当前场景类型包括:获取采集所述待验证语音信息的时间信息和/或地理位置信息;

查询与所述时间信息和/或地理位置信息相匹配的预设场景类型;

将查询到的预设场景类型作为当前场景类型。

6.根据权利要求1所述的方法,其特征在于,所述获取当前场景类型包括:获取采集所述待验证语音信息的时间信息和地理位置信息;

查找与所述时间信息和所述地理位置信息相匹配的天气信息;

查询与所述天气信息相匹配的预设场景类型;

将查询到的预设场景类型作为当前场景类型。

7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:获取公共特征模型;

获取与预设场景类型和所述用户标识相对应的训练语音样本;

根据所述训练语音样本将所述公共特征模型进行再训练,得到与所述预设场景类型和所述用户标识相匹配的特征模型。

8.一种语音验证装置,其特征在于,所述装置包括:信息获取模块,用于获取待验证语音信息和相应的用户标识;

信息提取模块,用于从所述待验证语音信息中提取待验证的声纹特征和待验证文本;

类型获取模块,用于获取当前场景类型;

模型查询模块,用于查询与所述当前场景类型匹配、且与所述用户标识对应的特征模型;

特征转换模块,用于通过所述特征模型,将所述待验证文本转换为参考声纹特征;

特征比较模块,用于比较所述待验证的声纹特征和所述参考声纹特征,得到语音验证结果再训练模块,用于当所述语音验证结果表示验证通过时,则根据所述待验证的声纹特征对所述特征模型进行再训练;

模型更新模块,用于使用再训练后的特征模型更新与所述当前场景类型匹配、且与所述用户标识对应的特征模型。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。