利索能及
我要发布
收藏
专利号: 2018103110980
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用户身份验证方法,其特征在于,该方法包括:

接收带有目标用户身份标识的身份验证请求,从客户端获取该目标用户的当前语音数据;

将该当前语音数据输入训练好的声纹识别模型中,确定该目标用户的当前声纹特征向量,根据预先确定的用户身份标识与标准声纹特征向量的映射关系,确定所述目标用户身份标识对应的标准声纹特征向量;其中,所述声纹识别模型包括:代表本征音空间矩阵的用户空间特征项和代表本征信道空间矩阵的信道空间特征项,所述用户空间特征项包括用户声纹特征向量,所述信道空间特征项包括信道因素特征向量;

利用预先确定的距离计算公式计算所述当前声纹特征向量与所述标准声纹特征向量之间的距离;及根据所述距离分析目标用户是否通过身份验证,将所述身份验证结果发送给该客户端;

所述声纹识别模型的训练过程包括:

预先获取第一预设数量的用户的语音样本,每一个所述用户的语音样本包括第二预设数量的不同语音段样本,每一个所述用户的不同的语音段样本分别通过不同的终端获取,并利用获取的各个所述用户的语音样本训练所述预设类型的声纹识别模型,生成训练好的声纹识别模型;

所述声纹识别模型的公式为:

Xij=μ+Fhi+Gwij+∈ij

其中,Xij表示第i个说话人的第j条语音,μ表示所有语音样本数据的均值,F表示身份空间且包含了用来表示各种身份的基底,F的每一列就相当于类间空间的特征向量,hi表示第i个说话人的声纹特征向量,G表示误差空间且包含了用来表示同一身份不同变化的基底,G的每一列相当于类内空间的特征向量,wij表示第i个说话人的第j条语音的信道因素特征向量,∈ij表示残留噪声项,“μ+Fhi”表示说话人空间特征项,“Gwij+∈ij”表示信道空间特征项。

2.如权利要求1所述的用户身份验证方法,其特征在于,所述“根据所述距离分析目标用户是否通过身份验证”的步骤包括:当计算的距离小于或者等于预设阈值时,判断目标用户身份验证通过;或

当计算的距离大于预设阈值时,判断目标用户身份验证失败。

3.如权利要求1所述的用户身份验证方法,其特征在于,所述“利用预先确定的距离计算公式计算所述当前声纹特征向量与所述标准声纹特征向量之间的距离”的步骤可以替换为:利用预先确定的距离计算公式计算当前声纹特征向量与各个预先确定的用户身份标识对应的标准声纹特征向量之间的距离。

4.如权利要求3所述的用户身份验证方法,其特征在于,所述“根据所述距离分析目标用户是否通过身份验证”的步骤包括:按照从大到小的顺序,对所述当前声纹特征向量与各个预先确定的用户身份标识对应的标准声纹特征向量之间的距离进行排序,所述各个预先确定的用户身份标识中包括目标用户身份标识;

筛选出排序在前的距离对应的第三预设数量的用户身份标识,判断该第三预设数量的用户身份标识中是否包含目标用户身份标识;

当所述第三预设数量的用户身份标识中包含目标用户身份标识时,判断目标用户身份验证通过;或当所述第三预设数量的用户身份标识中不包含目标用户身份标识时,判断目标用户身份验证失败。

5.一种身份验证服务器,其特征在于,该服务器包括:存储器、处理器,所述存储器上存储有可在所述处理器上运行的用户身份验证程序,该程序被所述处理器执行时实现如下步骤:接收带有目标用户身份标识的身份验证请求,从客户端获取该目标用户的当前语音数据;

将该当前语音数据输入训练好的声纹识别模型中,确定该目标用户的当前声纹特征向量,根据预先确定的用户身份标识与标准声纹特征向量的映射关系,确定所述目标用户身份标识对应的标准声纹特征向量;其中,所述声纹识别模型包括:代表本征音空间矩阵的用户空间特征项和代表本征信道空间矩阵的信道空间特征项,所述用户空间特征项包括用户声纹特征向量,所述信道空间特征项包括信道因素特征向量;

利用预先确定的距离计算公式计算所述当前声纹特征向量与所述标准声纹特征向量之间的距离;及根据所述距离分析目标用户是否通过身份验证,将所述身份验证结果发送给该客户端;

所述声纹识别模型的训练过程包括:

预先获取第一预设数量的用户的语音样本,每一个所述用户的语音样本包括第二预设数量的不同语音段样本,每一个所述用户的不同的语音段样本分别通过不同的终端获取,并利用获取的各个所述用户的语音样本训练所述预设类型的声纹识别模型,生成训练好的声纹识别模型;

所述声纹识别模型的公式为:

Xij=μ+Fhi+Gwij+∈ij

其中,Xij表示第i个说话人的第j条语音,μ表示所有语音样本数据的均值,F表示身份空间且包含了用来表示各种身份的基底,F的每一列就相当于类间空间的特征向量,hi表示第i个说话人的声纹特征向量,G表示误差空间且包含了用来表示同一身份不同变化的基底,G的每一列相当于类内空间的特征向量,wij表示第i个说话人的第j条语音的信道因素特征向量,∈ij表示残留噪声项,“μ+Fhi”表示说话人空间特征项,“Gwij+∈ij”表示信道空间特征项。

6.如权利要求5所述的身份验证服务器,其特征在于,所述“根据所述距离分析目标用户是否通过身份验证”的步骤包括:当计算的距离小于或者等于预设阈值时,判断目标用户身份验证通过;或

当计算的距离大于预设阈值时,判断目标用户身份验证失败。

7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有用户身份验证程序,该程序被处理器执行时实现如权利要求1至4中任一项所述的用户身份验证方法的步骤。