买专利、卖专利、专利购买、专利交易、专利出售、高企申报-更新声纹数据的语音识别方法、终端装置及存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

更新声纹数据的语音识别方法、终端装置及存储介质

面议

专利号： 2018100306231

申请人：平安科技(深圳)有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种更新声纹数据的语音识别方法，应用于终端装置，其特征在于，所述方法包括步骤：

注册预设数目的注册语音，并计算所述预设数目的注册语音中的每条注册语音的特征语音向量；

将所述每条注册语音的特征语音向量进行两两比对打分，并获取第一打分平均值作为第一阈值；

获取验证语音，并计算所述验证语音的特征语音向量；

将所述验证语音的特征语音向量分别和注册语音的特征语音向量进行两两比对打分，并获取第二打分平均值；

判断所述第二打分平均值是否大于第二阈值，所述第二阈值为所述第一阈值加一预设数值；及

若所述第二打分平均值大于所述第二阈值，则根据所述验证语音更新所述注册语音，包括：判断所述第二打分平均值是否大于第三阈值，及将所述第二打分平均值大于所述第三阈值的所述验证语音更新到所述注册语音中，并根据更新后的所述注册语音进行注册，其中，所述第三阈值大于所述第二阈值，所述第三阈值通过如下步骤进行确定：选取所有高于所述第二阈值的所述第二打分平均值的验证语音，并计数为N；

将选取后验证语音对应的所述第二打分平均值进行由高到低排序；及选取第N/3的第二打分平均值作为所述第三阈值。

2.如权利要求1所述的更新声纹数据的语音识别方法，其特征在于，所述计算所述预设数目的注册语音中的每条注册语音的特征语音向量的步骤，包括：使用MFCC方法提取每一份语音中每帧语音的MFCC特征并组成一个矩阵；及使用UBM和特征语音向量提取器筛选出所述矩阵中最核心的特征，组成所述特征语音向量。

3.如权利要求1所述的更新声纹数据的语音识别方法，其特征在于，所述将所述每条注册语音的特征语音向量进行两两比对打分的步骤，包括：利用向量点积算法和PLDA算法对所述每条注册语音的特征语音向量进行两两比对打分。

4.一种终端装置，其特征在于，所述终端装置包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的更新声纹数据的语音识别程序，所述更新声纹数据的语音识别程序被所述处理器执行时实现如下步骤：注册预设数目的注册语音，并计算所述预设数目的注册语音中的每条注册语音的特征语音向量；

将所述每条注册语音的特征语音向量进行两两比对打分，并获取第一打分平均值作为第一阈值；

获取验证语音，并计算所述验证语音的特征语音向量；

将所述验证语音的特征语音向量分别和注册语音的特征语音向量进行两两比对打分，并获取第二打分平均值；

判断所述第二打分平均值是否大于第二阈值，所述第二阈值为所述第一阈值加一预设值；及

若所述第二打分平均值大于所述第二阈值，则根据所述验证语音更新注册语音，包括：判断所述第二打分平均值是否大于第三阈值，及，将所述第二打分平均值大于所述第三阈值的所述验证语音更新到所述注册语音中，并根据更新后的所述注册语音进行注册，其中，所述第三阈值大于所述第二阈值，所述第三阈值通过如下步骤进行确定：选取所有高于所述第二阈值的所述第二打分平均值的验证语音，并计数为N；

将选取后验证语音对应的所述第二打分平均值进行由高到低排序；及选取第N/3的第二打分平均值作为所述第三阈值。

5.如权利要求4所述的终端装置，其特征在于，所述计算所述预设数目的注册语音中的每条注册语音的特征语音向量的步骤，包括：使用MFCC方法提取每一份语音中每帧语音的MFCC特征并组成一个矩阵；及使用UBM和特征语音向量提取器筛选出所述矩阵中最核心的特征，组成所述特征语音向量。

6.一种存储介质，所述存储介质存储有更新声纹数据的语音识别程序，所述更新声纹数据的语音识别程序可被至少一个处理器执行，以使所述至少一个处理器执行如权利要求

1‑3中任一项所述的更新声纹数据的语音识别方法的步骤。