买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于大数据的语音识别系统及方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于大数据的语音识别系统及方法

￥16800

专利号： 2021100155125

申请人：广州华源网络科技有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于大数据的语音识别系统，其特征在于，所述语音识别系统包括个人语音修正库、辅助修正库设置模块、语音信号采集模块和语音识别结果修正判断模块，所述个人语音修正库用于存储修正字，所述辅助修正库设置模块用于选取个人语音修正库的辅助修正库，所述语音信号采集模块用于采集语音信号，所述语音识别结果修正判断模块通过对语音信号进行识别播报以及与用户之间的交互判断是否要修正语音识别结果。

2.根据权利要求1所述的一种基于大数据的语音识别系统，其特征在于：所述辅助修正库设置模块包括重合度计算模块和重合度比较模块，所述重合度计算模块用于计算两两个人语音修正库之间的修正字的重合度，所述重合度比较模块将重合度计算模块计算出的重合度与第一重合度阈值进行比较，在重合度大于等于第一重合度阈值时，设置这两个语音修正库互为彼此的辅助修正库；所述语音识别结果修正判断模块包括语音采集间隔计算比较模块、第一相似度计算模块、语音采集时间判断模块、第二相似度计算模块、相似度比较模块、第一处理模块和第二处理模块；所述语音采集间隔计算比较模块将麦克风采集到第一语音信号的时间为第一时间，将麦克风采集到第二语音信号的时间为第二时间，计算第二时间与第一时间之间的间隔时长，并将间隔时长与第一间隔时长阈值进行比较，在间隔时长小于第一间隔时长阈值时，令第一相似度计算模块计算第一语音信号得到的第一语音识别结果与第二语音信号得到的第二语音识别结果之间的相似度为第一相似度，在第一相似度大于第一相似度阈值时，所述语音采集时间判断模块用于判断麦克风采集到第三语音信号时的时间是否与第二时间的间隔时长之间小于第二间隔时长阈值的时间，在小于第二间隔时长阈值的时间，所述第二相似度计算模块计算第一语音信号得到的第一语音识别结果与第三语音信号得到的第二语音识别结果之间的相似度为第二相似度，所述相似度比较模块用于比较第一相似度和第二相似度的大小，在第一相似度与第二相似度不相等时令第一处理模块对语音识别结果进行处理，在第一相似度与第二相似度相等时令第二处理模块对语音识别结果进行处理。

3.根据权利要求2所述的一种基于大数据的语音识别系统，其特征在于：所述第一处理模块包括播报询问模块、答复采集模块和肯定答复处理模块，所述播报询问模块用于播报询问第三语音识别结果识别是否正确，所述答复采集模块用于采集关于答复的语音信号，在采集到肯定答复的语音信号时，智能设备按照第三语音识别结果执行相应的操作并令肯定答复处理模块工作，在采集到否定答复时令第二处理模块工作，所述肯定答复处理模块包括第一关键字拆分模块、拆分关键字比较模块和修正字第一存储模块，所述第一关键字拆分模块将第三语音识别结果拆分成多个第一关键字，所述拆分关键字比较模块将每个第一关键字依次与第二语音识别结果中相应位置的第二关键字进行比较，存在某个第一关键字与第二关键字不相同时，令修正字第一存储模块采集第一关键字与第二关键字互为彼此的修正字，并将其存入第三语音信号所对应的声纹特征的个人语音修正库。

4.根据权利要求3所述的一种基于大数据的语音识别系统，其特征在于：所述第二处理模块包括待比较关键字拆分播报模块、修正语音信号采集模块、待比较关键字搜索模块、修正字修正替换模块、待替换单字拆分模块、组词信号采集模块、单字替换模块、替换关键字替换模块和修正字第二存储模块，所述待比较关键字拆分播报模块将第三语音识别结果拆分成多个待比较关键字，并依次播报待比较关键字，所述修正语音信号采集模块播报完一个待比较关键字的预设第二时间段内如果采集到进行修正的语音信号，令待比较关键字搜索模块判断第三语音信号所对应的该声纹特征的个人语音修正库和辅助语音修正库中是否存在该待比较关键字，在个人语音修正库中或者辅助语音修正库存在该待比较关键字时，令所述修正字修正替换模块获取个人语音修正库中或者辅助语音修正库中待比较关键字的修正字，依次将修正字替换第三语音信号中的待比较关键字后进行语音播报；在个人语音修正库和辅助语音修正库中都不存在待比较关键字时，所述待替换单字拆分模块将待比较关键字依次拆分成多个单字，设拆分成的单字为待替换单字，依次语音播报待替换单字，令用户按照语音播报的顺序，依次对待替换单字进行组词，所述组词信号采集模块用于采集到组词的语音信号，所述单字替换模块从组词当中提取与待替换单字相对应的单字为替换单字，将替换单字按照待替换单字在待比较关键字中的顺序进行排序组成替换关键字，所述替换关键字替换模块将替换关键字替换第三语音识别结果中相应的待比较关键字后，播报替换后的第三语音识别结果，所述修正字第二存储模块采集待比较关键字与替换关键字互为彼此的修正字，并将其存入第三语音信号所对应的声纹特征的个人语音修正库。

5.一种基于大数据的语音识别方法，其特征在于：所述语音识别方法包括以下步骤：

步骤S1：预先分别为每个家庭用户建立个人语音修正库，所述个人语音修正库用于存储修正字，其中，家庭用户的人数n大于等于二，

步骤S2：智能设备通过麦克风采集语音信号，通过对语音信号进行识别播报以及与用户之间的交互判断是否要修正语音识别结果。

6.根据权利要求5所述的一种基于大数据的语音识别方法，其特征在于：所述步骤S1还包括：

当激活智能设备后，获取麦克风采集到的语音信号，根据语音信号获取该语音的声纹特征，为麦克风最先采集到的n种不同的声纹特征建立个人语音修正库。

7.根据权利要求6所述的一种基于大数据的语音识别方法，其特征在于：所述步骤S1还包括：

将家庭用户中的个人语音修正库两两进行比较，当某个个人语音修正库与另一个个人语音修正库之间的修正字的重合度大于等于第一重合度阈值时，这两个语音修正库互为彼此的辅助修正库。

8.根据权利要求7所述的一种基于大数据的语音识别方法，其特征在于：所述步骤S2进一步包括：

当智能设备通过麦克风采集到语音信号时，设麦克风采集到第一语音信号的时间为第一时间，对第一语音信号进行识别并播报第一语音识别结果，

通过麦克风采集到第二语音信号的时间为第二时间，对第二语音信号进行识别并播报第二语音识别结果，计算第二时间与第一时间之间的间隔时长，当间隔时长小于第一间隔时长阈值时，采集第一语音识别结果和第二语音识别结果的相似度为第一相似度，当第一相似度大于第一相似度阈值时，如果麦克风在第三时间内采集到第三语音信号时，对第三语音信号进行识别并播报第三语音识别结果，其中，第三时间为与第二时间的间隔时长之间小于第二间隔时长阈值的时间，采集第三语音识别结果与第一语音识别结果的相似度为第二相似度，

如果第一相似度与第二相似度不相等，智能设备播报询问第三语音识别结果识别是否正确，当麦克风采集到肯定答复的语音信号时，智能设备按照第三语音识别结果执行相应的操作，并将第三语音识别结果拆分成多个第一关键字，将每个第一关键字依次与第二语音识别结果中相应位置的第二关键字进行比较，如果存在某个第一关键字与第二关键字不相同，采集第一关键字与第二关键字互为彼此的修正字，并将其存入第三语音信号所对应的声纹特征的个人语音修正库；

当麦克风采集到否定答复或者第一相似度与第二相似度相等时，将第三语音识别结果拆分成多个待比较关键字，智能设备依次播报待比较关键字，

当播报完一个待比较关键字的预设第二时间段内如果采集到进行修正的语音信号时，判断第三语音信号所对应的该声纹特征的个人语音修正库和辅助语音修正库中是否存在该待比较关键字，如果个人语音修正库中或者辅助语音修正库存在待比较关键字时，获取个人语音修正库中或者辅助语音修正库中待比较关键字的修正字，依次将修正字替换第三语音信号中的待比较关键字后进行语音播报，其中，个人语音修正库中修正字的优先级高于辅助语音修正库中修正字的优先级。

9.根据权利要求8所述的一种基于大数据的语音识别方法，其特征在于：所述步骤S2还包括：

如果个人语音修正库和辅助语音修正库中都不存在待比较关键字，将待比较关键字依次拆分成多个单字，设拆分成的单字为待替换单字，依次语音播报待替换单字，用户按照语音播报的顺序进行组词；

麦克风采集到组词的语音信号后，分别从组词当中提取与待替换单字相对应的单字为替换单字，将替换单字按照待替换单字在待比较关键字中的顺序进行排序组成替换关键字，将替换关键字替换第三语音识别结果中相应的待比较关键字后，播报替换后的第三语音识别结果；

并采集待比较关键字与替换关键字互为彼此的修正字，并将其存入第三语音信号所对应的声纹特征的个人语音修正库。

10.根据权利要求9所述的一种基于大数据的语音识别方法，其特征在于：当一个关键字有多个修正字时，那么该关键字的修正字之间也互为彼此的修正字。