买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于服务场景识别的语音数据处理方法及相关装置

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于服务场景识别的语音数据处理方法及相关装置

￥21600

专利号： 2022113061756

申请人：深圳市人马互动科技有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2025-10-09

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于服务场景识别的语音数据处理方法，其特征在于，应用于语音互动系统的服务器，所述服务器设置有人机互动引擎，所述语音互动系统还包括与所述服务器通信连接的电子设备，所述方法包括：接收来自所述电子设备的用户在当前次对话事件中所录入的语音信息，通过所述人机互动引擎执行如下操作：将所述语音信息转换为原始文本；

根据所述当前次对话事件的对话内容和/或事件关联信息确定所述当前次对话事件所属的目标服务场景，所述事件关联信息包括以下至少一种：所述电子设备在所述当前次对话事件中提供的服务或应用的类型、所述电子设备的设备类型；

获取所述目标服务场景的基准词语集合，具体包括：获取原始文本的词语名单，所述词语名单包括所述原始文本中根据不同的组合方式可能出现的所有词语；将词语名单中的所有词语与多个语义场景中每个语义场景的关键字进行匹配，确定所述所有词语中与每个所述目标服务场景的基准词语集合匹配的词语数量；将与所述基准词语集合匹配的词语数量最多的所述目标服务场景确定为所述原始文本对应的所述目标服务场景，将所述所有词语中与目标语义场景的关键字匹配的词语确定为所述基准词语；或者，确定所有词语中与每个目标服务场景的基准词语集合匹配的词语数量之后，若在所述原始文本的词语名单中，出现频率超过第二预设阈值的词语超过预设数量限制；则获取原始文本对应的目标服务场景的预设文本数据库；确定出现频率超过第二预设阈值的词语中在的历史输入语句中出现次数最多的词语，将所述出现次数最多的词语确定为所述第一文本文字数据的基准词语；

根据所述基准词语集合对所述原始文本进行分词，得到所述原始文本的适配所述目标服务场景的至少一个文本句式；

根据所述至少一个文本句式对所述原始文本进行语义分析，得到语义分析结果。

2.根据权利要求1所述的方法，其特征在于，所述至少一个文本句式包括多个，所述根据所述至少一个文本句式对所述原始文本进行语义分析之前，所述方法还包括：确定每个文本句式包括的词语中存在单字的文本句式为目标文本句式；

确定所述目标文本句式中包括的单字的可实现性；

从多个文本句式中删除所述可实现性低于预设值的文本句式。

3.根据权利要求2所述的方法，其特征在于，所述至少一个文本句式包括多个，所述根据所述至少一个文本句式对所述原始文本进行语义分析，包括：以每个文本句式中包括的基准词语为基础，对所述每个文本句式进行逻辑检测，得到所述每个文本句式的逻辑得分；

对所述逻辑得分最高的文本句式进行语义分析，得到语义分析结果。

4.根据权利要求3所述的方法，其特征在于，所述以每个文本句式中包括的基准词语为基础，对所述每个文本句式进行逻辑检测，得到所述每个文本句式的逻辑得分，包括：确定所述每个文本句式中与所述基准词语相邻的词语为校验词语；

确定所述基准词语与所述校验词语组合成一个短语的可能性评分；

根据所述可能性评分确定所述每个文本句式的逻辑得分。

5.根据权利要求4所述的方法，其特征在于，所述根据所述可能性评分确定所述每个文本句式的逻辑得分，包括：确定所述每个文本句式包括的所有词语中每个词语在所述目标服务场景的出现概率；

确定所述每个文本句式中每个词语的系数值，文本句式中距离所述基准词语越远的词语，系数值越低；

根据所述每个词语的出现概率和所述系数值确定概率评分；

根据所述可能性评分和所述概率评分确定每个文本句式的逻辑得分。

6.根据权利要求1‑5任一项所述的方法，其特征在于，所述根据所述基准词语集合对所述原始文本进行分词，包括：根据所述原始文本中包括的基准词语集合确定预设文本库中是否包括与所述原始文本相似度高于预设值的目标文本；

若存在，则根据所述目标文本的分词结果对所述原始文本进行分词。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

获取所述用户的历史文本，所述历史文本为根据所述用户的历史语音记录转换后的文本，所述历史文本对应的文本句式为用于语义分析的文本句式；

将所述历史文本和所述历史文本对应的文本句式添加到所述预设文本库。

8.一种基于服务场景识别的语音数据处理装置，其特征在于，应用于语音互动系统的服务器，所述服务器设置有人机互动引擎，所述语音互动系统还包括与所述服务器通信连接的电子设备，包括：接收单元：用于接收来自所述电子设备的用户在当前次对话事件中所录入的语音信息，通过所述人机互动引擎执行如下操作：确定单元：用于将所述语音信息转换为原始文本；

分析单元：用于获取所述目标服务场景的基准词语集合，具体包括：

获取原始文本的词语名单，所述词语名单包括所述原始文本中根据不同的组合方式可能出现的所有词语；将词语名单中的所有词语与多个语义场景中每个语义场景的关键字进行匹配，确定所述所有词语中与每个所述目标服务场景的基准词语集合匹配的词语数量；

将与所述基准词语集合匹配的词语数量最多的所述目标服务场景确定为所述原始文本对应的所述目标服务场景，将所述所有词语中与目标语义场景的关键字匹配的词语确定为所述基准词语；或者，确定所有词语中与每个目标服务场景的基准词语集合匹配的词语数量之后，若在所述原始文本的词语名单中，出现频率超过第二预设阈值的词语超过预设数量限制；则获取原始文本对应的目标服务场景的预设文本数据库；确定出现频率超过第二预设阈值的词语中在的历史输入语句中出现次数最多的词语，将所述出现次数最多的词语确定为所述第一文本文字数据的基准词语；

根据所述基准词语集合对所述原始文本进行分词，得到所述原始文本的适配所述目标服务场景的至少一个文本句式；

根据所述至少一个文本句式对所述原始文本进行语义分析，得到语义分析结果。

9.一种电子设备，其特征在于，包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1‑7任一项所述的方法中的步骤的指令。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如权利要求1‑7中任一项所述的方法。