利索能及
我要发布
收藏
专利号: 2019106572524
申请人: 北京如布科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2024-10-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种语音交互方法,其特征在于,所述方法包括:

如果在预设时间内检测到用户语音,则触发在初始拾音时间内识别用户语音的操作;

实时识别在所述初始拾音时间内获取的用户语音;

如果在所述初始拾音时间内获取的用户语音的识别结果与预设候选语句的匹配结果不满足匹配要求,则根据所述匹配结果与延时阈值的关系,在所述初始拾音时间的基础上,进行拾音时间延长;

将在延长拾音时间内获取的用户语音的识别结果与在所述初始拾音时间内获取的用户语音的识别结果进行整合,并将整合后的语音识别结果与所述预设候选语句进行匹配;

如果所述整合后的语音识别结果与所述预设候选语句的匹配结果满足所述匹配要求,则将与所述整合后的语音识别结果对应的反馈信息反馈给用户;

其中,根据所述匹配结果与延时阈值的关系,在所述初始拾音时间的基础上,进行拾音时间延长,包括:根据所述匹配结果与不同延时阈值的关系,以及不同延时阈值与目标延长时间的对应关系,在所述初始拾音时间的基础上,进行拾音时间延长,其中,所述延时阈值越大,对应的目标延长时间越短;其中,所述匹配结果越高,则代表用户已快要表达完想要表达的语音,且对应的目标延长时间越短。

2.根据权利要求1所示的方法,其特征在于,所述预设候选语句包括预测的人机交互过程中用户的提问语句,或者在人机交互过程中标准答复语句。

3.根据权利要求1所示的方法,其特征在于,所述方法还包括:如果在所述初始拾音时间内获取的用户语音的识别结果与预设候选语句的匹配结果满足匹配要求,则将与所述初始拾音时间内获取的用户语音的识别结果对应的反馈信息反馈给用户。

4.根据权利要求1所示的方法,其特征在于,所述方法还包括:如果所述整合后的语音识别结果与所述预设候选语句的匹配结果不满足所述匹配要求,则生成语音交互异常提示信息。

5.一种语音交互装置,其特征在于,所述装置包括:

用户语音识别触发模块,用于如果在预设时间内检测到用户语音,则触发在初始拾音时间内识别用户语音的操作;

用户语音识别模块,用于实时识别在所述初始拾音时间内获取的用户语音;

拾音时间延长模块,用于如果在所述初始拾音时间内获取的用户语音的识别结果与预设候选语句的匹配结果不满足匹配要求,则根据所述匹配结果与延时阈值的关系,在所述初始拾音时间的基础上,进行拾音时间延长;

语句匹配模块,用于将在延长拾音时间内获取的用户语音的识别结果与在所述初始拾音时间内获取的用户语音的识别结果进行整合,并将整合后的语音识别结果与所述预设候选语句进行匹配;

第一信息反馈模块,用于如果所述整合后的语音识别结果与所述预设候选语句的匹配结果满足所述匹配要求,则将与所述整合后的语音识别结果对应的反馈信息反馈给用户;

其中,拾音时间延长模块,具体用于:

根据所述匹配结果与不同延时阈值的关系,以及不同延时阈值与目标延长时间的对应关系,在所述初始拾音时间的基础上,进行拾音时间延长,其中,所述延时阈值越大,对应的目标延长时间越短;其中,所述匹配结果越高,则代表用户已快要表达完想要表达的语音,且对应的目标延长时间越短。

6.根据权利要求5所述的装置,其特征在于,所述装置还包括第二信息反馈模块,具体用于:如果在所述初始拾音时间内获取的用户语音的识别结果与预设候选语句的匹配结果满足匹配要求,则将与所述初始拾音时间内获取的用户语音的识别结果对应的反馈信息反馈给用户。

7.一种设备,其特征在于,所述设备还包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑4中任一所述的语音交互方法。

8.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑4中任一所述的语音交互方法。