1.一种语音驱动的智能人机交互方法,其特征在于,该方法的实现步骤如下:
(1)语音输入界面接收用户输入的语音;
(2)语音识别模块识别用户输入的语音,得到识别结果:字符串S;
(3)语义理解模块对字符串S进行分词,并根据文法对分词结果中的每个短语添加语义标签;所述文法包括语言模型和语义分类器,其中,语言模型定义了所有由语音识别器处理的词汇空间,由文法的规则描述或统计文法领域的n元组集合定义;语义分类器将词汇短语映射到语义标签的一个有限集,由训练好的统计分类器实现;
(4)对话管理器根据语义理解模块的语义解析结果,结合知识库确定将要执行的操作,具体为:
①如果用户的语音输入指定了所感兴趣事物的属性,对话管理器将查询后台的领域知识库,确定对话主题的必要属性信息、可选属性信息和属性优先级;如果用户提供的属性信息不足,对话管理器将询问用户缺少的必要属性信息;如果用户提供的属性信息覆盖了对话主题的必要属性信息,对话管理器将让用户确认所感兴趣事物的信息;②如果用户的语音输入为查询某一问题或名词,对话管理器将调用第三方搜索引擎查询、筛选和重新组织相关信息,并在下一步将结果返回给用户;
(5)对话管理器根据上一步确定的操作组织回答语句,并调用语音播放引擎向用户播放语句;其中,组织回答语句的过程分为查找语句模板和填充信息两步:在查找语句模板的步骤中,语句模板的类型由上一步所确定的操作类型决定:如果系统需要向用户询问相关信息,需使用询问疑问句;如果系统需要让用户确认信息,使用确认疑问句;如果系统需要将结果返回给用户,则使用陈述句;如果交互过程中出现语音识别拒识、超时、低可信度的问题,对话管理器将调用这些问题对应的提示语句;以上所有语句模板均存储在知识库中,对话管理器根据对话主题和查询类型提取语句模板;对话管理器确定语句模板之后,根据语义设置模板中的参数值,从而生成回答语句;
(6)用户接收到语音播放引擎的语音提示后,根据提示进一步输入语音进行对话,直到对话管理器确认用户的需要已得到满足,并结束当前会话;
(7)将会话所涉及的关键信息存储到用户案例库中,用于提高系统的智能化水平。