1.一种交互安全管理方法,与人机语音交互系统连接,其特征在于,包括:获取客户端发送的线上语音信息;
拦截所述线上语音信息,通过预置的声纹识别模型判断所述线上语音信息的发出者是否为所述客户端的所有者;若是,则取消对所述线上语音信息的拦截;
拦截所述线上语音信息,通过预置的机器学习模型识别所述线上语音信息的说话场景;若所述说话场景为真人交互,则取消对所述线上语音信息的拦截;若所述说话场景为非真人交互,则删除所述线上语音信息并生成报警信息;
所述机器学习模型的训练方法,包括:
获取注册语音信息,将所述注册语音信息的场景标签设为真人交互;
对所述注册语音信息进行场景处理得到场景语音信息,并将所述场景语音信息的场景标签设为非真人交互;其中,所述场景处理包括:录音场景处理和终端场景处理;所述录音场景处理是将所述注册语音信息录入录音设备,播放所述录音设备获得场景标签为非真人交互的场景语音信息;所述终端场景处理是将所述注册语音信息通过通信设备播放,获得场景标签为非真人交互的场景语音信息;
以具有所述场景标签的所述注册语音信息和所述场景语音信息为训练样本,通过反向传播算法对深度神经网络进行训练,得到能够识别线上语音信息所处场景的所述机器学习模型;将所述线上语音信息发送至人机语音交互系统,并接收所述人机语音交互系统根据所述线上语音信息生成的反馈语音;
将所述反馈语音发送至所述客户端。
2.根据权利要求1所述的交互安全管理方法,其特征在于,所述获取客户端发送的线上语音信息之后,所述方法还包括:调用线下监听线程,用以通过客户端获取所有者的线下语音信息;
拦截所述线上语音信息,根据所述线下语音信息判断客户端的环境状态;若所述环境状态为胁迫,则删除所述线上语音信息并生成报警信息;若所述环境状态为非胁迫,则取消对所述线上语音信息的拦截。
3.根据权利要求1所述的交互安全管理方法,其特征在于,所述通过预置的声纹识别模型判断所述线上语音信息的发出者是否为所述客户端的所有者,包括:获取与所述客户端对应的声纹库,提取所述客户端预先在所述声纹库中注册的标准声纹模型;其中,所述标准声纹模型是根据客户端在注册时所发送的注册语音信息所生成;
通过所述声纹识别模型识别所述标准声纹模型和所述线上语音信息之间的线上相似度;
判断所述线上相似度是否超过预置的线上阈值,若是,则判定所述线上语音信息的发出者为所述客户端的所有者;若否,则判定所述线上语音信息的发出者不为所述客户端的所有者。
4.根据权利要求2所述的交互安全管理方法,其特征在于,所述根据所述线下语音信息判断客户端的环境状态,包括:通过预置的语音识别组件对所述线下语音信息进行语音识别,获得线下文本信息;
识别所述线下文本信息中是否具有预置的胁迫字段;若是,则判定所述客户端的环境状态为胁迫;若否,则判定所述客户端的环境状态为非胁迫。
5.根据权利要求1所述的交互安全管理方法,其特征在于,所述将所述反馈语音发送至所述客户端之前,所述方法还包括:判断所述反馈语音中是否具有授权指令;
若所述反馈语音中不具有所述授权指令,则将所述反馈语音发送至所述客户端;
若所述反馈语音中具有所述授权指令,则根据所述授权指令拦截所述反馈语音,并向所述客户端发送口令对话框;接收所述客户端通过所述口令对话框发送的口令语音信息,判断所述口令语音信息是否与预置的固定口令信息一致;若是,则将所述反馈语音发送至所述客户端;若否,则删除反馈信息并结束。
6.根据权利要求2所述的交互安全管理方法,其特征在于,所述若所述环境状态为胁迫,则删除所述线上语音信息并生成报警信息之后,所述方法还包括:根据环境状态为胁迫所生成报警信息构建伪反馈结果,将所述伪反馈结果发送至所述客户端;
将所述伪反馈结果上传至区块链中。
7.一种交互安全管理装置,与人机语音交互系统连接,其特征在于,包括:线上语音模块,用于获取客户端发送的线上语音信息;
身份判断模块,用于拦截所述线上语音信息,通过预置的声纹识别模型判断所述线上语音信息的发出者是否为所述客户端的所有者;若是,则取消对所述线上语音信息的拦截;
真人识别模块,用于拦截所述线上语音信息,通过预置的机器学习模型识别所述线上语音信息的说话场景;若所述说话场景为真人交互,则取消对所述线上语音信息的拦截;若所述说话场景为非真人交互,则删除所述线上语音信息并生成报警信息;所述机器学习模型的训练方法,包括:获取注册语音信息,将所述注册语音信息的场景标签设为真人交互;
对所述注册语音信息进行场景处理得到场景语音信息,并将所述场景语音信息的场景标签设为非真人交互;其中,所述场景处理包括:录音场景处理和终端场景处理;所述录音场景处理是将所述注册语音信息录入录音设备,播放所述录音设备获得场景标签为非真人交互的场景语音信息;所述终端场景处理是将所述注册语音信息通过通信设备播放,获得场景标签为非真人交互的场景语音信息;以具有所述场景标签的所述注册语音信息和所述场景语音信息为训练样本,通过反向传播算法对深度神经网络进行训练,得到能够识别线上语音信息所处场景的所述机器学习模型;
信息交互模块,用于将所述线上语音信息发送至人机语音交互系统,并接收所述人机语音交互系统根据所述线上语音信息生成的反馈语音;
语音反馈模块,用于将所述反馈语音发送至所述客户端。
8.一种计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机设备的处理器执行所述计算机程序时实现权利要求1至6任一项所述交互安全管理方法的步骤。
9.一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,其特征在于,所述可读存储介质存储的所述计算机程序被处理器执行时实现权利要求1至6任一项所述交互安全管理方法的步骤。