利索能及
我要发布
收藏
专利号: 2019108047795
申请人: 南昌保莱科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于视觉感应的AI语音应答响应系统,其特征在于,包括语音输出设备,语音输入设备,语音转换设备,语音响应设备;人数视觉感应设备,电话视觉感应设备,嘴型视觉感应设备,监控设备;

监控设备,安装在需要响应的区域,对该区域进行实时监控;

语音输出设备,与语音转换设备相连,是产生语音的输出设备;

语音输入设备,与语音转换设备相连,将人的语音信息直接输入到计算机的人机接口设备;

语音转换设备,与语音输入设备和语音输出设备相连,输入的语音进行模拟信号和数字信号的转换,把语音输入设备输入的语音的特征信息作数字化处理后记录在计算机中;

或者把计算机的信息转换为语音的特征信息输出;

嘴型视觉感应设备,与语音响应设备,监控设备相连,对监控设备对监控区域拍摄的视频,进行判断视频中的人的嘴型是否静止,人的嘴型是静止,则不响应;

人数视觉感应设备,与语音响应设备,监控设备相连,对监控设备对监控区域拍摄的视频,进行判断,视频中有几个人,两个或两个以上的人就判断为是,就不响应;

电话视觉感应设备,与语音响应设备,监控设备相连,对监控设备对监控区域拍摄的视频,进行判断视频中的人是否手持电话或戴耳机,人手持电话或戴耳机,则不响应;

语音响应设备,与语音输入设备,语音转换设备相连,对语音产生响应的设备,语音响应分为两种,一种为特定语音响应,一种为特定语音响应,一种为其他语音响应。特定语音响应,就是只要语音响应设备接收到特定语音就产生响应,通过语音输出设备进行对话模式;其他语音响应,是除了语音响应设备接收到特定语音的其他语音,则启动监控设备,这时就要根据嘴型视觉感应设备,电话视觉感应设备,人数视觉感应设备产生的信息来判断是否响应,只有当人数视觉感应设备,电话视觉感应设备,嘴型视觉感应设备,都判断为是时,通过语音输出设备进行AI对话模式;

语音响应的工作流程是,用户通过语音输入设备输入语音,语音转换设备对输入的语音进行模拟信号和数字信号的转换,语音响应设备进行判断是否是特定语音,是特定语音则进行语音响应,通过语音输出设备进行AI对话模式;不是特定语音则为其他语音响应;

其他语音响应的工作流程是,由嘴型视觉感应设备,对监控设备对监控区域拍摄的视频,进行判断视频中的人的嘴型是否静止,人的嘴型是静止则不响应,人的嘴型不静止则,人的嘴型不静止则,由人数视觉感应设备,对监控设备对监控区域拍摄的视频,进行判断,视频中有几个人,两个或两个以上的人就判断为是,就不响应,一个人就由电话视觉感应设备,对监控设备对监控区域拍摄的视频,进行判断视频中的人是否手持电话,人手持电话则不响应,人不手持电话则,进行语音响应,通过语音输出设备进行AI对话模式。

2.根据权利要求1中的所述智能检索的监控平台系统,其特征在于,在监控设备中,能

360°旋转摄像头,对响应区域进行全景视频监控。

3.根据权利要求1中的所述智能检索的监控平台系统,其特征在于,在语音输出设备中,设置了锥盆式扬声器,使用的振膜材料在纸浆材料中掺入羊毛、蚕丝、碳纤维材料。

4.根据权利要求1中的所述智能检索的监控平台系统,其特征在于,在语音输出设备中,设置了分频器,分频器为功率分频器也称无源式后级分频器,是在功率功放之后进行分频的;它主要包含电感、电阻、电容无源组件,组成滤波器网络,把各频段的音频信号分别送到相应频段的扬声器中去重放。

5.根据权利要求1中的所述智能检索的监控平台系统,其特征在于,在嘴型视觉感应设备中,设置人脸识别系统,在识别的人脸区域内通过设定特定色彩的阈值,检测到嘴唇的区域,通过视频的上一帧和下一帧的对比,嘴唇的边界不重合,则人的嘴型不是静止的。

6.根据权利要求1中的所述智能检索的监控平台系统,其特征在于,在人数视觉感应设备中,设置计数器,计数器为1,则响应,计数器大于1,则不响应。

7.根据权利要求1中的所述智能检索的监控平台系统,其特征在于,在电话视觉感应设备中,设置移动电话和固定电话的三维模型库,通过识别人的手,进而通过三维模型库比对人的手中物体,进而判断是否为电话。

8.根据权利要求1中的所述智能检索的监控平台系统,其特征在于,在电话视觉感应设备中,设置蓝牙耳机和普通耳机的三维模型库,通过识别人的耳朵,进而通过三维模型库比对人的耳朵上戴的物体,进而判断是否为耳机。