利索能及
我要发布
收藏
专利号: 2021103014650
申请人: 北京市商汤科技开发有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种设备控制方法,其特征在于,包括:对获取的第一待检测图像进行手部检测,确定与预设手势类别匹配的目标手部的手部检测信息;

基于所述目标手部的手部检测信息,对获取的第二待检测图像中与所述目标手部相连的目标肢体进行肢体跟踪检测,并确定所述目标手部在所述第二待检测图像中的手势识别结果;其中,所述第二待检测图像为在所述第一待检测图像之后获取到的图像;

基于所述手势识别结果,控制目标设备。

2.根据权利要求1所述的方法,其特征在于,在所述基于所述手势识别结果,控制目标设备之前,还包括:

检测所述目标手部是否满足截止条件;

在检测到所述目标手部满足截止条件的情况下,在所述第二待检测图像中,重新确定与所述预设手势类别匹配的目标手部的手部检测信息。

3.根据权利要求2所述的方法,其特征在于,所述目标手部满足所述截止条件包括以下一种或多种:

在所述第二待检测图像中,所述目标手部的手势识别结果指示的手势类别为无效手势类别,所述无效手势类别包括如下至少一项:所述手势类别与所述预设手势类别不匹配,以及所述目标手部未发生移动;

在所述第二待检测图像包括多帧的情况下,所述目标手部的手势识别结果指示的手势类别为所述无效手势类别的帧数大于或等于数量阈值,和/或持续时长大于或等于时长阈值;

在所述第二待检测图像中,所述目标手部的手势识别结果指示的手势类别为有效手势类别,且所述有效手势类别用于指示重新确定目标手部和/或手部检测信息。

4.根据权利要求1~3任一所述的方法,其特征在于,所述对获取的第一待检测图像进行手部检测,包括:

对获取的所述第一待检测图像进行肢体检测,得到肢体检测信息;

基于所述肢体检测信息,对所述第一待检测图像进行手部检测,确定与所述肢体关联的所述目标手部的所述手部检测信息。

5.根据权利要求1~3任一所述的方法,其特征在于,所述对获取的第一待检测图像进行手部检测,包括:

对获取的所述第一待检测图像分别进行肢体检测和手部检测,得到肢体检测信息和所述手部检测信息;

基于所述肢体检测信息和所述手部检测信息,确定所述手部与所述肢体之间的距离;

基于所述距离,确定与所述肢体关联的所述目标手部的所述手部检测信息。

6.根据权利要求1~5任一所述的方法,其特征在于,所述控制目标设备,包括如下至少一种:

调整所述目标设备的音量;

调整所述目标设备的工作模式,所述工作模式包括关闭或开启所述目标设备的至少部分功能;

在所述目标设备的显示界面中显示移动标识,或调整所述显示界面中所述移动标识的显示位置;

所述显示界面中至少部分显示内容的缩小或放大;

所述显示界面的滑动或跳转。

7.根据权利要求1~6任一所述的方法,其特征在于,在所述第一待检测图像中包括多个用户的情况下,在所述基于所述目标手部的手部检测信息,对获取的第二待检测图像中与所述目标手部相连的目标肢体进行肢体跟踪检测之前,还包括:确定所述第一待检测图像中每个用户的目标关节点位置信息;

将所述第一待检测图像中的每个用户作为目标用户,基于所述目标用户的所述目标关节点位置信息,确定所述目标用户的目标关节点与多个用户中除所述目标用户之外的其他用户的目标关节点之间的水平距离;

在基于所述水平距离,确定所述其他用户中不存在干扰用户的情况下,则将所述目标用户的默认手势类别,作为所述目标用户的所述预设手势类别,所述干扰用户包括所述水平距离小于所述目标用户对应的距离阈值的用户。

8.根据权利要求7所述的方法,其特征在于,还包括:在基于所述水平距离,确定所述其他用户中存在干扰用户的情况下,则对所述目标用户的默认手势类别进行调整,并将调整后的默认手势类别作为所述目标用户的所述预设手势类别,调整所述默认手势类别包括以下至少一种操作:增加所述默认手势类别的种类、增加用于控制所述目标设备的至少一个功能的手势类别的种类,以及将手势类别的移动检测调整为手部检测框的移动检测。

9.根据权利要求7或8所述的方法,其特征在于,根据下述步骤确定所述目标用户对应的所述距离阈值:

确定所述目标用户的第一关节点的位置信息和第二关节点的位置信息;

基于所述第一关节点的位置信息和所述第二关节点的位置信息,确定用于表征所述目标用户肩宽的中间距离;

基于所述中间距离,确定所述目标用户对应的所述距离阈值。

10.一种设备控制装置,其特征在于,包括:第一确定模块,用于对获取的第一待检测图像进行手部检测,确定与预设手势类别匹配的目标手部的手部检测信息;

检测模块,用于基于所述目标手部的手部检测信息,对获取的第二待检测图像中与所述目标手部相连的目标肢体进行肢体跟踪检测,并确定所述目标手部在所述第二待检测图像中的手势识别结果;其中,所述第二待检测图像为在所述第一待检测图像之后获取到的图像;

控制模块,用于基于所述手势识别结果,控制目标设备。

11.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至9任一所述的设备控制方法的步骤。

12.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任一所述的设备控制方法的步骤。