利索能及
我要发布
收藏
专利号: 2021113679966
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种人体姿态估计方法,包括:针对待处理视频中的第i帧图像,i≤2≤M,M为大于一的正整数,表示所述待处理视频中包括的帧数,若确定从第i‑1帧图像中检测到了目标,则针对检测到的目标,进行以下处理:

根据所述目标在所述第i‑1帧图像中的包围框,确定出所述第i帧图像中包括所述目标的第一图像区域;

根据所述第一图像区域进行所述目标的关键点坐标预测。

2.根据权利要求1所述的方法,其中,所述确定出所述第i帧图像中包括所述目标的第一图像区域包括:

根据所述目标在所述第i‑1帧图像中的包围框生成扩展包围框,所述包围框对应的第一区域位于所述扩展包围框对应的第二区域内;

根据所述扩展包围框在所述第i‑1帧图像中的位置,确定出所述第i帧图像中所述位置对应的所述第一图像区域。

3.根据权利要求2所述的方法,其中,所述根据所述第一图像区域进行所述目标的关键点坐标预测包括:

从所述第i帧图像中截取出所述第一图像区域;

对截取出的所述第一图像区域进行目标检测,若检测到目标,则从所述第一图像区域中截取出检测到的目标的包围框对应的第二图像区域,并将所述第二图像区域作为待预测区域,根据所述待预测区域确定出其中的目标的关键点坐标。

4.根据权利要求3所述的方法,还包括:若确定未从所述第i‑1帧图像中检测到目标,则利用第一检测模型对所述第i帧图像进行目标检测;

若检测到目标,则从所述第i帧图像中截取出检测到的目标的包围框对应的第三图像区域,并将所述第三图像区域作为待预测区域,根据所述待预测区域确定出其中的目标的关键点坐标。

5.根据权利要求3所述的方法,还包括:若确定未从所述第i帧图像中检测到目标或符合预定的触发条件,则利用第一检测模型对所述第i帧图像进行目标检测;

若检测到目标,则从所述第i帧图像中截取出检测到的目标的包围框对应的第四图像区域,并将所述第四图像区域作为待预测区域,根据所述待预测区域确定出其中的目标的关键点坐标。

6.根据权利要求3、4或5所述的方法,其中,所述根据所述待预测区域确定出其中的目标的关键点坐标包括:

利用关键点预测模型确定出所述待预测区域中的目标的关键点坐标。

7.根据权利要求4或5所述的方法,其中,对所述第一图像区域进行目标检测包括:利用第二检测模型对所述第一图像区域进行目标检测,所述第二检测模型为对所述第一检测模型进行简化后得到的模型。

8.根据权利要求7所述的方法,还包括:利用第一数据集中的训练数据训练得到所述第一检测模型,每条训练数据中分别包括样本图像以及对应的标签,所述标签包括对应的样本图像中的目标的包围框;

针对任一包围框,分别进行以下处理:生成对应的扩展包围框,从所在样本图像中截取出所述扩展包围框对应的第五图像区域,将所述第五图像区域作为新的样本图像,并生成所述新的样本图像对应的标签,将所述新的样本图像及对应的标签作为一条新的训练数据;

利用得到的新的训练数据组成第二数据集,利用所述第二数据集训练得到所述第二检测模型。

9.一种人体姿态估计装置,包括:第一处理模块以及第二处理模块;

所述第一处理模块,用于针对待处理视频中的第i帧图像,i≤2≤M,M为大于一的正整数,表示所述待处理视频中包括的帧数,若确定从第i‑1帧图像中检测到了目标,则通知所述第二处理模块执行自身处理;

所述第二处理模块,用于针对检测到的目标,根据所述目标在所述第i‑1帧图像中的包围框,确定出所述第i帧图像中包括所述目标的第一图像区域,根据所述第一图像区域进行所述目标的关键点坐标预测。

10.根据权利要求9所述的装置,其中,所述第二处理模块根据所述目标在所述第i‑1帧图像中的包围框生成扩展包围框,所述包围框对应的第一区域位于所述扩展包围框对应的第二区域内,根据所述扩展包围框在所述第i‑1帧图像中的位置,确定出所述第i帧图像中所述位置对应的所述第一图像区域。

11.根据权利要求10所述的装置,其中,所述第二处理模块从所述第i帧图像中截取出所述第一图像区域,并对截取出的所述第一图像区域进行目标检测,若检测到目标,则从所述第一图像区域中截取出检测到的目标的包围框对应的第二图像区域,将所述第二图像区域作为待预测区域,根据所述待预测区域确定出其中的目标的关键点坐标。

12.根据权利要求11所述的装置,其中,所述第一处理模块进一步用于,若确定未从所述第i‑1帧图像中检测到目标,则利用第一检测模型对所述第i帧图像进行目标检测,若检测到目标,则从所述第i帧图像中截取出检测到的目标的包围框对应的第三图像区域,并将所述第三图像区域作为待预测区域,根据所述待预测区域确定出其中的目标的关键点坐标。

13.根据权利要求11所述的装置,其中,所述第二处理模块进一步用于,若确定未从所述第i帧图像中检测到目标或符合预定的触发条件,则利用第一检测模型对所述第i帧图像进行目标检测,若检测到目标,则从所述第i帧图像中截取出检测到的目标的包围框对应的第四图像区域,并将所述第四图像区域作为待预测区域,根据所述待预测区域确定出其中的目标的关键点坐标。

14.根据权利要求11、12或13所述的装置,其中,所述关键点坐标为利用关键点预测模型确定出的所述待预测区域中的目标的关键点坐标。

15.根据权利要求12或13所述的装置,其中,所述第二处理模块利用第二检测模型对所述第一图像区域进行目标检测,所述第二检测模型为对所述第一检测模型进行简化后得到的模型。

16.根据权利要求15所述的装置,还包括:预处理模块,用于利用第一数据集中的训练数据训练得到所述第一检测模型,每条训练数据中分别包括样本图像以及对应的标签,所述标签包括对应的样本图像中的目标的包围框,针对任一包围框,分别进行以下处理:生成对应的扩展包围框,从所在样本图像中截取出所述扩展包围框对应的第五图像区域,将所述第五图像区域作为新的样本图像,并生成所述新的样本图像对应的标签,将所述新的样本图像及对应的标签作为一条新的训练数据,利用得到的新的训练数据组成第二数据集,利用所述第二数据集训练得到所述第二检测模型。

17.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑8中任一项所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行权利要求1‑8中任一项所述的方法。

19.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现权利要求1‑8中任一项所述的方法。