利索能及
我要发布
收藏
专利号: 2021108728676
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-07-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种动作识别方法,包括:

获取目标视频;

确定所述目标视频对应的各个动作类别;

对于每个动作类别,从所述目标视频中确定该动作类别对应的动作转换前视频帧和动作转换后视频帧;其中,每个动作类别对应的动作转换前视频帧为该动作类别对应的动作初始状态对应的视频帧,每个动作类别对应的动作转换后视频帧为该动作类别对应的动作结束状态对应的视频帧;

基于各个动作类别对应的动作转换前视频帧和动作转换后视频帧,确定各个动作类别对应的动作次数,包括:对于每个动作类别,基于该动作类别对应的动作转换前视频帧和动作转换后视频帧在所述目标视频中的帧位置,确定该动作类别对应的动作转换前视频帧和动作转换后视频帧之间的动作转换次数;基于各个动作类别对应的动作转换次数,确定各个动作类别对应的动作次数。

2.根据权利要求1所述的方法,其中,所述对于每个动作类别,从所述目标视频中确定该动作类别对应的动作转换前视频帧和动作转换后视频帧,包括:基于所述目标视频和预设的动作识别模型,确定所述目标视频中各个视频帧对应的动作信息;

对于每个动作类别,基于所述动作信息,从所述各个视频帧中确定该动作类别对应的动作转换前视频帧和动作转换后视频帧。

3.根据权利要求2所述的方法,其中,所述基于所述目标视频和预设的动作识别模型,确定所述目标视频中各个视频帧对应的动作信息,包括:对于所述目标视频中每个视频帧,基于该视频帧和所述预设的动作识别模型,确定该视频帧属于所述各个动作类别对应的动作转换前视频帧和动作转换后视频帧的概率信息;

基于所述概率信息,确定所述动作信息。

4.根据权利要求2所述的方法,其中,所述预设的动作识别模型由以下步骤训练得到:获取各个样本图像;

确定每个样本图像对应的动作标注信息;

基于所述各个样本图像和待训练模型,确定所述各个样本图像对应的样本动作信息;

基于所述样本动作信息、所述动作标注信息以及预设的损失函数,对所述待训练模型进行训练,直至所述待训练模型收敛,得到所述预设的动作识别模型。

5.根据权利要求4所述的方法,其中,所述获取各个样本图像,包括:确定所述各个动作类别对应的类别数量;

基于目标参数,获取所述各个动作类别对应的所述各个样本图像;所述目标参数包括以下至少一项:所述类别数量、预设的动作角度、预设的距离参数、动作转换参数。

6.根据权利要求4所述的方法,其中,所述基于所述各个样本图像和待训练模型,确定所述各个样本图像对应的样本动作信息,包括:对于每个样本图像,基于该样本图像和所述待训练模型,确定该样本图像属于所述各个动作类别对应的动作转换前视频帧和动作转换后视频帧的样本概率信息;

基于所述样本概率信息,确定所述样本动作信息。

7.一种动作识别装置,包括:

视频获取单元,被配置成获取目标视频;

类别确定单元,被配置成确定所述目标视频对应的各个动作类别;

转换帧确定单元,被配置成对于每个动作类别,从所述目标视频中确定该动作类别对应的动作转换前视频帧和动作转换后视频帧;其中,每个动作类别对应的动作转换前视频帧为该动作类别对应的动作初始状态对应的视频帧,每个动作类别对应的动作转换后视频帧为该动作类别对应的动作结束状态对应的视频帧;

动作计数单元,被配置成基于各个动作类别对应的动作转换前视频帧和动作转换后视频帧,确定各个动作类别对应的动作次数;

所述动作计数单元进一步被配置成:

对于每个动作类别,基于该动作类别对应的动作转换前视频帧和动作转换后视频帧在所述目标视频中的帧位置,确定该动作类别对应的动作转换前视频帧和动作转换后视频帧之间的动作转换次数;

基于各个动作类别对应的动作转换次数,确定各个动作类别对应的动作次数。

8.根据权利要求7所述的装置,其中,所述转换帧确定单元进一步被配置成:基于所述目标视频和预设的动作识别模型,确定所述目标视频中各个视频帧对应的动作信息;

对于每个动作类别,基于所述动作信息,从所述各个视频帧中确定该动作类别对应的动作转换前视频帧和动作转换后视频帧。

9.根据权利要求8所述的装置,其中,所述转换帧确定单元进一步被配置成:对于所述目标视频中每个视频帧,基于该视频帧和所述预设的动作识别模型,确定该视频帧属于所述各个动作类别对应的动作转换前视频帧和动作转换后视频帧的概率信息;

基于所述概率信息,确定所述动作信息。

10.根据权利要求7所述的装置,其中,还包括:

模型训练单元,被配置成获取各个样本图像;确定每个样本图像对应的动作标注信息;

基于所述各个样本图像和待训练模型,确定所述各个样本图像对应的样本动作信息;基于所述样本动作信息、所述动作标注信息以及预设的损失函数,对所述待训练模型进行训练,直至所述待训练模型收敛,得到所述预设的动作识别模型。

11.根据权利要求10所述的装置,其中,所述模型训练单元进一步被配置成:确定所述各个动作类别对应的类别数量;

基于目标参数,获取所述各个动作类别对应的所述各个样本图像;所述目标参数包括以下至少一项:所述类别数量、预设的动作角度、预设的距离参数、动作转换参数。

12.根据权利要求10所述的装置,其中,所述模型训练单元进一步被配置成:对于每个样本图像,基于该样本图像和所述待训练模型,确定该样本图像属于所述各个动作类别对应的动作转换前视频帧和动作转换后视频帧的样本概率信息;

基于所述样本概率信息,确定所述样本动作信息。

13.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑6中任一项所述的方法。

15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1‑6中任一项所述的方法。