利索能及
我要发布
收藏
专利号: 2018103604410
申请人: 杭州易舞科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度学习图像识别的健身动作纠错方法,包括以下步骤:

接收从健身视频中截取的每帧健身图像,记录每帧健身图像对应的时间,并对每帧健身图像进行预处理;

将预处理后的健身图像输入到人体关节识别模型中,经所述人体关节识别模型计算,输出健身图像中包含的每个人体关节及其位置坐标;

将各个关节根据坐标位置有序连线,得到人体骨架图;

根据标准健身动作对所述人体骨架图进行比对分析,输出不标准健身图像以实现对健身动作的纠错。

2.如权利要求1所述的基于深度学习图像识别的健身动作纠错方法,其特征在于,所述人体关节识别模型是以VGG网络结构为基础,经训练获得。

3.如权利要求2所述的基于深度学习图像识别的健身动作纠错方法,其特征在于,所述VGG网络结构包括依次连接输出层、的224*224*64第一卷积层、112*112*128第一最大池化层、112*112*128第二卷积层、112*112*128第三卷积层、56*56*256第二最大池化层、56*56*

256第四卷积层、56*56*256第五卷积层、56*56*256第六卷积层、56*56*256第七卷积层、14*

14*512第三最大池化层、14*14*512第八卷积层、14*14*512第九卷积层、14*14*512第十卷积层、14*14*512第十一卷积层、1*1*448全连接输出层,所述全连接输出层分成两个独立的部分,每部分分别与独立的损失函数相连接,以计算模型的预测x坐标和y坐标与训练目标的误差,后向传播时,两个损失函数独立计算向后传播子梯度,并将两个子梯度之和作为全连接输出层的后向传播梯度。

4.如权利要求1所述的基于深度学习图像识别的健身动作纠错方法,其特征在于,所述根据标准健身动作对所述人体骨架图进行比对分析包括:当健身图像截取于有音乐节奏的健身视频时,在标准健身视频中截取与每帧健身图像对应时间相同的标准健身图像后,将每帧健身图像对应的人体骨架图与标准健身图像中的标准健身动作进行对比分析,以确定健身动作的错误。

5.如权利要求4所述的基于深度学习图像识别的健身动作纠错方法,其特征在于,在将每帧健身图像对应的人体骨架图与标准健身图像中的标准健身动作进行对比分析后,确定每帧人体骨架图中健身动作的分值,并将连续多帧人体骨架图对应分值的平均值作为连续多帧人体骨架图呈现的总体健身动作的总分值,将总分值低于阈值的人体骨架图对应的健身图像作为不标准健身图像。

6.如权利要求1所述的基于深度学习图像识别的健身动作纠错方法,其特征在于,所述根据标准健身动作对所述人体骨架图进行比对分析包括:当健身图像截取于有无音乐节奏的健身视频时,将每帧人体骨架图按照时间顺序进行记录,将健身动作中的关键动作与标准关键动作的角度、幅度进行对比,以关键动作与标准关键动作的角度、幅度的差异程度来确定关键动作分值,并将多个关键动作分值的平均值作为总体健身动作的总分值,将总分值低于阈值的人体骨架图对应的健身图像作为不标准健身图像。

7.如权利要求1所述的基于深度学习图像识别的健身动作纠错方法,其特征在于,输出不标准健身图像的同时,还输出与该不标准健身图像对应的标准健身图像和时间。

8.如权利要求1所述的基于深度学习图像识别的健身动作纠错方法,其特征在于,所述对每帧健身图像进行预处理包括:调整每帧健身图像到同一尺寸;

将每帧健身图像转换成灰度图。

9.一种基于深度学习图像识别的健身动作纠错系统,其特征在于,包括:接收单元,接收从健身视频中截取的每帧健身图像,记录每帧健身图像对应的时间;

预处理单元,调整接收的每帧健身图像至相同尺寸,并转换每帧健身图像至灰度图;

训练好的人体关节识别模型,对输入的预处理后的健身图像进行计算,获得健身图像中包含的每个人体关节及其位置坐标并输出;

人体骨架图生成单元,对各个关节根据坐标位置有序连线,得到人体骨架图;

比对单元,标准健身动作对所述人体骨架图进行比对分析,获得不标准健身图像;

输出单元,将所述不标准健身图像输出。