利索能及-专利交易平台_专利购买_专利出售-买专利,卖专利上利索能及

欢迎来到利索能及~ 联系电话：18621327849

查出售查求购

我要发布

专利交易专利求购

一种基于迁移学习的手势分类方法

￥2600

专利号： 2019105979800

申请人：淮阴工学院

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2024-10-29

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于迁移学习的手势分类方法，其特征在于，包括如下步骤：

(1)将手势视频V转换为手势帧数据集合G0；

(2)通过高斯滤波方法、OTSU算法和图像与运算对G0分别进行去除噪声、二值化和背景分割处理，得到手势帧数据集合G1，为G1设置标签后得到帧标签数据集合L；

(3)使用MobileNet卷积神经网络架构和权重文件进行迁移学习，创建与训练模型M1；

通过模型M1提取帧数据集合G1的特征，得到帧特征向量集合F0；

(4)将XGBoost作为分类模型对测试集进行分类，得到最终分类结果。

2.根据权利要求1所述的一种基于迁移学习的手势分类方法，其特征在于，所述步骤(1)中将手势视频V转换为手势帧数据集合G0的具体步骤如下：(1.1)定义V为手势视频数据集合，Video为单个视频信息集，V＝{Video1,Video2,…,Videoa,…,VideoA}，Videoa为V中第a个视频信息数据，A为V中Video的数量即手势类型数量，变量a∈[1,A]；

(1.2)定义N为每个Video转换的帧总数量，Frame为单个帧信息集，定义循环变量i用于遍历V，i∈[1,A]，i赋初值为1，开始遍历V；

(1.3)如果i≤A，则跳转至步骤(1.4)，否则跳转至步骤(1.6)；

(1.4)定义count记录Videoi转换的帧数，当count＝N时，得到N个Frame帧信息集；

(1.5)i＝i+1，跳转至步骤(1.3)继续遍历V；

(1.6)结束遍历V，得到帧数据集合G0，G0＝{Frame1,Frame2,…,FrameN,Frame(N+1),…,Frame(2×N),Frame(2×N+1),…,Frame(A×N)}，FrameN表示第N个帧数据信息，(A×N)为帧Frame的数量，即帧标签总数量。

3.根据权利要求1所述的一种基于迁移学习的手势分类方法，其特征在于，所述步骤(2)中得到手势帧数据集合G1，为G1设置标签后得到帧标签数据集合L的具体步骤如下：(2.1)定义frame为Frame预处理后的单个帧信息集，定义循环变量j用来遍历G0，j∈[1,A×N]，j赋初值为1，开始遍历G0；

(2.2)如果j≤(A×N)，则跳转至步骤(2.3)，否则跳转至步骤(2.8)；

(2.3)读取帧Framej，将其分割为三通道帧，分别为明亮度yj、色调Crj和饱和度Cbj，通过高斯滤波方法对Crj通道帧进行滤波平滑处理，采用(3×3)的高斯内核与Crj进行卷积得到帧Cr1j；

(2.4)通过OTSU算法求帧阈值，对帧Cr1j进行二值化处理得到帧skinj；

(2.5)对帧skinj使用内核为3×3的方形进行2次形态学开运算(先腐蚀再膨胀)，得到帧sure_bgj；

(2.6)将帧Framej和帧sure_bgj每个像素值进行二进制与运算，得到背景分割的手势帧framej；

(2.7)j＝j+1，跳转至步骤(2.2)，继续遍历G0；

(2.8)结束遍历G0，得到预处理后的手势帧数据集合G1，G1＝{frame1,frame2,…,framed,…,frame(A×N)}，framed为Framed经过预处理后的帧数据信息，d∈[1,A×N]；

(2.9)对G1中的数据添加类别标签得到帧标签数据集合L，L＝{Label1,Label2,…,LabelN,…,Label(A×N)}，LabelN为第N帧即frameN对应的标签,，将L划分为训练集L1和测试集L2，满足len(L1):len(L2)＝4:1。

4.根据权利要求1所述的一种基于迁移学习的手势分类方法，其特征在于，所述步骤(3)中创建与训练模型M1，通过模型M1提取帧数据集合G1的特征，得到帧特征向量集合F0的具体步骤如下：(3.1)构建使用预训练的权重、网络顶部没有完全连接层、帧输入维度为(224,224,3)的网络架构模型M1；

(3.2)M1模型通过深度可分离卷积的方法，将标准卷积分解成两个更小的操作为深度卷积和点卷积；

(3.3)将维度为H×W×C(长×宽×通道数)的输入帧分为C组，然后对每一组做3×3的卷积，收集每个组的特征即每个通道的特征；

(3.4)将步骤(3.3)中得到的每个通道的特征做1×1的卷积进行组合并输出至步骤(3.3)进行下一次的深度卷积操作；

(3.5)重复步骤(3.3)和步骤(3.4)的操作13次，即经过13次深度可分离卷积提取帧特征；

(3.6)使用M1模型提取手势帧数据集合G1的特征，得到手势帧特征向量集合F0，将F0划分为训练集F1和测试集F2，满足len(F1):len(F2)＝4:1。

5.根据权利要求1所述的一种基于迁移学习的手势分类方法，其特征在于，所述步骤(4)中将XGBoost作为分类模型对测试集进行分类，得到最终分类结果的具体步骤如下：(4.1)设置XGBClassifier函数参数，包括：基分类器为树模型、CART树的最大深度为6、学习率为0.1、CART树的个数为60、目标函数为“mulit:softmax”和多分类个数为10，构建XGBoost模型M2；

(4.2)通过递归寻找最优的切分特征和切分点，对叶子节点的权值进行优化得到CART树，根据F1和L1构建训练第一棵CART树，拟合已经生成的前一棵CART树的残差，构建下一棵新的CART树，训练好具有10棵树的M2模型；

(4.3)基于M2模型，对F2分类预测得到分类结果。