1.一种基于注意力机制的静态手势识别方法,其特征在于:包括如下步骤:
1)对各种手势进行图像采集获得原始手势图像,对原始手势图像进行尺寸归一化处理;
2)将尺寸归一化处理后的图像输入基准网络的第一层,获得第一阶特征向量;
3)将第一阶特征向量输入手势细节注意力模块,获得手势细节特征向量;将第一阶特征向量输入基准网络的第二层,获得第二阶特征向量;将手势细节特征向量和第二阶特征向量进行融合获得经过手势细节标定后的第二阶特征向量;
4)将经过手势细节标定后的第二阶特征向量输入第一通道注意力模块,获得经手势细节标定和通道标定后的第二阶特征向量;
5)将第一阶特征向量和第一通道注意力模块的输出均输入手势主体注意力模块,获得手势主体特征向量;
6)将通道注意力模块的输出输入基准网络的第三层,获得第三阶特征向量;将第三阶特征向量和手势主体特征向量融合后输入第二通道注意力模块;
7)将第二通道注意力模块的输出依次输入剩余基准网络、平均池化层和softmax分类器,获得手势图像的分类结果。
2.根据权利要求1所述的一种基于注意力机制的静态手势识别方法,其特征在于:所述手势细节注意力模块包括依次连接的三个卷积层;第一个卷积层和第二个卷积层之间连接有一个上采样层;第一个卷积层的为卷积核大小为1×1,第二个和第三个卷积层的卷积核大小为3×3。
3.根据权利要求1所述的一种基于注意力机制的静态手势识别方法,其特征在于:所述通道注意力模块包括依次连接的全局平均池化层、第一全连接层和第二全连接层,第二全连接层的输出与通道注意力模块的输入在通道维度上相乘后得到的特征向量作为通道注意力模块的输出。
4.根据权利要求1所述的一种基于注意力机制的静态手势识别方法,其特征在于:所述手势主体注意力模块包括手势主体第一分支、手势主体第二分支和选通模组;手势主体第一分支和手势主体第二分支并联设置,且两个分支的输出均输入选通模组;
手势主体第一分支包括四个依次连接的卷积层,第一个和第二个卷积层之间连接有第一平均池化层,第二个和第三个卷积层之间连接有第二平均池化层,第三个卷积层和第四个卷积层之间连接有一个上采样层;手势主体第二分支与手势主体第一分支的第一平均池化层的卷积核大小不同,其余结构相同;
选通模组包括两组并行组成的子分支,每组子分支包括依次连接的平均池化层和两个全连接层。
5.根据权利要求4所述的一种基于注意力机制的静态手势识别方法,其特征在于:手势主体第一分支和手势主体第二分支的输出分别输入两组子分支的平均池化层,将两个平均池化层的输出在高宽维度上相加后输出的特征图展平,将展平后的特征图分别输入两组子分支的两个全连接层,分别得到两个一维特征向量;
两组子分支输出的两个一维特征向量分别与手势主体第二分支与手势主体第一分支的输出相乘后得到两个特征向量,然后将两个特征向量在高宽维度上相加,得到的特征向量即为手势主体特征向量。
6.根据权利要求4所述的一种基于注意力机制的静态手势识别方法,其特征在于:第一个卷积层的卷积核大小为1×1,第二个、第三个和第四个卷积层的卷积核大小为3×3;手势主体第二分支中第一平均池化层的卷积核大小为4×4,手势主体第二分支中第一平均池化层的卷积核大小为2×2。